Archivos de la categoría Noticia

Más empresas que emplean R en entornos de producción

Aquí os dejamos un pequeño resumen de algunos casos, publicados recientemente en el portal Microsoft Customer Stories, de ejemplos de empresas que empleann R en entornos de producción…

La información original podéis leerla en: www.r-bloggers.com

  • eToro, the social trading network, uses Microsoft R Server and Azure Machine Learning so that investors can automatically duplicate market strategies and actual investment decisions of successful traders in the eToro network to use in their own portfolios.

  • Acxiom, the marketing analytics company, is using SQL Server R Services to build more accurate models using larger data sets, which results in more precisely targeted marketing for customers.

  • Merck, the pharmaceutical company, is using Microsoft R Server for Hadoop to analyze the various factors that affect the cold chain such as origin, destination, shipment route, external weather, and logistics providers. With an improved temperature-controlled supply route, Merck can reduce wastage caused by temperature fluctuations.

  • PROS, the dynamic pricing software company, uses Microsoft Azure and Microsoft SQL Server 2016 with R Services to to keep up-to-the-minute pricing accurate, competitive, and profitable.

  • WorldSmart, the retail technology specialist, uses Azure Stream Analytics services and Microsoft R Server to drive several of its Machine Learning forecasts and analysis.

  • dv01, the financial reporting and analytics platform, uses Microsoft SQL Server 2016 running on Azure Virtual Machines and R to bring greater transparency to the consumer lending market.

  • Heartland Bank, in New Zealand, replaced SAS with Microsoft R Server and SQL Server to analyze risk, evaluate credit lines, and understand cash flows.

Una fuga de cerebros “estratégica”

Imagen original publicada en investigacionyciencia.es, Nº 488, mayo de 2017.

Con esa «posverdad», publicada el pasado febrero en la revista Science & Diplomacy, se encontraron los y las jóvenes investigadoras españolas que tuvieron que marcharse del país en busca de oportunidades, debido a los recortes que el Gobierno ha ido realizando en inversión pública destinada a investigación, restringiendo así sus oportunidades de obtener becas y empleo, y que mermaron gravemente la capacidad investigadora del país.

Resulta sin embargo que el Gobierno español lo que hace es reclutar a científicos emigrantes «para que sirvan de aliados fundamentales», la fuga de talentos españoles forma parte de su campaña para «consolidar su presencia científica en países estratégicos», la cual según ellos será beneficiosa para todos.

Pero es que la tergiversación no queda ahí, según el artículo España está estratégicamente «integrando las prioridades del plan nacional de investigación, desarrollo e innovación (I+D+I) en la política exterior española» para poderse «aprovechar del talento nacional, allí donde esté, y explorar fórmulas flexibles para permitir que el conocimiento resultante beneficie al país». Así que los políticos españoles tratan de atribuirse el mérito de la ciencia realizada y financiada en el extranjero, y la proclaman «Made in Spain».

Estas y otras «posverdades» ha hecho que las y los científicos españoles exiliados se sientan sorprendidos de su consideración diplomática a la vez que consternados e insultados, tal y como se puede leer en la entrada completa

IX Jornadas de Usuarios de R. Granada

Web de las IX Jornadas de R en Granada

Web de las IX Jornadas de R en Granada

Ya tenemos anuncio de las IX Jornadas de Usuarios de R, que este año se celebrarán en Granada los días 16 y 17 de noviembre.

La web de las jornadas ya está disponible en la dirección http://r-es.org/9jornadasR donde podéis encontrar toda la información sobre envío de comunicaciones, reservas, programa, etc.

Desde este Servicio os animamos a asistir, ya que, es una muy buena oportunidad de ver cómo utilizan R en otras disciplinas y conocer gente.

Aquí os dejamos el correo que hace unos días envío la Asociación R-Hispano.

La Asociación R-Hispano tiene el placer de anunciar la celebración de las IX Jornadas de Usuarios de R. En esta ocasión, será la Universidad de Granada , en la ETS de Ingenierías Informática y de Telecomunicación, quien acoja las Jornadas los días 16 y 17 de noviembre de 2017.

El objetivo de las Jornadas es proporcionar un punto de encuentro a la diversidad de usuarios de R por lo que, independientemente de la filiación o del área de trabajo o investigación, todo usuario de R es bienvenido.

Como en años anteriores, la presentación de trabajos en las Jornadas puede ser en forma de Presentación oral, en distintas sesiones paralelas, que reflejen el amplio abanico de análisis de datos mediante R, Póster, en una sesión específica, o como un Taller que permita profundizar en aspectos interesantes y menos conocidos de R.

El envío de trabajos ha de hacerse a través de enlace a easychair habilitado en la web del congreso en http://r-es.org/9jornadasR/. En esta edición de las Jornadas también se otorgará un premio al mejor trabajo presentado por un investigador joven (ver bases en la web de las Jornadas).

Finalmente, queremos agradecer la colaboración de nuestros patrocinadores, sin los que las Jornadas no serían posible. Si tú o tu institución estáis interesados en patrocinar las Jornadas puedes consultar cómo hacerlo en http://r-es.org/9jornadasR/.

Las fechas importantes son:

Linux Foundation amplía su oferta de cursos gratuitos

¿Te gustaría iniciarte en tecnologías relacionadas con Linux o bien aprender sus conceptos básicos? Linux Foundation se alió hace tiempo con edX para ofrecer cursos orientados en esa dirección, abarcando los fundamentos del sistema y con un fuerte enfoque en el Cloud Computing (destacando OpenStack), ya que dicho campo está destinado a jugar un papel muy importante en la computación profesional del futuro.

En esta ocasión vamos a aprovechar para mencionar los cursos gratuitos ofrecidos actualmente por Linux Foundation, a los cuales se puede acceder durante un año. Es difícil encontrar un curso profundo y de nivel gratuito, por lo que casi todos los mencionados aquí son introductorios. Aun así, estos contenidos no están orientados a personas recién iniciadas en la informática, sino a aquellas que ya tengan ciertos conocimientos sobre la materia. Dicho de otra forma, se necesitaría ser al menos un usuario avanzado (y en algunos casos posiblemente ni eso sea suficiente) para poder entender las materias impartidas en estos cursos gratuitos. Por otro lado, se requiere saber inglés, idioma “oficial” de la informática, más cuando hablamos de cosas que van más allá de las tareas comunes.

Los cursos gratuitos ofrecidos actualmente por Linux Foundation, la mayoría de estos a través de edX: seguir leyendo en www.muylinux.com

Donald Knuth

Donald Knuth (imagen tomada de Wikipedia)

Quizá a algunos os suene el nombre de Donald Knuth. Uno de los padres de la informática moderna y creador, entre otras cosas, del sistema de tipografía TeX (en el que se basan otros sistemas como LaTeX).

Pues bien, hace unos días se publicó en Magnet (Xataka) una breve entrada sobre él que os recomendamos desde la Sección de Apoyo Estadístico. La entrada no es muy larga pero hace un breve repaso sobre su vida y sus obras más conocidas The Art of Computer Programming y TeX. Además, se cuentan algunas curiosidades y anécdotas interesantes, por lo que se hace una lectura muy amena.

Así que, sin más, aquí os dejamos la entrada. Esperamos que la disfrutéis.

El día de 3.14159265359… (o casi)

]1 J. Gabás Esteban (Flickr)

Lucas Fos es un niño que estudia 5º de Primaria en un colegio de Valencia. En sus ratos libres, el joven comparte en YouTube tutoriales de videojuegos o la forma de resolver un cubo Rubik. Los más de 20.000 suscriptores de su canal Megasuperluc4s seguramente se sorprendieron cuando hace dos semanas el niño subió un nuevo vídeo en el que explicaba cómo calcular el número Pi utilizando solo sus pies. Fos es uno de los ganadores del concurso “Sin π no soy nada” gracias a la creatividad e imaginación que ha demostrado con su propuesta audiovisual.

Seguir leyendo en https://hipertextual.com

El grupo de usuarios de R de Madrid

Interesante post de r-bloggers sobre el origen del Grupo de usuarios de R de Madrid

En la primera reunión éramos 5, ahora somos más de 60 y de forma consistente. No nos costó mucho poner en marcha el grupo de usuarios de R de Madrid. A través de la propia lista de ayuda R-help-es los que solíamos responder de forma más habitual a las dudas de esta nueva comunidad (Gregorio Serrano, Carlos Gil Bellosta, Pedro Concejero y Carlos Ortega), acordamos juntarnos por primera vez. Fue en marzo de 2012, nos juntamos en un aula de la Facultad de Economia de uno de los Campus de Madrid. Hablamos de: a) Cómo modelizar diferentes estrategias de trading con R, b) Cómo modelizar el número de bugs presentes en el código R, y c) la presentación de una librería para crear gráficos espaciales del mapa de España.

El grupo de Usuarios de R de Madrid, nació como grupo promovido por la Asociación de R de España. La Asociación nos permitió alojar las agendas de nuevas convocatorias y el contenido generado en las reuniones en un espacio de su portal online. Este punto ayudó a dotar de un punto inicial de credibilidad sobre el grupo.

A partir de este momento, hemos mantenido una reunión mensual de forma constante, excepto los meses de julio y agosto y diciembre – un total de unas 45 reuniones.

Inicialmente cambiamos de sede varias veces, hasta que encontramos un sitio en donde reunirnos de forma estable en un aula de la Escuela de Ciencias de la UNED, donde estuvimos los tres primeros años aproximadamente. Fue aquí donde el grupo forjó su futuro. Cubrimos muchos de los temas emergentes que en la Comunidad de R se venían tratando: análisis de redes sociales, representación espacial (mapas), y diferentes tipos de análisis sobre conjuntos abiertos.


Desde un primer momento, acordamos grabar todas las reuniones en video y ser muy consistentes en hacer accesible el material presentado (video y presentaciones).

Después de esta primera época, el salto que nos permitió conseguir mayor visibilidad y notoriedad fue el utilizar el portal de Meetup y conseguir una sede más céntrica en Madrid.

Meetup por un lado, nos puso en contacto inmediato con otras personas con el mismo tipo de interés y el celebrar las reuniones en un espacio dedicado a las nuevas tecnologías (MediaLab Prado), promovido por el Ayuntamiento de Madrid nos puso en contacto con otros grupos con el mismo tipo de interés en todo lo relativo a los datos: Periodistas de Datos, Analytics, Usuarios de Python, etc.

Curiosamente, el entrar en Meetup fue también una necesidad cuando nos presentamos para conseguir la ayuda que a los diferentes grupos de usuarios de R recibían de Revolution Analytics. Esta esponsorización nos ha ayudado a mantener el grupo en Meetup y el poder alojar todos los videos en Vimeo.

Ahora que R se ha convertido en un lenguaje de gran éxito y tracción, el grupo sigue evolucionando: El Big Data ya está con nosotros, compartir las experiencias de haber participado en Kaggle, la estadística bayesiana, etc.

Igualmente esta evolución se ha producido en el perfil de los asistentes: comenzamos a ver presentaciones de empresas, y afortunadamente es mucha la gente joven entre los asistentes y los que presentan.

De la experiencia acumulada en estos años, a aquellos que quieran crear su propio grupo, les daríamos estas recomendaciones:

Mantener la consistencia, la periodicidad mensual es la más ajustada. Los asistentes valoran mantener la regularidad. Utilizar Meetup se ha demostrado como un elemento clave del éxito por la visibilidad que ofrece y por el alcance a otros grupos y usuarios con los mismos intereses. Otro elemento clave para darse a conocer y ampliar el alcance del grupo ha sido el participar en reuniones de otras comunidades: Periodistas de Datos, Analytics, Usuarios de Python, etc. Ser rigurosos en el anuncio de las reuniones con cierta antelación y en compartir el material presentado. El grabar las sesiones en video (usamos para ello un trípode y un Smartphone) también ha ayudado a mantener una comunidad fiel.

Hemos hecho mucho, pero sin duda lo mejor está todavía por llegar.

Leer noticiaoriginal en www.r-bloggers.com

EIDUM: Métodos de análisis de datos multivariantes

fernandoPS

La segunda semana de marzo comienza el curso de EIDUM “Métodos de análisis de datos multivariantes.”. Consiste en tres sesiones,con un solo grupo. Se imparte en el aula Mangel de ATICA.

Aulas

Destinatarios

El curso está dirigido a alumnos de doctorado con conocimientos básicos en R y elaboración de informes y documentos sencillos en Rmarkdown. En su caso es recomendable haber realizado los cursos de Introducción a R y Rstudio, Procedimientos para la elaboración de informes y documentos científico-técnicos, Representación y tabulación de datos, o tener los conocimientos considerados en estos cursos.

En el curso abordará las técnicas de análisis de datos multivariantes evitando en lo posible los aspectos más formales, abordando las cuestiones desde un punto de vista eminentemente práctico. Se estudiarán las técnicas de ordenación y clasificación más habituales sus aplicaciones y ejemplos prácticos. Finalmente se hará una introducción a las técnicas de aprendizaje automatizado (machine learning), así como al empleo de curvas ROC y sus aplicaciones.

Competencias

  • Ser capaz de identificar la naturaleza del problema multivariante a abordar y las técnicas a aplicar
  • Ser capaz de realizar una clasificación e interpretar los resultados identificando las características de los grupos obtenidos.
  • Ser capaz de realizar una ordenación e interpretar los resultados
    describiendo el significado de los ejes obtenidos.
  • Ser capaz de leer un informe de resultados de una análisis realizado por una técnica de aprendizaje automático.

Contenidos

  1. Técnicas de ordenación: Análisis de componentes principales
  2. Técnicas de ordenación: Análisis de correspondencias
  3. Técnicas de ordenación: Escalado multidimensional
  4. Técnicas de ordenación: Análisis factorial
  5. Técnicas de clasificación: Clasificación no jerárquica: algoritmo k-means
  6. Técnicas de clasificación: Clasificación jerárquica: Elaboración de dendrogramas
  7. Curvas ROC usos e interpretación
  8. Introducción al aprendizaje automatizado

Resultados de aprendizaje

  • Conocer las más habituales técnicas multivariantes existentes.
  • Saber aplicar las técnicas multivariantes con R.
  • Ser capaz de interpretar y elaborar informes de los resultados.
  • Saber aplicar los fundamentos del aprendizaje automatizado para el diseño de análisis.
  • Ser capaz de construir en R una curva ROC e interpretar el resultado.
  • Ser capaz de combinar los resultados de distintos análisis multivariantes. para mejorar la interpretación de los resultados.

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

pca 00rteam

EIDUM: Representación y tabulación de datos con R

elvirax-pizarra

La segunda semana de marzo comienza el curso de EIDUM “Representación y tabulación de datos.”.

Consiste en tres sesiones, y hay dos grupos diferentes, es necesario que se desde el Aula virtual se seleccione uno de los dos grupos. El horario es de 16:00 a 20:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

Se imparte en el aula Mangel de ATICA y la Bisbita de la facultad de Biología.

Destinatarios/as

Alumnos y alumnas de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a quienes se interesen por avanzar en tareas de gestión de datos, y en su caso, en el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos; en especial, a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración de una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos.
Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Sigue leyendo

El banco de Nueva Zelanda sustituye SAS por R

El banco Heartland Bank, de Nueva Zelanda, decidió utilizar técnicas de análisis de datos para evaluar las líneas de crédito, analizar riesgos y comprender los flujos de efectivo.

Comenzaron utilizando el sistema SAS, usual en estos ambientes, pero pronto se dieron cuenta de que este sistema era complicado y consumía mucho tiempo y recursos, sobretodo cuando trataban de actualizar los modelos financieros.

Así, el Heartland Bank reemplazó a SAS por servidores de R y SQL Server, y a adoptó R como su plataforma de análisis de datos. Heartland utiliza ahora R para diferentes procesos como el desarrollo de tarjetas de crédito, el análisis de atrasos y la previsión de inversiones, entre otros.

Además, su uso ha generado una nueva forma de trabajar los datos dentro de la empresa, ahora son los propios empresarios del banco quienes utilizan R para trabajar directamente con los nuevos modelos de datos, en lugar de depender de TI para producir informes. Así los empleados tienen acceso a información en tiempo real.

Pueden ver el artículo completo aquí.