Archivos de la categoría Software

R en la formación del profesorado de la Región de Murcia

Se ha publicado en el marco de la formación permanente del profesorado para el próximo curso la Resolución de la Directora General de Planificación Educativa y Recursos humanos, de la Consejería de Educación, Juventud y Deportes de la Región de Murcia, por la que se aprueba, el Plan Regional de Formación Permanente del profesorado del curso 2017–2018 (pdf).

Concretamente en su página tres del Anexo I (página 11 del pdf): Propuesta del Plan Regional de Formación Permanente del Profesorado del curso 2017–2018 en su apartado A), Acciones formativas para los distintos puestos docentes, incluye:

  • Modalidad: Curso

  • Título: Introducción al software estadístico R. Aplicaciones en el aula.

  • Destinatarios. Profesorado de centros educativos sostenidos con fondos públicos de la Región de Murcia: Matemáticas, Ciencias y Tecnología.

  • Horas: 25

Algunas ideas para el uso de git y bookdown en la elaboración de memorias e informes

La edición de datos y la salvaguardia del trabajo mediante copias de seguridad de los materiales son los procesos inevitables en el trabajo cotidiano.

Para resolver la preparación de documentos podemos recurrir a la elaboración de elegantes texto con markdown. Para documentos largos, memorias de tesis, trabajos de fin de grado o máster puede resultar muy conveniente a la suma de potentes herramientas como son kntir + pandoc + git + rmarkdow + bookdown.

Para cerrar este curso 2016/17 hemos preparado un taller destinado a aquello que ya tiene algunos conocimientos y práctica con rstudio+knitr con dos partes:

  • Git para tejedores: Introducción al uso de control de versiones git en el marco de RStudio (1h)

  • Bookdown: cómo preparar una memoria de tesis o científico-técnica sin morir en el intento (1h)

Tendrá lugar:

el próximo 14 de julio de 12.00 a 14.00

en la Sala de Vídeo de la Facultad de Biología

Desafortunadamente el aforo es limitado, quien quiera asistir al seminario debe remitir un correo a palazon@um.es

Más empresas que emplean R en entornos de producción

Aquí os dejamos un pequeño resumen de algunos casos, publicados recientemente en el portal Microsoft Customer Stories, de ejemplos de empresas que empleann R en entornos de producción…

La información original podéis leerla en: www.r-bloggers.com

  • eToro, the social trading network, uses Microsoft R Server and Azure Machine Learning so that investors can automatically duplicate market strategies and actual investment decisions of successful traders in the eToro network to use in their own portfolios.

  • Acxiom, the marketing analytics company, is using SQL Server R Services to build more accurate models using larger data sets, which results in more precisely targeted marketing for customers.

  • Merck, the pharmaceutical company, is using Microsoft R Server for Hadoop to analyze the various factors that affect the cold chain such as origin, destination, shipment route, external weather, and logistics providers. With an improved temperature-controlled supply route, Merck can reduce wastage caused by temperature fluctuations.

  • PROS, the dynamic pricing software company, uses Microsoft Azure and Microsoft SQL Server 2016 with R Services to to keep up-to-the-minute pricing accurate, competitive, and profitable.

  • WorldSmart, the retail technology specialist, uses Azure Stream Analytics services and Microsoft R Server to drive several of its Machine Learning forecasts and analysis.

  • dv01, the financial reporting and analytics platform, uses Microsoft SQL Server 2016 running on Azure Virtual Machines and R to bring greater transparency to the consumer lending market.

  • Heartland Bank, in New Zealand, replaced SAS with Microsoft R Server and SQL Server to analyze risk, evaluate credit lines, and understand cash flows.

useR!2017 en Bruselas del 4 al 7 de julio.

The full schedule of talks for useR!2017, the global R user conference, has now been posted. The conference will feature 16 tutorials, 6 keynotes, 141 full talks, and 86 lightning talks starting on July 5 in Brussels. That’s a lot to fir into 4 days, but I’m especially looking forward to the keynote presentations:

  • 20 years of CRAN (Uwe Ligges)
  • Parallel Computation in R: What We Want, and How We (Might) Get It (Norm Matloff)
  • Structural Equation Modeling: models, software and stories (Yves Roseel)
  • Teaching data science to new useRs (Mine Cetinkaya-Rundel)
  • Dose-response analysis: considering dose both as qualitative factor and quantitative covariate using R (Ludwig Hothorn)
  • R tools for the analysis of complex heterogeneous data (Isabella Gollini)

[…] leer la entrada completa en Rbloggers

I hope you can attend too! Registration is still open if you’d like to join in. You can find the complete schedule linked below.

Sched: useR!2017

IX Jornadas de Usuarios de R. Granada

Web de las IX Jornadas de R en Granada

Web de las IX Jornadas de R en Granada

Ya tenemos anuncio de las IX Jornadas de Usuarios de R, que este año se celebrarán en Granada los días 16 y 17 de noviembre.

La web de las jornadas ya está disponible en la dirección http://r-es.org/9jornadasR donde podéis encontrar toda la información sobre envío de comunicaciones, reservas, programa, etc.

Desde este Servicio os animamos a asistir, ya que, es una muy buena oportunidad de ver cómo utilizan R en otras disciplinas y conocer gente.

Aquí os dejamos el correo que hace unos días envío la Asociación R-Hispano.

La Asociación R-Hispano tiene el placer de anunciar la celebración de las IX Jornadas de Usuarios de R. En esta ocasión, será la Universidad de Granada , en la ETS de Ingenierías Informática y de Telecomunicación, quien acoja las Jornadas los días 16 y 17 de noviembre de 2017.

El objetivo de las Jornadas es proporcionar un punto de encuentro a la diversidad de usuarios de R por lo que, independientemente de la filiación o del área de trabajo o investigación, todo usuario de R es bienvenido.

Como en años anteriores, la presentación de trabajos en las Jornadas puede ser en forma de Presentación oral, en distintas sesiones paralelas, que reflejen el amplio abanico de análisis de datos mediante R, Póster, en una sesión específica, o como un Taller que permita profundizar en aspectos interesantes y menos conocidos de R.

El envío de trabajos ha de hacerse a través de enlace a easychair habilitado en la web del congreso en http://r-es.org/9jornadasR/. En esta edición de las Jornadas también se otorgará un premio al mejor trabajo presentado por un investigador joven (ver bases en la web de las Jornadas).

Finalmente, queremos agradecer la colaboración de nuestros patrocinadores, sin los que las Jornadas no serían posible. Si tú o tu institución estáis interesados en patrocinar las Jornadas puedes consultar cómo hacerlo en http://r-es.org/9jornadasR/.

Las fechas importantes son:

EIDUM: Métodos de contraste de hipótesis y diseño de experimentos

Después de las fiestas de primavera comienza un nuevo curso de EIDUM: “Métodos de contraste de hipótesis y diseño de experimentos”.

Son dos sesiones (dos semanas) y hemos abierto dos grupos.

Destinatarios

Para cualquier investigador resulta básico la lectura y la generación de documentación donde se encuentran detallados los procedimientos de análisis estadístico. En este curso se plantea como objetivo general proporcionar a los participantes la capacidad práctica para abordar un estudio estadístico basado en el contraste de hipótesis. De forma práctica se abordarán, especialmente, tanto el análisis de la varianza (ANOVA) como la realización de análisis lineal (regresión lineal), pasando por otros aspectos relevantes y test más habituales.

Se trata de un curso eminentemente práctico y es imprescindible tener conocimientos de R (en particular de tabulación y representación gráfica de datos) y del uso de investigación reproducible.

Competencias

  • Se capaz de realizar adecuadamente un análisis de la varianza con R e interpretar los resultados obtenidos.
  • Se capaz de realizar adecuadamente un análisis de regresión con R e interpretar los resultados obtenidos.
  • Ser capaz de evaluar la adecuación de los principales test estadísticos a los problemas y los casos prácticos más frecuentes.

Contenidos

  1. Conceptos y distribuciones de probabilidad aplicados al contraste de hipótesis. El teorema del límite central. Los intervalos de confianza de un estadístico y los tipos de variables.
  2. Introducción a la aplicación de los contrastes de hipótesis y las situaciones de aplicación.
  3. Pruebas de diferencias de poblaciones (t, $\chi^2$ y ANOVA).
  4. Modelos de respuesta (el modelo lineal y otros modelos).

Resultados de aprendizaje

  • Capacidad de uso de los conceptos de probabilidad, las pruebas estadísticas, el contrastes de hipótesis y la significación en la elaboración de los datos propios y en la lectura crítica de documentación técnica.

  • Identificar las situaciones más frecuentes en el diseño de experimentos y sus soluciones.

  • Realización de protocolos de análisis con R y uso de análisis reproducible para elaborar informes de resultados.

Linux Foundation amplía su oferta de cursos gratuitos

¿Te gustaría iniciarte en tecnologías relacionadas con Linux o bien aprender sus conceptos básicos? Linux Foundation se alió hace tiempo con edX para ofrecer cursos orientados en esa dirección, abarcando los fundamentos del sistema y con un fuerte enfoque en el Cloud Computing (destacando OpenStack), ya que dicho campo está destinado a jugar un papel muy importante en la computación profesional del futuro.

En esta ocasión vamos a aprovechar para mencionar los cursos gratuitos ofrecidos actualmente por Linux Foundation, a los cuales se puede acceder durante un año. Es difícil encontrar un curso profundo y de nivel gratuito, por lo que casi todos los mencionados aquí son introductorios. Aun así, estos contenidos no están orientados a personas recién iniciadas en la informática, sino a aquellas que ya tengan ciertos conocimientos sobre la materia. Dicho de otra forma, se necesitaría ser al menos un usuario avanzado (y en algunos casos posiblemente ni eso sea suficiente) para poder entender las materias impartidas en estos cursos gratuitos. Por otro lado, se requiere saber inglés, idioma “oficial” de la informática, más cuando hablamos de cosas que van más allá de las tareas comunes.

Los cursos gratuitos ofrecidos actualmente por Linux Foundation, la mayoría de estos a través de edX: seguir leyendo en www.muylinux.com

Donald Knuth

Donald Knuth (imagen tomada de Wikipedia)

Quizá a algunos os suene el nombre de Donald Knuth. Uno de los padres de la informática moderna y creador, entre otras cosas, del sistema de tipografía TeX (en el que se basan otros sistemas como LaTeX).

Pues bien, hace unos días se publicó en Magnet (Xataka) una breve entrada sobre él que os recomendamos desde la Sección de Apoyo Estadístico. La entrada no es muy larga pero hace un breve repaso sobre su vida y sus obras más conocidas The Art of Computer Programming y TeX. Además, se cuentan algunas curiosidades y anécdotas interesantes, por lo que se hace una lectura muy amena.

Así que, sin más, aquí os dejamos la entrada. Esperamos que la disfrutéis.

El grupo de usuarios de R de Madrid

Interesante post de r-bloggers sobre el origen del Grupo de usuarios de R de Madrid

En la primera reunión éramos 5, ahora somos más de 60 y de forma consistente. No nos costó mucho poner en marcha el grupo de usuarios de R de Madrid. A través de la propia lista de ayuda R-help-es los que solíamos responder de forma más habitual a las dudas de esta nueva comunidad (Gregorio Serrano, Carlos Gil Bellosta, Pedro Concejero y Carlos Ortega), acordamos juntarnos por primera vez. Fue en marzo de 2012, nos juntamos en un aula de la Facultad de Economia de uno de los Campus de Madrid. Hablamos de: a) Cómo modelizar diferentes estrategias de trading con R, b) Cómo modelizar el número de bugs presentes en el código R, y c) la presentación de una librería para crear gráficos espaciales del mapa de España.

El grupo de Usuarios de R de Madrid, nació como grupo promovido por la Asociación de R de España. La Asociación nos permitió alojar las agendas de nuevas convocatorias y el contenido generado en las reuniones en un espacio de su portal online. Este punto ayudó a dotar de un punto inicial de credibilidad sobre el grupo.

A partir de este momento, hemos mantenido una reunión mensual de forma constante, excepto los meses de julio y agosto y diciembre – un total de unas 45 reuniones.

Inicialmente cambiamos de sede varias veces, hasta que encontramos un sitio en donde reunirnos de forma estable en un aula de la Escuela de Ciencias de la UNED, donde estuvimos los tres primeros años aproximadamente. Fue aquí donde el grupo forjó su futuro. Cubrimos muchos de los temas emergentes que en la Comunidad de R se venían tratando: análisis de redes sociales, representación espacial (mapas), y diferentes tipos de análisis sobre conjuntos abiertos.


Desde un primer momento, acordamos grabar todas las reuniones en video y ser muy consistentes en hacer accesible el material presentado (video y presentaciones).

Después de esta primera época, el salto que nos permitió conseguir mayor visibilidad y notoriedad fue el utilizar el portal de Meetup y conseguir una sede más céntrica en Madrid.

Meetup por un lado, nos puso en contacto inmediato con otras personas con el mismo tipo de interés y el celebrar las reuniones en un espacio dedicado a las nuevas tecnologías (MediaLab Prado), promovido por el Ayuntamiento de Madrid nos puso en contacto con otros grupos con el mismo tipo de interés en todo lo relativo a los datos: Periodistas de Datos, Analytics, Usuarios de Python, etc.

Curiosamente, el entrar en Meetup fue también una necesidad cuando nos presentamos para conseguir la ayuda que a los diferentes grupos de usuarios de R recibían de Revolution Analytics. Esta esponsorización nos ha ayudado a mantener el grupo en Meetup y el poder alojar todos los videos en Vimeo.

Ahora que R se ha convertido en un lenguaje de gran éxito y tracción, el grupo sigue evolucionando: El Big Data ya está con nosotros, compartir las experiencias de haber participado en Kaggle, la estadística bayesiana, etc.

Igualmente esta evolución se ha producido en el perfil de los asistentes: comenzamos a ver presentaciones de empresas, y afortunadamente es mucha la gente joven entre los asistentes y los que presentan.

De la experiencia acumulada en estos años, a aquellos que quieran crear su propio grupo, les daríamos estas recomendaciones:

Mantener la consistencia, la periodicidad mensual es la más ajustada. Los asistentes valoran mantener la regularidad. Utilizar Meetup se ha demostrado como un elemento clave del éxito por la visibilidad que ofrece y por el alcance a otros grupos y usuarios con los mismos intereses. Otro elemento clave para darse a conocer y ampliar el alcance del grupo ha sido el participar en reuniones de otras comunidades: Periodistas de Datos, Analytics, Usuarios de Python, etc. Ser rigurosos en el anuncio de las reuniones con cierta antelación y en compartir el material presentado. El grabar las sesiones en video (usamos para ello un trípode y un Smartphone) también ha ayudado a mantener una comunidad fiel.

Hemos hecho mucho, pero sin duda lo mejor está todavía por llegar.

Leer noticiaoriginal en www.r-bloggers.com

EIDUM: Métodos de análisis de datos multivariantes

fernandoPS

La segunda semana de marzo comienza el curso de EIDUM “Métodos de análisis de datos multivariantes.”. Consiste en tres sesiones,con un solo grupo. Se imparte en el aula Mangel de ATICA.

Aulas

Destinatarios

El curso está dirigido a alumnos de doctorado con conocimientos básicos en R y elaboración de informes y documentos sencillos en Rmarkdown. En su caso es recomendable haber realizado los cursos de Introducción a R y Rstudio, Procedimientos para la elaboración de informes y documentos científico-técnicos, Representación y tabulación de datos, o tener los conocimientos considerados en estos cursos.

En el curso abordará las técnicas de análisis de datos multivariantes evitando en lo posible los aspectos más formales, abordando las cuestiones desde un punto de vista eminentemente práctico. Se estudiarán las técnicas de ordenación y clasificación más habituales sus aplicaciones y ejemplos prácticos. Finalmente se hará una introducción a las técnicas de aprendizaje automatizado (machine learning), así como al empleo de curvas ROC y sus aplicaciones.

Competencias

  • Ser capaz de identificar la naturaleza del problema multivariante a abordar y las técnicas a aplicar
  • Ser capaz de realizar una clasificación e interpretar los resultados identificando las características de los grupos obtenidos.
  • Ser capaz de realizar una ordenación e interpretar los resultados
    describiendo el significado de los ejes obtenidos.
  • Ser capaz de leer un informe de resultados de una análisis realizado por una técnica de aprendizaje automático.

Contenidos

  1. Técnicas de ordenación: Análisis de componentes principales
  2. Técnicas de ordenación: Análisis de correspondencias
  3. Técnicas de ordenación: Escalado multidimensional
  4. Técnicas de ordenación: Análisis factorial
  5. Técnicas de clasificación: Clasificación no jerárquica: algoritmo k-means
  6. Técnicas de clasificación: Clasificación jerárquica: Elaboración de dendrogramas
  7. Curvas ROC usos e interpretación
  8. Introducción al aprendizaje automatizado

Resultados de aprendizaje

  • Conocer las más habituales técnicas multivariantes existentes.
  • Saber aplicar las técnicas multivariantes con R.
  • Ser capaz de interpretar y elaborar informes de los resultados.
  • Saber aplicar los fundamentos del aprendizaje automatizado para el diseño de análisis.
  • Ser capaz de construir en R una curva ROC e interpretar el resultado.
  • Ser capaz de combinar los resultados de distintos análisis multivariantes. para mejorar la interpretación de los resultados.

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

pca 00rteam