Archivo del Autor: amaurandi

useR!2017 en Bruselas del 4 al 7 de julio.

The full schedule of talks for useR!2017, the global R user conference, has now been posted. The conference will feature 16 tutorials, 6 keynotes, 141 full talks, and 86 lightning talks starting on July 5 in Brussels. That’s a lot to fir into 4 days, but I’m especially looking forward to the keynote presentations:

  • 20 years of CRAN (Uwe Ligges)
  • Parallel Computation in R: What We Want, and How We (Might) Get It (Norm Matloff)
  • Structural Equation Modeling: models, software and stories (Yves Roseel)
  • Teaching data science to new useRs (Mine Cetinkaya-Rundel)
  • Dose-response analysis: considering dose both as qualitative factor and quantitative covariate using R (Ludwig Hothorn)
  • R tools for the analysis of complex heterogeneous data (Isabella Gollini)

[…] leer la entrada completa en Rbloggers

I hope you can attend too! Registration is still open if you’d like to join in. You can find the complete schedule linked below.

Sched: useR!2017

EIDUM: Métodos de contraste de hipótesis y diseño de experimentos

Después de las fiestas de primavera comienza un nuevo curso de EIDUM: “Métodos de contraste de hipótesis y diseño de experimentos”.

Son dos sesiones (dos semanas) y hemos abierto dos grupos.

Destinatarios

Para cualquier investigador resulta básico la lectura y la generación de documentación donde se encuentran detallados los procedimientos de análisis estadístico. En este curso se plantea como objetivo general proporcionar a los participantes la capacidad práctica para abordar un estudio estadístico basado en el contraste de hipótesis. De forma práctica se abordarán, especialmente, tanto el análisis de la varianza (ANOVA) como la realización de análisis lineal (regresión lineal), pasando por otros aspectos relevantes y test más habituales.

Se trata de un curso eminentemente práctico y es imprescindible tener conocimientos de R (en particular de tabulación y representación gráfica de datos) y del uso de investigación reproducible.

Competencias

  • Se capaz de realizar adecuadamente un análisis de la varianza con R e interpretar los resultados obtenidos.
  • Se capaz de realizar adecuadamente un análisis de regresión con R e interpretar los resultados obtenidos.
  • Ser capaz de evaluar la adecuación de los principales test estadísticos a los problemas y los casos prácticos más frecuentes.

Contenidos

  1. Conceptos y distribuciones de probabilidad aplicados al contraste de hipótesis. El teorema del límite central. Los intervalos de confianza de un estadístico y los tipos de variables.
  2. Introducción a la aplicación de los contrastes de hipótesis y las situaciones de aplicación.
  3. Pruebas de diferencias de poblaciones (t, $\chi^2$ y ANOVA).
  4. Modelos de respuesta (el modelo lineal y otros modelos).

Resultados de aprendizaje

  • Capacidad de uso de los conceptos de probabilidad, las pruebas estadísticas, el contrastes de hipótesis y la significación en la elaboración de los datos propios y en la lectura crítica de documentación técnica.

  • Identificar las situaciones más frecuentes en el diseño de experimentos y sus soluciones.

  • Realización de protocolos de análisis con R y uso de análisis reproducible para elaborar informes de resultados.

Linux Foundation amplía su oferta de cursos gratuitos

¿Te gustaría iniciarte en tecnologías relacionadas con Linux o bien aprender sus conceptos básicos? Linux Foundation se alió hace tiempo con edX para ofrecer cursos orientados en esa dirección, abarcando los fundamentos del sistema y con un fuerte enfoque en el Cloud Computing (destacando OpenStack), ya que dicho campo está destinado a jugar un papel muy importante en la computación profesional del futuro.

En esta ocasión vamos a aprovechar para mencionar los cursos gratuitos ofrecidos actualmente por Linux Foundation, a los cuales se puede acceder durante un año. Es difícil encontrar un curso profundo y de nivel gratuito, por lo que casi todos los mencionados aquí son introductorios. Aun así, estos contenidos no están orientados a personas recién iniciadas en la informática, sino a aquellas que ya tengan ciertos conocimientos sobre la materia. Dicho de otra forma, se necesitaría ser al menos un usuario avanzado (y en algunos casos posiblemente ni eso sea suficiente) para poder entender las materias impartidas en estos cursos gratuitos. Por otro lado, se requiere saber inglés, idioma “oficial” de la informática, más cuando hablamos de cosas que van más allá de las tareas comunes.

Los cursos gratuitos ofrecidos actualmente por Linux Foundation, la mayoría de estos a través de edX: seguir leyendo en www.muylinux.com

El día de 3.14159265359… (o casi)

]1 J. Gabás Esteban (Flickr)

Lucas Fos es un niño que estudia 5º de Primaria en un colegio de Valencia. En sus ratos libres, el joven comparte en YouTube tutoriales de videojuegos o la forma de resolver un cubo Rubik. Los más de 20.000 suscriptores de su canal Megasuperluc4s seguramente se sorprendieron cuando hace dos semanas el niño subió un nuevo vídeo en el que explicaba cómo calcular el número Pi utilizando solo sus pies. Fos es uno de los ganadores del concurso “Sin π no soy nada” gracias a la creatividad e imaginación que ha demostrado con su propuesta audiovisual.

Seguir leyendo en https://hipertextual.com

El grupo de usuarios de R de Madrid

Interesante post de r-bloggers sobre el origen del Grupo de usuarios de R de Madrid

En la primera reunión éramos 5, ahora somos más de 60 y de forma consistente. No nos costó mucho poner en marcha el grupo de usuarios de R de Madrid. A través de la propia lista de ayuda R-help-es los que solíamos responder de forma más habitual a las dudas de esta nueva comunidad (Gregorio Serrano, Carlos Gil Bellosta, Pedro Concejero y Carlos Ortega), acordamos juntarnos por primera vez. Fue en marzo de 2012, nos juntamos en un aula de la Facultad de Economia de uno de los Campus de Madrid. Hablamos de: a) Cómo modelizar diferentes estrategias de trading con R, b) Cómo modelizar el número de bugs presentes en el código R, y c) la presentación de una librería para crear gráficos espaciales del mapa de España.

El grupo de Usuarios de R de Madrid, nació como grupo promovido por la Asociación de R de España. La Asociación nos permitió alojar las agendas de nuevas convocatorias y el contenido generado en las reuniones en un espacio de su portal online. Este punto ayudó a dotar de un punto inicial de credibilidad sobre el grupo.

A partir de este momento, hemos mantenido una reunión mensual de forma constante, excepto los meses de julio y agosto y diciembre – un total de unas 45 reuniones.

Inicialmente cambiamos de sede varias veces, hasta que encontramos un sitio en donde reunirnos de forma estable en un aula de la Escuela de Ciencias de la UNED, donde estuvimos los tres primeros años aproximadamente. Fue aquí donde el grupo forjó su futuro. Cubrimos muchos de los temas emergentes que en la Comunidad de R se venían tratando: análisis de redes sociales, representación espacial (mapas), y diferentes tipos de análisis sobre conjuntos abiertos.


Desde un primer momento, acordamos grabar todas las reuniones en video y ser muy consistentes en hacer accesible el material presentado (video y presentaciones).

Después de esta primera época, el salto que nos permitió conseguir mayor visibilidad y notoriedad fue el utilizar el portal de Meetup y conseguir una sede más céntrica en Madrid.

Meetup por un lado, nos puso en contacto inmediato con otras personas con el mismo tipo de interés y el celebrar las reuniones en un espacio dedicado a las nuevas tecnologías (MediaLab Prado), promovido por el Ayuntamiento de Madrid nos puso en contacto con otros grupos con el mismo tipo de interés en todo lo relativo a los datos: Periodistas de Datos, Analytics, Usuarios de Python, etc.

Curiosamente, el entrar en Meetup fue también una necesidad cuando nos presentamos para conseguir la ayuda que a los diferentes grupos de usuarios de R recibían de Revolution Analytics. Esta esponsorización nos ha ayudado a mantener el grupo en Meetup y el poder alojar todos los videos en Vimeo.

Ahora que R se ha convertido en un lenguaje de gran éxito y tracción, el grupo sigue evolucionando: El Big Data ya está con nosotros, compartir las experiencias de haber participado en Kaggle, la estadística bayesiana, etc.

Igualmente esta evolución se ha producido en el perfil de los asistentes: comenzamos a ver presentaciones de empresas, y afortunadamente es mucha la gente joven entre los asistentes y los que presentan.

De la experiencia acumulada en estos años, a aquellos que quieran crear su propio grupo, les daríamos estas recomendaciones:

Mantener la consistencia, la periodicidad mensual es la más ajustada. Los asistentes valoran mantener la regularidad. Utilizar Meetup se ha demostrado como un elemento clave del éxito por la visibilidad que ofrece y por el alcance a otros grupos y usuarios con los mismos intereses. Otro elemento clave para darse a conocer y ampliar el alcance del grupo ha sido el participar en reuniones de otras comunidades: Periodistas de Datos, Analytics, Usuarios de Python, etc. Ser rigurosos en el anuncio de las reuniones con cierta antelación y en compartir el material presentado. El grabar las sesiones en video (usamos para ello un trípode y un Smartphone) también ha ayudado a mantener una comunidad fiel.

Hemos hecho mucho, pero sin duda lo mejor está todavía por llegar.

Leer noticiaoriginal en www.r-bloggers.com

EIDUM: Métodos de análisis de datos multivariantes

fernandoPS

La segunda semana de marzo comienza el curso de EIDUM “Métodos de análisis de datos multivariantes.”. Consiste en tres sesiones,con un solo grupo. Se imparte en el aula Mangel de ATICA.

Aulas

Destinatarios

El curso está dirigido a alumnos de doctorado con conocimientos básicos en R y elaboración de informes y documentos sencillos en Rmarkdown. En su caso es recomendable haber realizado los cursos de Introducción a R y Rstudio, Procedimientos para la elaboración de informes y documentos científico-técnicos, Representación y tabulación de datos, o tener los conocimientos considerados en estos cursos.

En el curso abordará las técnicas de análisis de datos multivariantes evitando en lo posible los aspectos más formales, abordando las cuestiones desde un punto de vista eminentemente práctico. Se estudiarán las técnicas de ordenación y clasificación más habituales sus aplicaciones y ejemplos prácticos. Finalmente se hará una introducción a las técnicas de aprendizaje automatizado (machine learning), así como al empleo de curvas ROC y sus aplicaciones.

Competencias

  • Ser capaz de identificar la naturaleza del problema multivariante a abordar y las técnicas a aplicar
  • Ser capaz de realizar una clasificación e interpretar los resultados identificando las características de los grupos obtenidos.
  • Ser capaz de realizar una ordenación e interpretar los resultados
    describiendo el significado de los ejes obtenidos.
  • Ser capaz de leer un informe de resultados de una análisis realizado por una técnica de aprendizaje automático.

Contenidos

  1. Técnicas de ordenación: Análisis de componentes principales
  2. Técnicas de ordenación: Análisis de correspondencias
  3. Técnicas de ordenación: Escalado multidimensional
  4. Técnicas de ordenación: Análisis factorial
  5. Técnicas de clasificación: Clasificación no jerárquica: algoritmo k-means
  6. Técnicas de clasificación: Clasificación jerárquica: Elaboración de dendrogramas
  7. Curvas ROC usos e interpretación
  8. Introducción al aprendizaje automatizado

Resultados de aprendizaje

  • Conocer las más habituales técnicas multivariantes existentes.
  • Saber aplicar las técnicas multivariantes con R.
  • Ser capaz de interpretar y elaborar informes de los resultados.
  • Saber aplicar los fundamentos del aprendizaje automatizado para el diseño de análisis.
  • Ser capaz de construir en R una curva ROC e interpretar el resultado.
  • Ser capaz de combinar los resultados de distintos análisis multivariantes. para mejorar la interpretación de los resultados.

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

pca 00rteam

EIDUM: Representación y tabulación de datos con R

elvirax-pizarra

La segunda semana de marzo comienza el curso de EIDUM “Representación y tabulación de datos.”.

Consiste en tres sesiones, y hay dos grupos diferentes, es necesario que se desde el Aula virtual se seleccione uno de los dos grupos. El horario es de 16:00 a 20:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

Se imparte en el aula Mangel de ATICA y la Bisbita de la facultad de Biología.

Destinatarios/as

Alumnos y alumnas de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a quienes se interesen por avanzar en tareas de gestión de datos, y en su caso, en el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos; en especial, a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración de una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos.
Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Sigue leyendo

Diferencias entre R y Excel o Calc

Si empelas Calc o Excel (o cualquier otra hoja de cálculo), la adaptación para aprender y usar R puede ser difícil. Como explica este post de Gordon Shotwell, una de las razones es que las cosas simples pueden ser más difíciles de hacer en R que Excel. Pero vale la pena perseverar, porque las cosas complejas pueden ser más fáciles.

Dificultad vs. complejidad

Mientras que Excel o Calc es muy bueno cosas como la aritmética y las tabulaciones, el enfoque programático de R introduce conceptos como estructuras de datos, iteración y funciones. Una vez que se ha hecho la inversión en tiempo para aprender R, estas abstracciones hacen que la reducción de tareas complejas en pasos discretos posibles, y la automatización de tareas similares repetidas mucho más fácil.

EIDUM: Introduccción a R y Rstudio para el análisis de datos

aurora-ant

Carga del curso

Número de horas de dedicación del estudiante:

  • Actividad presenciales (talleres): 12 horas (3 talleres de 4h)
  • Actividad personal: 18 horas

Destinatarios

Este curso va dirigido a los investigadores que requieren de herramientas para la manipulación de datos o han de utilizar métodos de análisis de datos. Esencialmente es un curso básico del lenguaje estadístico R y sus capacidades para manejar información cuantitativa y cualitativa, representación de datos y una introducción al uso de su amplísimo catálogo de funciones, que en la actualidad supera de largo el millón y medio. Entender los procedimientos de trabajo de los programas estadísticos y la metodología para preparar los datos y desarrollar protocolos de trabajo es uno de los aspectos básicos en la formación de un doctorando, si no posees estos conocimientos este curso es para ti; también, si sólo necesitas realizar tareas repetitivas para procesar información preparando tablas o gráficos. Es muy aconsejable haber realizado previamente el curso de Procedimientos para la elaboración de informes y documentos científico-técnicos, en su defecto conocer la elaboración de textos con rmarkdown.

Competencias

  • Utilizar con fluidez la terminal y manejar la interfaz básica de R.
  • Aprovechar las características los principales elementos, así como el fundamento, de la sintaxis de R.
  • Elaborar procedimientos básico de trabajo con R.
  • Resolver los problemas derivados de los mensajes de error del sistema.
  • Aprovechar las capacidades de R para generar documentos de investigación reproducible.

Resultados de aprendizaje

Ser capaz de instalar y utilizar el software libre R y Rstudio Disponer de procedimientos de trabajo para abordar el análisis para un conjunto de datos Saber elaborar procedimientos básicos para el tratamiento de datos Ser capaz de aplicar protocolos predefinidos de análisis con R Saber reutilizar protocolos conocidos o parte de ellos para resolver nuevos problemas Elaborar informes reproducibles

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

Agenda del curso

Todas las sesiones del curso, se realizarán durante el año 2017. El horario de los grupos 1 y 2 es de 16:00 a 20:00, el grupo 3 tiene horario de mañana, 9:30 a 13:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

calendario

EIDUM: Procedimientos para la elaboración de informes y documentos científico-técnicos

Prof. Laura del Río

Prof. Laura del Río

En enero comenzará el curso “Procedimientos para la elaboración de informes y documentos científico-técnicos” del programa de la Escuela Internacional de Doctorado de la Universidad de Murcia.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software recomendable proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas que evitan el trabajo manual y descargando las tareas repetitivas en el ordenador. Estas preparando la tesis doctoral y este es tu curso.

Sigue leyendo