Archivos de la categoría UMU

Algunas ideas para el uso de git y bookdown en la elaboración de memorias e informes

La edición de datos y la salvaguardia del trabajo mediante copias de seguridad de los materiales son los procesos inevitables en el trabajo cotidiano.

Para resolver la preparación de documentos podemos recurrir a la elaboración de elegantes texto con markdown. Para documentos largos, memorias de tesis, trabajos de fin de grado o máster puede resultar muy conveniente a la suma de potentes herramientas como son kntir + pandoc + git + rmarkdow + bookdown.

Para cerrar este curso 2016/17 hemos preparado un taller destinado a aquello que ya tiene algunos conocimientos y práctica con rstudio+knitr con dos partes:

  • Git para tejedores: Introducción al uso de control de versiones git en el marco de RStudio (1h)

  • Bookdown: cómo preparar una memoria de tesis o científico-técnica sin morir en el intento (1h)

Tendrá lugar:

el próximo 14 de julio de 12.00 a 14.00

en la Sala de Vídeo de la Facultad de Biología

Desafortunadamente el aforo es limitado, quien quiera asistir al seminario debe remitir un correo a palazon@um.es

EIDUM: Métodos de contraste de hipótesis y diseño de experimentos

Después de las fiestas de primavera comienza un nuevo curso de EIDUM: “Métodos de contraste de hipótesis y diseño de experimentos”.

Son dos sesiones (dos semanas) y hemos abierto dos grupos.

Destinatarios

Para cualquier investigador resulta básico la lectura y la generación de documentación donde se encuentran detallados los procedimientos de análisis estadístico. En este curso se plantea como objetivo general proporcionar a los participantes la capacidad práctica para abordar un estudio estadístico basado en el contraste de hipótesis. De forma práctica se abordarán, especialmente, tanto el análisis de la varianza (ANOVA) como la realización de análisis lineal (regresión lineal), pasando por otros aspectos relevantes y test más habituales.

Se trata de un curso eminentemente práctico y es imprescindible tener conocimientos de R (en particular de tabulación y representación gráfica de datos) y del uso de investigación reproducible.

Competencias

  • Se capaz de realizar adecuadamente un análisis de la varianza con R e interpretar los resultados obtenidos.
  • Se capaz de realizar adecuadamente un análisis de regresión con R e interpretar los resultados obtenidos.
  • Ser capaz de evaluar la adecuación de los principales test estadísticos a los problemas y los casos prácticos más frecuentes.

Contenidos

  1. Conceptos y distribuciones de probabilidad aplicados al contraste de hipótesis. El teorema del límite central. Los intervalos de confianza de un estadístico y los tipos de variables.
  2. Introducción a la aplicación de los contrastes de hipótesis y las situaciones de aplicación.
  3. Pruebas de diferencias de poblaciones (t, $\chi^2$ y ANOVA).
  4. Modelos de respuesta (el modelo lineal y otros modelos).

Resultados de aprendizaje

  • Capacidad de uso de los conceptos de probabilidad, las pruebas estadísticas, el contrastes de hipótesis y la significación en la elaboración de los datos propios y en la lectura crítica de documentación técnica.

  • Identificar las situaciones más frecuentes en el diseño de experimentos y sus soluciones.

  • Realización de protocolos de análisis con R y uso de análisis reproducible para elaborar informes de resultados.

EIDUM: Métodos de análisis de datos multivariantes

fernandoPS

La segunda semana de marzo comienza el curso de EIDUM “Métodos de análisis de datos multivariantes.”. Consiste en tres sesiones,con un solo grupo. Se imparte en el aula Mangel de ATICA.

Aulas

Destinatarios

El curso está dirigido a alumnos de doctorado con conocimientos básicos en R y elaboración de informes y documentos sencillos en Rmarkdown. En su caso es recomendable haber realizado los cursos de Introducción a R y Rstudio, Procedimientos para la elaboración de informes y documentos científico-técnicos, Representación y tabulación de datos, o tener los conocimientos considerados en estos cursos.

En el curso abordará las técnicas de análisis de datos multivariantes evitando en lo posible los aspectos más formales, abordando las cuestiones desde un punto de vista eminentemente práctico. Se estudiarán las técnicas de ordenación y clasificación más habituales sus aplicaciones y ejemplos prácticos. Finalmente se hará una introducción a las técnicas de aprendizaje automatizado (machine learning), así como al empleo de curvas ROC y sus aplicaciones.

Competencias

  • Ser capaz de identificar la naturaleza del problema multivariante a abordar y las técnicas a aplicar
  • Ser capaz de realizar una clasificación e interpretar los resultados identificando las características de los grupos obtenidos.
  • Ser capaz de realizar una ordenación e interpretar los resultados
    describiendo el significado de los ejes obtenidos.
  • Ser capaz de leer un informe de resultados de una análisis realizado por una técnica de aprendizaje automático.

Contenidos

  1. Técnicas de ordenación: Análisis de componentes principales
  2. Técnicas de ordenación: Análisis de correspondencias
  3. Técnicas de ordenación: Escalado multidimensional
  4. Técnicas de ordenación: Análisis factorial
  5. Técnicas de clasificación: Clasificación no jerárquica: algoritmo k-means
  6. Técnicas de clasificación: Clasificación jerárquica: Elaboración de dendrogramas
  7. Curvas ROC usos e interpretación
  8. Introducción al aprendizaje automatizado

Resultados de aprendizaje

  • Conocer las más habituales técnicas multivariantes existentes.
  • Saber aplicar las técnicas multivariantes con R.
  • Ser capaz de interpretar y elaborar informes de los resultados.
  • Saber aplicar los fundamentos del aprendizaje automatizado para el diseño de análisis.
  • Ser capaz de construir en R una curva ROC e interpretar el resultado.
  • Ser capaz de combinar los resultados de distintos análisis multivariantes. para mejorar la interpretación de los resultados.

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

pca 00rteam

EIDUM: Representación y tabulación de datos con R

elvirax-pizarra

La segunda semana de marzo comienza el curso de EIDUM “Representación y tabulación de datos.”.

Consiste en tres sesiones, y hay dos grupos diferentes, es necesario que se desde el Aula virtual se seleccione uno de los dos grupos. El horario es de 16:00 a 20:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

Se imparte en el aula Mangel de ATICA y la Bisbita de la facultad de Biología.

Destinatarios/as

Alumnos y alumnas de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a quienes se interesen por avanzar en tareas de gestión de datos, y en su caso, en el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos; en especial, a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración de una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos.
Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Sigue leyendo

El SAE en las VIII Jornadas de Usuarios de R

Congreso-R-Albacete-2016-GrupoMurcia Este año 2016, los del SAE y algunas personas más pudimos asistir a las VIII Jornadas de R, que esta vez se celebraron en Albacete.

Como siempre, el encuentro fue magnífico. Vimos a viejos amigos y amigas, gente que lleva acudiendo a las jornadas desde las primeras allá por el año 2009 en Murcia, e hicimos nuevos que esperamos seguir viendo en la próximas.

Es curioso constatar cómo cada vez el mundo de R, que hace pocos años era un grupúsculo de “cuasi frikis” o “visionarios”, se va ampliando. Aún así, el ambiente es aún muy familiar; acudieron unas 100 personas. Quien llega nuevo rápidamente se integra y se crea una camaradería que yo no he visto en otras reuniones científicas. Es un “congreso” en el que mucha gente dice “aquí me siento normal”, hartos de ser “el o la rarita de de R”. Es grato encontrar gente con tus aficiones y formas parecidas de entender la ciencia y, como cada vez somos más, pudimos comprobar con la charla de David Ríos Insua (RIMAS) cómo, incluso ministros del estado español, ya tienen acceso a informes hechos con R y Rstudio en LaTeX. Parece sorprendente, ¿no?

Las presentaciones y los materiales están disponibles en este enlace, incluidas nuestras 6 aportaciones.

En la asamblea de la Comunidad R Hispano que tuvo lugar, se acordó el lugar donde celebrar las siguientes: las IX Jornadas de R Granada, de la mano de José Luis Cañadas Reche. Seguro que van a estar genial. Y las X en Murcia (¡las jornadas X!). Así que tenemos citas en el calendario.

¡¡Ah!! ¡Y molan las pegatinas!. 2016-11-23 13.53.06

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

Seminario SAE: Consistencia interna en cuestionarios

corrplotMañana (viernes 14/oct) tendrá lugar el en el aula del SACE (12h) el seminario sobre “Consistencia interna en cuestionarios “, que dará Elvira Ferre Jaén, matemática estadística de este servicio.

En la exposición se repasaran diversa técnicas para medir consistencia interna y correlación en cuestionarios.

Actualización: Aquí os dejamos la presentación correlacion-consistencia-interna.pdf

Seminario SAE: El paquete Tables

alvarox Hoy ha tenido lugar el seminario sobre “El paquete tables de R”, que ha dado Álvaro Hernández Vicente. Que facilita mucho la creación de tablas con muchas categorías, cuidando el aspecto, genial para incluir en nuestros informes automáticos de grandes conjuntos de datos.

Os dejamos aquí la presentación en pdf. Paquete-tables-pres.pdf

Seminario: Visualización y análisis de escalas Likert

Ant J. Perán en el aula del edificio SACE del SAI

Ant José Peran en el aula del edificio SACE del SAI

El pasado viernes 30 de septiembre tuvo lugar en el Edificio SACE, el seminario “Visualización y análisis de escalas Likert”, presentado por nuestro compañero Antonio José Perán.

Esperamos que sea el primero de una saga de pequeños seminarios sobre paquetes de R y técnicas estadísticas que consideremos interesantes. Las iremos anunciando con más antelación que esta en esta web.

Os dejamos aquí la presentación en pdf: Visualizacion-y-analisis-de-escalas-Likert.pdf

R4U…. Introducción al uso de R en entornos universitarios

R44U

Comienza el curso “Introducción al uso de R en entornos universitarios” al que nosotros denominamos R4U

Este curso plantea un desafío aproximar el uso de R, un lenguaje, a un colectivo diverso como es el del “personal” de la universidad. Es un colectivo diverso en cualquiera de sus dimensiones, la marca es la heterogeneidad tanto en el PDI como en el PAS. Sin embargo, más allá del propio lenguaje está la metodología de trabajo, la gestión de la información, la automatización de procedimientos y tanto la optimización en la gestión del tiempo, como la de los resultados de la comunicación.

Veremos como R forma parte de un sistema de trabajo más amplio que exige ciertos cambios en los modus operandi y una formación continua, este esfuerzo proporciona resultado de distinta naturaleza y plantea preguntas personales relevantes, para conseguir las respuestas vamos a proporcionar elementos de juicio.

¿Qué esperamos del curso?

Estamos seguros de que muchas son las preguntas que los participantes en el taller se plantean y pueden ir desde lo más simple hasta cuestiones mucho más avanzadas ¿Qué es R? ¿R sólo lo usan los estadísticos? ¿Sabiendo ya manejar el programa estadístico X podre cambiarme a R fácilmente? ¿Cuánto cuesta aprender a utilizarlo? ¿Está orientado a un campo del conocimiento específico? ¿Tengo que aprender mucho e invertir mucho tiempo? ¿Hay diferentes niveles de “aprendizaje”? ¿Me compensa el esfuerzo de aprender para el rendimiento que obtendré en mi trabajo? ¿Cómo puedo hacer el análisis estadístico X y que significan sus resultados?

Realizaremos una serie de actividades que nos proporcionaran argumentos para responder a estas y otras preguntas, así, veremos:

  • como utilizar el lenguaje R para resolver problemas simples que nos afectan en el quehacer cotidiano.
  • Como se puede utilizar con fluidez la terminal y manejar la interfaz básica de R con muy poco esfuerzo.
  • Estudiaremos como aprovechar las características los principales elementos de R y su entrono, así como el fundamento de la sintaxis de R.
  • Abordaremos el desafío de elaborar procedimientos básicos de trabajo documentados y reproducibles con R.

Obviamente, el nivel del experiencia previa y las expectativas de uso para cada uno de los distintos participantes puede ser muy distinta, por ello, vamos a empezar desde cero, los más experimentados pueden saltar aquellas propuestas de lectura o actividades que sugerimos en los materiales de trabajo; pero nadie puede “saltarse” las tareas propuestas.

Estamos a vuestra disposición… 00RTeam