Archivos de la categoría Taller

Algunas ideas para el uso de git y bookdown en la elaboración de memorias e informes

La edición de datos y la salvaguardia del trabajo mediante copias de seguridad de los materiales son los procesos inevitables en el trabajo cotidiano.

Para resolver la preparación de documentos podemos recurrir a la elaboración de elegantes texto con markdown. Para documentos largos, memorias de tesis, trabajos de fin de grado o máster puede resultar muy conveniente a la suma de potentes herramientas como son kntir + pandoc + git + rmarkdow + bookdown.

Para cerrar este curso 2016/17 hemos preparado un taller destinado a aquello que ya tiene algunos conocimientos y práctica con rstudio+knitr con dos partes:

  • Git para tejedores: Introducción al uso de control de versiones git en el marco de RStudio (1h)

  • Bookdown: cómo preparar una memoria de tesis o científico-técnica sin morir en el intento (1h)

Tendrá lugar:

el próximo 14 de julio de 12.00 a 14.00

en la Sala de Vídeo de la Facultad de Biología

Desafortunadamente el aforo es limitado, quien quiera asistir al seminario debe remitir un correo a palazon@um.es

EIDUM: Introduccción a R y Rstudio para el análisis de datos

aurora-ant

Carga del curso

Número de horas de dedicación del estudiante:

  • Actividad presenciales (talleres): 12 horas (3 talleres de 4h)
  • Actividad personal: 18 horas

Destinatarios

Este curso va dirigido a los investigadores que requieren de herramientas para la manipulación de datos o han de utilizar métodos de análisis de datos. Esencialmente es un curso básico del lenguaje estadístico R y sus capacidades para manejar información cuantitativa y cualitativa, representación de datos y una introducción al uso de su amplísimo catálogo de funciones, que en la actualidad supera de largo el millón y medio. Entender los procedimientos de trabajo de los programas estadísticos y la metodología para preparar los datos y desarrollar protocolos de trabajo es uno de los aspectos básicos en la formación de un doctorando, si no posees estos conocimientos este curso es para ti; también, si sólo necesitas realizar tareas repetitivas para procesar información preparando tablas o gráficos. Es muy aconsejable haber realizado previamente el curso de Procedimientos para la elaboración de informes y documentos científico-técnicos, en su defecto conocer la elaboración de textos con rmarkdown.

Competencias

  • Utilizar con fluidez la terminal y manejar la interfaz básica de R.
  • Aprovechar las características los principales elementos, así como el fundamento, de la sintaxis de R.
  • Elaborar procedimientos básico de trabajo con R.
  • Resolver los problemas derivados de los mensajes de error del sistema.
  • Aprovechar las capacidades de R para generar documentos de investigación reproducible.

Resultados de aprendizaje

Ser capaz de instalar y utilizar el software libre R y Rstudio Disponer de procedimientos de trabajo para abordar el análisis para un conjunto de datos Saber elaborar procedimientos básicos para el tratamiento de datos Ser capaz de aplicar protocolos predefinidos de análisis con R Saber reutilizar protocolos conocidos o parte de ellos para resolver nuevos problemas Elaborar informes reproducibles

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

Agenda del curso

Todas las sesiones del curso, se realizarán durante el año 2017. El horario de los grupos 1 y 2 es de 16:00 a 20:00, el grupo 3 tiene horario de mañana, 9:30 a 13:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

calendario

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

Taller: Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG

El día viernes, 13 de Mayo, se celebrará a las 12:00 en el ADLA BUITRE, el taller “Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG”.

Zpala

¿Qué es el “WYSIWYG”?

Las siglas “WYSIWYG” significan “What you see is what you get”, y hacen referencia a todos los editores/procesadores de texto con un tipo de formato que permite escribir un documento viendo directamente el resultado final, frecuentemente el resultado impreso.
Esto, aunque aparentemente parece una ventaja, tiene sus inconvenientes, pues en pos de poder ver lo que será el resultado, el software sacrifica prestaciones, al no poder obtener un manejo absoluto de lo que se está editando.
Un ejemplo de editores/procesadores de texto que no se encuadran dentro de la familia “WYSIWYG” es LaTeX; un sistema de composición de textos, orientado a la creación de documentos escritos que presenten una alta calidad tipográfica. Por sus características y posibilidades, es usado de forma especialmente intensa en la generación de artículos y libros científicos que incluyen, entre otros elementos, expresiones matemáticas.

EIDUM, MAN01: Métodos de análisis de datos multivariantes

fernandoPSComienza el curso de EIDUM “Métodos de análisis de datos multivariantes.”. Consiste en dos sesiones, y hay tres grupos con diferente horario (horario de tarde). Se imparte en el aula Mangel de ATICA y la buitre de la facultad de Biología. Acceso a la agenda aquí.

Destinatarios

El curso está dirigido a alumnos de doctorado con conocimientos básicos en R y elaboración de informes y documentos sencillos en Rmarkdown. En su caso es recomendable haber realizado los cursos de Introducción a R y Rstudio, Procedimientos para la elaboración de informes y documentos científico-técnicos, Representación y tabulación de datos, o tener los conocimientos considerados en estos cursos.

En el curso abordará las técnicas de análisis de datos multivariantes evitando en lo posible los aspectos más formales, abordando las cuestiones desde un punto de vista eminentemente práctico. Se estudiarán las técnicas de ordenación y clasificación más habituales sus aplicaciones y ejemplos prácticos. Finalmente se hará una introducción a las técnicas de aprendizaje automatizado (machine learning), así como al empleo de curvas ROC y sus aplicaciones.

Competencias

  • Ser capaz de identificar la naturaleza del problema multivariante a abordar y las técnicas a aplicar
  • Ser capaz de realizar una clasificación e interpretar los resultados identificando las características de los grupos obtenidos.
  • Ser capaz de realizar una ordenación e interpretar los resultados
    describiendo el significado de los ejes obtenidos.
  • Ser capaz de leer un informe de resultados de una análisis realizado por una técnica de aprendizaje automático.

Contenidos

  1. Técnicas de ordenación: Análisis de componentes principales
  2. Técnicas de ordenación: Análisis de correspondencias
  3. Técnicas de ordenación: Escalado multidimensional
  4. Técnicas de ordenación: Análisis factorial
  5. Técnicas de clasificación: Clasificación no jerárquica: algoritmo k-means
  6. Técnicas de clasificación: Clasificación jerárquica: Elaboración de dendrogramas
  7. Introducción al aprendizaje automatizado.
  8. Curvas ROC usos e interpretación.

Resultados de aprendizaje

  • Conocer las más habituales técnicas multivariantes existentes.
  • Saber aplicar las técnicas multivariantes con R.
  • Ser capaz de interpretar y elaborar informes de los resultados.
  • Saber aplicar los fundamentos del aprendizaje automatizado para el diseño de análisis
  • Ser capaz de construir en R una curva ROC e interpretar el resultado.
  • Ser capaz de combinar los resultados de distintos análisis multivariantes para mejorar la interpretación de los resultados.

En la clase de hoy hemos hecho un PCA viviente….

PCA( 00Rteam[,1:4], graph = TRUE, scale.unit = TRUE )

pca_00rteam

I Jornada Big Data y Salud en la Región de Murcia

El pasado 21 de Abril tuvimos el placer de asistir a la I Jornada Big Data y Salud en la Región de Murcia. En ella, diversos conferenciantes expusieron proyectos muy interesantes en los que se hacía necesaria una recogida ingente de datos. Y es aquí, donde los modelos que ofrece el Big Data para el tratamiento de la información, se convertían en una herramienta fundamental. Sin duda, la conclusión unánime de la jornada fue, que cada vez se hará más patente la demanda de analistas de datos en el ámbito de la salud, pues este intercambio disciplinar no hace más que ampliar las posibilidades y enriquecer los resultados.



Podéis pinchar aquí para consultar el programa de la I Jornada Big Data y Salud en la Región de Murcia, y en este otro enlace para ver la galería de fotos del evento.

EIDUM, MEX01: Métodos de contraste de hipótesis y diseño de experimentos

421821075_110627

Destinatarios

Para cualquier investigador resulta básico la lectura y la generación de documentación donde se encuentran detallados los procedimientos de análisis estadístico. En este curso se plantea como objetivo general proporcionar a los participantes la capacidad práctica para abordar un estudio estadístico basado en el contraste de hipótesis. De forma práctica se abordarán, especialmente, tanto el análisis de la varianza (ANOVA) como la realización de análisis lineal (regresión lineal), pasando por otros aspectos relevantes y test más habituales.

Se trata de un curso eminentemente práctico y es imprescindible tener conocimientos de R (en particular de tabulación y representación gráfica de datos) y del uso de investigación reproducible.

Competencias

  • Se capaz de realizar adecuadamente un análisis de la varianza con R e interpretar los resultados obtenidos.
  • Se capaz de realizar adecuadamente un análisis de regresión con R e interpretar los resultados obtenidos.
  • Ser capaz de evaluar la adecuación de los principales test estadísticos a los problemas y los casos prácticos más frecuentes.

Contenidos

  1. Conceptos y distribuciones de probabilidad aplicados al contraste de hipótesis. El teorema del límite central. Los intervalos de confianza de un estadístico y los tipos de variables.
  2. Introducción a la aplicación de los contrastes de hipótesis y las situaciones de aplicación.
  3. Pruebas de diferencias de poblaciones (t, \chi^2 y ANOVA).
  4. Modelos de respuesta (el modelo lineal y otros modelos).

Resultados de aprendizaje

  • Capacidad de uso de los conceptos de probabilidad, las pruebas estadísticas, el contrastes de hipótesis y la significación en la elaboración de los datos propios y en la lectura crítica de documentación técnica.

  • Identificar las situaciones más frecuentes en el diseño de experimentos y sus soluciones.

  • Realización de protocolos de análisis con R y uso de análisis reproducible para elaborar informes de resultados.

EIDUM, IDC01: Representación y tabulación de datos

elvirax-pizarra

Esta semana comienza el curso de EIDUM “Representación y tabulación de datos.”. Consiste en tres sesiones, y hay tres grupos con diferente horario (mañana y tarde). Se imparte en el aula Mangel de ATICA y la buitre de la facultad de Biología. Acceso a la agenda aquí.

Destinatarios

Alumnos de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a aquellos investigadores que se interesan por avanzar en tareas de gestión de datos, y en su caso, el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos. En especial a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos. Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Contenidos

  1. Datos y ficheros: formatos, codificación y estructura
  2. Importación y exportación de datos en R
  3. Resumen de datos: tablas, estadísticos y gráficos
  4. Distribución de frecuencias y distribuciones de probabilidad
  5. Objetos en R: manipulación avanzada de datos y simulación
  6. Creación de funciones en R: generalizando un procedimiento
  7. Toda la potencia de la representación gráfica en R
  8. Creación de gráficos y exportación: formatos gráficos Sigue leyendo

EIDUM, GDA01: Procedimientos para la elaboración de informes y documentos científico-técnicos

2014-10-23 12.16.26

Comienza el curso de EIDUM “Procedimientos para la elaboración de informes y documentos científico-técnicos”. Consiste en dos sesiones, y hay tres grupos con diferente horario (mañana y tarde). Se imparte en el aula Mangel de ATICA. Acceso a la agenda aquí.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software adecuado proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos y como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas para evitar el trabajo manual y descargando las tareas repetitivas en el ordenador.

Es recomendable tener nociones básicas del lenguaje R.

Competencias

  • Saber elaborar documentación con un sistema minimalista.
  • Saber crear documentos científicos de calidad y para distintos formatos a partir de un mismo original.
  • Saber organizar adecuadamente la información para realizar automáticamente la presentación de la información en el documento final.
  • Saber gestionar las referencias bibliográficas y su citado de forma automática en los documentos.

Contenidos

  1. Documentos: estructuras y ficheros
  2. Los lenguajes de marcas y markdown
  3. Edición de documentos con markdown: programas y plugins, usando rstudio
  4. Normas de estilo y fundamentos en la elaboración de documentos científicos
  5. Uso de bases de datos de referencias y citado automático
  6. Introducción al análisis reproducible

Resultados de aprendizaje

  • Crear documentos científicos de calidad
  • Reducir los tiempos de edición y revisión de los materiales elaborados
  • Trabajar reduciendo al máximo los errores en las tareas mecánicas con un coste mínimo de elaboración

III. CURSO Fundamentos Estadísticos para Investigación. Introducción a R.

Estudios-Propios Ya está accesible para preinscripción el curso de “Estadística con R” que ofrecemos desde este Servicio.

El curso es de estadística, y emplearemos R como herramienta de trabajo. Dedicaremos unas sesiones a conocer R desde cero, aprovechando la simplicidad de R, para llegar a la elaboración de informes automáticos personalizados, siguiendo el principio de “esto lo puedes hacer tu y es así de fácil”. R no sólo es una herramienta para calcular, es un instrumento para aprender y comprender; evidentemente requiere cierto esfuerzo por parte de los participantes.

  • La prescripción comienza el día 14 de Septiembre y las matriculas a partir del día 30 de Septiembre.
  • El curso se realizará en horario de mañanas o tardes, fundamentalmente durante el mes de noviembre de 2014 en días salteados. Intentaremos adaptarnos a las necesidades de la mayoría.
  • Más información sobre el curso (fechas, temario, …) aquí.
  • Como resultado del curso el alumno deberá de ser capaz de:
    • Preparar un conjunto de datos para poder analizarlos (con R u otra herramienta).
    • Discutir que técnica estadística es más apropiada para el análisis, dadas las hipótesis de trabajo.
    • Realizar un análisis con R; para ello contará con un material, que modo de pequeños protocolos, pretendemos le sea de ayuda.

¿Por que con R?

  • R es un potente lenguaje orientado a objetos y destinado al análisis estadístico y la representación de datos.
  • Se trata de software libre que permite una utilización libre y gratuita; bajo la continua supervisión y contraste de los usuarios.
  • La comunidad científica internacional lo ha elegido, de facto como la ‘lingua franca’ del análisis de datos.
  • Tiene una gran implantación en universidades y cada vez más en mundo empresarial:
  • Este vídeo resume en minuto y medio las características mas relevante de R.

Contenidos del curso

  1. Entorno de trabajo R, y RStudio
  2. Investigación reproducible
  3. Introducción a los contrastes
  4. Comparación de medias
  5. Modelos de Regresión
  6. Contrastes no paramétricos
  7. Taller de Gráficos con R
  8. R en la web: Introducción al paquete Shiny

keep-calm-and-markdown FEIR3-agosto14