Archivos de la categoría RStudio

EIDUM: Representación y tabulación de datos con R

elvirax-pizarra

La segunda semana de marzo comienza el curso de EIDUM “Representación y tabulación de datos.”.

Consiste en tres sesiones, y hay dos grupos diferentes, es necesario que se desde el Aula virtual se seleccione uno de los dos grupos. El horario es de 16:00 a 20:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

Se imparte en el aula Mangel de ATICA y la Bisbita de la facultad de Biología.

Destinatarios/as

Alumnos y alumnas de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a quienes se interesen por avanzar en tareas de gestión de datos, y en su caso, en el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos; en especial, a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración de una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos.
Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Sigue leyendo

EIDUM: Procedimientos para la elaboración de informes y documentos científico-técnicos

Prof. Laura del Río

Prof. Laura del Río

En enero comenzará el curso “Procedimientos para la elaboración de informes y documentos científico-técnicos” del programa de la Escuela Internacional de Doctorado de la Universidad de Murcia.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software recomendable proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas que evitan el trabajo manual y descargando las tareas repetitivas en el ordenador. Estas preparando la tesis doctoral y este es tu curso.

Sigue leyendo

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

Seminario SAE: El paquete Tables

alvarox Hoy ha tenido lugar el seminario sobre “El paquete tables de R”, que ha dado Álvaro Hernández Vicente. Que facilita mucho la creación de tablas con muchas categorías, cuidando el aspecto, genial para incluir en nuestros informes automáticos de grandes conjuntos de datos.

Os dejamos aquí la presentación en pdf. Paquete-tables-pres.pdf

R4U…. Introducción al uso de R en entornos universitarios

R44U

Comienza el curso “Introducción al uso de R en entornos universitarios” al que nosotros denominamos R4U

Este curso plantea un desafío aproximar el uso de R, un lenguaje, a un colectivo diverso como es el del “personal” de la universidad. Es un colectivo diverso en cualquiera de sus dimensiones, la marca es la heterogeneidad tanto en el PDI como en el PAS. Sin embargo, más allá del propio lenguaje está la metodología de trabajo, la gestión de la información, la automatización de procedimientos y tanto la optimización en la gestión del tiempo, como la de los resultados de la comunicación.

Veremos como R forma parte de un sistema de trabajo más amplio que exige ciertos cambios en los modus operandi y una formación continua, este esfuerzo proporciona resultado de distinta naturaleza y plantea preguntas personales relevantes, para conseguir las respuestas vamos a proporcionar elementos de juicio.

¿Qué esperamos del curso?

Estamos seguros de que muchas son las preguntas que los participantes en el taller se plantean y pueden ir desde lo más simple hasta cuestiones mucho más avanzadas ¿Qué es R? ¿R sólo lo usan los estadísticos? ¿Sabiendo ya manejar el programa estadístico X podre cambiarme a R fácilmente? ¿Cuánto cuesta aprender a utilizarlo? ¿Está orientado a un campo del conocimiento específico? ¿Tengo que aprender mucho e invertir mucho tiempo? ¿Hay diferentes niveles de “aprendizaje”? ¿Me compensa el esfuerzo de aprender para el rendimiento que obtendré en mi trabajo? ¿Cómo puedo hacer el análisis estadístico X y que significan sus resultados?

Realizaremos una serie de actividades que nos proporcionaran argumentos para responder a estas y otras preguntas, así, veremos:

  • como utilizar el lenguaje R para resolver problemas simples que nos afectan en el quehacer cotidiano.
  • Como se puede utilizar con fluidez la terminal y manejar la interfaz básica de R con muy poco esfuerzo.
  • Estudiaremos como aprovechar las características los principales elementos de R y su entrono, así como el fundamento de la sintaxis de R.
  • Abordaremos el desafío de elaborar procedimientos básicos de trabajo documentados y reproducibles con R.

Obviamente, el nivel del experiencia previa y las expectativas de uso para cada uno de los distintos participantes puede ser muy distinta, por ello, vamos a empezar desde cero, los más experimentados pueden saltar aquellas propuestas de lectura o actividades que sugerimos en los materiales de trabajo; pero nadie puede “saltarse” las tareas propuestas.

Estamos a vuestra disposición… 00RTeam

Índice de contenidos, figuras y tablas

Este documento es un ejemplo de cómo hacer con RStudio que tus documentos, además de un índice de contenidos, tengan un índice de tablas y otro de figuras. Para eso haremos uso de instrucciones de LaTeX en el documento de Rmarkdown.

Se puede descargar el fichero en Rmd y pdf desde aquí:.Rmd, .pdf

Índice de contenidos: toc

Para hacer que aparezca un índice de contenidos, en el preámbulo del documento ponemos toc: yes, de esta forma:

---
title: "Índice de contenidos, figuras y tablas"
output:
  pdf_document:
    toc: yes
---

toc

Índice de tablas y figuras

Para el índice de figuras tenemos que añadir dos sentencias de LaTeX donde queramos que aparezcan estos índices

\listoffigures
\listoftables

simplemente aparecerá al principio el toc o table of contents que es lo que pretendíamos. Vemos los detalles …

listoffigures

list of figures

Sigue leyendo

EIDUM, IDC01: Representación y tabulación de datos

elvirax-pizarra

Esta semana comienza el curso de EIDUM “Representación y tabulación de datos.”. Consiste en tres sesiones, y hay tres grupos con diferente horario (mañana y tarde). Se imparte en el aula Mangel de ATICA y la buitre de la facultad de Biología. Acceso a la agenda aquí.

Destinatarios

Alumnos de doctorado con conocimientos básicos sobre el manejo de R y sobre la elaboración de informes y documentos reproducibles. Recomendable haber realizado previamente los cursos de Introduccción a R y Rstudio y Procedimientos para la elaboración de informes y documentos ciéntifico-técnicos, o poseer los conocimientos que se abordan en ellos.

El curso está destinado a aquellos investigadores que se interesan por avanzar en tareas de gestión de datos, y en su caso, el manejo de grandes volúmenes de información. También se abordará la adecuada organización de los datos en una o más tablas, la codificación y los formatos para la presentación de los dados. Por otro lado, discutiremos métodos para la elaboración automática de tablas de datos. En especial a partir de fuentes originalmente heterogéneas o donde es necesario reelaborar la propia información para abordar otros enfoques o análisis de la información. También se abordará la elaboración una estadística descriptiva mediante tablas de resultados o gráficos más o menos complejos. Todo ello considerando siempre la forma de automatizar las tareas repetitivas con funciones de usuario.

Competencias

  • Saber preparar la información para su mecanización y tratamiento estadístico
  • Ser capaz de representar datos y funciones de forma integrada con R
  • Ser capaz de resumir la información mediante tablas y estadísticos
  • Ser capaz de exportar tablas y gráficos elaborados con R

Contenidos

  1. Datos y ficheros: formatos, codificación y estructura
  2. Importación y exportación de datos en R
  3. Resumen de datos: tablas, estadísticos y gráficos
  4. Distribución de frecuencias y distribuciones de probabilidad
  5. Objetos en R: manipulación avanzada de datos y simulación
  6. Creación de funciones en R: generalizando un procedimiento
  7. Toda la potencia de la representación gráfica en R
  8. Creación de gráficos y exportación: formatos gráficos Sigue leyendo

Tablas en pdf con RMarkdown y Knitr

Para los que suelen trabajar con archivos Rmarkdown desde RStudio, hoy traemos tres funciones para generar tablas en un documento pdf: kable(), pandoc.table() y xtable(); de los paquetes: knitr, pander y xtable, respectivamente.

Pasamos a ver cada una por separado, generando las tablas con las opciones habituales en cada caso para que puedan servir de plantilla base.

Función kable(), del paquete knitr

Yo diría que la más sencilla de utilizar. Por defecto hace unas tablas muy bonitas. Tiene pocas opciones, así que, por un lado es muy fácil de aprender a usar pero, por otro, si queremos algo más concreto puede quedarse corta. Tal y como se afirma en si descripción: “No es su intención reemplazar a ningún otro paquete de R para hacer tablas”.

Una característica a destacar es que en un pdf, si quedara muy larga la tabla para una página, por defecto kable() la divide en dos y la continúa en la siguiente.

# install.packages("knitr")
library(knitr)
data("airquality")
df <- head(airquality, 15)
kable( df , caption = "BBDD `airquality` con `kable()`"
       , align = c('l', 'c', 'r', 'r', 'c', 'l')
       , col.names = c("Ozono","Solar.R","Viento","Temp","Mes","Día")
       , row.names = TRUE
       , digits = 1
       , format.args = list( decimal.mark = ",")
      )

tabla-kable

Función pandoc.table(), del paquete pander

Tiene bastantes opciones. Características a destacar: que también divide las tablas como kable() si son muy largas, y además, también lo hace si son muy anchas. En este último caso, te parte la tabla automáticamente y te la muestra a continuación con las columnas que no hubieran cabido. Importante: no hay que olvidar poner results = 'asis' en las opciones del chunk.

# install.packages("pander")
library(pander)
pandoc.table( df
              , caption = "BBDD `airquality` con `pandoc.table()`"
              , justify = 'lcrrcl'
              , round = 2
              , decimal.mark = ","
              , missing = NA
              , emphasize.rownames = FALSE
              , split.cells = 5
              , emphasize.strong.cells =
                  which(df > 12 & df == df$Wind, arr.ind = TRUE)
             )

tabla-pandoctable

Función xtable(), del paquete xtable

Potencia LaTeX. Lo mejor es utilizarla junto con print(), ya que, se añaden más opciones (ver print.xtable()). Importante: igual que con pandoc.table() hay que poner results = 'asis'.

# install.packages("xtable")
library(xtable)
print(xtable( df
             , caption = "BBDD \\texttt{airquality} con
                          \\texttt{xtable()}"
             , align = 'clcrrcp{2cm}'
             , digits = 2
             , label = "tab:label"
            )
      , comment = FALSE
      , table.placement = "h!"
      , caption.placement = "top"
      , NA.string = "NA"
     )

tabla-xtable

Conclusiones

En resumen, para una tabla sencilla en Rmd yo personalmente utilizo la función kable(): no hay que instalar ningún paquete adicional a knitr y la sintaxis se aprende muy rápido. Solo cuando quiero hacer alguna tabla más concreta (o cuando es muy ancha) opto por pandoc.table(), que te da muchas opciones sin perder la relativa sencillez. Y finalmente, en contadas situaciones, cuando he de hacer algo muy muy concreto en el que tengo que tirar de LaTeX utilizo xtable().

Cada cual que utilice la que más le guste, o como yo, la que más le convenga en cada caso.

Referencias y enlaces

EIDUM, GDA01: Procedimientos para la elaboración de informes y documentos científico-técnicos

2014-10-23 12.16.26

Comienza el curso de EIDUM “Procedimientos para la elaboración de informes y documentos científico-técnicos”. Consiste en dos sesiones, y hay tres grupos con diferente horario (mañana y tarde). Se imparte en el aula Mangel de ATICA. Acceso a la agenda aquí.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software adecuado proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos y como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas para evitar el trabajo manual y descargando las tareas repetitivas en el ordenador.

Es recomendable tener nociones básicas del lenguaje R.

Competencias

  • Saber elaborar documentación con un sistema minimalista.
  • Saber crear documentos científicos de calidad y para distintos formatos a partir de un mismo original.
  • Saber organizar adecuadamente la información para realizar automáticamente la presentación de la información en el documento final.
  • Saber gestionar las referencias bibliográficas y su citado de forma automática en los documentos.

Contenidos

  1. Documentos: estructuras y ficheros
  2. Los lenguajes de marcas y markdown
  3. Edición de documentos con markdown: programas y plugins, usando rstudio
  4. Normas de estilo y fundamentos en la elaboración de documentos científicos
  5. Uso de bases de datos de referencias y citado automático
  6. Introducción al análisis reproducible

Resultados de aprendizaje

  • Crear documentos científicos de calidad
  • Reducir los tiempos de edición y revisión de los materiales elaborados
  • Trabajar reduciendo al máximo los errores en las tareas mecánicas con un coste mínimo de elaboración

EIDUM, IER01: Introduccción a R y Rstudio

2016-02-10 13.23.37

El primer grupo, hay 3, comenzó el día 3 de febrero de 2016. Se imparte en las aulas Buitre de la fac de Biologíia y Mangel de ATICA.
Acceso a la agenda aquí.

Destinatarios

Este curso va dirigido a los investigadores que requieren de herramientas para la manipulación de datos o han de utilizar métodos de análisis de datos. Esencialmente es un curso básico del lenguaje estadístico R y sus capacidades para manejar información cuantitativa y cualitativa, representación de datos y una introducción al uso de su amplísimo catálogo de funciones, que en la actualidad supera las 150000.

Entender los procedimientos de trabajo de los programas estadísticos y la metodología para preparar los datos y desarrollar protocolos de trabajo es uno de los aspectos básicos en la formación de un doctorando, si no posees estos conocimientos este curso es para ti; también, si sólo necesitas realizar tareas repetitivas para procesar información preparando tablas o gráficos.

Competencias

  • Utilizar con fluidez la terminal y manejar la interfaz básica de R.
  • Aprovechar las características los principales elementos, así como el fundamento, de la sintaxis de R
  • Elaborar procedimientos básico de trabajo con R
  • Resolver los problemas derivados de los mensajes de error del sistema

Contenidos

  1. Sintaxis del lenguaje R: el valor de la expresiones
  2. Las interfases de R: uso de RStudio
  3. Valores, operadores y funciones en R
  4. Objetos en R: vectores, matrices, data frames y listas
  5. Ficheros de datos y de protocolos
  6. Ayudas y documentación en R

Resultados de aprendizaje

  • Ser capaz de instalar y utilizar el software libre R y RStudio
  • Disponer de procedimientos de trabajo para abordar el análisis para un conjunto de datos
  • Saber elaborar procedimientos básicos para el tratamiento de datos
  • Ser capaz de aplicar protocolos predefinidos de análisis con R
  • Saber reutilizar protocolos conocidos o parte de ellos para resolver nuevos problemas