Archivos de la categoría knitr

Algunas ideas para el uso de git y bookdown en la elaboración de memorias e informes

La edición de datos y la salvaguardia del trabajo mediante copias de seguridad de los materiales son los procesos inevitables en el trabajo cotidiano.

Para resolver la preparación de documentos podemos recurrir a la elaboración de elegantes texto con markdown. Para documentos largos, memorias de tesis, trabajos de fin de grado o máster puede resultar muy conveniente a la suma de potentes herramientas como son kntir + pandoc + git + rmarkdow + bookdown.

Para cerrar este curso 2016/17 hemos preparado un taller destinado a aquello que ya tiene algunos conocimientos y práctica con rstudio+knitr con dos partes:

  • Git para tejedores: Introducción al uso de control de versiones git en el marco de RStudio (1h)

  • Bookdown: cómo preparar una memoria de tesis o científico-técnica sin morir en el intento (1h)

Tendrá lugar:

el próximo 14 de julio de 12.00 a 14.00

en la Sala de Vídeo de la Facultad de Biología

Desafortunadamente el aforo es limitado, quien quiera asistir al seminario debe remitir un correo a palazon@um.es

EIDUM: Procedimientos para la elaboración de informes y documentos científico-técnicos

Prof. Laura del Río

Prof. Laura del Río

En enero comenzará el curso “Procedimientos para la elaboración de informes y documentos científico-técnicos” del programa de la Escuela Internacional de Doctorado de la Universidad de Murcia.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software recomendable proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas que evitan el trabajo manual y descargando las tareas repetitivas en el ordenador. Estas preparando la tesis doctoral y este es tu curso.

Sigue leyendo

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

Seminario SAE: El paquete Tables

alvarox Hoy ha tenido lugar el seminario sobre “El paquete tables de R”, que ha dado Álvaro Hernández Vicente. Que facilita mucho la creación de tablas con muchas categorías, cuidando el aspecto, genial para incluir en nuestros informes automáticos de grandes conjuntos de datos.

Os dejamos aquí la presentación en pdf. Paquete-tables-pres.pdf

Tablas en pdf con RMarkdown y Knitr

Para los que suelen trabajar con archivos Rmarkdown desde RStudio, hoy traemos tres funciones para generar tablas en un documento pdf: kable(), pandoc.table() y xtable(); de los paquetes: knitr, pander y xtable, respectivamente.

Pasamos a ver cada una por separado, generando las tablas con las opciones habituales en cada caso para que puedan servir de plantilla base.

Función kable(), del paquete knitr

Yo diría que la más sencilla de utilizar. Por defecto hace unas tablas muy bonitas. Tiene pocas opciones, así que, por un lado es muy fácil de aprender a usar pero, por otro, si queremos algo más concreto puede quedarse corta. Tal y como se afirma en si descripción: “No es su intención reemplazar a ningún otro paquete de R para hacer tablas”.

Una característica a destacar es que en un pdf, si quedara muy larga la tabla para una página, por defecto kable() la divide en dos y la continúa en la siguiente.

# install.packages("knitr")
library(knitr)
data("airquality")
df <- head(airquality, 15)
kable( df , caption = "BBDD `airquality` con `kable()`"
       , align = c('l', 'c', 'r', 'r', 'c', 'l')
       , col.names = c("Ozono","Solar.R","Viento","Temp","Mes","Día")
       , row.names = TRUE
       , digits = 1
       , format.args = list( decimal.mark = ",")
      )

tabla-kable

Función pandoc.table(), del paquete pander

Tiene bastantes opciones. Características a destacar: que también divide las tablas como kable() si son muy largas, y además, también lo hace si son muy anchas. En este último caso, te parte la tabla automáticamente y te la muestra a continuación con las columnas que no hubieran cabido. Importante: no hay que olvidar poner results = 'asis' en las opciones del chunk.

# install.packages("pander")
library(pander)
pandoc.table( df
              , caption = "BBDD `airquality` con `pandoc.table()`"
              , justify = 'lcrrcl'
              , round = 2
              , decimal.mark = ","
              , missing = NA
              , emphasize.rownames = FALSE
              , split.cells = 5
              , emphasize.strong.cells =
                  which(df > 12 & df == df$Wind, arr.ind = TRUE)
             )

tabla-pandoctable

Función xtable(), del paquete xtable

Potencia LaTeX. Lo mejor es utilizarla junto con print(), ya que, se añaden más opciones (ver print.xtable()). Importante: igual que con pandoc.table() hay que poner results = 'asis'.

# install.packages("xtable")
library(xtable)
print(xtable( df
             , caption = "BBDD \\texttt{airquality} con
                          \\texttt{xtable()}"
             , align = 'clcrrcp{2cm}'
             , digits = 2
             , label = "tab:label"
            )
      , comment = FALSE
      , table.placement = "h!"
      , caption.placement = "top"
      , NA.string = "NA"
     )

tabla-xtable

Conclusiones

En resumen, para una tabla sencilla en Rmd yo personalmente utilizo la función kable(): no hay que instalar ningún paquete adicional a knitr y la sintaxis se aprende muy rápido. Solo cuando quiero hacer alguna tabla más concreta (o cuando es muy ancha) opto por pandoc.table(), que te da muchas opciones sin perder la relativa sencillez. Y finalmente, en contadas situaciones, cuando he de hacer algo muy muy concreto en el que tengo que tirar de LaTeX utilizo xtable().

Cada cual que utilice la que más le guste, o como yo, la que más le convenga en cada caso.

Referencias y enlaces

EIDUM, GDA01: Procedimientos para la elaboración de informes y documentos científico-técnicos

2014-10-23 12.16.26

Comienza el curso de EIDUM “Procedimientos para la elaboración de informes y documentos científico-técnicos”. Consiste en dos sesiones, y hay tres grupos con diferente horario (mañana y tarde). Se imparte en el aula Mangel de ATICA. Acceso a la agenda aquí.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software adecuado proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos y como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas para evitar el trabajo manual y descargando las tareas repetitivas en el ordenador.

Es recomendable tener nociones básicas del lenguaje R.

Competencias

  • Saber elaborar documentación con un sistema minimalista.
  • Saber crear documentos científicos de calidad y para distintos formatos a partir de un mismo original.
  • Saber organizar adecuadamente la información para realizar automáticamente la presentación de la información en el documento final.
  • Saber gestionar las referencias bibliográficas y su citado de forma automática en los documentos.

Contenidos

  1. Documentos: estructuras y ficheros
  2. Los lenguajes de marcas y markdown
  3. Edición de documentos con markdown: programas y plugins, usando rstudio
  4. Normas de estilo y fundamentos en la elaboración de documentos científicos
  5. Uso de bases de datos de referencias y citado automático
  6. Introducción al análisis reproducible

Resultados de aprendizaje

  • Crear documentos científicos de calidad
  • Reducir los tiempos de edición y revisión de los materiales elaborados
  • Trabajar reduciendo al máximo los errores en las tareas mecánicas con un coste mínimo de elaboración

Cierre de las V Jornadas de R en Zaragoza.

El pasado diciembre se celebraron en Zaragoza las V Jornadas de R. Es bonito ver como aquella semilla que se plantó en Murcia hace ya 5 años sigue su curso y enganchando cada vez a más gente.

palazon-apertura

El evento académico comenzó con la apertura a cargo de  José Antonio Palazón.  La Asociación de usuarios de R, “Comunidad R-Hispano” celebró una reunión y renovó cargos, ¡ya hemos cumplió 3 años como asociación!.  Seguramente las próximas jornadas se celebren en Galicia: Santiago de Compostela.

R-Hispano

Accede aquí al Libro de Resúmenes.

“Los de Murcia dimos un taller al que puedes acceder desde aquí: Docencia de R mediante investigación reproducible. RStudio, knitr, markdown. Ponto pondremos un git con todo el material accesible.