Archivo del Autor: amaurandi

Diferencias entre R y Excel o Calc

Si empelas Calc o Excel (o cualquier otra hoja de cálculo), la adaptación para aprender y usar R puede ser difícil. Como explica este post de Gordon Shotwell, una de las razones es que las cosas simples pueden ser más difíciles de hacer en R que Excel. Pero vale la pena perseverar, porque las cosas complejas pueden ser más fáciles.

Dificultad vs. complejidad

Mientras que Excel o Calc es muy bueno cosas como la aritmética y las tabulaciones, el enfoque programático de R introduce conceptos como estructuras de datos, iteración y funciones. Una vez que se ha hecho la inversión en tiempo para aprender R, estas abstracciones hacen que la reducción de tareas complejas en pasos discretos posibles, y la automatización de tareas similares repetidas mucho más fácil.

EIDUM: Introduccción a R y Rstudio para el análisis de datos

aurora-ant

Carga del curso

Número de horas de dedicación del estudiante:

  • Actividad presenciales (talleres): 12 horas (3 talleres de 4h)
  • Actividad personal: 18 horas

Destinatarios

Este curso va dirigido a los investigadores que requieren de herramientas para la manipulación de datos o han de utilizar métodos de análisis de datos. Esencialmente es un curso básico del lenguaje estadístico R y sus capacidades para manejar información cuantitativa y cualitativa, representación de datos y una introducción al uso de su amplísimo catálogo de funciones, que en la actualidad supera de largo el millón y medio. Entender los procedimientos de trabajo de los programas estadísticos y la metodología para preparar los datos y desarrollar protocolos de trabajo es uno de los aspectos básicos en la formación de un doctorando, si no posees estos conocimientos este curso es para ti; también, si sólo necesitas realizar tareas repetitivas para procesar información preparando tablas o gráficos. Es muy aconsejable haber realizado previamente el curso de Procedimientos para la elaboración de informes y documentos científico-técnicos, en su defecto conocer la elaboración de textos con rmarkdown.

Competencias

  • Utilizar con fluidez la terminal y manejar la interfaz básica de R.
  • Aprovechar las características los principales elementos, así como el fundamento, de la sintaxis de R.
  • Elaborar procedimientos básico de trabajo con R.
  • Resolver los problemas derivados de los mensajes de error del sistema.
  • Aprovechar las capacidades de R para generar documentos de investigación reproducible.

Resultados de aprendizaje

Ser capaz de instalar y utilizar el software libre R y Rstudio Disponer de procedimientos de trabajo para abordar el análisis para un conjunto de datos Saber elaborar procedimientos básicos para el tratamiento de datos Ser capaz de aplicar protocolos predefinidos de análisis con R Saber reutilizar protocolos conocidos o parte de ellos para resolver nuevos problemas Elaborar informes reproducibles

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales que son obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales. En cada sesión se propondrán diversos ejercicios, que se discutirán y resolverán in situ, y se planteará una tarea previa a la siguiente sesión que se entregará en el aula virtual. Además, existe una tarea final del curso con fecha límite de una semana tras la realización de la última sesión presencial.

Agenda del curso

Todas las sesiones del curso, se realizarán durante el año 2017. El horario de los grupos 1 y 2 es de 16:00 a 20:00, el grupo 3 tiene horario de mañana, 9:30 a 13:00. En cada una de ellas habrá un descanso de 20 minutos, la duración total es de 4 horas.

calendario

EIDUM: Procedimientos para la elaboración de informes y documentos científico-técnicos

Prof. Laura del Río

Prof. Laura del Río

En enero comenzará el curso “Procedimientos para la elaboración de informes y documentos científico-técnicos” del programa de la Escuela Internacional de Doctorado de la Universidad de Murcia.

Destinatarios

Para elaborar documentación de carácter técnico es necesario incluir diversos elementos en el texto: índice de contenidos, de figuras y de tablas, datos, referencias cruzadas, citas bibliográficas, etc. La utilización de un adecuado proceso de trabajo y del software recomendable proporciona los mejores resultados y numerosos beneficios, por ejemplo, el ahorro de tiempo, mejor calidad tipográfica y reducción de errores; además, permite introducir elementos y modificaciones en cualquier momento sin requerir una reedición del material ya elaborado.

Además de estas ventajas, cabe añadir la posibilidad de que los documentos, cuando contienen análisis estadísticos, puedan incluir tanto los procedimientos como los resultados de los cálculos realizados. Los documentos así elaborados permiten reproducir los mismos análisis y cálculos únicamente utilizando nuevos datos de entrada; esta forma de trabajar que se demonima investigación reproducible o análisis reproducible.

Estas tareas se pueden abordar desde lenguajes de marcas como markdown, que se ha convertido en un estándar en la elaboración de documentos digitales y que proporciona la posibilidad de crear desde un mismo documento base, distintas versiones en formatos de word, pdf, epub (y otras versiones de documentos electrónicos).

Este curso proporcionará las bases para poder preparar documentos aprovechando al máximo las capacidades de los programas que evitan el trabajo manual y descargando las tareas repetitivas en el ordenador. Estas preparando la tesis doctoral y este es tu curso.

Sigue leyendo

El SAE en las VIII Jornadas de Usuarios de R

Congreso-R-Albacete-2016-GrupoMurcia Este año 2016, los del SAE y algunas personas más pudimos asistir a las VIII Jornadas de R, que esta vez se celebraron en Albacete.

Como siempre, el encuentro fue magnífico. Vimos a viejos amigos y amigas, gente que lleva acudiendo a las jornadas desde las primeras allá por el año 2009 en Murcia, e hicimos nuevos que esperamos seguir viendo en la próximas.

Es curioso constatar cómo cada vez el mundo de R, que hace pocos años era un grupúsculo de “cuasi frikis” o “visionarios”, se va ampliando. Aún así, el ambiente es aún muy familiar; acudieron unas 100 personas. Quien llega nuevo rápidamente se integra y se crea una camaradería que yo no he visto en otras reuniones científicas. Es un “congreso” en el que mucha gente dice “aquí me siento normal”, hartos de ser “el o la rarita de de R”. Es grato encontrar gente con tus aficiones y formas parecidas de entender la ciencia y, como cada vez somos más, pudimos comprobar con la charla de David Ríos Insua (RIMAS) cómo, incluso ministros del estado español, ya tienen acceso a informes hechos con R y Rstudio en LaTeX. Parece sorprendente, ¿no?

Las presentaciones y los materiales están disponibles en este enlace, incluidas nuestras 6 aportaciones.

En la asamblea de la Comunidad R Hispano que tuvo lugar, se acordó el lugar donde celebrar las siguientes: las IX Jornadas de R Granada, de la mano de José Luis Cañadas Reche. Seguro que van a estar genial. Y las X en Murcia (¡las jornadas X!). Así que tenemos citas en el calendario.

¡¡Ah!! ¡Y molan las pegatinas!. 2016-11-23 13.53.06

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

Seminario SAE: Consistencia interna en cuestionarios

corrplotMañana (viernes 14/oct) tendrá lugar el en el aula del SACE (12h) el seminario sobre “Consistencia interna en cuestionarios “, que dará Elvira Ferre Jaén, matemática estadística de este servicio.

En la exposición se repasaran diversa técnicas para medir consistencia interna y correlación en cuestionarios.

Actualización: Aquí os dejamos la presentación correlacion-consistencia-interna.pdf

Seminario SAE: El paquete Tables

alvarox Hoy ha tenido lugar el seminario sobre “El paquete tables de R”, que ha dado Álvaro Hernández Vicente. Que facilita mucho la creación de tablas con muchas categorías, cuidando el aspecto, genial para incluir en nuestros informes automáticos de grandes conjuntos de datos.

Os dejamos aquí la presentación en pdf. Paquete-tables-pres.pdf

PSPP reemplazo libre a SPSS

PSPP screenshot

¿Qué es PSPP y por qué usarlo?

Muchos de los cursos introductorios de estadística requieren el uso de algún software de análisis estadístico. La estadística debe y es independiente del software que se emplee, ¿por qué usar un software propietario cuando existe una alternativa libre como PSPP?

PSPP es una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa la biblioteca científica GNU para sus rutinas matemáticas, y plotutils para la generación de gráficos. Es un reemplazo libre para el software propietario SPSS y aparentemente muy similar con pequeñas excepciones. Las más importantes son:

  1. La copia de PSPP no expira con el tiempo
  2. Admite alrededor de un billón de casos y un billón de variables.
  3. No hay paquetes adicionales que haya que adquirir con el fin de obtener las funciones “avanzadas”; todas las funcionalidades que PSPP aporta actualmente están en el paquete básico.

Técnicas que implementa

PSPP ofrece muchas transformaciones y utilidades. Entre ellas, cabe destacar la capacidad de realizar:

  • t-tests
  • ANOVA
  • Regresión lineal
  • Regresión logística
  • Análisis de conglomerados
  • Análisis de confiabilidad
  • Análisis factorial
  • Pruebas no paramétricas

Algunas funcionalidades adicionales:

  • Pegar la sintaxis del análisis en ficheros parecidos a los .sps de SPSS.
  • Exportar los resultados a pdf, html, odt, csv, etc.

Enlaces de descarga del PSPP

Sigue leyendo

Conviértete en un Data Scientist

Nace el Grado en Matemática Aplicada al análisis de datos por la Universidad Europea de Madrid.

En los últimos años han irrumpido en nuestra sociedad términos como el Internet de las Cosas, la industria 4.0, las Smart Cities, y el Big Data. Todos estos términos tienen en común la necesidad del almacenamiento masivo de grandes cantidades de datos en tiempo real y del análisis automático de los mismos con el objetivo de obtener información útil como base en la toma de decisiones a niveles estratégicos. Los ámbitos de aplicación son, además, muy extensos como Salud, Educación, Industria, Energía, y un largo etcétera. Los efectos que está teniendo en los resultados de las organizaciones son tales que en algunos casos se están tomando decisiones de gran nivel basándose únicamente en los resultados de estos procesos automáticos. Un ejemplo de ello son los nuevos seguros de automóviles que están basando el cálculo de las cuotas en los resultados de analizar los datos de la trazabilidad recopilados a través de todos los sensores que hoy en día disponen los automóviles. Es tal la influencia que el análisis de datos está generando en la sociedad y, en particular, en la industria, que ya se habla de la 3º revolución industrial.

El data scientist

Este reto requiere de profesionales que estén bien formados y perfectamente preparados para generar valor en torno a esta gran oportunidad. Un analista de datos tiene que ser capaz de abordar funciones de Explotación, Desarrollo, Diseño y Administración de sistemas de gran volumen de datos, y en un nivel superior, las funciones de Análisis, Arquitectura y Dirección de los mismos. Para ello tiene que dominar las técnicas y herramientas de las matemáticas y la estadística, así como, las técnicas y herramientas software que se utilizan para el almacenamiento de grandes cantidades de datos en tiempo real, para el análisis y procesamiento de los mismos (utilizando modelos predictivos e inteligencia de negocio), así como para la visualización de forma adecuada para mejor entendimiento del encargado de tomar la decisión final.

Una profesión con mucho presente y más futuro Sigue leyendo

R4U…. Introducción al uso de R en entornos universitarios

R44U

Comienza el curso “Introducción al uso de R en entornos universitarios” al que nosotros denominamos R4U

Este curso plantea un desafío aproximar el uso de R, un lenguaje, a un colectivo diverso como es el del “personal” de la universidad. Es un colectivo diverso en cualquiera de sus dimensiones, la marca es la heterogeneidad tanto en el PDI como en el PAS. Sin embargo, más allá del propio lenguaje está la metodología de trabajo, la gestión de la información, la automatización de procedimientos y tanto la optimización en la gestión del tiempo, como la de los resultados de la comunicación.

Veremos como R forma parte de un sistema de trabajo más amplio que exige ciertos cambios en los modus operandi y una formación continua, este esfuerzo proporciona resultado de distinta naturaleza y plantea preguntas personales relevantes, para conseguir las respuestas vamos a proporcionar elementos de juicio.

¿Qué esperamos del curso?

Estamos seguros de que muchas son las preguntas que los participantes en el taller se plantean y pueden ir desde lo más simple hasta cuestiones mucho más avanzadas ¿Qué es R? ¿R sólo lo usan los estadísticos? ¿Sabiendo ya manejar el programa estadístico X podre cambiarme a R fácilmente? ¿Cuánto cuesta aprender a utilizarlo? ¿Está orientado a un campo del conocimiento específico? ¿Tengo que aprender mucho e invertir mucho tiempo? ¿Hay diferentes niveles de “aprendizaje”? ¿Me compensa el esfuerzo de aprender para el rendimiento que obtendré en mi trabajo? ¿Cómo puedo hacer el análisis estadístico X y que significan sus resultados?

Realizaremos una serie de actividades que nos proporcionaran argumentos para responder a estas y otras preguntas, así, veremos:

  • como utilizar el lenguaje R para resolver problemas simples que nos afectan en el quehacer cotidiano.
  • Como se puede utilizar con fluidez la terminal y manejar la interfaz básica de R con muy poco esfuerzo.
  • Estudiaremos como aprovechar las características los principales elementos de R y su entrono, así como el fundamento de la sintaxis de R.
  • Abordaremos el desafío de elaborar procedimientos básicos de trabajo documentados y reproducibles con R.

Obviamente, el nivel del experiencia previa y las expectativas de uso para cada uno de los distintos participantes puede ser muy distinta, por ello, vamos a empezar desde cero, los más experimentados pueden saltar aquellas propuestas de lectura o actividades que sugerimos en los materiales de trabajo; pero nadie puede “saltarse” las tareas propuestas.

Estamos a vuestra disposición… 00RTeam