Archivos de la categoría Software-Libre

EIDUM: Métodos de contraste de hipótesis y diseño de experimentos

Después de las fiestas de primavera comienza un nuevo curso de EIDUM: “Métodos de contraste de hipótesis y diseño de experimentos”.

Son dos sesiones (dos semanas) y hemos abierto dos grupos.

Destinatarios

Para cualquier investigador resulta básico la lectura y la generación de documentación donde se encuentran detallados los procedimientos de análisis estadístico. En este curso se plantea como objetivo general proporcionar a los participantes la capacidad práctica para abordar un estudio estadístico basado en el contraste de hipótesis. De forma práctica se abordarán, especialmente, tanto el análisis de la varianza (ANOVA) como la realización de análisis lineal (regresión lineal), pasando por otros aspectos relevantes y test más habituales.

Se trata de un curso eminentemente práctico y es imprescindible tener conocimientos de R (en particular de tabulación y representación gráfica de datos) y del uso de investigación reproducible.

Competencias

  • Se capaz de realizar adecuadamente un análisis de la varianza con R e interpretar los resultados obtenidos.
  • Se capaz de realizar adecuadamente un análisis de regresión con R e interpretar los resultados obtenidos.
  • Ser capaz de evaluar la adecuación de los principales test estadísticos a los problemas y los casos prácticos más frecuentes.

Contenidos

  1. Conceptos y distribuciones de probabilidad aplicados al contraste de hipótesis. El teorema del límite central. Los intervalos de confianza de un estadístico y los tipos de variables.
  2. Introducción a la aplicación de los contrastes de hipótesis y las situaciones de aplicación.
  3. Pruebas de diferencias de poblaciones (t, $\chi^2$ y ANOVA).
  4. Modelos de respuesta (el modelo lineal y otros modelos).

Resultados de aprendizaje

  • Capacidad de uso de los conceptos de probabilidad, las pruebas estadísticas, el contrastes de hipótesis y la significación en la elaboración de los datos propios y en la lectura crítica de documentación técnica.

  • Identificar las situaciones más frecuentes en el diseño de experimentos y sus soluciones.

  • Realización de protocolos de análisis con R y uso de análisis reproducible para elaborar informes de resultados.

El banco de Nueva Zelanda sustituye SAS por R

El banco Heartland Bank, de Nueva Zelanda, decidió utilizar técnicas de análisis de datos para evaluar las líneas de crédito, analizar riesgos y comprender los flujos de efectivo.

Comenzaron utilizando el sistema SAS, usual en estos ambientes, pero pronto se dieron cuenta de que este sistema era complicado y consumía mucho tiempo y recursos, sobretodo cuando trataban de actualizar los modelos financieros.

Así, el Heartland Bank reemplazó a SAS por servidores de R y SQL Server, y a adoptó R como su plataforma de análisis de datos. Heartland utiliza ahora R para diferentes procesos como el desarrollo de tarjetas de crédito, el análisis de atrasos y la previsión de inversiones, entre otros.

Además, su uso ha generado una nueva forma de trabajar los datos dentro de la empresa, ahora son los propios empresarios del banco quienes utilizan R para trabajar directamente con los nuevos modelos de datos, en lugar de depender de TI para producir informes. Así los empleados tienen acceso a información en tiempo real.

Pueden ver el artículo completo aquí.

El SAE en las VIII Jornadas de Usuarios de R

Congreso-R-Albacete-2016-GrupoMurcia Este año 2016, los del SAE y algunas personas más pudimos asistir a las VIII Jornadas de R, que esta vez se celebraron en Albacete.

Como siempre, el encuentro fue magnífico. Vimos a viejos amigos y amigas, gente que lleva acudiendo a las jornadas desde las primeras allá por el año 2009 en Murcia, e hicimos nuevos que esperamos seguir viendo en la próximas.

Es curioso constatar cómo cada vez el mundo de R, que hace pocos años era un grupúsculo de “cuasi frikis” o “visionarios”, se va ampliando. Aún así, el ambiente es aún muy familiar; acudieron unas 100 personas. Quien llega nuevo rápidamente se integra y se crea una camaradería que yo no he visto en otras reuniones científicas. Es un “congreso” en el que mucha gente dice “aquí me siento normal”, hartos de ser “el o la rarita de de R”. Es grato encontrar gente con tus aficiones y formas parecidas de entender la ciencia y, como cada vez somos más, pudimos comprobar con la charla de David Ríos Insua (RIMAS) cómo, incluso ministros del estado español, ya tienen acceso a informes hechos con R y Rstudio en LaTeX. Parece sorprendente, ¿no?

Las presentaciones y los materiales están disponibles en este enlace, incluidas nuestras 6 aportaciones.

En la asamblea de la Comunidad R Hispano que tuvo lugar, se acordó el lugar donde celebrar las siguientes: las IX Jornadas de R Granada, de la mano de José Luis Cañadas Reche. Seguro que van a estar genial. Y las X en Murcia (¡las jornadas X!). Así que tenemos citas en el calendario.

¡¡Ah!! ¡Y molan las pegatinas!. 2016-11-23 13.53.06

Taller: Documentos científicos y técnicos de alta calidad: más allá de wysiwyg

noWar

¿Qué es esto?

Presentaremos una metodología sencilla que proporciona documentos de calidad: tipográfica y estructurados. El método, relativamente sencillo, deja al ordenador y sus programas las tareas más rutinarias:

  • gestión de citas y referencias bibliográficas,
  • numeración de tablas y figuras,
  • salidas a distintos formatos (pdf, epub, web, word,. . . )
  • útil para documento cortos, trabajos organizados por capítulos, presentaciones, . . .

¿A quién va dirigido?

A los alumnos de cualquier titulación de la Facultad de Biología, pero puede participar cualquier miembro de la misma. Este taller está destinado preferentemente a alumnos de cuarto, tercer, segundo y primer curso (por ese orden). ¿Cuándo? De cuatro a seis de la tarde la fecha la seleccionas tu: 27 Octubre, 10 ó 15 Noviembre.

Sigue leyendo

PSPP reemplazo libre a SPSS

PSPP screenshot

¿Qué es PSPP y por qué usarlo?

Muchos de los cursos introductorios de estadística requieren el uso de algún software de análisis estadístico. La estadística debe y es independiente del software que se emplee, ¿por qué usar un software propietario cuando existe una alternativa libre como PSPP?

PSPP es una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa la biblioteca científica GNU para sus rutinas matemáticas, y plotutils para la generación de gráficos. Es un reemplazo libre para el software propietario SPSS y aparentemente muy similar con pequeñas excepciones. Las más importantes son:

  1. La copia de PSPP no expira con el tiempo
  2. Admite alrededor de un billón de casos y un billón de variables.
  3. No hay paquetes adicionales que haya que adquirir con el fin de obtener las funciones “avanzadas”; todas las funcionalidades que PSPP aporta actualmente están en el paquete básico.

Técnicas que implementa

PSPP ofrece muchas transformaciones y utilidades. Entre ellas, cabe destacar la capacidad de realizar:

  • t-tests
  • ANOVA
  • Regresión lineal
  • Regresión logística
  • Análisis de conglomerados
  • Análisis de confiabilidad
  • Análisis factorial
  • Pruebas no paramétricas

Algunas funcionalidades adicionales:

  • Pegar la sintaxis del análisis en ficheros parecidos a los .sps de SPSS.
  • Exportar los resultados a pdf, html, odt, csv, etc.

Enlaces de descarga del PSPP

Sigue leyendo

Bulgaria solo aceptará software de código abierto

Mapa y bandera de BulgariaDesde el pasado 1 de julio toda empresa que quiera contratar con la administración pública de Bulgaria para el desarrollo, mejora o implementación de programas informáticos tendrá como requisitos:

  1. Que se cumplan los criterios de open source software o software de código abierto,
  2. Que no hay limitaciones de copyright para su uso, modificación y distribución
  3. Y que se desarrolle en un repositorio mantenido por la administración.

Tal y como el autor de esta entrada afirma:

“Esto significa que cualquier software que el gobierno obtenga será visible y accesible para todo el mundo. Después de todo, es pagado con el dinero de los contribuyentes y ellos deberían poder verlo y beneficiarse de él.” De esta manera, todos los programas informáticos que se contraten a partir de ahora estarán disponibles para el público y podrán ser reutilizados y modificados según las necesidades de cada uno, con el ahorro que eso supone para la administración pública.

De esta manera, todos los programas informáticos que se contraten a partir de ahora estarán disponibles para el público y podrán ser reutilizados y modificados según las necesidades de cada uno, con el ahorro que eso supone para la administración pública.

Vía La mirada del replicante y ThePolicy.us.

R4U…. Introducción al uso de R en entornos universitarios

R44U

Comienza el curso “Introducción al uso de R en entornos universitarios” al que nosotros denominamos R4U

Este curso plantea un desafío aproximar el uso de R, un lenguaje, a un colectivo diverso como es el del “personal” de la universidad. Es un colectivo diverso en cualquiera de sus dimensiones, la marca es la heterogeneidad tanto en el PDI como en el PAS. Sin embargo, más allá del propio lenguaje está la metodología de trabajo, la gestión de la información, la automatización de procedimientos y tanto la optimización en la gestión del tiempo, como la de los resultados de la comunicación.

Veremos como R forma parte de un sistema de trabajo más amplio que exige ciertos cambios en los modus operandi y una formación continua, este esfuerzo proporciona resultado de distinta naturaleza y plantea preguntas personales relevantes, para conseguir las respuestas vamos a proporcionar elementos de juicio.

¿Qué esperamos del curso?

Estamos seguros de que muchas son las preguntas que los participantes en el taller se plantean y pueden ir desde lo más simple hasta cuestiones mucho más avanzadas ¿Qué es R? ¿R sólo lo usan los estadísticos? ¿Sabiendo ya manejar el programa estadístico X podre cambiarme a R fácilmente? ¿Cuánto cuesta aprender a utilizarlo? ¿Está orientado a un campo del conocimiento específico? ¿Tengo que aprender mucho e invertir mucho tiempo? ¿Hay diferentes niveles de “aprendizaje”? ¿Me compensa el esfuerzo de aprender para el rendimiento que obtendré en mi trabajo? ¿Cómo puedo hacer el análisis estadístico X y que significan sus resultados?

Realizaremos una serie de actividades que nos proporcionaran argumentos para responder a estas y otras preguntas, así, veremos:

  • como utilizar el lenguaje R para resolver problemas simples que nos afectan en el quehacer cotidiano.
  • Como se puede utilizar con fluidez la terminal y manejar la interfaz básica de R con muy poco esfuerzo.
  • Estudiaremos como aprovechar las características los principales elementos de R y su entrono, así como el fundamento de la sintaxis de R.
  • Abordaremos el desafío de elaborar procedimientos básicos de trabajo documentados y reproducibles con R.

Obviamente, el nivel del experiencia previa y las expectativas de uso para cada uno de los distintos participantes puede ser muy distinta, por ello, vamos a empezar desde cero, los más experimentados pueden saltar aquellas propuestas de lectura o actividades que sugerimos en los materiales de trabajo; pero nadie puede “saltarse” las tareas propuestas.

Estamos a vuestra disposición… 00RTeam

Taller: Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG

El día viernes, 13 de Mayo, se celebrará a las 12:00 en el ADLA BUITRE, el taller “Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG”.

Zpala

¿Qué es el “WYSIWYG”?

Las siglas “WYSIWYG” significan “What you see is what you get”, y hacen referencia a todos los editores/procesadores de texto con un tipo de formato que permite escribir un documento viendo directamente el resultado final, frecuentemente el resultado impreso.
Esto, aunque aparentemente parece una ventaja, tiene sus inconvenientes, pues en pos de poder ver lo que será el resultado, el software sacrifica prestaciones, al no poder obtener un manejo absoluto de lo que se está editando.
Un ejemplo de editores/procesadores de texto que no se encuadran dentro de la familia “WYSIWYG” es LaTeX; un sistema de composición de textos, orientado a la creación de documentos escritos que presenten una alta calidad tipográfica. Por sus características y posibilidades, es usado de forma especialmente intensa en la generación de artículos y libros científicos que incluyen, entre otros elementos, expresiones matemáticas.

Privacidad en la red: 3 alternativas a Gmail

candado

Imagina que cierta entidad te ofrece, a cambio de instalar un bonito buzón en casa, un contrato en el que le concedes permiso para que cada día revise este buzón, abra tus cartas, anote información relevante y use ésta con fines de lucro, es decir, para establecer un perfil sobre ti que luego venderá a empresas que adecuarán su publicidad a tus intereses. Firmar esto nos parecería una locura, pero es, idénticamente aunque de manera digital, lo que nos hace firmar Google – cuando creamos una cuenta de correo electrónico – en sus Condiciones de Privacidad. Aún es más, la llave que Google pone a nuestro buzón es algo insegura, pues cualquier persona con los pertinentes conocimientos en seguridad informática podría acceder también a tus cartas.

Esto es algo serio, ya que cada vez más vinculamos más servicios a nuestro correo electrónico; como notificaciones de nuestra cuenta bancaria, reservas en hoteles, trabajo, etc. Por eso, proponemos estas tres alternativas a Gmail que mantendrán a salvo tu información personal.

openmailbox Openmailbox: Es un proveedor de correo electrónico en la web que usa únicamente software libre y cuya filosofía es ser totalmente independientes de todas las grandes compañías de la web y cuya prioridad es respetar la privacidad de los miembros, como maniefiestan en su página web. Además, cuando te das de alta en Openmailbox, estos te crean automáticamente una cuenta en ownCloud – un servicio de almacenamiento en la nube – con 1 GB de capacidad.

protonmail ProtonMail: Es el servicio de correo electrónico de código abierto y libre más seguro de los tres que hablamos y fue abierto al público hace poco tiempo – antes solo podrías registrarte mediante invitación. Cuando creas una cuenta debes introducir dos contraseñas; una para el usuario, y otra para la bandeja de entrada. Además, permite crear una contraseña para proteger los correos que envíes a servidores de correo electrónico distintos de ProtonMail, y cuenta con aplicación móvil. Los motivos que llevaron a sus desarrolladores a crear ProtonMail y cómo transcurrió el proceso son muy curiosos y se explican en este interesantísimo vídeo.

openmailbox Tutanota: Es un servicio de correo electrónico en la web de código abierto y libre muy similar a ProtonMail en cuanto a seguridad. Permite crear contraseñas para correos que sean enviados a servidores de correo electrónico distintos de Tutanota, pero no crea una contraseña para la bandeja de correo. También cuenta con aplicación móvil.

Si te ha resultado interesante la entrada puedes seguir leyendo sobre el tema pinchando en el siguiente enlace: Google te espía, pídele el divorcio

Generando gráficos 3D en movimiento con R

movie

En esta entrada explicamos cómo elaborar un gráfico 3D en movimiento con R. Además veremos cómo exportarlo en formato .gif. Utilizamos para ello la librería rgl de R.

Preparando los datos

Leemos el fichero de datos con el que queremos trabajar.

biom <- read.table("http://ares.inf.um.es/00Rteam/datos/biom2003.dat")

Verificamos una lectura adecuada con un simple vistazo de las primeras filas de biom:

head( biom )

Comprobamos que el número de filas y columnas es adecuado:

dim( biom )

Pasamos a elaborar nuestro gráfico en 3 dimensiones.

Gráficos 3D

Cargamos la librería rgl y elaboramos el gráfico con la función plot3d().

library( rgl )
plot3d( biom$Altura, biom$Peso, biom$Hombros, 
        col = biom$Sexo, type = "s", radius = 1.5 )

Para ver nuestro gráfico en movimiento utilizamos la función play3d() cuyos argumentos son

  • spin3d(): para girar el gráfico.
  • duration: tiempo que está en movimiento (seg.)

La expresión quedaría:

play3d( spin3d(  ), duration = 10 )

Podemos añadirle a la función spin3d() los argumentos axis y rpm, con los que indicamos los ejes y la velocidad de rotación.

play3d( spin3d( axis = c(0, 0, 1), rpm = 7), duration = 10 )

Sigue leyendo