Archivos de la categoría Formación

Seminario SAE: Consistencia interna en cuestionarios

corrplotMañana (viernes 14/oct) tendrá lugar el en el aula del SACE (12h) el seminario sobre “Consistencia interna en cuestionarios “, que dará Elvira Ferre Jaén, matemática estadística de este servicio.

En la exposición se repasaran diversa técnicas para medir consistencia interna y correlación en cuestionarios.

Actualización: Aquí os dejamos la presentación correlacion-consistencia-interna.pdf

Seminario SAE: El paquete Tables

alvarox Hoy ha tenido lugar el seminario sobre “El paquete tables de R”, que ha dado Álvaro Hernández Vicente. Que facilita mucho la creación de tablas con muchas categorías, cuidando el aspecto, genial para incluir en nuestros informes automáticos de grandes conjuntos de datos.

Os dejamos aquí la presentación en pdf. Paquete-tables-pres.pdf

PSPP reemplazo libre a SPSS

PSPP screenshot

¿Qué es PSPP y por qué usarlo?

Muchos de los cursos introductorios de estadística requieren el uso de algún software de análisis estadístico. La estadística debe y es independiente del software que se emplee, ¿por qué usar un software propietario cuando existe una alternativa libre como PSPP?

PSPP es una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C. Usa la biblioteca científica GNU para sus rutinas matemáticas, y plotutils para la generación de gráficos. Es un reemplazo libre para el software propietario SPSS y aparentemente muy similar con pequeñas excepciones. Las más importantes son:

  1. La copia de PSPP no expira con el tiempo
  2. Admite alrededor de un billón de casos y un billón de variables.
  3. No hay paquetes adicionales que haya que adquirir con el fin de obtener las funciones “avanzadas”; todas las funcionalidades que PSPP aporta actualmente están en el paquete básico.

Técnicas que implementa

PSPP ofrece muchas transformaciones y utilidades. Entre ellas, cabe destacar la capacidad de realizar:

  • t-tests
  • ANOVA
  • Regresión lineal
  • Regresión logística
  • Análisis de conglomerados
  • Análisis de confiabilidad
  • Análisis factorial
  • Pruebas no paramétricas

Algunas funcionalidades adicionales:

  • Pegar la sintaxis del análisis en ficheros parecidos a los .sps de SPSS.
  • Exportar los resultados a pdf, html, odt, csv, etc.

Enlaces de descarga del PSPP

Sigue leyendo

Seminario: Visualización y análisis de escalas Likert

Ant J. Perán en el aula del edificio SACE del SAI

Ant José Peran en el aula del edificio SACE del SAI

El pasado viernes 30 de septiembre tuvo lugar en el Edificio SACE, el seminario “Visualización y análisis de escalas Likert”, presentado por nuestro compañero Antonio José Perán.

Esperamos que sea el primero de una saga de pequeños seminarios sobre paquetes de R y técnicas estadísticas que consideremos interesantes. Las iremos anunciando con más antelación que esta en esta web.

Os dejamos aquí la presentación en pdf: Visualizacion-y-analisis-de-escalas-Likert.pdf

Buenas noticias: IBM crea una plataforma de cursos online gratuitos sobre Big Data

En los tiempos que corren es innegable que el conocimiento de las técnicas estadísticas que engloban la disciplina conocida como Big Data, se ha convertido en una herramienta indispensable para la gran mayoría de analistas de datos de la actualidad. La hiper-conectividad del siglo XXI y los grandes avances en materia tecnológica de estos últimos veinte años hacen que la sociedad se esté involucrando, voluntaria o involuntariamente, en una generación continua de datos que están esperando para ser analizados.

Cada vez más, plataformas o empresas propensas a recabar grandes volúmenes de datos, ven necesario disponer de una sección dedicada a aplicar técnicas de Big Data a la información obtenida en pos de un próspero desarrollo. Ejemplos de esto pueden hallarse en ámbitos como el de la sanidad, el transporte, o las redes sociales.

Quizá por este u otros motivos IBM haya decidido subirse al carro del Big Data presentando “Big Data University”, un sitio web educacional que ofrece cursos gratuitos sobre Big Data y bases de datos. Lo más interesante de estos cursos es que incluyen laboratorios prácticos que puede realizar en la nube y que cuenta con una pequeña prueba que si superas recibes un certificado.

Otra de las ventaja de BigDataUniversity.com es que se trata de un sitio manejado por la comunidad de IBMers, que contribuyen voluntariamente al desarrollo de los cursos y a la mejora del sitio web.

Conviértete en un Data Scientist

Nace el Grado en Matemática Aplicada al análisis de datos por la Universidad Europea de Madrid.

En los últimos años han irrumpido en nuestra sociedad términos como el Internet de las Cosas, la industria 4.0, las Smart Cities, y el Big Data. Todos estos términos tienen en común la necesidad del almacenamiento masivo de grandes cantidades de datos en tiempo real y del análisis automático de los mismos con el objetivo de obtener información útil como base en la toma de decisiones a niveles estratégicos. Los ámbitos de aplicación son, además, muy extensos como Salud, Educación, Industria, Energía, y un largo etcétera. Los efectos que está teniendo en los resultados de las organizaciones son tales que en algunos casos se están tomando decisiones de gran nivel basándose únicamente en los resultados de estos procesos automáticos. Un ejemplo de ello son los nuevos seguros de automóviles que están basando el cálculo de las cuotas en los resultados de analizar los datos de la trazabilidad recopilados a través de todos los sensores que hoy en día disponen los automóviles. Es tal la influencia que el análisis de datos está generando en la sociedad y, en particular, en la industria, que ya se habla de la 3º revolución industrial.

El data scientist

Este reto requiere de profesionales que estén bien formados y perfectamente preparados para generar valor en torno a esta gran oportunidad. Un analista de datos tiene que ser capaz de abordar funciones de Explotación, Desarrollo, Diseño y Administración de sistemas de gran volumen de datos, y en un nivel superior, las funciones de Análisis, Arquitectura y Dirección de los mismos. Para ello tiene que dominar las técnicas y herramientas de las matemáticas y la estadística, así como, las técnicas y herramientas software que se utilizan para el almacenamiento de grandes cantidades de datos en tiempo real, para el análisis y procesamiento de los mismos (utilizando modelos predictivos e inteligencia de negocio), así como para la visualización de forma adecuada para mejor entendimiento del encargado de tomar la decisión final.

Una profesión con mucho presente y más futuro Sigue leyendo

R4U…. Introducción al uso de R en entornos universitarios

R44U

Comienza el curso “Introducción al uso de R en entornos universitarios” al que nosotros denominamos R4U

Este curso plantea un desafío aproximar el uso de R, un lenguaje, a un colectivo diverso como es el del “personal” de la universidad. Es un colectivo diverso en cualquiera de sus dimensiones, la marca es la heterogeneidad tanto en el PDI como en el PAS. Sin embargo, más allá del propio lenguaje está la metodología de trabajo, la gestión de la información, la automatización de procedimientos y tanto la optimización en la gestión del tiempo, como la de los resultados de la comunicación.

Veremos como R forma parte de un sistema de trabajo más amplio que exige ciertos cambios en los modus operandi y una formación continua, este esfuerzo proporciona resultado de distinta naturaleza y plantea preguntas personales relevantes, para conseguir las respuestas vamos a proporcionar elementos de juicio.

¿Qué esperamos del curso?

Estamos seguros de que muchas son las preguntas que los participantes en el taller se plantean y pueden ir desde lo más simple hasta cuestiones mucho más avanzadas ¿Qué es R? ¿R sólo lo usan los estadísticos? ¿Sabiendo ya manejar el programa estadístico X podre cambiarme a R fácilmente? ¿Cuánto cuesta aprender a utilizarlo? ¿Está orientado a un campo del conocimiento específico? ¿Tengo que aprender mucho e invertir mucho tiempo? ¿Hay diferentes niveles de “aprendizaje”? ¿Me compensa el esfuerzo de aprender para el rendimiento que obtendré en mi trabajo? ¿Cómo puedo hacer el análisis estadístico X y que significan sus resultados?

Realizaremos una serie de actividades que nos proporcionaran argumentos para responder a estas y otras preguntas, así, veremos:

  • como utilizar el lenguaje R para resolver problemas simples que nos afectan en el quehacer cotidiano.
  • Como se puede utilizar con fluidez la terminal y manejar la interfaz básica de R con muy poco esfuerzo.
  • Estudiaremos como aprovechar las características los principales elementos de R y su entrono, así como el fundamento de la sintaxis de R.
  • Abordaremos el desafío de elaborar procedimientos básicos de trabajo documentados y reproducibles con R.

Obviamente, el nivel del experiencia previa y las expectativas de uso para cada uno de los distintos participantes puede ser muy distinta, por ello, vamos a empezar desde cero, los más experimentados pueden saltar aquellas propuestas de lectura o actividades que sugerimos en los materiales de trabajo; pero nadie puede “saltarse” las tareas propuestas.

Estamos a vuestra disposición… 00RTeam

EIDUM, EDE01: Creación, manejo y explotación de datos espaciales

paqui1Comienza el curso de EIDUM: Creación, manejo y explotación de datos espaciales”. Consiste en tres sesiones, y hay tres grupos con diferente horario (horario de tarde). Se imparte en el aula Bisbita de la facultad de Biología.

Destinatarios

Alumnos de doctorado con conocimientos básicos de SIG (esencialmente los recogidos por el documento del Instituto Geográfico Nacional Conceptos cartográficos ) y con conocimientos de R, tanto los gestión de datos como en los de representación gráfica, puede participar en este curso para aprovechar el potencial de R en la gestión y la representación de datos espaciales y complementar este conocimiento con el uso de un programa de desktop mapping potente como es Quantum GIS.

Competencias

paqui2

  • Ser capaz de combinar información espacial procedente de distintas fuentes o formatos
  • Ser capaz de preparar datos espaciales propios y representarlos adecuadamente
  • Ser capaz de independizar los datos del software empleado para su procesamiento, análisis o representación

Contenidos

  1. Visualización de datos cartográficos (Qgis)
  2. Reproyecciones (gdal y ogr)
  3. Captura de datos cartográficos de Internet (openlayers y otros)
  4. Introducción a la elaboración de mapas con R. Gestión de información ráster y vectorial
  5. Diseño de impresión de mapas (Qgis y R)

Resultados de aprendizaje

  • Poder visualizar mapas propios en pantalla o en papel documentación cartográfica personalizada
  • Poder utilizar la información procedente de servidores cartográficos y otras fuentes
  • Poder realizar cálculos básicos con la información espacial para la obtención de mapas propios
  • Manejar adecuadamente los sistemas de proyección y poder reproyectar convenientemente la cartografía disponible
  • Preparar la información para generar mapas de calidad destinados a la impresión

Evaluación

Para la superación del curso se exigirá:

  • la asistencia a las sesiones presenciales obligatorias
  • la cumplimentación del cuestionario de satisfacción del curso
  • la realización y entrega de las tareas requeridas, tal como se indica a continuación

El curso es semipresencial, y al trabajo en las sesiones presenciales ha de sumarse el realizado por los alumnos siguiendo las indicaciones que se detallan en el aula virtual; estas se inician antes de las sesiones presenciales.

En todas las sesiones presenciales se realizarán dos controles, tipo test, de unos diez minutos de duración:

  1. Al inicio, donde se evaluará la actividad del alumno con los materiales puestos a su disposición en el aula virtual. La actividad será seguida además por las herramientas de monitorización del AV.

  2. Al final, en el que se evaluará los avances logrados durante la sesión de clase.

Además, existe una tarea del curso que se presentará en el aula virtual con fecha límite de una semana tras la realización de la última sesión presencial. Esta tarea será evaluada por dos compañeros en la propia aula virtual con una semana de tiempo a contar desde la entrega de la tarea.

VIII Jornadas de Usuarios de R

RalbaceteLa Asociación R-Hispano tiene el placer de anunciar la celebración de las VIII Jornadas de Usuarios de R. En esta ocasión, será la Universidad de Castilla-La Mancha, en su campus de Albacete, quien acoja las Jornadas los días 17 y 18 de noviembre de 2016.

El objetivo de las Jornadas es proporcionar un punto de encuentro a la diversidad de usuarios de R por lo que, independientemente de la filiación o del área de trabajo o investigación, todo usuario de R es bienvenido.

Como en años anteriores, la presentación de trabajos en las Jornadas puede ser en forma de Presentación oral, en distintas sesiones paralelas, que reflejen el amplio abanico de análisis de datos mediante R, Póster, en una sesión específica, o como un Taller que permita profundizar en aspectos interesantes y menos conocidos de R.

El envío de trabajos ha de hacerse a través del formulario habilitado en la web del congreso en http://r-es.org/8jornadasR . En esta edición de las Jornadas también se otorgará un premio al mejor trabajo presentado por un investigador joven (ver bases en la web de las Jornadas).

Finalmente, queremos agradecer la colaboración de nuestros patrocinadores, sin los que las Jornadas no serían posible. Si tú o tu institución estáis interesados en patrocinar las Jornadas puedes consultar cómo hacerlo en http://r-es.org/8jornadasR .

Las fechas importantes son:

  • Envío de comunicaciones (presentación/póster/taller): del 15/02/2016 al 15/06/2016 (PLAZO AMPLIADO)
  • Decisión sobre envíos: 01/07/2016
  • Registro: del 01/03/2016 al 18/11/2016

Taller: Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG

El día viernes, 13 de Mayo, se celebrará a las 12:00 en el ADLA BUITRE, el taller “Documentos científicos y técnicos de alta calidad: más allá de WYSIWYG”.

Zpala

¿Qué es el “WYSIWYG”?

Las siglas “WYSIWYG” significan “What you see is what you get”, y hacen referencia a todos los editores/procesadores de texto con un tipo de formato que permite escribir un documento viendo directamente el resultado final, frecuentemente el resultado impreso.
Esto, aunque aparentemente parece una ventaja, tiene sus inconvenientes, pues en pos de poder ver lo que será el resultado, el software sacrifica prestaciones, al no poder obtener un manejo absoluto de lo que se está editando.
Un ejemplo de editores/procesadores de texto que no se encuadran dentro de la familia “WYSIWYG” es LaTeX; un sistema de composición de textos, orientado a la creación de documentos escritos que presenten una alta calidad tipográfica. Por sus características y posibilidades, es usado de forma especialmente intensa en la generación de artículos y libros científicos que incluyen, entre otros elementos, expresiones matemáticas.