Archivos de la categoría Big Data

Buenas noticias: IBM crea una plataforma de cursos online gratuitos sobre Big Data

En los tiempos que corren es innegable que el conocimiento de las técnicas estadísticas que engloban la disciplina conocida como Big Data, se ha convertido en una herramienta indispensable para la gran mayoría de analistas de datos de la actualidad. La hiper-conectividad del siglo XXI y los grandes avances en materia tecnológica de estos últimos veinte años hacen que la sociedad se esté involucrando, voluntaria o involuntariamente, en una generación continua de datos que están esperando para ser analizados.

Cada vez más, plataformas o empresas propensas a recabar grandes volúmenes de datos, ven necesario disponer de una sección dedicada a aplicar técnicas de Big Data a la información obtenida en pos de un próspero desarrollo. Ejemplos de esto pueden hallarse en ámbitos como el de la sanidad, el transporte, o las redes sociales.

Quizá por este u otros motivos IBM haya decidido subirse al carro del Big Data presentando “Big Data University”, un sitio web educacional que ofrece cursos gratuitos sobre Big Data y bases de datos. Lo más interesante de estos cursos es que incluyen laboratorios prácticos que puede realizar en la nube y que cuenta con una pequeña prueba que si superas recibes un certificado.

Otra de las ventaja de BigDataUniversity.com es que se trata de un sitio manejado por la comunidad de IBMers, que contribuyen voluntariamente al desarrollo de los cursos y a la mejora del sitio web.

I Jornada Big Data y Salud en la Región de Murcia

El pasado 21 de Abril tuvimos el placer de asistir a la I Jornada Big Data y Salud en la Región de Murcia. En ella, diversos conferenciantes expusieron proyectos muy interesantes en los que se hacía necesaria una recogida ingente de datos. Y es aquí, donde los modelos que ofrece el Big Data para el tratamiento de la información, se convertían en una herramienta fundamental. Sin duda, la conclusión unánime de la jornada fue, que cada vez se hará más patente la demanda de analistas de datos en el ámbito de la salud, pues este intercambio disciplinar no hace más que ampliar las posibilidades y enriquecer los resultados.



Podéis pinchar aquí para consultar el programa de la I Jornada Big Data y Salud en la Región de Murcia, y en este otro enlace para ver la galería de fotos del evento.

Consumidores y Big Data

El pasado 31 de enero podíamos leer en Diagonal: Big Data para rastrear al consumidor.

Big Data

[…] cada minuto se realizan cuatro millones de búsquedas en Google, se cruzan 204 millones de correos electrónicos, se suben 400 horas de vídeo a YouTube o se publican 2,5 millones de contenidos en Facebook. Y esta red de 3.400 millones de personas, el 45% de la población mundial, incrementa año tras año su tráfico de información casi en un 30%, calcula Cisco VNI.

Toda esa información está ahí y ahora se habla de Big Data porque, efectivamente, son muchos datos, pero sobre todo, porque con ellos vienen nuevas formas de entender su gestión y uso.

[…] De momento, sólo las tarjetas electrónicas, el teléfono móvil y algunos pocos wearables (dispositivos electrónicos incorporados a la ropa o complementos) están funcionando como rastreadores de nuestros movimientos, pero la tendencia es innegable. Este mismo año, señala Teresa García, la mitad del tráfico de internet se realizará a través de conexiones wifi, “pudiendo controlar qué ocurre en las tiendas, las veces que se acude a ellas, el tiempo de permanencia, la reacción ante un descuento o ante el rediseño de un espacio”.

El Big Data, por tanto, vuelve a alimentar el sueño de predecir el comportamiento del consumidor en las distintas fases del consumo. Poco se habla todavía de los impactos negativos que esto podría tener para nuestros derechos y nuestra capacidad de elección, pero nos los vamos imaginando.

Por eso desde este servicio intentamos utilizar el buscador que no rastrea DuckDuckGo como alternativa a Google.

Los mejores lenguajes de programación 2015

New languages enter the scene, and big data makes its mark

This app ranks top10proglang2015the popularity of dozens of programming languages. You can filter them by listing only those most relevant to particular sectors, such as “Web” or “embedded programming.” Rankings are created by weighting and combining 12 metrics from 10 sources. We offer preset weightings—the default is our IEEE Spectrum ranking—but there are presets for those interested in what’s trending or most looked for by employers. Don’t like the defaults? Take complete control and create your own ranking by adjusting each metric’s weighting yourself. To compare with last year’s data, add a comparison and then choose “edit ranking,” which will give you the option to take data from 2014.

We take a similarly pragmatic approach to how we classify languages into types like “embedded” or “Web.” Placement is based on typical use: For example, we are very impressed by those brave souls who have written Web servers completely in assembly code, but we’re not going to categorize Assembly as a Web development language. (Read more about our method and sources)

Once you’ve had a chance to use the app, let us know your feedback using this quick survey, or leave a comment below.

Leer el post original completoy comentarios en :  spectrum.ieee.org

Data scientists: ‘As rare as unicorns’

keep-calm-and-love-unicorns-35Data scientists are in high demand as executives seek talented individuals capable of unlocking the hidden value from big data to create big business results. But managing such scarce talent requires a proactive approach over the short, medium and long term.

Big data is enabling companies to gain new insights into areas ranging from customer behaviour to how their businesses function. These data-driven findings can have profound results on the bottom line.

The explosive growth in the amount of available data and an appreciation of its value is going to continue driving very strong demand for data scientists. In fact, their rarity already has some executives describing them as “unicorns”.

Sigue leyendo

Stonebraker: la base de datos Oracle está obsoleta y Facebook tiene el mayor problema de datos del mundo

Michael Stonebraker es una leyenda viva en el mundo de las bases de datos.

Stonebraker refinó las técnicas relacionales que hoy conforman el núcleo de miles de millones de dólares en ventas anuales de software por empresas como Oracle (ORCL), International Business Machines (IBM) y Microsoft (MSFT). Sigue siendo frecuente oir a tal o cual nueva startup tecnológica o ejecutivo del sector refiriéndose con asombro y admiración a su trabajo en los últimos 40 años. Sigue leyendo

Los analistas de negocio que gestionan BBDD serán reemplazados en los próximos años por los científicos de datos

Stonebraker,

Predice que muchos de los analistas de negocio que gestionan los almacenes de datos serán reemplazados en los próximos años por los científicos de datos, ya que están capacitados para trabajar con matrices en lugar de tablas, y con técnicas tales como el análisis de regresión, el análisis bayesiano y otros enfoques representados por programas como el paquete estadístico R:

Leer articulo original en español: http://www.bigdatahispano.org

Artículo original: Michael Stonebraker Explains Oracle’s Obsolescence, Facebook’s Enormous Challenge, by Tiernan Ray

 

For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights

Technology revolutions come in measured, sometimes foot-dragging steps. The lab science and marketing enthusiasm tend to underestimate the bottlenecks to progress that must be overcome with hard work and practical engineering.

The field known as “big data” offers a contemporary case study. The catchphrase stands for the modern abundance of digital data from many sources — the web, sensors, smartphones and corporate databases — that can be mined with clever software for discoveries and insights. Its promise is smarter, data-driven decision-making in every field. That is why data scientist is the economy’s hot new job.

Yet far too much handcrafted work — what data scientists call “data wrangling,” “data munging” and “data janitor work” — is still required. Data scientists, according to interviews and expert estimates, spend from 50 percent to 80 percent of their time mired in this more mundane labor of collecting and preparing unruly digital data, before it can be explored for useful nuggets. Sigue leyendo

Kaggle: how it Works

We’re the global leader in solving business challenges through predictive analytics.

http://www.kaggle.com

Un matemático andaluz desconocido es el mejor científico de datos del mundo

El matemático José Antonio Guerrero (Cádiz, 1961) es pintor, pero sus óleos son los datos. El lienzo sobre el que trabaja cada noche hasta el amanecer, después de su jornada laboral oficial, es el ordenador de su casa, en Sevilla, donde de forma obsesiva y anónima, como los artistas auténticos, ha pintado una serie de modelos predictivos que le han convertido en el mejor científico de datos del mundo.

kaggle rankings

Sus predicciones matemáticas son, a su modo, obras de arte: “Lo más parecido a mi trabajo sería el impresionismo. Muchas veces vas dando pasos intermedios definiendo y calculando variables, construyendo modelos parciales. El conjunto sólo toma pleno sentido cuando se mira desde una cierta perspectiva”, cuenta a Teknautas el escurridizo Guerrero, inédito aún –salvo este post de Soraya Paniagua– en las búsquedas de Google. Sin duda, forma parte del reducido grupo de personas que pueden encontrar la belleza en el big data.