domingo, 17 de junio de 2012

Esto de BIG DATA traerá cola

He decido hacer un resumen de los tres artículos que sobre Big Data teníamos en nuestro antiguo Blog. Muchos de vosotros no lo leíais y creo que es un tema que esta ahora de interés, cuando la primera entrada tiene mas de año y medio. Pero en parte BigQuery va a revolucionar esto así que, aquí teneís de nuevo parte de mi ciencia.

Hablemos de Big Data


Hace ya más de un año que una de mis revistas digitales favoritas se hacía la siguiente pregunta What is "Big Data?" y no les faltaba razón en cuestionarlo porque, ya llevaba el mundo de las grandes empresas de TI dándole muchas vueltas al asunto. Yo me hice el siguiente razonamiento: "Esto de Big Data tiene buena pinta pero me parece que de momento está más orientado a las grandes consultoras, bueno, cuando vea que Google compra una empresa especializada en Big Data o saque un producto sobre el tema le empezaré a dar mayor importancia. De momento me dedicaré a leer toda la información que vaya saliendo sobre el tema". Y en esto que ya tenemos a Google que anuncia su inmersión en Big Data bajo el nombre de BigQuery.


Así nos lo contaron en Mayo del año 2010 y la respuesta la pregunta que se que te estas haciendo es: porque ahora es el momento en que el mercado está empezando a madurar (por supuesto, al otro lado del océano Atlántico) y Google (desde el día 1 de mayo) ha empezado su campaña de marketing como mejor sabe, de forma viral, y aquí estoy yo hablando de Big Data.

¿Pero que es Big Data?

La propia traducción nos lo dice, siempre que demos con el termino adecuado para la palabra big, ya que data es fácil, datos. Así que en este caso no traduciremos big como grande o enorme, sino como gran cantidad o enorme cantidad, por supuesto, de datos.
Siempre que pensamos en datos nos hemos acostumbrado a asociarlo con base de datos y nos lo solemos imaginar con conceptos como matricula, dni, telefono o genero (todavía me encuentro bases de datos que usan el nombre de campo "sexo" y no permiten rellenarlo con mucho o poco). Pero en la actualidad ya no trabajamos realmente con ese tipo de datos. Trabajamos con webs, con fotos, con vídeos, con documentos pdf, que asociamos a un proyecto o a una persona con un número de identificación. Y esos datos, esa gran cantidad de datos, que es imposible tratar con las herramientas clásicas de base de datos a las que hemos estado acostumbrados a usar hasta ahora, es a lo que llamamos Big Data.
Un ejemplo muy sencillo puede ser el de un historial médico de un paciente. Hasta ahora para los servicios de salud, sus clientes no eran más que un nombre, una dirección y el médico de familia que les correspondía. Pero hoy en día nadie concibe que un historial no incluya las radiografías, los informes de urgencias, todas las analíticas de la vida del paciente y cualquier dato que te puedas imaginar.Osakidetza ya lleva en ese proceso desde el año 2009 con la eliminación a finales de este año de las radiografías tradicionales.

Big data, “the next buzzword”

La palabra buzzword se usa para denominar esos términos que de la noche a la mañana empiezan a usar todos los consultores de TI, los vendedores de informática, y que si no has usado en tu última conferencia, la gente sale diciendo que no estas al día en vigilancia tecnológica. Así que si todavía no lo habías escuchado, a partir de hoy te vas a hartar de oírselo decir a todos los "gurus". Yo los suelo llamar "palabros".
Existen muchas herramientas de grandes compañías que permiten tratar y utilizar esta gran cantidad de datos. Una de las más conocidas es Oracle Exadata. Pero también hay una de código abierto denominada Hadoop. Ninguna de ellas es sencilla y por tanto requiere de un entrenamiento y conocimiento en el campo de las bases de datos a nivel de experto. Pero que esto no te haga renunciar a iniciarte en un campo del que vamos a oír hablar mucho en los próximos tiempos.

No hay comentarios:

Publicar un comentario en la entrada