Juan de la Herrán charlando en esta ocasión con el equipo de GlobalDMTech, Joxe Etxebarria Intxausti CEO, Iker Jauregibeitia Chief Data Officer y con Ignacio "Ina" Arriola OregiVer Principal Data Scientist.
En la charla hemos descubierto que...
"Año 2020, Joxe Etxebarria, presidente del Zornotza ST, decide dar un paso más dentro del sector tecnológico al que lleva ligado más de dos décadas, para apostar por aquello que está resultando ser la clave para la optimización de procesos: la explotación inteligente de los datos. Como buen cazatalentos, se marca el mejor Slam dunk con el fichaje de Iker Jauregibeitia, a quien bautiza como Moneyball, por su particular método para aplicar la inteligencia artificial en el desarrollo de estrategias deportivas en ligas profesionales. Junto a un equipo multidisciplinar especializado en Microsoft 365, comunicación corporativa y producción audiovisual, nace Global DMTech. Un concepto de empresa que es capaz de diseñar soluciones para todo aquel que quiera dar el paso hacia la transición digital. Dos años después de su fundación, sus algoritmos han sido aplicados en disciplinas tan dispares como la recogida de residuos, la biociencia o el deporte; contribuyendo a la optimización de metodologías, recursos o estrategias. Pero la ambición y competitividad que han marcado su trayectoria deportiva dejan huella en Etxebarria, que sigue imparable y ya está inmerso en la creación de una nueva línea de negocio centrada en la computación cuántica. Global Data Quantum es la jugada maestra que tratará de unificar sus algoritmos con las tecnologías cuánticas, con la ayuda de la estrategia Quantum Ecosystem de la Diputación Foral de Bizkaia. "
Mi columna en DEIA, El valor de los datos personales
ESTE es el título con el que la Agencia Vasca de Protección de Datos realiza hoy un encuentro dentro de los XXXIII Cursos de Verano de la UPV. Han tenido a bien invitarme como ponente dentro de la mesa redonda Publicidad y Cookies. El encuentro se centra en el problema del uso de los datos personales de los ciudadanos que en muchas ocasiones son utilizados con fines comerciales. Está claro que la tecnología está cambiando la apreciación que tenemos sobre nuestros datos. Un ejemplo muy sencillo, comentado en las jornadas de documentación médica, fue que se había detectado que una de las historias clínicas de un paciente, había tenido más de 500 accesos. Lo normal es que tan solo un médico y una enfermera lo consulten. Solución: la paciente era una famosa cantante y sus datos personales pudieron ser utilizados para la obtención de rendimientos económicos al ser filtrada la exclusiva de su enfermedad.
POR JUAN DE LA HERRÁN - Lunes, 23 de Junio de 2014 - Actualizado a las 06:05h
ESTE es el título con el que la Agencia Vasca de Protección de Datos realiza hoy un encuentro dentro de los XXXIII Cursos de Verano de la UPV. Han tenido a bien invitarme como ponente dentro de la mesa redonda Publicidad y Cookies. El encuentro se centra en el problema del uso de los datos personales de los ciudadanos que en muchas ocasiones son utilizados con fines comerciales. Está claro que la tecnología está cambiando la apreciación que tenemos sobre nuestros datos. Un ejemplo muy sencillo, comentado en las jornadas de documentación médica, fue que se había detectado que una de las historias clínicas de un paciente, había tenido más de 500 accesos. Lo normal es que tan solo un médico y una enfermera lo consulten. Solución: la paciente era una famosa cantante y sus datos personales pudieron ser utilizados para la obtención de rendimientos económicos al ser filtrada la exclusiva de su enfermedad.
En materia de tecnología y datos se legisla tarde y para casos concretos, lo que hace que las normas estén obsoletas incluso desde antes de su aprobación. Creo que el papel de las cookies, facilitar y ayudar a los usuarios a que su experiencia mientras navega por internet sea lo más eficaz posible, se ha ido perdiendo a medida que se han empezado a utilizar con fines lucrativos. Recordemos el ejemplo de los billetes de avión buscados por internet. Prueba a pedir el precio de un vuelo. Vuelve al día siguiente y ese mismo vuelo será ya más caro. Ahora borra las cookies de tu navegador y el precio vuelve a ser el del primer día. Por tanto, el futuro no está en las cookies que poco a poco dejarán de ser utilizadas y daremos paso a la publicidad social personalizada.
La publicidad es necesaria, aunque solo sea para saber qué opciones tengo dentro del mercado. Pero me niego a que tan solo las grandes marcas y multinacionales me inunden con sus anuncios y pierda mi derecho a poder adquirir ese producto que me encaja perfectamente, pero que desconozco de su existencia porque su fabricante no puede acceder a los canales habituales de comunicación publicitaria. En las redes sociales he conseguido que la publicidad que me llega haga referencia a mis aficiones, a mis gustos y a mi capacidad económica, con lo que el nivel de conocimiento de productos que necesito comprar es mucho mayor que antes. En esta comunidad sí admitimos publicidad; eso sí, personalizada.
AMIGOS de la redacción, no maten al mensajero, solo escribo sobre aquello que está pasando en el mundo de la tecnología. El pasado mes de marzo la versión digital de Los Angeles Times era la primera en publicar la noticia sobre un temblor que se acababa de producir. Ken Ken Schwencke había creado un algoritmo basado en sistemas de inteligencia artificial que escribiría un artículo breve en el momento en que se produjera un temblor. Pero este algoritmo es ya capaz de hacer lo mismo a partir de los datos recibidos sobre homicidios, accidentes de tráfico y en un futuro, quien sabe si podrá diferenciar cuál es la noticia que va a la portada de un diario.
POR JUAN DE LA HERRÁN - Lunes, 16 de Junio de 2014 - Actualizado a las 04:34h
AMIGOS de la redacción, no maten al mensajero, solo escribo sobre aquello que está pasando en el mundo de la tecnología. El pasado mes de marzo la versión digital de Los Angeles Times era la primera en publicar la noticia sobre un temblor que se acababa de producir. Ken Ken Schwencke había creado un algoritmo basado en sistemas de inteligencia artificial que escribiría un artículo breve en el momento en que se produjera un temblor. Pero este algoritmo es ya capaz de hacer lo mismo a partir de los datos recibidos sobre homicidios, accidentes de tráfico y en un futuro, quien sabe si podrá diferenciar cuál es la noticia que va a la portada de un diario.
Christer Clerwall, un profesor profesor asistente de medios de comunicación y las comunicaciones en la Universidad de Karlstad en Suecia, ha encontrado la respuesta a esta pregunta. En un estudio, con una muestra de datos importante, ha hecho leer y comparar los mismos artículos redactados por periodistas y por este sistema robot de Los Angeles Times. Su conclusión, "Estoy bastante seguro de que en un futuro no muy lejano, el contenido más periodístico (incluso más elaborado que lo que vemos hoy en día) probablemente será producido por los ordenadores (o algoritmos)". La combinación datos en la nube, big data e inteligencia artificial pueden hacer que esto suceda. Este tipo de algoritmos analizan constantemente cuáles son las noticias más leídas, más comentadas. Son capaces de aprender y mejorar de una forma totalmente subjetiva y dar a sus lectores incluso periódicos personalizados.
Que nadie piense que esto es un ataque al periodismo. En un artículo de The Economist del mes de enero The Future Of Jobs: The Onrushing Wave nos da una lista de aquellos trabajos que serán sustituidos por uno de estos robots software, de aquí a 20 años. Operadores de Telemarketing, Contables y Auditores, Agentes Inmobiliarios o Pilotos de Aviación Comercial son algunos de los que se ven más amenazados. Pero hay profesiones como la medicina, en la que los robots son capaces de operar de forma remota guiados por un humano. A medida que vayan realizando más intervenciones, con los datos de éxito o de fracaso, estos sistemas serán mucho más precisos en sus diagnósticos y podrán llegar a realizar intervenciones quirúrgicas sin necesidad de la intervención de un humano.
ESTA es la conferencia que voy a desarrollar el próximo jueves en el Palacio de Congresos Europa, en Vitoria-Gasteiz. Participo dentro de las XVI Jornadas Nacionales de Documentación Médica, que bajo el título Orientando nuestro servicio a la atención integral al ciudadano, va a reunir a sanitarios, médicos, gerentes y, en general, profesionales interesados en la documentación médica. Hablar de salud y nuevas tecnologías parece algo obvio, pero una gran labor de los servicios de salud se la lleva la parte burocrática y en especial las historias clínicas de los pacientes.
POR JUAN DE LA HERRÁN - Lunes, 9 de Junio de 2014 - Actualizado a las 06:00h
ESTA es la conferencia que voy a desarrollar el próximo jueves en el Palacio de Congresos Europa, en Vitoria-Gasteiz. Participo dentro de las XVI Jornadas Nacionales de Documentación Médica, que bajo el título Orientando nuestro servicio a la atención integral al ciudadano, va a reunir a sanitarios, médicos, gerentes y, en general, profesionales interesados en la documentación médica. Hablar de salud y nuevas tecnologías parece algo obvio, pero una gran labor de los servicios de salud se la lleva la parte burocrática y en especial las historias clínicas de los pacientes.
En la actualidad creo que existen las herramientas tecnológicas suficientes para que sea una realidad que todo nuestro historial médico, que se genera desde el mismo momento de nuestro nacimiento, esté totalmente informatizado. Técnicamente es posible almacenar cualquier tipo de dato, incluyendo nuestras radiografías, los videos de nuestras intervenciones, todos nuestros electrocardiogramas, los medicamentos que hemos tomado, independientemente del servicio de salud que nos haya atendido, tanto público como privado, y estemos en la región que estemos, o incluso, del país donde se nos atendió. Si una cadena de supermercados o una empresa como Amazon o Facebook, son capaces de saber de nuestros gustos y proponernos descuentos y ofertas en función de nuestra historia como clientes, creo que los servicios de salud pueden hacer mucho en cuanto a la atención preventiva individualizada.
La otra historia, la real, es cómo poner de acuerdo a las diferentes administraciones. Cómo convencer a los diferentes departamentos de informática para trabajar en sistemas y estándares que faciliten este tipo de iniciativas. Seguimos con el miedo absurdo a que nuestra información se encuentre almacenada en la nube. Y nos encontramos con todas las trabas y problemas que desde tiempo inmemorial pone la burocracia, por lo que esto no será factible de forma inmediata.
Gracias a un smartphone y a miles de ponibles podemos almacenar cuántas horas hemos dormido, cómo se ha comportado nuestro ritmo cardíaco durante todo el año, el ejercicio exacto y preciso que hemos desarrollado, y mil y un datos más. En unos años nuestro médico no nos preguntará si hemos hecho ejercicio y cuanto, o en qué momento nuestro corazón se aceleró, tendrá el dato preciso, y eso redundará en nuestra salud.
Cómo podemos crear organizaciones y gobiernos que sean cooperativos, productivos y creativos? Esta es la pregunta que trata de resolver la Social Physics, en un momento en el que la competencia global, los retos medioambientales y el fracaso de los gobiernos están en la mente de toda la sociedad. El motor que impulsa la Social Physics es el Big Data. Tenemos a nuestra disposición toda una serie de datos en formato digital sobre todos los aspectos de la vida humana. Mediante el tratamiento de estos datos podemos predecir el comportamiento humano para diseñar mejores sistemas sociales. Esta es la última tendencia que ha surgido dentro del MIT (Instituto Tecnológico de Massachusetts).
POR JUAN DE LA HERRÁN - Lunes, 24 de Marzo de 2014 - Actualizado a las 04:00h
Cómo podemos crear organizaciones y gobiernos que sean cooperativos, productivos y creativos? Esta es la pregunta que trata de resolver la Social Physics, en un momento en el que la competencia global, los retos medioambientales y el fracaso de los gobiernos están en la mente de toda la sociedad. El motor que impulsa la Social Physics es el Big Data. Tenemos a nuestra disposición toda una serie de datos en formato digital sobre todos los aspectos de la vida humana. Mediante el tratamiento de estos datos podemos predecir el comportamiento humano para diseñar mejores sistemas sociales. Esta es la última tendencia que ha surgido dentro del MIT (Instituto Tecnológico de Massachusetts).
Hasta ahora hemos venido hablando de Data Mining o minería de los datos pero tenemos que cambiar el concepto por el de minería de opiniones, que va a permitir estudiar los datos y el conocimiento de las personas y por tanto su forma de actuar o de tomar decisiones. Ya no es necesario pensar en poner un chip o un sensor a cada individuo para saber que hace, que piensa o donde se encuentra. El smartphone nos facilita esa información y junto con las nuevas herramientas matemáticas de análisis, es ya una realidad poder predecir las relaciones sociales. Hay una serie de principios que se repiten en el 80% o el 90% de las personas. Todo esto no lo digo yo, lo dice Alex Pentland en su libro Social Physics: Cómo se extienden las buenas ideas que hay que leer en inglés.
El primer sitio donde veo que se pueden empezar a aplicar estas teorías es en el desarrollo urbanístico, Urban Metabolism. La idea es levantar nuevos barrios, o incluso ciudades, basándose en el comportamiento social. Si hacemos una encuesta a pie de calle sobre las prácticas deportivas de las personas, el resultado nos daría que tenemos que construir un estadio olímpico en cada barrio de Bilbao. Mentimos como bellacos en las encuestas. Pero el análisis de los comportamientos y de las opiniones nos pueden ayudar a satisfacer las necesidades reales de la población: quizás es mejor una cancha de baloncesto que un campo de fútbol o una jardín con columpios que una pista de bolos. Siempre que se respeten los niveles de seguridad y de privacidad me parece bien que aprovechemos el tratamiento abierto de los datos.
Mi columna en DEIA, ¿Se cumplieron las previsiones?
A principios de este año, escribí dos columnas tituladas Las 10 tendencias tecnológicas de 2013 en las que me aventuraba a realizar las previsiones que en el mundo de la tecnología suponía que podían triunfar en este año. Para terminar los artículos decía que "Alguien dijo que el papel lo aguanta todo y además como esta columna también queda guardada en internet no me queda más remedio que responder a mis predicciones el año que viene". Así que vamos a ser coherentes con nuestros actos y vamos a revisar si se cumplieron o no esas tendencias.
Lunes, 30 de Diciembre de 2013 - Actualizado a las 06:03h
A principios de este año, escribí dos columnas tituladas Las 10 tendencias tecnológicas de 2013 en las que me aventuraba a realizar las previsiones que en el mundo de la tecnología suponía que podían triunfar en este año. Para terminar los artículos decía que "Alguien dijo que el papel lo aguanta todo y además como esta columna también queda guardada en internet no me queda más remedio que responder a mis predicciones el año que viene". Así que vamos a ser coherentes con nuestros actos y vamos a revisar si se cumplieron o no esas tendencias.
Las más curiosa de todas es la referente a que este sería el año del 4G. Si nos remontamos a enero, nadie daba un euro porque las operadoras realizarían el despliegue durante este año, dado el problema que existía con las frecuencias y la TDT. Pero cuando comento con alguien sobre esta previsión, me da la impresión que no tenemos memoria histórica, y la gente piensa que ya llevamos años con este servicio. Esto me lleva a pensar que las novedades tecnológicas se adaptan enseguida en nuestro entorno como si las hubiéramos tenido toda la vida.
La previsión más arriesgada era la del uso de nuestro teléfono móvil como medio de pago. Este año hemos visto ciertos casos de éxito, Kuapay, y parece que la adopción de la tecnología NFC por parte de los grandes operadores de tarjetas de crédito es una realidad. Pero será este año cuando veamos como la banca va cambiando los datáfonos de las tiendas y por tanto este sistema de pago sea una realidad.
Con la aparición de los papeles de Snowden, nos hemos centrado en las escuchas pero no en cómo se puede tratar tan ingente cantidad de información. El Big Data, el tratamiento de estos datos para obtener informaciones útiles o relevantes ya está aquí y nos damos cuenta del valor que tiene toda esa información que se genera cada día.
Los tablets se han comido al PC y el desarrollo de apps está generando nuevas empresas de éxito, algunas de ellas radicadas en nuestro entorno. Pero no fuimos capaces de ver a principios de año que el phablet venía con fuerza. Las empresas son cada vez más sociales y gracias a este tipo de redes están generando más negocio. Casi no puedes comprar una TV que no sea Smart. Bueno, si quieres ver todas las previsiones tira de hemeroteca o busca en mi blog las dos columnas.
¿Se cumplieron las previsiones? Los artículos originales
A principios de este año, escribí dos columnas tituladas “Las 10 tendencias tecnológicas de 2013” en las que me aventuraba a realizar las previsiones que en el mundo de la tecnología suponía que podían triunfar en este año. Para terminar los artículos decía que “Alguien dijo que el papel lo aguanta todo y además como esta columna también queda guardada en Internet no me queda más remedio que responder a mis predicciones el año que viene”. Así que vamos a ser coherentes con nuestros actos y vamos a revisar si se cumplieron o no esas tendencias.
Mi columna en DEIA, Las 10 tendencias tecnológicas de 2013 (I)
HE estado repasando todas las revistas y artículos que hablaban sobre las tendencias que se harían realidad en el año 2012 y resulta curioso cómo muchos han dado en la diana, a pesar de que en tiempos de crisis las cosas suelen cambiar sin saber uno mucho cómo o por qué. A la vista de estos resultados he decidido hacer mi propio hit parade de tendencias tecnológicas para el año 2013. No trato de adivinar el futuro, solo me fijo en lo que está ocurriendo y cómo se están moviendo los mercados tecnológicos. Sí, en esto también hay mercados, no se vayan ustedes a pensar que la tecnología es inmune a ellos, pero de lo que sí que estoy seguro es de que gracias al impulso de este tipo de aplicaciones y de empresas estoy viendo un camino para salir de la crisis, pero de esto hablaremos otro día, ahora vamos con la bola de cristal.
POR JUAN DE LA HERRÁN - Lunes, 7 de Enero de 2013 - Actualizado a las 05:34h
HE estado repasando todas las revistas y artículos que hablaban sobre las tendencias que se harían realidad en el año 2012 y resulta curioso cómo muchos han dado en la diana, a pesar de que en tiempos de crisis las cosas suelen cambiar sin saber uno mucho cómo o por qué. A la vista de estos resultados he decidido hacer mi propio hit parade de tendencias tecnológicas para el año 2013. No trato de adivinar el futuro, solo me fijo en lo que está ocurriendo y cómo se están moviendo los mercados tecnológicos. Sí, en esto también hay mercados, no se vayan ustedes a pensar que la tecnología es inmune a ellos, pero de lo que sí que estoy seguro es de que gracias al impulso de este tipo de aplicaciones y de empresas estoy viendo un camino para salir de la crisis, pero de esto hablaremos otro día, ahora vamos con la bola de cristal.
Las tablets. Las tabletas están comiendo cuota de mercado a PC y portátiles por todo el mundo, y solo en los EE.UU. habrá cerca de 90 millones de personas que serán propietarios de uno de estos cacharros en 2014. Sí, ¿pero cómo me va a afectar esto a mí o a mi empresa? Los consumidores estamos cambiando la forma y modo de acceder a internet, nuestra forma de comprar, de consumir publicidad, nuestro ocio, y las empresas no pueden dejarlo a un lado, hundir sus cabezas en la arena como el avestruz.
Cloud computing. La nube. Algunos empezaron teniendo una cuenta de correo en la red, y hoy raro es quien no cuenta ya con servicios como Dropbox o Google Drive con los que almacenamos y compartimos archivos, empresas con su contabilidad en la red, programas de gestión de proyectos que nos facilitan trabajar con cualquiera sin necesidad de tener que levantarnos e ir a su mesa. Las empresas están dejando atrás sus miedos y preocupaciones sobre la seguridad y privacidad y están entrando en la nube, desplegando desde ella servicios de atención al cliente, comunicaciones o redes sociales corporativas.
Big Data. Ya escribí una columna sobre Big Data en 2012, y se seguirá hablando de ello en 2013 y 2014. Cada vez disponemos de más y más información y datos de los usuarios, de los consumidores. Cada vez que entramos en una web, en una red social, dejamos detrás información sobre gustos, aficiones, amigos y todo tipo de detalles. Conseguir extraer algo de sentido a toda esta información con la que contamos sólo va a ser posible mediante sistemas de tratamiento y análisis de datos debidamente preparados.
Monederos móviles. Ya está funcionando la tecnología NFC (Near Field Communication), que permite realizar pagos de manera sencilla y segura mediante un teléfono móvil. Cientos de iniciativas surgen por todas partes, todas interesadas en que el teléfono no se quede atrás y termine siendo nuestra cartera. Google Wallet, PayPal, Visa, e incluso se rumorea que hasta Groupon está desarrollando su propia solución. ¿Adiós al dinero físico? Veremos quién se lleva el premio y se convierte en el líder de este mercado que algunos ven prometedor.
Apps móviles. Los smartphones están cada vez más omnipresentes. ¿Quién compra ahora un teléfono que solo sirve para hablar por teléfono? En 2013 se espera que en USA haya más accesos a internet en movilidad que en PC de sobremesa o portátiles. Y eso que cada vez lo utilizamos menos para hablar y más para cualquier otra cosa, desde hacer fotos, jugar, escribir y leer correos electrónicos, ver televisión, leer libros o revistas, mandar mensajes de amor y de otro tipo, escuchar música, interactuar socialmente con nuestros miles y miles de amigos de las redes sociales, buscar trabajo. Sea lo que sea que hagamos, todo debe estar adaptado a esas pequeñas pantallas. Tenemos que hacer las cosas en el momento. Y no podemos olvidarnos de las implicaciones y posibilidades que, para muchos negocios, tiene que la máquina nos cuente dónde nos encontramos en ese momento gracias a la geolocalización o a servicios tipo Foursquare.
Hasta aquí las 5 primeras, la semana que viene continuaremos con las 5 siguientes, aunque en esto de la tecnología nunca sabemos qué nos depararán las cosas y lo mismo aparecemos con otras 10 distintas. Eso es lo malo de todo esto, o quizás lo bueno.
Durante muchos años he estado poniendo como ejemplo de uso de Data Mining a las tarjetas de fidelización. He de reconocer que ya hace años el ejemplo de pañales y cerveza es discutido como una leyenda urbana, y en ocasiones aparece Wal Mart como la cadena de supermercados y en otras ocasiones otros, pero lo que nadie me negará después de leer el artículo es que resulta perfecto para explicar el sentido que un buen análisis de datos puede hacer cambiar las estructuras del marketing.
Pero lo importante es poder introducir la BuzzWord o palabro Big Data para que demostrar que nos encontramos en la cresta de la ola. Que pena que lleve hablando de ello desde hace años y tenga que volver ahora a escribir como si fuera la primera vez. Pero estas cosas son así.
Dentro de unas semanas tengo intención de escribir sobre Inbound Marketing (Marketing de Atracción) y ya me gustaría tener un ejemplo tan solido y tan claro para explicar como funciona.
POR JUAN DE LA HERRÁN - Lunes, 18 de Junio de 2012 - Actualizado a las 05:38h
ÉRASE una vez en una república federal muy lejana, una cadena de supermercados que estaba regida por una astuta legión de expertos de marketing. Un día decidieron conceder un deseo a todos sus clientes y les dieron a cada uno de ellos una tarjeta de fidelización totalmente gratis, eso sí, después de rellenar un sencillo formulario en el que además de su nombre, apellidos y dirección, se les solicitaba que pusieran unos datos complementarios, algo tan simple como su fecha de nacimiento, estudios, nivel de ingresos o color favorito. Todos los ciudadanos querían tener aquella tarjeta, que si bien no era un medio de pago, sí les servía para acumular puntos por cada compra y luego canjearlos por jugosos regalos. Los ciudadanos de aquella república fueron felices y obtuvieron muchos descuentos y regalos.
Pero los astutos expertos de marketing se pusieron de acuerdo con unos todavía más astutos informáticos que les habían explicado antes de sacar la tarjeta lo que era el data mining (minería de datos). Con los millones de datos que recogían de las compras de sus clientes, gracias a pasar su tarjeta de fidelización, pusieron a funcionar sus más potentes ordenadores y un buen día obtuvieron un interesante resultado. La mayoría de los hombres de entre 21 y 35 años, que acudían a sus supermercados los domingos por la noche (qué horarios de apertura más raros tenían en ese país) compraban pañales y cerveza. Siempre ese día de la semana y siempre lo mismo, pañales y cerveza. Los expertos en marketing siguieron analizando más datos, vigilaron sus tiendas y a sus clientes y llegaron a la conclusión de que a los hombres de esa edad les gustaba el baseball, que casualmente se jugaba una hora después de la compra (cerveza). También se dieron cuenta que eran casi todos padres primerizos o con niños pequeños (pañales). Y por último, detectaron un terrible error que habían cometido, los pañales y las cervezas estaban casi juntos y al principio del supermercado.
Propongo ahora una prueba de agudeza visual, ¿dónde están ahora los pañales y dónde las bebidas alcohólicas en los supermercados? Después de subsanar ese leve error de ubicación de sus productos, los hombres que iban a la compra de pañales y cerveza, regresaban a sus casas con patatas, jamón, pan o lo que pudieran pillar de oferta, en su ahora largo paseo, entre los dos únicos productos que realmente tenían que comprar, pañales y cerveza.
Este es el primer gran ejemplo de uso del data mining, que no es más que tratar una cantidad inmensa de datos y poder sacar conclusiones a partir de investigarlos. Para ello son necesarios ordenadores muy potentes, programas de base de datos con que tratar la información, y por supuesto, obtener previamente esos datos. La forma en que se logra tener esa información es totalmente legal, el problema es que cuando rellenamos el formulario nadie nos dijo qué es lo que harían con ellos, y si nos lo dijeron, la letra en la que lo indicaban era tan sumamente pequeña, que nadie nos dimos cuenta, al firmar las condiciones de uso de la tarjeta de fidelización.
Hoy en día los datos que se disponen son tan desproporcionadamente grandes que es imposible tratarlos con ese tipo de herramientas de base de datos. La información que tienen que tratar pueden ser fotografías que hemos visto a través de internet, vídeos, música o dibujos. Se puede saber a través de qué webs hemos navegado o qué programas hemos instalado, cuáles son nuestros favoritos o cuántos mensajes de teléfono móvil hemos realizado en los últimos 4 días. Los antiguos sistemas de minería de los datos no son capaces de procesar esta información, pero tranquilos, ya tenemos Big Data. Con este termino nos referimos a los nuevos sistemas de gestión y tratamiento de datos que son capaces de procesar e investigar ingentes cantidades de información recogidas de redes sociales, páginas webs o dispositivos móviles. Pero como dicen ellos, esta información solo se utilizará para hacernos ofertas personalizadas y que podamos disfrutar de descuentos a medida… y fueron felices para siempre.
He decido hacer un resumen de los tres artículos que sobre Big Data teníamos en nuestro antiguo Blog. Muchos de vosotros no lo leíais y creo que es un tema que esta ahora de interés, cuando la primera entrada tiene mas de año y medio. Pero en parte BigQuery va a revolucionar esto así que, aquí teneís de nuevo parte de mi ciencia.
Hablemos de Big Data
Hace ya más de un año que una de mis revistas digitales favoritas se hacía la siguiente pregunta What is "Big Data?" y no les faltaba razón en cuestionarlo porque, ya llevaba el mundo de las grandes empresas de TI dándole muchas vueltas al asunto. Yo me hice el siguiente razonamiento: "Esto de Big Data tiene buena pinta pero me parece que de momento está más orientado a las grandes consultoras, bueno, cuando vea que Google compra una empresa especializada en Big Data o saque un producto sobre el tema le empezaré a dar mayor importancia. De momento me dedicaré a leer toda la información que vaya saliendo sobre el tema". Y en esto que ya tenemos a Google que anuncia su inmersión en Big Data bajo el nombre de BigQuery.
Así nos lo contaron en Mayo del año 2010 y la respuesta la pregunta que se que te estas haciendo es: porque ahora es el momento en que el mercado está empezando a madurar (por supuesto, al otro lado del océano Atlántico) y Google (desde el día 1 de mayo) ha empezado su campaña de marketing como mejor sabe, de forma viral, y aquí estoy yo hablando de Big Data.
¿Pero que es Big Data?
La propia traducción nos lo dice, siempre que demos con el termino adecuado para la palabra big, ya que data es fácil, datos. Así que en este caso no traduciremos big como grande o enorme, sino como gran cantidad o enorme cantidad, por supuesto, de datos.
Siempre que pensamos en datos nos hemos acostumbrado a asociarlo con base de datos y nos lo solemos imaginar con conceptos como matricula, dni, telefono o genero (todavía me encuentro bases de datos que usan el nombre de campo "sexo" y no permiten rellenarlo con mucho o poco). Pero en la actualidad ya no trabajamos realmente con ese tipo de datos. Trabajamos con webs, con fotos, con vídeos, con documentos pdf, que asociamos a un proyecto o a una persona con un número de identificación. Y esos datos, esa gran cantidad de datos, que es imposible tratar con las herramientas clásicas de base de datos a las que hemos estado acostumbrados a usar hasta ahora, es a lo que llamamos Big Data.
Un ejemplo muy sencillo puede ser el de un historial médico de un paciente. Hasta ahora para los servicios de salud, sus clientes no eran más que un nombre, una dirección y el médico de familia que les correspondía. Pero hoy en día nadie concibe que un historial no incluya las radiografías, los informes de urgencias, todas las analíticas de la vida del paciente y cualquier dato que te puedas imaginar.Osakidetza ya lleva en ese proceso desde el año 2009 con la eliminación a finales de este año de las radiografías tradicionales.
Big data, “the next buzzword”
La palabra buzzword se usa para denominar esos términos que de la noche a la mañana empiezan a usar todos los consultores de TI, los vendedores de informática, y que si no has usado en tu última conferencia, la gente sale diciendo que no estas al día en vigilancia tecnológica. Así que si todavía no lo habías escuchado, a partir de hoy te vas a hartar de oírselo decir a todos los "gurus". Yo los suelo llamar "palabros".
Existen muchas herramientas de grandes compañías que permiten tratar y utilizar esta gran cantidad de datos. Una de las más conocidas es Oracle Exadata. Pero también hay una de código abierto denominada Hadoop. Ninguna de ellas es sencilla y por tanto requiere de un entrenamiento y conocimiento en el campo de las bases de datos a nivel de experto. Pero que esto no te haga renunciar a iniciarte en un campo del que vamos a oír hablar mucho en los próximos tiempos.