martes, diciembre 01, 2009

La nube de información de tiempo real sobre Londres 2012

En los últimos meses he estado trabajando en el un proyecto de "Cloud Computing" para aplicaciones de tiempo real (IRMOS) -algo similar a Amazon EC2 pero para aplicaciones senstivas a retrasosy pérdidas en procesamiento y enlaces-. También uno de mis "pet projects" es un data-ming en twitter (el cual -twitter- tiene como uno de sus objetivos ser el "pulso del mundo"). Así que esta noticia acerca de la construcción de la "Cloud" (Nube) o el observatorio de tiempo real para los juegos olímpicos de Londres captó mi ojo de inmediato.




La idea de la Cloud es construir una plataforma de observación compuesta de ligeras nubes esféricas. Las nubes son alimentadas por información en tiempo real recolectada usando múltiples fuentes de datos. Estos datos se suponen vienes de fuentes como Facebook, Google, Twitter y estarían relacionados con los juegos olímpicos (por ejemplo videos, fotos, updates de estatus de los eventos).

Está de más comentar de lo innovador y pretencioso del proyecto. Por un lado el desafío físico de construir la plataforma y las nubes (materiales, y claro, los permisos del ayuntamiento y el presupuesto para la construcción) y por otro el tecnológico para procesar los ríos de información en tiempo real. En el contexto técnico, hay dos grandes problemas:

1) Analizar cada pieza de información para determinar que está relacionada con los juegos, categorizar el tipo de información y finalmente presentarla. En este aspecto es indiscutible que algún tipo de inteligencia articifial y "machine learning" es necesario. En el campo de procesamiento de lenguaje (NLP) ha habido grandes avances y supongo que no será muy complejo obtener sino información perfecta, si una buena aproximación. Otros adelantos como la identificación de usuarios via GPS y smartphones creo que ayudará, sin embargo el gran problema puede ser:
2) Como manajer y procesar la gran cantidad de información en tiempo real que se produce. Aquí Google puede aportar mucho al proyecto en el uso de tecnologías de procesamiento en paralelo como mapreduce y en su propia experiencia como search-engine.

En general creo que el proyecto es muy interesante, dudo que los veamos hecho realidad en la forma en la que está presentado hoy en día, pero estoy seguro que generará algunos resultados interesantes. Como datos del proyecto, éste está impulsado por el "senseable city lab" del M.I.T, Google y Umberto Eco como asesor. Más información en los sitios de la Cloud y en el artículo de Techcrunch donde encontré la noticia.