viernes, noviembre 28, 2008

Notas cortas en Intelligencia Artificial (and ML): Google muestra anuncios pro-terrorismo Google Ads <2>

   Cuando la Inteligencia Artificial resulta ser poco inteligente nos puede meter en problemas. Y esto es lo que le pasó a Google (y no es la primera vez) cuando su algoritmo de Google Ads decidió mostrar anuncios pro-terrorismo en los sitios que reportaban los atentados en Bombay.  Las imágenes de la captura de pantalla las pueden ver en Mashable aquí. El anuncio dice:

Terrorism: Pursue a certificate in terrorism 100% online. Enroll today

Terrorismo: Consiga un certificado en terrorismo 100% en línea. Inscríbase ahora.

Esto nos recuerda que la IA a veces no es tan inteligente, vamos al final es programada por humanos. Y aunque creo Google a invertido mucho esfuerzo para eliminar spammers, phishers y ahora terroristas aún veremos este tipo de cosas durante algún tiempo. ¿Quién dijo que los anuncios en línea era negocio fácil?




lunes, noviembre 24, 2008

Notas cortas en Intelligencia Artificial (and Machine Learning): Learning (Aprender) <1>

¿Realmente existe la Inteligencia Artificial?

¿Son las máquinas inteligentes?

¿Las máquinas aprenden?

Bueno, estas son algunas preguntas que nos hemos hecho durante los últimos quizá 60 años y aún seguimos sin responderlas. Ni siquiera mentes tan brillantes como Alan Turing fueron capaces de definir como identificar a una máquina inteligente. Así que sería inútil tratar de hacerlo aquí en un simple post de un humilde blog acerca de muchas cosas.

Sin embargo para ponernos en contexto empezaremos por definir que significa aprender desde el punto de vista maquinal. De acuerdo a Tom Mitchel [1] podemos de decir que un programa aprende cuando ejecuta una tarea T y adquiere una experience E y el desempeño medido P (Performance) de T aumenta con la experiencia E. Estando de acuerdo con el término aprender podemos definir algunos formas en que las máquinas aprenden (Machine Learning).

En general el aprendizaje maquinal puede ser dividido en Aprendizaje Supervisado (Supervised Learning), Aprendizaje No-Supervisado (Unsupervised Learning) y Aprendizaje Reforzado (Reinforcement Learning). En aprendizaje supervisado el programa intenta aprender un concepto o hipótesis a partir de ejemplos etiquetados. Para aprender el concepto, el programa genera una función a partir de los ejemplos dados. Redes Neuronales, Arboles de Decisión y Redes de Bayes son ejemplos de este tipo de aprendizaje máquina.

Contrario a aprendizaje supervisado, el aprendizaje no-supervisado usa ejemplos no etiquetados o categorizados. El objetivo es encontrar las relaciones entre los ejemplos para generar categorías. Ejemplos de este tipo de aprendizaje son Factorización de Matrices no negativas y Mapas auto-organizados. Finalmente en aprendizaje reforzado (RL) el agente aprende interactuando con el ambiente. En RL el agente sensa el ambiente y ejecuta acciones. A través de refuerzos positivos o negativos el agente aprende que acciones llevan a mejores refuerzos (rewards) a largo plazo en determinados estados del medio ambiente [2]. Algoritmos basados en RL son Q-Learning [3] y SARSA.

Por lo pronto esta fue una pequeña introducción a Aprendizaje Maquinal. En otros posts iré ahondando en cada uno de los temas.


viernes, noviembre 14, 2008

Adios SPAM ... Hola SPAM


   Si han notado que en estos últimos días han recibido menos SPAM no es su imaginación. A partir del "desenmascaramiento" de una red de SPAMers a partir de un artículo del Washington Post el ISP que hosteaba a los servidores de esta red decidió cortales la conexión. De acuerdo a las estadísticas de Iron Port y Spamcop  el envío de SPAM bajó entre un 66% y un 75%. Si creen que esto es sorprendente, se dice que el 80% del SPAM es controlado por sólo 100 spammers.

Sin embargo nuestro descanso  no va a durar mucho, hay ya algunas teorías de que los "desconectados" están buscando otros ISPs donde hostear sus servers. Mientras tanto disfruten su inbox menos cargado de e-mail chatarra.

miércoles, noviembre 12, 2008

Notas cortas en Intelligencia Artificial (and Machine Learning): Introducción <0>


   Desde hace tiempo tengo deseos de escribir algunas notas cortas sobre temas en Inteligencia Artificial (AI) y Machine Learning (ML). De alguna manera trateré de explicar algunos temas sobre estas áreas y en lo posible incluso pondré algunos ejemplos de apliaciones en web que pueden usar estas técnicas.

    Mi primera impresión de AI y ML es que eran complicadas, que usaban muchas matemáticas y que nunca se usaban para aplicaciones reales. Bueno, la realidad es que sin son algo complicadas en un principio pero después terminas por entender de que se trata el asunto, si usan muchas matemáticas y si, se usan mucho para aplicaciones reales. Es más, muchas aplicaciones están ahí en nuestra vida diaria cuando navegamos en la Web. Solo piensen por ejemplo como indexa y rankea sus páginas Google, como Picasa reconoce las caras que etiquetas en tus fotos, como delicious encuentra bookmarks que pueden interesarte y como Amazon lo hace con sus productos y como Last.fm sabe que una canción esta relacionada con otra. Si bien "el fine tunning" de los algoritmos que mueven estas aplicaciones son secretos, hasta cierto punto podemos replicarlos y explicarlos en algunas líneas. Y bueno, ese será el objetivo de mis posts futuros en el tema.

Por lo pronto los dejo con unas fotos de unos robots y un video de RAVON (Robust Autonomous Vehicle for Offroad Navigation) que tomé en la Conferencia Alemana de Inteligencia Artificial. Algunas especificaciones de RAVON.








martes, noviembre 04, 2008

RIP La Cofradia Digital


   Después de muchos años La Cofradia Digital llega su fin. Inspirado creo yo en el modelo de control de edición de notas al estilo Slashdot, La Cofradia no siguió adelante y hoy ha cerrado sus puertas (bueno, al menos hoy me di cuenta gracias al post de David Treviño).

   No se que uso le quieran dar al sitio o si sus creadores quieran seguir adelante, pero considerando lo conocido de su nombre aquí hay algunas ideas que pueden seguir:

- Sitio de noticias sociales al estilo Digg. Aunque en México ya hay muchos como Efecto Tequila, Enchílame y Chido.
- Sitio de blogs y podcasts. Junten a algunos buenos blogueros y creen un sitio con varias categorias de blogs. Creo que aunque en México hay buenos blogueros ya, hace falta un buen espacio que incluya blogs con varios autores y en varios temas, no solo tecnología. 
- Repositorio tecnológico al estilo wikipedia. Algo así como un wiki pero de temas de tecnología (recordemos que una buena parte de los cofrades era de perfil técnico). Y aquí pueden buscar un modelo de negocio donde al autor del artículo técnico le caiga algo de la lana del advertising.
- Un mexican craiglist, quiza enfocado a publicar empleos ahora que empieza la crisis (o sigue). Creo que en México no hay muy buenos sitios de búsquedas de empleos. Aquí se me ocurre que pueden fusionar algunas tecnologías como Web 2.0, RSS, alertas, mashups, etc. que los sitios actuales no tienen (de hecho ver algunos es como regresar al 2000 sin CSS).
- Instalen laconi.ca y hagan un clon de twitter al muy estilo mexicano.

O de plano a lo fácil, vendan el dominio a alguién que tenga tiempo y $$$ para invertir y sacarle provecho.


Nueva vulnerabilidad RCP de Microsoft explotada y en la red.


   Un nuevo post en mi blog de investigación de ataques de DoS/DDoS. Está en inglés, pero si quieren la traducción "pochona" y al buen estilo de los bots les dejo este link de Google Translate.


Nueva vulnerabilidad RCP de Microsoft


  Si no se dieron cuenta el ISC (Internet Storm Center) cambió de verde a amarillo (nuevamente esta en verde) debido al anuncio de una nueva vulnerabilidad (MS08-067) RPC de Microsoft. La vulnerabilidad esta en los servicios RCP e intercambio de archivos y es similar a la que explotaron los worms Blaster y similares. Afecta a la familia XP, Windows Server 2003, Windows Server 2008 y Windows Vista.

Microsoft anunció un parche crítico fuera del ciclo normal de parcheo. Así que administradores de redes Windows, a probar e instalar parches. Nadie quiere otra semanita como la de hace unos años en donde muchos anduvimos de apaga fuegos y cazadores de máquinas comprometidas. Más información:


Update: Si quieren saber si su máquina ya se infectó aquí pueden encontrar que buscar en los registros de windows.