Diseñando un bot de Twitter

Últimamente y título personal me están creciendo muchas inquitudes sobre el social media: Twitter, Facebook, Blogs, etc.

Además estoy inquieto 🙂 me he puesto un huequecito en el salón con un monitor, teclado y ratón y lo tengo conectado a mi portátil (un Core i7 con una GeForce GT540M y Windows 7 64 bits), y lo dicho, estoy inquieto.

Quiero crear algo, no se todavía el qué, pero algo útil y relacionado con el social media.

Por lo pronto estoy empezando a hacer unas primeras pruebas con un bot de twitter bajo la cuenta @eduardo_mateo
inicialmente se conecta a las noticias de Google tecnología unas 6 veces al día y twittea la primera. Esto podría plantear problemas de repetición que resolveré más adelante aunque twitter tiene un pequeño filtro para evitar eso mismo.

Puede parecer algo sencillo (y lo es), pero pretendo darle algo de IA (otro tema que siempre me ha gustado). Que sea capaz de responder a personas.

Todo esto se podría enfocar a un servicio para empresas donde al dar de alta una noticia en su web, automáticamente se twitteara y se pusiera en el muro de facebook. Además se tendría la capacidad de si alguien pregunta por algún producto, el bot de forma automática lo remitiría a la dirección de la web donde se habla de dicho producto 🙂

Saludos!

Actualización 15/08/2011: Ya le he incorporado un filtro de URLs para no repetir posts. Sería bueno incorporar algún filtro más para reconocimientos de títulos similares para no duplicar noticias… Además he incorporado mi acortador de URLs http://www.dots.es a través de su propio API http://www.dots.es/help.php

 Actualización 15/08/2011 (II): Nuevo problema. Google publica una misma noticia con diferentes titulares y fuentes (URLs), lo que provoca que la misma noticia se twittee varias veces con diferentes titulares y fechas. He incorporado un motor de similitudes a mi bot de twitter que devuelve un % de similitud. He ajustado el rango de similitud a 22%. Menos que eso no lo considero como noticia similar. Más que eso sí y por tanto no twittea pero sí lo guarda en la bbdd. Posiblemente tenga que bajar el % para filtrar mejor pero aun es pronto.

A continuación un ejemplo de similitud:

titulo a comparar: Google pagará 8.700 millones por los móviles de Motorola
titulo de la bbdd: Google compra Motorola
66.6666666667

titulo a comparar: Google pagará 8.700 millones por los móviles de Motorola
titulo de la bbdd: Google pagará 8.700 millones por los móviles de Motorola
100

titulo a comparar: Google pagará 8.700 millones por los móviles de Motorola
titulo de la bbdd: Google compra la división móvil de Motorola
44.4444444444

titulo a comparar: Google pagará 8.700 millones por los móviles de Motorola
titulo de la bbdd: Google compra Motorola para parecerse a Apple
28.5714285714

titulo a comparar: Google pagará 8.700 millones por los móviles de Motorola
titulo de la bbdd: Google adquiere Motorola por 12.500 millones de dólares
62.5

Saludos!!