31 agosto 2008

La muerte del captcha (o ?de donde salía tanto spam?)

El hecho de que el volumen de spam siguiese siendo creciente a pesar de la popularización de modelos destinados a evitar su funcionamiento automatizado dejaba clara una cosa: algo no estaba funcionando. Y efectivamente: los viejos sistemas basados en los llamados captchas (Completely Automated Public Turing test to tell Computers and Humans Apart), esa serie de caracteres deformados y mostrados sobre fondos confusos para evitar su reconocimiento automático, pueden considerarse ya completamente superados.

Tres son, como mínimo, los sistemas utilizados por los spammers para superar el obstáculo que plantea un captcha: el primero, el más simple de todos, consistente en pagar a un humano para que lo resuelva. Un artículo en ZDNet, Inside India's CAPTCHA solving economy, pone de manifiesto el complejo entramado desarrollado en países como India destinado a subcontratar personas para resolver captchas a razón de dos dólares por cada mil. Un sistema que llega incluso a utilizar en ocasiones sistemas como el Amazon Mechanical Turk para reclutar uuarios que apoyen el posicionamiento de sitios de spam en sitios sociales como Digg, Del.icio.us y muchos otros.

En segundo lugar, un método algo más sutil, más de tipo ingeniería social: ofrecer algún incentivo no económico a cambio de la resolución de captchas. Por ejemplo, una página web en la que los usuarios acceden a fotografías de una modelo con una prenda menos de ropa cada vez si en cada etapa resuelven el captcha solicitado, que resulta provenir precisamente del sitio en el que el spammer pretende entrar.

En tercero, el empleo de algoritmos automatizados de reconocimiento de caracteres, convenientemente mejorados para llegar a reconocer incluso las caprichosas deformaciones habituales en los captchas. En este caso es preciso tener en cuenta que no es necesaria una gran exactitud: la perversa matemática utilizada en el mundo spammer, capaz de lanzar cien mil intentos por día, hace que un simple 15% de eficiencia en la resolución de un sistema de captchas determinado ya resulte suficientemente productivo como para que compense invertir en su desarrollo.

Mucho me temo que a estas alturas y visto el panorama, ya no podemos esperar mucha más defensa del viejo captcha. Como siempre, la mejor defensa sigue siendo la de siempre: la paciencia, los filtros sociales tipo Akismet y similares para la detección colectiva y, sobre todo, la educación de los usuarios para que jamás respondan a ese tipo de ofertas. Para un usuario con un nivel de uso de la red razonable, el spam hoy en día ya no tiene porqué suponer un gran problema. Sí lo es, sin embargo, para los administradores de los sistemas utilizados por los spammers: imaginemos cuánta carga de recursos supone, por ejemplo, en un sitio de e-mail, de foros o de blogs, atender las decenas de miles de peticiones entrando a los servidores simultáneamente y en todo momento, como hace tiempo nos recordaba Rogelio Bernal en un comentario

Y sí, sin duda, tendremos spam para rato…

(Enlace a la entrada original - Licencia)

1 comentario:

ATENCIÓN: Google ha metido en Blogger un sistema antispam automático que clasifica como spam casi lo que le da la gana y que no se puede desactivar.

Si después de hacer tu comentario este no aparece, no se trata del espíritu de Dans que anda censurando también aquí, es que se ha quedado en la cola de aceptación. Sacaré tu mensaje de ahí tan pronto como pueda, si bien el supersistema este tampoco me avisa de estas cosas, por lo que tengo que estar entrando cada cierto tiempo a ver si hay alguno esperando. Un inventazo, vaya.