02 noviembre 2011

Sobre como transformar la prueba más odiosa de internet en un beneficio para la humanidad

No debe ser nada fácil soportar que 1.600 personas al unísono levanten la mano para responder a dos preguntas (¿Quién alguna vez debió llenar un formulario en Internet e introducir unas letras distorsionadas?: 1.600 manos en alto ¿Cuántos odian hacer eso?: 1.600 manos en alto). No debe ser nada fácil si esas 1.600 personas expresan su odio hacia algo que has inventado. Y menos fácil debe ser el afrontar semejante manifestación de “odio” desde un escenario.

Luis von Ahn lo tiene asumido: su invento es sumamente antipático. Luis von Ahn es el creador de la prueba desafío-respuesta captcha, esa misma que nos hace perder 10 segundos de nuestras vidas en cada oportunidad que la enfrentamos.

image

Imagen en desenredandolared

El momento de interpretar la imagen distorsionada de un conjunto de caracteres (letras y números) para enviarlos y demostrar que somos humanos es uno de los más antipáticos de los protocolos de uso de Internet.  El captcha lo afrontamos al registrarnos como usuario en internet, llenar un formulario o realizar una compra, con la misma resignación con la que Luis von Ahn enfrentaba al gigantesco auditorio del evento TEDxRiodelaPlata convertido en un mar de manos alzadas.

El captcha, es definitivamente una pérdida de tiempo que resulta inevitable para el buen funcionamiento de tantas webs (protege a unas 100.000 páginas web del fraude y el spam). Pero entre tanto fastidio, la misión de la charla parece encaminarse a convencer a quienes pasamos por la prueba captcha y lo odiamos, que hay algo productivo cuando interpretamos y tecleamos los extraños caracteres: estamos colaborando para digitalizar libros.

Von Ahn creó el sistema captcha, y se lo vendió a Google en su evolución reCaptcha. Y Google, hoy utiliza el sistema para completar su proyecto de digitalización de libros, un proyecto en el que sin saberlo, participamos millones de personas a diario. Se estima que 200 millones de odiosos captcha son completados en un día, lo que suma (a un promedio de 10 segundos por captcha) unas 500 mil horas diarias. Von Ahn necesitaba convencer a los 1.600 usuarios fastidiados de su invento, que aunque es antipático, el captcha sirve para algo productivo. La idea de completar la digitalización de libros a través del captcha, es en definitiva, un consuelo para su conciencia.

Resulta que los sistemas que escanean libros antiguos de forma automática para digitalizarlo, no son perfectos: en el reconocimiento óptico de caracteres (OCR) pueden tener dificultades para “interpretar” ciertas palabras impresas con tinta borrosa, o gastadas, una dificultad que suele alcanzar el 30% de lo escrito.

La idea genial es mostrar esas palabras distorsionadas que las computadoras no saben interpretar a través de las pruebas captcha. Una palabra no reconocida en la parte automática de la digitalización, pasa a la base de datos de Recaptcha, que se las muestra a algún usuario que “inocentemente” la interpreta, la teclea, y la envía. Cuando varios usuarios coinciden al interpretar el mismo captcha, la palabra queda confirmada y digitalizada completando algún fragmento de un libro. 

Ésto también explica la razón por la que el sistema recaptcha nos muestra dos palabras a la hora de determinar si no somos un robot: una es para hacer el control “antirobots” tradicional, y la otra una palabra para digitalizar en algún libro. El problema es que no sabremos cual es cual.

Von Ahn explica que con éste mecanismo se están digitalizando alrededor de 100 millones de palabras diarias, o lo que se traduce, suma dos millones de libros al año. Para más cifras, 900 millones de personas estamos a diario ayudando a digitalizar libros mientras respondemos a un reCaptcha.

La charla de Von Ahn casi concluye con un clima genial. Las mismas 1.600 personas que minutos antes expresábamos nuestro odio hacia el padre de la criatura, ahora aplaudimos con reconocimiento. Queda por explicar cuanto dinero le hubiese salido a Google completar la digitalización de libros a través de trabajadores a sueldo, pero hay que reconocerlo, al menos, al pasar por una prueba captcha, nos sentiremos más útiles.

La entrada es consecuencia de una de las charlas TEDxRiodelaPlata que tuve la oportunidad de presenciar ayer.

5 comentarios:

  1. Que interesante! siempre se aprende algo nuevo aunque sigo odiando los captcha grrrr

    ResponderBorrar
  2. Excelente! Ya no voy a maldecir el reCaptcha cada vez que no entiendo alguna letra.

    ResponderBorrar
  3. Lo pondré en conocimiento de mis abogados, habrá que pasarle la minuta a Google.

    ResponderBorrar
  4. Lo primero decir que me ha parecido una noticia muy interesante.

    Pero yo creo que hay que se un poco capullo para hacerle el trabajo de manera gratuita a una empresa privada y encima sentirse útil.

    ResponderBorrar
    Respuestas
    1. Una empresa privada QUE JAMAS TE HA COBRADO UN CENTAVO POR SUS SERVICIOS.. Hipócrita.

      Borrar