Ofrecido por

GurusBlog

Google compra reCAPTCHA, que capacidad de “darle la vuelta a la tortilla”

Google ha anunciado a través de su blog que ha comprado reCAPTCHA, una compañía que proporciona imágenes digitalizadas de libros con el objeto de proteger el acceso a zonas restringidas de las webs de sistemas automatizados que intentan producir fraude o generar spamm.

Google Recaptcha Captcha compra

Estas imágenes (tienen el nombre de CAPTCHAS) como la que podéis ver en la parte superior,  las podéis ver habitualmente en los formularios de registro de muchas web (está siendo utilizado por más de 100.000 sites, entre ellos Facebook o Twitter),  donde van acompañadas de una solicitud para que introduzcamos las letras o palabras que vemos en la imagen, y de esta forma validar que no son máquinas las que están intentando el acceso sino personas.

Aquí es donde viene el interés de Google, estas imágenes (CAPTCHAS) provienen del escaneo masivo de periódicos o libros antiguos que por el paso del tiempo (deterioro y degradación de la tinta y papel) no pueden ser leídos por sistemas automáticos de reconocimiento de caracteres (OCR).

ReCAPTCHA ha diseñado un sistema que a través de las palabras que que introducimos en estos formularios cada vez  que nos aparece una de estas imágenes, aprende a “entender” el texto escaneado. Este es su valor! la “colaboración” de millones de usuarios en la lectura de estas imágenes que permiten a los sistemas automatizados aprender y “entender” esta información y que Google pretende utilizar por ejemplo en Google Books.

Google está comprando esta tecnología y aprendizaje que és único, y que mejora el proceso por el cual imágenes escaneadas son convertidas en texto plano entendible por los ordenadores (los sistemas OCR de reconocimiento óptico de carácteres), lo que permitirá mejorar proyectos de Google que implican masivos procesos de escaneo como Google Books o Google News Archive Search,  y de esta forma permitir volcar más información “buscable” en la red.

Sorprendente como Google tiene esta capacidad de “darle la vuelta a la tortilla”, y de un sistema que inicialmente está pensado para luchar contra el fraude y el spamm, Google consigue ver el valor en el sistema de aprendizaje que permite mejorar el proceso de escaneo masivo de los libros y periódicos.



Conversación

5 comentarios

  1.    Responder

    Se sabe por cuanto?. Google me parece la mejor empresa de tecnologia del mundo. Pero se esta convirtiendo en un monstruo muy grande, dejando fuera a pequenos emprendedores. Ahora quien podra competir en este rubro?.

  2.    Responder

    Google no deja de asombrarnos con sus ideas y estrategia. Estad atentos: la siguiente frontera es la búsqueda de imágenes; no tengo ni idea de cómo pero van a hacerlo. Por cierto, ya están pilotando la búsqueda de vídeos en Youtube usando palabras “dichas” en el vídeo.

    Debería ser un ejemplo para los que siempre recurren a los despidos para reflotar una empresa (más o menos encubiertos): las inversiones en inteligencia son las más rentables a largo plazo.

  3.    Responder

    Aun siendo ‘fan’ de google, en este caso lo cierto es que la idea de utilizar humanos para reconocer palabras, digamos, dificiles, no ha sido de google sino de reCaptcha, que llevaban utilizando el sistema por lo menos un par de años.

    No se si reCaptcha estaba tambien metido en OCR pero presumo que a un cierto nivel si puesto que ya habia visto el sistema en muchos sitios.

    En cualquier casi, bien por google comprando una buena idea.

  4.    Responder

    ¿no es el que usa facebook? ¿te imaginas cuantas palabras pueden reconocer 300 millones de personas buscando amigos?

  5.    Responder

    Pues sí es una operación de vista, sí. Contrasta con muchas adquisiciones empresariales que se hacen solamente para captar los clientes del enemigo, lícito, pero de poca o nula visión más allá de eliminar competencia.


Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies.

ACEPTAR