Google ha anunciado a través de su blog que ha comprado reCAPTCHA, una compañía que proporciona imágenes digitalizadas de libros con el objeto de proteger el acceso a zonas restringidas de las webs de sistemas automatizados que intentan producir fraude o generar spamm.

Google Recaptcha Captcha compra

Estas imágenes (tienen el nombre de CAPTCHAS) como la que podéis ver en la parte superior,  las podéis ver habitualmente en los formularios de registro de muchas web (está siendo utilizado por más de 100.000 sites, entre ellos Facebook o Twitter),  donde van acompañadas de una solicitud para que introduzcamos las letras o palabras que vemos en la imagen, y de esta forma validar que no son máquinas las que están intentando el acceso sino personas.

Aquí es donde viene el interés de Google, estas imágenes (CAPTCHAS) provienen del escaneo masivo de periódicos o libros antiguos que por el paso del tiempo (deterioro y degradación de la tinta y papel) no pueden ser leídos por sistemas automáticos de reconocimiento de caracteres (OCR).

ReCAPTCHA ha diseñado un sistema que a través de las palabras que que introducimos en estos formularios cada vez  que nos aparece una de estas imágenes, aprende a “entender” el texto escaneado. Este es su valor! la “colaboración” de millones de usuarios en la lectura de estas imágenes que permiten a los sistemas automatizados aprender y “entender” esta información y que Google pretende utilizar por ejemplo en Google Books.

Google está comprando esta tecnología y aprendizaje que és único, y que mejora el proceso por el cual imágenes escaneadas son convertidas en texto plano entendible por los ordenadores (los sistemas OCR de reconocimiento óptico de carácteres), lo que permitirá mejorar proyectos de Google que implican masivos procesos de escaneo como Google Books o Google News Archive Search,  y de esta forma permitir volcar más información “buscable” en la red.

Sorprendente como Google tiene esta capacidad de “darle la vuelta a la tortilla”, y de un sistema que inicialmente está pensado para luchar contra el fraude y el spamm, Google consigue ver el valor en el sistema de aprendizaje que permite mejorar el proceso de escaneo masivo de los libros y periódicos.

  1. Pues sí es una operación de vista, sí. Contrasta con muchas adquisiciones empresariales que se hacen solamente para captar los clientes del enemigo, lícito, pero de poca o nula visión más allá de eliminar competencia.

  2. Aun siendo ‘fan’ de google, en este caso lo cierto es que la idea de utilizar humanos para reconocer palabras, digamos, dificiles, no ha sido de google sino de reCaptcha, que llevaban utilizando el sistema por lo menos un par de años.

    No se si reCaptcha estaba tambien metido en OCR pero presumo que a un cierto nivel si puesto que ya habia visto el sistema en muchos sitios.

    En cualquier casi, bien por google comprando una buena idea.

  3. Google no deja de asombrarnos con sus ideas y estrategia. Estad atentos: la siguiente frontera es la búsqueda de imágenes; no tengo ni idea de cómo pero van a hacerlo. Por cierto, ya están pilotando la búsqueda de vídeos en Youtube usando palabras “dichas” en el vídeo.

    Debería ser un ejemplo para los que siempre recurren a los despidos para reflotar una empresa (más o menos encubiertos): las inversiones en inteligencia son las más rentables a largo plazo.

  4. Se sabe por cuanto?. Google me parece la mejor empresa de tecnologia del mundo. Pero se esta convirtiendo en un monstruo muy grande, dejando fuera a pequenos emprendedores. Ahora quien podra competir en este rubro?.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

También te gustará

Una IA de Google permite diagnosticar el cáncer de mama con una tasa de acierto del 99%

En el caso del diagnóstico realizado sólo bajo el ojo humano la tasa de acierto de una muestra individual con metástasis en ganglio linfático puede ser ta baja como del 38%. La tasa de acierto en la detección de IA de Google es del 99%. 

Uber prepara su salida a Bolsa perdiendo más dinero que nunca

Las pérdidas de UBER siguen aumentando perdiendo en el tercer trimestre cerca de -$939 millones versus los -$680 millones que perdió en el segundo trimestre de 2018.

Cuando minar criptomonedas consume más energía que minar oro

El minado de criptomonedas está a día de hoy emitiendo el mismo CO2 que entre 3 y 15 millones de vuelos transatlánticos

El creador de Fortnite logra una valoración de 15 mil millones al cerrar una mega ronda

KKR, Kleiner Perkins o Lightspeed Venture Partners, entre otros, han metido $1.250 millones valorando a Epic Games, creador de Fortnite, en $15 mil millones.