Publicado en apple, facebook, ios, iphone, jailbreak, Sin categoría

“A las computadoras les falta sentido común” Von Ahn el guatemalteco creador del ReCaptcha

IMG_0149.JPG

Le pregunto, al empezar la entrevista, si sabe que es la segunda persona más odiada del mundo. Se ríe y me responde que sí. Siguiendo con la broma, quiere saber, rápido de reflejos, quién ocupa el primer puesto. “Notable -pienso-, también en eso le interesa competir. Un rasgo típico de los emprendedores exitosos. Pero el primer puesto está demasiado disputado.”

Con quien estoy hablando es Luis von Ahn, un guatemalteco que se hizo célebre, a los 20 años, por haber sido uno de los creadores de los Captcha, esas imágenes de palabras deformadas, difíciles de leer, que los sitios usan para verificar que somos humanos y que el proceso de registro (abrir una cuenta de correo electrónico, por ejemplo) no es obra de un software, quizás en un intento de atacar al sitio o de cometer algún tipo de fraude. Las siglas vienen de Completely Automated Public Turing test to tell Computers and Humans Apart.

Von Ahn, que ahora tiene 35 años y pasó por la Argentina para hablar en TEDx, fue también pionero del crowdsourcing y aparece en la lista de los 10 científicos brillantes de 2006 de la revista Popular Science y en la de las 100 personas de negocios más creativas de 2010 de la revista Discover (http://www.nsf.gov/news/special_reports/voices/luis_von_ahn.jsp).

A pesar de que es profesor en Carnegie Mellon, donde se doctoró, hoy dedica todo su tiempo a su nueva criatura, Duolingo (https://www.duolingo.com/), una plataforma de enseñanza de idiomas que cofundó en 2011 junto a Severin Hacker. Desde su lanzamiento oficial, en junio de 2012, cosechó 42 millones de usuarios.

-¿Qué es Duolingo?

-Es una aplicación para aprender idiomas.

-¿Es una app para móviles?

-También tenemos un sitio Web, pero el 85% de nuestros usuarios es móvil. Es la aplicación número 1 de educación en Android y Apple. Tiene varias diferencias con otras plataformas de este tipo. La primera es que es completamente gratis, no se le cobra nada al usuario.

-¿Ganan plata con la publicidad?

-No, tampoco tiene publicidad.

-¿Y entonces?

-Esa es parte de la idea. Cuando empecé Duolingo le había vendido mi segunda compañía a Google, así que realmente no necesitaba dinero. Quería hacer algo para ayudar. Por eso quise que fuera una aplicación gratis. Pero de todas formas necesitaba encontrar una manera de financiarla. La publicidad no me dio resultado, así que hicimos otra cosa. Funciona de esta manera: cuando le enseñamos a alguien, digamos, las palabras relacionadas con la comida, le decimos que si quiere practicar con algo del mundo real, aquí tiene un documento que puede ayudarnos a traducir. Ese documento no ha sido traducido antes. Por ejemplo, la CNN es uno de nuestros clientes. Ellos escriben todas sus notas en inglés, luego nos las mandan y nosotros se las ofrecemos a nuestros alumnos. Es algo voluntario y opcional. Normalmente, varios trabajan en la misma traducción en simultáneo, corrigiéndose unos a otros. Finalmente, le mandamos la noticia traducida a la CNN y ellos nos pagan.

-Deduzco, por lo que me decís, que todavía no es lo suficientemente buena la traducción automática.

-No, todavía no. No se ha visto un libro, por ejemplo, traducido automáticamente.

-¿Por qué creés que eso es así?

-Hay varias cosas que las computadoras todavía no pueden hacer tan bien como los humanos. Una de esas es entender bien el idioma.

-Es cierto, ¿pero por qué?

-En muchos casos es por falta de sentido común. Muchas palabras tienen un gran número de significados. Nosotros no lo tenemos ni que pensar, pero hay palabras muy sencillas que tienen diez significados diferentes. En inglés está la palabra “bank”, que puede significar la entidad bancaria, pero también la orilla de un río. Lo que entendamos va a depender del contexto.

-Me decías que hay otras razones por las que Duolingo es diferente.

-Decidimos hacerlo como un juego, para que resulte entretenido. Y decidimos eso porque una de las cosas más difíciles cuando aprendés algo de forma autodidacta es mantenerse motivado. No es un juego, es una aplicación para aprender idiomas, pero la mayoría de las personas dice “Estoy jugando a Duolingo”. Y el tercer motivo por el que es diferente es porque lo basamos en ciencia. Cuando empezamos, no sabía mucho de cómo enseñar idiomas. Me puse a leer libros sobre el tema, y descubrí que eran un poco como las dietas, cada uno tenía una receta diferente. Se contradecían unos a otros. La cuestión es que cuando sobrepasamos el millón de usuarios nos dimos cuenta de que podíamos empezar a averiguar cómo enseñar idiomas basándonos en los datos que teníamos. Por ejemplo, si hoy queremos averiguar si a los hispanoparlantes que están aprendiendo inglés tenemos que enseñarles primero plurales o adjetivos o viceversa, entonces hacemos un experimento. Con las próximas 50.000 personas, a la mitad le enseñamos de una forma y a la otra mitad, al revés. Y ahí medimos quiénes aprenden mejor, basándonos en datos de usuarios reales. Eso es algo que hacemos constantemente.

-¿Por qué enseñar idiomas y no otra cosa?

-Quizá porque soy de Guatemala, y en Guatemala todo el mundo quiere aprender inglés y nadie tiene dinero.

-¿De qué vas a hablar en TEDx?

-Del modelo de negocios de Duolingo, que es bastante extraño. Enseñamos totalmente gratis, pero obtenemos valor de lo que las personas hacen cuando están aprendiendo, y vendemos eso. Es un modelo muy parecido al que existía hace 500 años, el del aprendiz. No había intercambio monetario, sino que el aprendiz hacía una parte del trabajo del maestro, y el maestro le enseñaba el oficio. En Duolingo el alumno no paga con dinero.

-Paga con mano de obra.

-Exacto.

-Una mano de obra que a la vez está relacionada con lo que el alumno aprende.

-Así es, y no se discrimina al que no tiene dinero, porque cualquiera puede aportar esa mano de obra. Y el otro incentivo que el modelo del aprendiz tiene para el maestro, en este caso Duolingo, es que cuanto mejor aprende el alumno, mejor hace su trabajo. Con los avances que vamos haciendo hemos conseguido que Duolingo sea tan bueno como un salón de clase. Por ejemplo, hay un estudio de la universidad de Nueva York que dice que si una persona usa Duolingo durante 34 horas aprende lo mismo que en un semestre universitario. Sin embargo, Duolingo no es tan efectivo como un tutor uno a uno, que es la mejor forma de aprender cualquier cosa.

Eso es impracticable, pero creo que las computadoras lo pueden hacer. ¿Por qué es mejor un tutor uno a uno? Porque se adapta al estudiante. En eso estamos trabajando ahora en la empresa, queremos que Duolingo sea una forma adaptativa de enseñar.

-¿Cuánto tiempo pensás que va a pasar hasta que los Captchas o los otros tests de esta clase dejen de funcionar? Tomando en consideración máquinas como Watson de IBM, por ejemplo (http://es.wikipedia.org/wiki/Watson_%28inteligencia_artificial%29).

-Es imposible saberlo, pero digamos 50 años. Va a llevar mucho tiempo.

-¿Por qué tanto?

-Hay diferentes cosas en las que las computadoras no son todavía muy buenas. Por ejemplo, la visión. Watson funciona sólo con texto. El tema de la visión es dificilísimo, una tercera parte de nuestro cerebro está dedicada a la visión. Hemos estado trabajando para hacer que las computadoras sean tan buenas como los humanos en la visión durante los últimos 50 años, y hoy lo mejor que pueden hacer es diferenciar entre la imagen de un perro y un gato.

-¿Es falta de poder de cómputo u otra cosa?

-Es sólo que no hemos entendido aún cómo representar una imagen bien. Una imagen es una matriz de pixeles, y de allí tenemos que llegar a que la computadora interprete un gato. Y hay tantas posibles posiciones de un gato… Hasta es un problema decidir qué es una “A”, algo que parece mucho más sencillo. Hay muchísimos signos que nosotros interpretamos como una “A”, y para las computadoras esto es muy difícil aún.

-Debe haber algo también del orden de que no sabemos como nosotros vemos.

-Claro, ese es parte del problema, pero no es necesario saber cómo lo hacemos nosotros. Quizás podamos encontrar una forma más sencilla. Nosotros no llegamos a nuestro sistema de visión por ingeniería, sino por evolución.

-Sí, pero lo mismo se ha dicho con el lenguaje…

-Y hasta la fecha no podemos, es cierto.

-Recuerdo un ingeniero de IBM en los ’90 diciéndome que en un año iba a poder conectar mi grabador a la computadora y la máquina iba a transcribir el reportaje. Y sigo esperando.

-Precisamente, las dos cosas que las computadoras aún no hacen muy bien son la visión y el lenguaje.

-Bueno, el lenguaje está un poco en el centro de todo. Sin él no tendríamos matemática ni lógica.

-Así es, el lenguaje es lo más central. Y la visión. Cuando las computadoras puedan hacer muy bien eso, llegaremos muy lejos.

-Qué es la human computation.

-Está muy relacionado con el crowdsourcing. La idea es que miles o millones de personas se junten y trabajen en algo para el bien de la humanidad. Uno de los ejemplos relacionados con mi trabajo es algo así como la segunda vuelta de los Captchas. Unos 5 años después me di cuenta de que unas 200 millones de veces al día alguien escribía uno. Primero me sentí muy orgulloso, pero luego me puse a pensar y cada vez que alguien escribe un captcha pierde alrededor de 10 segundos de su tiempo. Si hacemos la cuenta, resulta que la humanidad está perdiendo 500.000 horas diarias escribiendo captchas.

-Te lo dije al principio (risas).

-Así que me puse a pensar en si habría alguna forma de hacer un buen uso de ese tiempo. Porque la cuestión es que cuando alguien está escribiendo un captcha su cerebro está haciendo algo increíble, algo que las computadoras no pueden hacer. ¿Será entonces que podemos hacer buen uso de esos 10 segundos? Y resulta ser que sí. La función de los captchas es autenticarnos como humanos. Ahora, además, al escribir un captcha las personas ayudan a digitalizar libros. Hay varios proyectos de digitalización de libros, uno de ellos es de Google. ¿Cómo se hace? Se lo escanea, es decir, se le saca una foto a cada página del libro. El próximo paso es que la computadora descifre todas las palabras en esa foto digital. El problema es que en los libros más antiguos la máquina no puede entender muchas de las palabras.

-Entonces lo hace la gente.

-Exacto, tomamos todas las palabras que la computadora no puede reconocer y se las vamos mandando a las personas que en alguna parte del mundo están escribiendo un captcha. Hoy los captchas están tomados de palabras que vienen de un libro que está siendo digitalizado, y usamos lo que la gente escribe para mejorar el software que se usa para digitalizar los libros. Hasta la fecha, 1100 millones de personas han ayudado a descifrar al menos una palabra de algún libro.

-Eso es reCaptcha.

-Eso es reCaptcha, algo que se convirtió en una compañía que luego le vendí a Google, y lo usan hoy para digitalizar sus libros.

-¿La gente sabe que está ayudando en esa tarea?

-Hay un mensaje que dice que estás ayudando a digitalizar libros, y un link para saber más. Pero casi nadie hace clic allí.

-¿Cómo ves los numerosos intentos que existen hoy de controlar y filtrar contenidos en Internet?

-Creo que en el largo plazo no es posible controlar Internet.

-Salvo apagando Internet.

-Sí, pero eso no se puede.

-¿Por qué no se puede?

-Si en Estados Unidos apagan Internet, al día siguiente hay una revolución.

-Y una catástrofe económica. Egipto sólo pudo estar 5 días fuera de Internet, y debieron volver a conectarse por motivos económicos.

-Exacto. Además, Egipto y otros de la región son países con un fuerte control de Internet, y sin embargo las personas lograron en muchos casos deshacerse de sus dictadores.

-¿Cuál es la clave en Internet para que ocurran estos fenómenos?

-Creo que en parte es [un sistema] muchísimo más democrático. Le da más voz a más gente, no les da la misma voz a todas las personas, pero sí a mucha más gente. Eso es más poder para la gente.

-Es decir que la misma naturaleza de Internet hace que, si le aplicaran filtros y censura, entonces dejaría de ser Internet.

-Claro, ya no sería Internet, y no creo que pueda pasar, la gente se rebelaría.

-Bueno, es verdad, pero había muchas cosas que creíamos que no podían pasar, los genocidios de Stalin y Hitler, por ejemplo, y ocurrieron. ¿Qué dirías que tiene que hacer un ciudadano de una nación democrática para evitar esa distopía en la que Internet es transformada en una herramienta que se usa para atontar y vigilar?

-Definitivamente, votar en contra de todas las leyes que están tratando de controlar Internet. En Estados Unidos cada 6 meses aparece una nueva ley que intenta controlar Internet. Por suerte, hasta la fecha ninguna ha pasado. Y eso es porque mediante Internet millones de personas se reúnen y votan en contra de eso. Eso es lo que el ciudadano debe hacer. Votar por que Internet siga siendo libre y que siga habiendo neutralidad de la red. Eso, y seguir expresándose, comentando, opinando. Cuanto más nos expresemos, más difícil es ocultarlo. Cuando hay 3 comentarios es fácil filtrarlo. Pero cuando hay 10 millones es imposible.

-Cuando le pregunté a Vinton Cerf si creía que la censura estaba acorralada, por esto mismo que vos decís, me respondió: “Sí, pero acordate de que todavía hay 4000 millones de personas que no tienen Internet”.

-Sí, pero eso está cambiando, y en los próximos 10 años muchas personas van a tener acceso a la Red. Los teléfonos inteligentes van a colaborar con eso, y con mejorar la educación. En nuestra opinión, el sistema educativo no está funcionando en el mundo. Hay 1000 millones de personas analfabetas, adultos analfabetos, y en muchos casos es solamente porque el sistema educativo no les llega. Pero a través de teléfonos móviles podemos llegar hasta donde están. Hoy hay 6000 millones de personas en el mundo con acceso a un teléfono móvil. Y esto es interesante: sólo 4000 millones de personas tienen acceso a un inodoro. Creo que es la primera vez en la historia en el que podemos llegar a todos con la educación.

Por Ariel Torres lanacion