La tecnología ha apoyado en muchas ciencias para tener logros que se veían lejanos, las investigadores del lenguaje han intentado por años descifrar muchos idiomas antiguos sin tener éxito.
Recientemente, la revista MIT Technology Review, publicó un artículo en el que reveló un sistema de aprendizaje automático capaz de descifrar idiomas perdidos.
Jiaming Luo y Regina Barzilay del Massachusetts Institute of Technology (MIT) y Yuan Cao del laboratorio de Inteligencia Artificial (IA) de Google en Mountain View, California desarrollaron un sistema que ya fue puesto a prueba con dos idiomas.
“La gran idea detrás de la traducción automática es comprender que las palabras están relacionadas entre sí de manera similar, independientemente del idioma involucrado”, explican.
El proceso comenzó mapeando las relaciones para un lenguaje específico, lo que requirió de enormes bases de datos de texto, para que luego una máquina buscará este texto para ver con qué frecuencia aparece cada palabra al lado de otra.
La palabra puede considerarse como un vector dentro de un espacio, y este vector actúa como una restricción sobre cómo aparece la palabra en cualquier traducción que surja con la máquina.
Estos vectores obedecen algunas reglas matemáticas, comentan, y dan como ejemplo el siguiente: rey - hombre + mujer = reina, “una oración puede considerarse como un conjunto de vectores que siguen uno tras otro para formar una especie de trayectoria”, dicen.
Por lo tanto, el proceso de traducción de oraciones se convierte en el proceso de encontrar trayectorias similares a través de los espacios. “La máquina nunca necesita saber lo que significan las oraciones”.
Los investigadores del MIT y Google pusieron a prueba la técnica con dos idiomas perdidos, el Ugaritic y Linear B, de este último pudieron traducir correctamente el 67,3% de los cognados a sus equivalentes griegos, afirman.