El buscador de Alphabet, Google , continuamente se encuentra integrando mejoras a su sistema, como la inclusión de modelos lingüísticos basados en Inteligencia Artificial, con redes neuronales que estudian el lenguaje natural en más de 70 idiomas en el mundo.
En entrevista con El Universal, Pandu Nayak , VP de Búsquedas de Google , explicó el trabajo que en los últimos años han desarrollado para su buscador con Machine Learning. Uno puede pensar que las búsquedas que se realizan en Google se mejoran casi como por arte de magia, sin embargo, existe un equipo de investigación que trata cada día de innovar en este campo, y eso requiere entender a profundidad, la manera en que los usuarios utilizan las palabras y frases al realizar una búsqueda en Internet.
Las técnicas usadas previamente, incluían encontrar palabras equivalentes en una gran base de datos, pero debido a que esas mismas consultas han evolucionado (el 15% de ellas son nuevas diariamente), el sistema ha tenido que evolucionar también.
Es por ello que Google se encuentra por implementar un sistema en el que ha trabajado desde el año pasado, llamado BERT , el cual utiliza técnicas para procesar el lenguaje natural y así entrenar un sistema de Inteligencia Artificial que le dé contexto a las palabras o frases que se usan en las búsquedas diarias, logrando un mejor entendimiento de las consultas.
El motor de búsqueda de Google ha evolucionado conforme se han llevado a cabo estudios lingüísticos, pasando de buscar equivalentes y estudiar sinónimos hace 10 años a entender cómo funciona el mundo y el lenguaje actualmente.
En el modelo de elementos transformadores que propone BERT , se mejora el entendimiento del lenguaje y se obtiene un mejor significado de las palabras gracias a su contexto, y es este proceso de entrenamiento que usa redes neuronales el que lo hace posible. De acuerdo a Nayak , hay una mejora inmediata del 10 al 20% en los resultados de las consultas con este nuevo sistema, que se integrará gradualmente a partir de la próxima semana en más de setenta idiomas alrededor del mundo.
Gracias a los avances en Machine Learning e Inteligencia Artificial , que han sido amplios en los últimos años, el proceso de entrenamiento de BERT ha sido más rápido. Como todo sistema de IA, una parte del entrenamiento incluye la evaluación del mismo, y Google ha publicado un documento con las pautas que se han utilizado para lograr un resultado de excelencia en sus búsquedas.
Se han obtenido mejoras con elementos que podían parecer simples (como una negación o problemas de ubicación geográfica) pero que dependen del contexto para tener un resultado ideal. BERT también ayuda a detectar patrones visuales y que combinan palabras en diferentes idiomas que previamente se perdían, de manera que este nuevo sistema ofrece mejorías que no se habían obtenido en los últimos cinco años de investigaciones en el campo de las búsquedas.