La literatura universal tiene sus misterios, muchos de los cuales radican en lo autoral. Quizás en este siglo se resuelvan muchos de esos misterios gracias a la Inteligencia Artificial. Trece instituciones europeas, entre ellas la española UNED (Universidad Nacional de Educación a Distancia) forman parte del proyecto Computational Literary Studies Infraestructure que cuenta con un fondo de cinco millones de euros para investigaciones literarias. Parte de este proyecto desarrolla herramientas digitales capaces de develar a los autores detrás del seudónimo a través de la comparación de obras y la estilometría; técnica utilizada, recientemente, para corroborar la autoría de un par de obras de J.K. Rowling que había firmado con seudónimo, los algoritmos revelaron que aquellos dos libros coincidían en un 90%, en patrones estilométricos, con otros libros de la autora. Otro ejemplo es la obra “La Conquista de Jerusalén”, descubierta en el siglo XX por el hispanista italiano Stefano Arata, esta obra situada en la primera cruzada con escenas que alternan entre lo que pasa del lado cristiano y musulmán y que incluyen algún triángulo amoroso interreligioso, gracias al Computational Literary Studies Infraestructure se ha confirmado la autoría de esta obra a Miguel de Cervantes Saavedra que estaba dentro de una lista de posibles candidatos que estuvieron rondando por décadas. El proyecto busca también la verdadera identidad de la escritora italiana Elena Ferrante, de quien se sospecha no sea su verdadero nombre, ya que no hay registros que lo avalen, aunque aquí hay podría haber un tema de respeto a una decisión personalísima. Otro caso sobresaliente es el de el Lazarillo de Tormes, que se atribuyó, de manera más o menos homogénea pero no sin detractores, a Alfonso de Valdés; hoy gracias al proyecto este autor ha quedado descartado y suenan más fuerte otros nombres como posibles autores: Fray Luis de León, Juan Arce de Otálora, entre otros; ya veremos si se siguen descartando uno a uno esos nombres que estaban en el radar o si se confirma alguno.
El algoritmo desarrollado por el proyecto europeo es capaz de indagar profundo no sólo en textos narrativos; si de poesía se trata, tiene la posibilidad de contar sílabas o identificar figuras retóricas, encontrar patrones en estos y otros elementos para develar identidades perdidas, el reto mayor está, en el caso de los textos más antiguos, en buscar formatos legibles para que los ordenadores puedan “leerlos”. Por supuesto que el ejercicio puede resultar en conclusiones diametralmente opuestas, quizá una obra atribuida a cierto autor resulte en descartarlo, y si no hay otras obras de dicho escritor, no podríamos conocer su identidad. En esa situación podrían encontrase muchas obras escritas por mujeres que, al no poder firmar con su nombre, se vieron obligadas a usar seudónimos o firmar como si fueran sus maridos, esos descubrimientos que si bien no restaurarán el honor a quien lo merece, sí que abrirán las puertas a investigaciones más profundas que quizá algún día permitan identificar a estas autoras de manera plena.
Los resultados de esas primeras investigaciones están resultando muy interesantes, aunque hay que decir que, en el caso de la literatura en castellano, se está viendo limitado el potencial de esta inteligencia artificial al no tener el mismo nivel de desarrollo que otras lenguas; este es un reto personal para las cabezas de la UNED involucradas.