Desde hace un tiempo, la discusión sobre el uso de obras literarias protegidas por derechos de autor para entrenar a una inteligencia artificial ha estado sobre la mesa. Escritores se han pronunciado en contra de esta acción, sin embargo, algunas compañías continúan usando libros para entrenarlas.
Tal es el caso de Anthropic, compañía detrás de Claude, un asistente de IA que ha sido entrenado con libros. Esto ha propiciado la demanda de tres autores que señalan que la firma ha construido "un negocio multimillonario robando cientos de miles de libros protegidos por derechos de autor".
Leer también: WhatsApp: qué significa recibir un mensaje con el código 520
De acuerdo con la demanda, Antrophic habría usado Book3, un dataset de más de 196 mil libros, para entrenar a su modelo de lenguaje Claude. Esto se debe a que The Pile, un dataset open-source, entrenó a Claude con datasets más pequeños entre los que se encontraba Books3.
Antrophic a inicios de mes confirmó que se había usado The Pile para entrenar Claude y, aunque en agosto del año pasado Books3 se eliminó del dataset, los autores aseguran que la versión original del dataset aún sigue disponible.
"Anthropic descargó y reprodujo copias de The Pile y Books3, a sabiendas de que estos conjuntos de datos estaban formados por un cúmulo de contenidos protegidos por derechos de autor procedentes de sitios web piratas como Bibiliotik", señala la demanda.
En este sentido, los demandantes buscan que Antrophic pague daños y perjuicios a los afectados, además de obligar a la firma a no usar el contenido protegido por derechos de autor para entrenar a Claude.
Hasta la redacción de esta nota, Anthropic no ha emitido ningún comentario al respecto.
Esta no sería la primera demanda que enfrenta la compañía. En octubre del año pasado, Universal Music Group (UMG), Concord Publishing y ABKCO Music & Records presentaron una demanda en contra de la firma de IA por usar "las letras de numerosas composiciones musicales" para entrenar a Claude.
En dicha demanda, señalaban que con este entrenamiento la IA era capaz de generar letras idénticas o casi idénticas de alrededor de 500 canciones.
Leer también: Aprende de ciencia y tecnología en el BIDIFest de la UAM
Recibe todos los viernes Hello Weekend, nuestro newsletter con lo último en gastronomía, viajes, tecnología, autos, moda y belleza. Suscríbete aquí: https://www.eluniversal.com.mx/newsletters