Noticias

Chatbots de IA necesitan más libros para aprender

Todo lo que se ha dicho en internet fue tan sólo el comienzo de enseñarle a la inteligencia artificial acerca de la humanidad.
  • Por: Associated Press
  • 17 / Junio / 2025 -
  • COMPARTIR
Chatbots de IA necesitan más libros para aprender

Un ciclista camina junto al Langdell Hall, la biblioteca de derecho de Harvard, en la facultad de derecho de la Universidad de Harvard, en Cambridge, Massachusetts.

CAMBRIDGE, Massachusetts.- Todo lo que se ha dicho en internet fue tan sólo el comienzo de enseñarle a la inteligencia artificial acerca de la humanidad. Ahora las empresas de tecnología están recurriendo a un depósito de conocimiento más antiguo: las estanterías de libros en las bibliotecas.

Casi un millón de libros publicados inclusive en una época tan antigua como el siglo XV —y en 254 idiomas— forman parte de una colección de la Universidad de Harvard que se compartió recientemente con investigadores. Próximamente también se incluirán tesoros de periódicos antiguos y documentos gubernamentales en poder de la biblioteca pública de Boston.

Abrir las bóvedas para tener acceso a tomos centenarios podría suponer una fortuna de datos para las empresas de tecnología que enfrentan demandas de novelistas, artistas visuales y otros cuyas obras creativas han utilizado sin su consentimiento para entrenar a chatbots de IA.

"Es una decisión prudente comenzar con la información de dominio público, porque eso es menos controversial en este momento que el contenido que todavía tiene derechos de autor", expresó Burton Davis, abogado general adjunto de Microsoft.

Davis indicó que las bibliotecas también resguardan "enormes cantidades de datos culturales, históricos y lingüísticos interesantes", ausentes en las últimas décadas de comentarios en línea de los que los chatbots de IA han aprendido en su mayoría. Los temores a quedarse sin información también han llevado a los desarrolladores de IA a recurrir a datos "sintéticos", creados por los propios chatbots y de menor calidad.

Con el apoyo de "obsequios sin restricciones" de Microsoft y OpenAI —el fabricante de ChatGPT—, la Iniciativa de Datos Institucionales con sede en Harvard está trabajando con bibliotecas y museos de todo el mundo sobre cómo hacer que sus colecciones históricas estén listas para la IA de una manera que también beneficie a las comunidades a las que atienden.

"Estamos tratando de trasladar parte del poder que en este momento está en manos de la IA de vuelta a estas instituciones", manifestó Aristana Scourtas, quien dirige la investigación en el Laboratorio de Innovación de Bibliotecas de la Facultad de Derecho de Harvard. "Los bibliotecarios siempre han sido los administradores de los datos y la información".

EL MAÑANA RECOMIENDA