11/07/2025

Chatbots de IA: Bibliotecas de EE.UU. prestan libros para aprender

Los chatbots de IA necesitan más libros para aprender y varias bibliotecas de EE.UU. se los prestarán

La inteligencia artificial ha venido aprendiendo mucho sobre nosotros a través de internet, pero ahora las empresas tecnológicas están recurriendo a una fuente de conocimiento más antigua: las bibliotecas. La Universidad de Harvard ha compartido una colección de casi un millón de libros, algunos tan antiguos como del siglo XV, en 254 idiomas. Estos libros serán de gran utilidad para mejorar la precisión y confiabilidad de los sistemas de inteligencia artificial.

Es importante empezar con información de dominio público, ya que es menos polémica que el contenido con derechos de autor. Las bibliotecas guardan una enorme cantidad de datos culturales, históricos y lingüísticos interesantes, que pueden enriquecer el aprendizaje de la inteligencia artificial.

La iniciativa de datos de Harvard, con el apoyo de empresas como Microsoft y OpenAI, está trabajando para hacer accesibles estas valiosas colecciones a los desarrolladores de inteligencia artificial. Se busca devolver parte del poder a las instituciones que han sido guardianes de la información durante mucho tiempo.

La colección de libros de Harvard contiene más de 394 millones de páginas escaneadas, con obras que abarcan desde el siglo XV hasta el XIX. Este conjunto de datos, que incluye más de 242 mil millones de tokens, será de gran ayuda para entrenar a los sistemas de inteligencia artificial.

La colaboración entre Google y Harvard para compartir volúmenes de libros del dominio público también es una iniciativa positiva. Sin embargo, es importante tener en cuenta que algunos datos obsoletos, como teorías desacreditadas o narrativas racistas, también están incluidos en esta colección.

En síntesis, la colaboración entre las bibliotecas y las empresas tecnológicas para compartir colecciones históricas es crucial para el desarrollo de la inteligencia artificial. Estos datos enriquecerán el aprendizaje de los sistemas de IA y abrirán nuevas posibilidades para la tecnología del futuro.

Preguntas frecuentes:

1. ¿Qué tipo de libros forman parte de la colección de Harvard?
La colección incluye casi un millón de libros, algunos tan antiguos como del siglo XV, en 254 idiomas.

2. ¿Por qué es importante empezar con información de dominio público en el aprendizaje de la inteligencia artificial?
Es menos polémico y permite acceder a una gran cantidad de datos culturales, históricos y lingüísticos interesantes.

3. ¿Cómo colaboran las empresas tecnológicas con las bibliotecas en este proyecto?
Empresas como Microsoft y OpenAI apoyan la iniciativa de datos de Harvard para hacer accesibles las colecciones históricas a los desarrolladores de inteligencia artificial.

4. ¿Qué cantidad de páginas escaneadas contiene la colección de libros de Harvard?
Más de 394 millones de páginas escaneadas forman parte de la colección.

5. ¿Qué tipo de datos obsoletos se pueden encontrar en la colección de libros de Harvard?
Se incluyen teorías desacreditadas, narrativas racistas y coloniales, entre otros.

Crédito de la fuente original: www.clarin.com

Anuncio Horizontal