Temática: Infraestructura abiertas para la ciencia: buenas y malas prácticas
País: México
Organización: Universidad Nacional Autónoma de México, Instituto de Geofísica, Biblioteca Conjunta de Ciencias de la Tierra
Póster
Castro Escamilla, M., Pérez Juárez, B., Barrientos Bernabé, O., & Sosa Jiménez, M. Á. (2025, octubre 27). El Repositorio de Fuentes Históricas en Ciencias de la Tierra de México: el uso de la Inteligencia Artificial para su desarrollo. 2do. Congreso Iberoamericano de Ciencia Abierta (CibCA2025), Quito-Ecuador. Zenodo. El Repositorio de Fuentes Históricas en Ciencias de la Tierra de México: el uso de la Inteligencia Artificial para su desarrollo
Vídeo de presentación
Autor(a) principal: Minerva Castro Escamilla
- ORCID: ORCID
- Mini biografía:
Maestra en Bibliotecología y Estudios de la Información con Mención Honorífica por la UNAM.
Autora y coautora de artículos y ponencias relacionados con el acceso a la información, repositorios y ciencia abierta.
Profesora en la Escuela Nacional de Estudios Superiores, Unidad Morelia, UNAM.
Ganadora de la Beca del Programa IBEREX de prácticas formativas para profesionales iberoamericanos del Sector Cultural de España.
Técnica Académica en el Departamento de Servicios Electrónicos de la Biblioteca Conjunta de Ciencias de la Tierra de la UNAM, participa en el Programa de Repositorios Institucionales de Datos para la investigación y es Editora Técnica de la revista Geofísica Internacional.
Palabras clave: Ciencias de la Tierra en México, Repositorios institucionales, Documentos históricos, Inteligencia artificial, Archivos históricos, Ciencia abierta.
Otros autores:
-
Nombre: Benjamín
Apellido: Pérez Juárez
Univesidad / organización: Universidad Nacional Autónoma de México, Instituto de Geofísica
País de residencia: México -
Nombre: Ofelia
Apellido: Barrientos Bernabé
Univesidad / organización: Universidad Nacional Autónoma de México, Instituto de Geología, Biblioteca Conjunta de Ciencias de la Tierra
País de residencia: México -
Nombre: Miguel Ángel
Apellido: Sosa Jiménez
Univesidad / organización: Universidad Nacional Autónoma de México, Instituto de Geofísica, Servicio Sismológico Nacional
País de residencia: México
Resumen:
El Repositorio de Fuentes Históricas en Ciencias de la Tierra de México es una iniciativa de la Biblioteca Conjunta de Ciencias de la Tierra (BCCT-UNAM) planeada y desarrollada por el personal académico, bajo los lineamientos del acceso abierto (principios FAIR), la preservación del patrimonio documental científico y la promoción de una ciencia abierta, colaborativa y sustentable.
Su desarrollo es parte de una estrategia institucional para fortalecer infraestructura abierta no comercial. Esta infraestructura contribuye a la investigación, la docencia y la vinculación social. Además, garantiza el acceso libre a fuentes documentales históricas de impacto científico, académico y social, ya que son materiales únicos a nivel nacional. Se hace énfasis en principios de apertura e interoperabilidad en el manejo de la ciencia abierta.
El repositorio reúne documentos que, por sus características, representan un testimonio invaluable del desarrollo científico en el área de las Ciencias de la Tierra de México de finales del siglo XIX. En particular, se pone a disposición del público, en texto completo, libros, revistas, folletos, literatura gris, reportes internos, mapas, sismogramas, telegramas y manuscritos sobre temas varios.
Además, incorpora dos tipos de archivos: uno sobre académicos que forman parte de la memoria colectiva de la historia de las ciencias de la tierra y otro de instituciones especializadas en el área, el cual alberga material de los Servicios Mareográfico Nacional y Sismológico Nacional.
Estas fuentes no sólo evidencian el avance del conocimiento técnico y científico, sino también la construcción de redes de colaboración académica, la profesionalización de la disciplina y los procesos institucionales.
Uno de los componentes clave de este proyecto fue la aplicación de herramientas de inteligencia artificial (IA) para llevar a cabo la curaduría de los documentos, clasificación y análisis documental. En particular, se emplearon modelos de procesamiento de lenguaje natural. Esto permitió automatizar el proceso de registro de los telegramas, uno de los materiales más antiguos en el archivo, y bajo un entrenamiento personalizado (o Custom Extractor) para la recuperación de entidades. Asimismo, se llevó a cabo el procesamiento de datos del registro, en cuanto a la normalización de nombres de afiliaciones, identificación de ubicaciones geográficas, fechas de sismos y eventos clave mediante la detección de patrones de comunicación en los documentos históricos. Permitiendo con ello acelerar significativamente los tiempos de procesamiento, reducir los errores humanos en la indexación y mejorar la experiencia de búsqueda para los usuarios, logrando procesar más de 11 mil documentos para su consulta digital.
Los documentos se han catalogado mediante el esquema de metadatos Dublín Core, para su interoperabilidad y compatibilidad con estándares internacionales. Con ello, facilitando la integración del repositorio en sistemas de cosecha, lo que incrementa su visibilidad y permite el intercambio de información con otras infraestructuras de acceso abierto a nivel nacional e internacional.
El proyecto se desarrolló en la plataforma DSpace, software de código abierto ampliamente utilizado en el ámbito académico para la gestión de repositorios institucionales. Esto refuerza el compromiso con la construcción de infraestructuras abiertas no comerciales que favorezcan el intercambio libre de conocimiento y la colaboración entre comunidades científicas, archivísticas y técnicas.
Su impulso se ha dado por profesionales de la información para realizar una gestión documental. Esto se hace en el marco de una estrategia institucional para promover la ciencia abierta, la preservación digital del patrimonio documental científico y la construcción de redes de conocimiento histórico. El propósito es apoyar la investigación histórica y el respaldo documental de eventos pasados.
Con esta iniciativa, no solo se asegura la preservación de documentos históricos esenciales para comprender el desarrollo de las ciencias de la tierra en México. También se fortalecen las capacidades digitales en investigación que garantizan la disponibilidad, accesibilidad y reutilización de la información en beneficio de las futuras generaciones. Esto establece infraestructura abierta para la ciencia, facilita el intercambio de información y promueve la cooperación bajo estándares internacionales y el compromiso con el acceso equitativo al conocimiento.
Referencias bibliográficas:
- API de Géminis. (s/f). IA de Google para desarrolladores. Recuperado en julio de 2025, de Gemini API | Google AI for Developers
- Arcubio, G. (2025). Repositorios institucionales y plataformas de inteligencia artificial ¿acceso abierto para todo? En Memoria académica: compartimos lo que sabemos. Universidad Nacional de la Plata.
- Castro Escamilla, M. (2020). Desarrollo de un repositorio de datos científicos de apoyo a la investigación: el caso de las ciencias de la tierra (Tesis de Maestría en Bibliotecología y Estudios de la Información). Universidad Nacional Autónoma de México, Programa de Posgrado en Bibliotecología y Estudios de la Información Facultad de Filosofía y Letras (164 pág). http://132.248.9.195/ptd2020/agosto/0802846/Index.html
- Castro Escamilla, M.; Armendáriz Sánchez, S.; Castro Escamilla, RC; Sosa Jiménez, MA (2024). Metadatos para un repositorio de datos sobre Ciencias de la Tierra. En F. F. Martínez Arellano y P. de la Rosa Valgañón (Coord.), Áreas de oportunidad ante el nuevo entorno de la catalogación y los metadatos (pp. 129-156). UINAM, Instituto de Investigaciones Bibliotecológicas y de la Información.
- Colavizza, G., Blanke, T., Jeurgens, C. y Noordegraaf, J. (2021). Archives and AI: An Overview of Current Debates and Future Perspectives. Journal on Computing and Cultural Heritage, 15(1), 4. https://doi.org/10.1145/3479010
- Documento AI. (s/f). Nube de Google. Recuperado en julio de 2025, de https://cloud.google.com/document-ai
- Domínguez, M., “Marco metodológico para el tratamiento de archivos históricos para la investigación científica: recomendaciones para la elaboración de una tipología documental,” COMCIENT: repositorio institucional del CAICYT especializado en información y comunicación científica, consulta 4 de julio de 2025, Marco metodológico para el tratamiento de archivos históricos para la investigación científica: recomendaciones para la elaboración de una tipología documental - COMCIENT: repositorio institucional del CAICYT especializado en información y comunicación científica
- Evaluar el desempeño. (s/f). Nube de Google. Recuperado en julio de 2025, de Evalúa el rendimiento | Document AI | Google Cloud
- P. Lopes, A. S. (2015). Estrategias de preservación de documentos históricos en repositorio digital=Estrategies of preservation of historical documents in digital repositories, Revista Ciencias de la documentación, 1(2), 7-14. http://arquivistica.fci.unb.br/wp-content/uploads/tainacan-items/476350/976986/Estrategias-de-preservacion-de-documentos-historicos-en-repositorio-digital.pdf
- Universidad Nacional Autónoma de México. Biblioteca Conjunta de Ciencias de la Tierra. (2025). Repositorio de Fuentes Históricas en Ciencias de la Tierra de México – CTMex, México: UNAM, BCCT. http://132.248.182.92/xmlui/