La Investigación Histórica Digital (2025) by La Colección Puertorriqueña

La Investigación Histórica Digital

una guía practica para el historiador puertorriqueño

La Investigación Histórica Digital una guía practica para el historiador puertorriqueño

Archivo Digital Nacional de Puerto Rico (adnpr.net & archivonacional.com) admin@archivonacional.com

Museo y Centro de Estudios Humanísticos de la Universidad Ana G. Méndez

Autor: Joseph Harrison Flores

Portada: Creada por Gemini (agosto 2025)

Creación, diseño y realización de Archivo Digital Nacional de Puerto Rico (ADNPR) Reservados todos los derechos

PALABRAS PRELIMINARES

La disciplina histórica se encuentra en un proceso de innovación constante. Durante siglos, el oficio del historiador estuvo definido por el contacto físico con el documento, el silencio de los archivos y la búsqueda paciente en legajos tangibles. Sin embargo, la revolución digital ha transformado radicalmente nuestro entorno. No se trata meramente de un cambio de medio; la velocidad, el volumen y la interconexión de la información exigen una nueva mentalidad crítica y metodológica.

Es en este contexto de transformación donde el Museo y Centro de Estudios Humanísticos (MCEH) de la Universidad Ana G. Méndez se complace en presentar la obra de Joseph Harrison Flores, Investigación Histórica en la Era Digital. Este texto no es solo un manual necesario, sino que constituye una brújula indispensable para navegar la investigación histórica de nuestro tiempo. Lo que el lector tiene en sus manos trasciende la lista de herramientas tecnológicas. Es una redefinición metodológica profunda que conecta las visiones pioneras de Vannevar Bush y Douglas Engelbart con la realidad inmediata de la inteligencia artificial. Harrison Flores logra una síntesis admirable que sirve de puente entre el rigor de la historiografía tradicional y las posibilidades infinitas de los artefactos digitales contemporáneos.

A lo largo de estas páginas, se nos desafía a reconsiderar cómo formulamos nuestras preguntas. Conceptos innovadores como la Investigación Periférica nos invitan a mirar más allá de los protagonistas habituales, utilizando la tecnología para iluminar redes invisibles y rescatar voces silenciadas. La integración de la redacción diaria y el filtrado crítico como parte del ciclo investigativo es, en sí misma, una lección de disciplina intelectual que nuestros estudiantes e investigadores sabrán valorar.

Especialmente valiosa es la discusión sobre la Inteligencia Artificial. Lejos de caer en el rechazo o la adopción acrítica, el autor ofrece un marco ético y práctico (el sistema H-LAM/T) para utilizar estas herramientas como extensiones de nuestro intelecto. Sus ejemplos, desde el análisis del Grito de Lares

hasta la Ley Jones de 1917, demuestran cómo la tecnología puede refinar nuestra comprensión del pasado puertorriqueño.

Esta publicación llega en un momento crucial. Al revisar la estructura, los anejos y la profundidad de este trabajo, mi conclusión es que este libro representa un gran paso y aportación a la historiografía puertorriqueña. De esto deberíamos estar hablando por los próximos 20 años. Invito a la comunidad académica, a los estudiantes y a todo aquel apasionado por la historia a adentrarse en esta guía. Aquí encontrarán las claves no solo para investigar mejor en el presente, sino para escribir la historia del futuro.

Dr. Félix R. Huertas González

Director Museo y Centro de Estudios Humanísticos

Universidad Ana G. Méndez, Recinto de Gurabo

NOTA INFORMATIVA SOBRE EL ORIGEN Y ELABORACIÓN DE ESTE TRABAJO

El presente documento tiene su génesis en una presentación académica realizada en octubre de 2024 en la Universidad de Puerto Rico, donde se expusieron los fundamentos, metodologías y aplicaciones prácticas de la investigación histórica digital. La acogida y el interés generado por dicha presentación, así como las preguntas y debates subsiguientes, evidenciaron la necesidad de desarrollar un texto más amplio y detallado que sirviera como guía metodológica para investigadores, estudiantes y profesionales interesados en las humanidades digitales y, específicamente, en la investigación histórica utilizando recursos digitales.

Este trabajo constituye una guía metodológica integral sobre la investigación histórica en la era digital. El manuscrito aborda de manera sistemática los siguientes temas fundamentales:

1. Los archivos digitales y su tipología, incluyendo hemerotecas digitales, bibliotecas virtuales y repositorios institucionales, con especial énfasis en recursos relacionados con Puerto Rico y el ámbito hispanoamericano.

2. La metodología de investigación periférica, un enfoque innovador que propone explorar conexiones tangenciales y sutiles para obtener una comprensión más profunda de eventos y figuras históricas.

3. Técnicas de búsqueda avanzada y estrategias para la localización efectiva de fuentes primarias y secundarias en entornos digitales.

4. Sistemas de organización y nomenclatura de archivos digitales que facilitan el manejo eficiente de grandes volúmenes de documentación histórica.

5. El análisis crítico de fuentes digitales y las consideraciones metodológicas específicas del trabajo con documentos digitalizados.

6. Aplicaciones prácticas mediante estudios de caso, incluyendo el análisis de documentos educativos históricos de Puerto Rico.

7. La transformación del rol de bibliotecas y archivos en la era digital, y el desarrollo de modelos híbridos que combinan la custodia tradicional con las ventajas tecnológicas.

8. El uso de inteligencia artificial como herramienta de apoyo en la investigación histórica (Capítulo VIII).

La obra se dirige tanto a investigadores experimentados que buscan incorporar metodologías digitales a su práctica profesional, como a estudiantes y académicos que inician su formación en las humanidades digitales.

Declaración Sobre El Uso De Inteligencia Artificial

En aras de la transparencia académica y la integridad intelectual, es importante declarar que, debido a las exigencias temporales para la culminación de este manuscrito, se utilizó asistencia de inteligencia artificial en la redacción de algunas secciones del texto. Específicamente, el Capítulo VIII, que versa sobre "Inteligencia Artificial en la Investigación Histórica", fue desarrollado con el apoyo significativo de herramientas de IA, lo cual resulta metodológicamente coherente dado que el capítulo mismo trata sobre esta tecnología y su aplicación en el campo historiográfico.

El uso de IA en este contexto permitió:

1. Agilizar el proceso de redacción sin comprometer la rigurosidad académica.

2. Ejemplificar de manera práctica las posibilidades que ofrece esta tecnología para la investigación y escritura académica.

3. Mantener la coherencia estilística y metodológica a lo largo del manuscrito.

4. Es importante subrayar que la estructura conceptual, el enfoque metodológico, los criterios de selección de contenidos, los ejemplos específicos basados en investigaciones propias, y la supervisión editorial completa permanecieron bajo la dirección y responsabilidad intelectual del autor. La inteligencia artificial funcionó como herramienta de asistencia en la articulación y desarrollo de ideas previamente conceptualizadas.

Condiciones De Distribución

Este manuscrito ha sido preparado con la intención de que pueda ser compartido dentro de contextos académicos y educativos apropiados. Se autoriza su distribución para fines de:

1. Docencia e investigación en instituciones educativas.

2. Consulta por parte de bibliotecas e instituciones culturales.

3. Uso por investigadores y estudiosos de las humanidades digitales.

Se solicita que cualquier reproducción, cita o referencia al texto respete los estándares académicos de atribución y reconocimiento de autoría.

Esta obra aspira a contribuir al desarrollo de las humanidades digitales en el contexto puertorriqueño e hispanoamericano, proporcionando herramientas metodológicas y reflexiones críticas sobre la práctica de la investigación histórica en un entorno cada vez más digitalizado. El texto busca servir como puente entre las metodologías tradicionales de la historiografía y las posibilidades que ofrecen las tecnologías contemporáneas, manteniendo siempre el rigor académico y la reflexión crítica como principios fundamentales.

Joseph Harrison Flores 27 de octubre de 2025

I. INTRODUCCIÓN

La tecnología digital ha transformado radicalmente la manera en que interactuamos con la información y los documentos históricos, para la investigación histórica. Esta transformación ha creado nuevas formas de acceder, analizar y procesar los documentos históricos, modificando así las metodologías tradicionales de investigación. Sin embargo, la tecnología que hoy se ve como novedad tiene más de 80 años desde que fue planteada originalmente por varios científicos de los Estados Unidos.

En 1945, cuando la Segunda Guerra Mundial llegaba a su fin, el científico estadounidense

Vannevar Bush publicó un ensayo visionario titulado "As We May Think" en The Atlantic Monthly1 .

En su artículo, Bush identificó uno de los desafíos que enfrentaría la investigación en la era moderna, era la dificultad para manejar la creciente cantidad de información científica y la ineficiencia de los métodos tradicionales para acceder a estos 2 Según Bush los métodos tradicionales requerían a los investigadores desplazarse físicamente entre bibliotecas, archivos, hemerotecas y otros depósitos documentales lo cual era un proceso lento y engorroso. La dispersión física de los documentos y la falta de sistemas ágiles para su consulta se convertían en verdaderos obstáculos para el avance del conocimiento.

Para mitigar esa limitación Bush propuso, teóricamente, un equipo tecnológico para uso individual que funcionaría como una especie de archivo y biblioteca privados y mecanizados donde el investigador podría almacenar todos sus libros, documentos y comunicaciones, y consultar los mismos inmediatamente. Este equipo sería una extensión a la memoria del investigador por eso su nombre sería Memex (memory extender)3 . El Memex (ver ilustración) era un escritorio mecánico-eléctrico que permitiría a un individuo almacenar todos sus libros, discos y comunicaciones, y consultarlos a gran velocidad y flexibilidad. El concepto del Memex tenía un

1 Vannevar Bush, The Atlantic, Julio 1945. P. 101.

2 Idem. “los métodos para transmitir y revisar los resultados de la investigación datan de hace generaciones y hoy en día son totalmente inadecuados para su propósito”

3 Idem. P. 106-107.

teclado y botones que permitirían al usuario acceder el material en rollos microfilm y mostrar su contenido en pantallas. La característica más revolucionaria del Memex era su capacidad de indexar el material para crear vínculos entre el material almacenado en los microfilms.4

La visión de Bush anticipó muchos de los desarrollos que hoy son comunes en la investigación histórica digital. Los archivos digitales contemporáneos han materializado la visión del Memex de Bush. Pero el fundamento del ensayo de Bush no recae en la digitalización de documentos ni en las capacidades técnicas de búsqueda. Según Bush, lo verdaderamente importante era desarrollar sistemas que funcionaran al igual que la mente humana, por asociación, de manera que toda la información acumulada tuviese un sentido para el investigador.5 Ese es el camino actual de la inteligencia artificial.

Ilustración 1 - Memex- Life Magazine, 10 de septiembre de 1945. P.123

4 Idem. P. 107.

5 Idem. P. 106.

Lo que Bush vislumbró en 1945 se ha materializado en gran medida a través de la revolución digital. Pero le correspondió a otro ingeniero estadounidense el hacer realidad algunas de las ideas planteadas por Bush. Son pocas las personas que no están envueltas en el campo de la tecnología que conocen a Douglas Engelbart. Los que lo conocen solamente lo hacen por atribuírsele la invención del “mouse”.6 Pero Engelbart es más que el “mouse”. Mientras Bush imaginó las posibilidades teóricas, Engelbart desarrolló el marco conceptual y las bases prácticas para aumentar la capacidad del intelecto humano a través de la tecnología. Su trabajo revolucionario, que culminaría en la histórica demostración de 1968 conocida como "The Mother of all Demos", no solo introdujo tecnologías pioneras como el mouse y el hipertexto (hypertext), sino que estableció la filosofía de que la tecnología debe funcionar como un sistema integrado para ampliar la capacidad del ser humano La demostración de Engelbart sentó las bases de la computación moderna y creó la base esencial para el internet, incluyendo los “Network Information Centers” (NICs) hasta los sistemas de navegación por enlaces que hoy usamos cotidianamente.

Según Engelbart el intelecto humano opera dentro de un “sistema jerárquico de procesos y capacidades, donde el lenguaje, los artefactos y la metodología se combinan para permitir el pensamiento y la resolución de problemas complejos”7. Engelbart planteó que a medida que las herramientas tecnológicas se desarrollaban para resolver problemas del ser humano, también generaban nuevos problemas. Estos nuevos problemas obligaban al ser humano a adaptarse y desarrollar soluciones a estos nuevos problemas, lo que a su vez provocaba un aumento del intelecto humano.8

Ese marco conceptual fue llamado por Engelbart sistema H-LAM/T (Human using Language, Artifacts, Methodology, in which he is Trained).9 Este modelo describe cómo los seres humanos

6 Thierry Bardin. Bootstrapping, Douglas Engelbart, Coevolution, and the Origins of Personal Computing. Stanford University Press, Stanford California. 2000. P.1

7 Douglas Englerbart. Augmenting Human Intellect: A Conceptual Framework. Stanford Research Institute, Menlo Park, California. Octubre 1962.

8 Idem. P. 132.

9 Idem. P. 9.

resuelven problemas complejos no de manera aislada, sino como parte de un sistema integrado con componentes interdependientes:

• H (Human)- El componente principal con sus capacidades innatas de razonamiento, percepción y acción. Engelbart argumenta que estas capacidades fundamentales son limitadas, pero pueden ser mejoradas a través de los otros componentes del sistema.

• L (Language)- No solo el lenguaje natural, sino toda forma de representación simbólica que usamos para estructurar conceptos. Incluye claves especializadas, terminologías técnicas, diagramas y sistema de símbolos que permiten al humano externalizar y manipular ideas.

• A (Artifacts)- Son las herramientas físicas y tecnológicas que usamos. Desde un simple lápiz y papel hasta computadoras y dispositivos modernos. Estos artefactos actúan como "prótesis" del cerebro humano que extienden nuestras capacidades, permitiéndonos manipular símbolos y datos de formas nuevas y más eficientes.

• M (Methodology)- Los métodos, procedimientos y estrategias que guían cómo utilizamos el lenguaje y los artefactos para resolver un problema. Esto incluye tanto los procesos formales como los hábitos de trabajo que hemos desarrollado con el tiempo.

• T (Training)- Es el proceso de aprendizaje y adaptación que le permite al humano dominar los otros tres componentes del sistema (Lenguaje, Artefactos, Metodología). El entrenamiento no es solo la educación formal, sino la experiencia y la práctica que nos capacitan para operar eficazmente dentro del sistema H-LAM/T

Lo revolucionario del modelo teórico de Engelbart es la interdependencia dinámica de cada componente. 10 Un cambio en cualquier elemento puede transformar todo el sistema. Por ejemplo, la introducción de un nuevo artefacto (como la inteligencia artificial) no solo acelera la investigación, sino que permite nuevas metodologías de análisis de datos, requiere nuevos conceptos lingüísticos (como "IA”, “Prompt”), y requiere nuevo entrenamiento. Esta propagación de cambios crea lo que Engelbart llamaba "efectos compuestos" que pueden resultar en aumentos dramáticos en la efectividad intelectual.11

La aplicación del sistema H-LAM/T a la investigación histórica con herramientas digitales se puede explicar de la siguiente manera. El historiador (H) mantiene sus capacidades cognitivas básicas, pero ahora emplea lenguajes (L) expandidos que incluyen no solo la terminología

10 Idem. Pp. 38-39.

11 Idem. P. 45.

historiográfica tradicional, sino también vocabularios especializados (AND, OR, NOT) para describir fuentes, o terminología bilingüe necesaria para navegar colecciones dispersas en los archivos de San Juan, Madrid, Washington, Dinamarca, etc Los artefactos (A) han evolucionado desde la consulta presencial en el Archivo General de Puerto Rico y la Colección Puertorriqueña hacia repositorios digitales como la Biblioteca Digital Puertorriqueña, el Portal del Archivo Nacional de Estados Unidos, y PARES para el Archivo de Indias, complementados con software de sistemas de información geográfica para estudiar transformaciones territoriales desde el período taíno hasta el presente. La metodología (M) incorpora ahora técnicas digitales para analizar padrones de esclavos, registros parroquiales, y documentos de las Actas del Cabildo de San Juan, mientras que el entrenamiento (T) requiere conocimiento y literacia en computadoras, navegación de bases de datos de los archivos, y la construcción de ”prompts” en inteligencia artificial.

Ilustración 2- Douglas Engelbart

Ilustración 3- Resumen Sistema H-LAM/T de Douglas Engelbart

Los esfuerzo teóricos y prácticos de Bush y de Engelbart vieron la luz el 9 de diciembre de 1968 12 En una histórica presentación, llevada a cabo durante el “Fall Joint Computer Conference” en San Francisco, Engelbart y su equipo de investigación del Stanford Research Institute (SRI) mostraron al mundo, por primera vez, un sistema integrado que materializaba muchos de los conceptos que hoy son fundamentales para la investigación digital. En la presentación de noventa minutos, se mostró cómo funcionaba en la práctica el sistema H-LAM/T, la indexación mediante palabras clave, el hipertexto para enlazar documentos, y el mouse como extensión

12 . Stanford Research Institute. The Mother of All Demos. Recuperado de https://youtu.be/UhpTiWyVa6k?si=7Kpi1ZhyX2Oet0kX

física del usuario. Todos estos artefactos fueron mostrados trabajando como un sistema coherente tal como lo habia planteado Bush en su concepto del Memex.

Ilustración 4- Promoción de presentación de Engelbart (1968) https://invention.si.edu/invention-stories/mother-all-demos

La demostración de Engelbart estableció principios fundamentales que continúan definiendo la manera en que manejamos hoy la información digital. En primer lugar, Engelbart demostró que la utilidad y efectividad en el manejo de información requiere una integración de múltiples componentes, el hardware, el software, las interfaces y las metodologías de trabajo. Todos ellos deben funcionar como un sistema coherente y unificado que permitieran una interacción natural y fluida con la información digital. Dicho principio, que actualmente en muchos casos no lo es, debe ser la norma al momento de diseñar herramientas para la investigación histórica digital, donde la facilidad de uso y la naturalidad de la interacción son cruciales para que el usuario apoye la tecnología.

Ilustración 5- Primera versión del “Mouse”- SRI International

Documentos Digitales

Ilustración 6- Teclado y mouse operado por Douglas Engelbart en su presentación de 1968.

Los documentos en formato digital han transformado fundamentalmente la manera en que los historiadores e investigadores acceden, analizan el material histórico. Esta transformación no solo ha modificado la metodología de investigación, sino que también ha redefinido la relación entre el investigador y sus fuentes primarias, creando nuevas oportunidades y desafíos en el campo de la historia. A partir del año 2020, hemos presenciado una transformación sin precedentes en el material disponible digitalmente para investigaciones históricas al igual que las herramientas disponibles para la organización de documentos. Esto permite al investigador la oportunidad de llevar a cabo su búsqueda sin tener que entrar a una biblioteca o archivo. Este cambio en la manera de investigar requiere que el historiador este preparado para enfrentar el

reto y la infinidad de documentos y lugares de donde puede obtener los documentos para su investigación.

La documentación digital presenta fortalezas significativas para la investigación histórica, pero también introduce desafíos metodológicos particulares que el investigador debe comprender y navegar críticamente. (Parauna discusióndetalladade las ventajas y limitaciones de labúsqueda digital, ver Capítulo III). Entre las herramientas más transformadoras se encuentra el OCR (Reconocimiento Óptico de Caracteres), que facilita la transcripción, organización y análisis de datos históricos, transformando documentos estáticos en información procesable. Últimamente, la inteligencia artificial y el aprendizaje automático están expandiendo las posibilidades de análisis y colaboración global entre investigadores. Sin embargo, la documentación digital también enfrenta debilidades y amenazas. Entre las debilidades principales está la dependencia absoluta de dispositivos tecnológicos y la conexión permanente Internet, lo que puede limitar el acceso en áreas con infraestructura deficiente. Existe también el riesgo de perder el contexto original de los documentos, lo que puede llevar a interpretaciones incorrectas. El depender en su totalidad de lo digital es una debilidad ya que no todos los documentos están digitalizados, creándose brechas que pueden crear historias imprecisas.

Entre las amenazas de la investigación digital está el cambio constante de formatos digitales y la obsolescencia de archivos que pueden volverse inaccesibles con el tiempo. Además, la desigualdad digital que excluye a ciertas regiones de los beneficios de la documentación digital. Una amenaza inherente es la posible pérdida de familiaridad con técnicas tradicionales de investigación, como la lectura de manuscritos originales, que actualmente ofrecen una comprensión contextual única que la digitalización no siempre puede replicar.

Ilustración 7- Análisis de Fortalezas, Oportunidades Debilidades y Amenazas de la investigación digital

Es necesario reconocer que este análisis de fortalezas, oportunidades, debilidades y amenazas no es exclusivo de la documentación digital, sino que también se manifiesta, aunque de manera diferente, en la investigación histórica tradicional. Mientras que la investigación tradicional enfrenta limitaciones de acceso físico y geográfico a los archivos, ofrece la riqueza del contacto directo con los documentos originales y su contexto material. Esta dualidad entre lo tradicional y lo digital no debe verse como una dicotomía excluyente, sino como metodologías complementarias que, cuando se integran, amplían exponencialmente las capacidades investigativas. Es precisamente en este punto de convergencia donde se sitúa la necesidad de desarrollar competencias híbridas que aprovechen lo mejor de ambos mundos.

Dentro de este corto marco teórico presentaremos en este trabajo una descripción de una metodología para la investigación digital, una lista de portales de documentos históricos, una descripción de las nuevas herramientas de inteligencia artificial que están disponibles para el investigador de Puerto Rico. Esto permitirá al investigador maximizar el uso de los recursos digitales y así aumentar el intelecto colectivo puertorriqueño.

Metodología

Como primer paso propongo una metodología práctica y sencilla para la investigación histórica Digital. Esta teoría se basa en la propuesta por Goskar en su guía "How to Do Historical Research Online" y modificada para añadir el concepto de la investigación periférica y la Inteligencia Artificial. 13 Goskar propone un proceso cíclico e interconectado que comienza con el establecimiento de puntos de partida claros, los cuales conducen a la identificación y desarrollo de palabras clave relacionadas a la investigación. A partir de estas palabras clave, el investigador sigue un rastro de evidencia documental, aplicando filtros críticos para evaluar la relevancia y fiabilidad de la información encontrada. Los materiales seleccionados se guardan sistemáticamente para su posterior consulta y análisis, y finalmente son documentados y anotados meticulosamente, proceso que a su vez puede generar nuevos puntos de partida, reiniciando así el ciclo de investigación.

Como aporte metodológico a la investigación histórica digital, propongo una metodología que expande el ciclo desarrollado por Goskar. Esta metodología alterna integra tres elementos fundamentales: 1) la historia o análisis periférico, 2) la redacción diaria y 3) el uso de la inteligencia artificial como herramienta de apoyo a la investigación. El resultado de esta metodología alterna es mejorar la investigación mediante la incorporación sistemática de la investigación periférica, que amplía el alcance de la investigación para incluir no solo los actores y eventos principales, sino también los de su periferia. Además, implementar una disciplina de

13 Tehmina Goskar, Curatorial Research Centre. https://curatorialresearch.com/services/research/how-to-dohistorical-research-online/

escritura y revisión diaria que convierte la redacción en una herramienta activa de investigación y análisis y por último el uso estratégico de herramientas de inteligencia artificial que potencian la capacidad del investigador para identificar patrones, establecer conexiones y manejar grandes volúmenes de información.

Ilustración 8- Metodología Goskar https://curatorialresearch.com/services/research/how-to-do-historical-research-online/

Ilustración 9- Metodología Harrison para la investigación Histórica

Esta variante metodológica se construye sobre los fundamentos establecidos por Goskar pero se introducen innovaciones críticas que responden a las necesidades contemporáneas del historiador digital. Lo que se propone reconoce que la investigación histórica en el siglo XXI requiere no solo herramientas digitales, sino también una reconceptualización de cómo abordamos el pasado.

Un componente de esta metodología, la historia o análisis periférico. Mientras que las metodologías tradicionales tienden a centrarse en evaluar los documentos relacionados a los actores principales y los eventos de mayor impacto, propongo una expansión deliberada del campo de visión investigativo. Este enfoque periferal implica examinar los márgenes de los eventos históricos, prestando aleatoriamente atención a otros documentos no relacionados y

que usualmente son excluidos por no estar relacionados. Esta técnica puede revelar conexiones inesperadas, patrones ocultos y contextos más amplios que frecuentemente pasan desapercibidos en el análisis más convencional.

Laredaccióndiaria, comosegundoelemento de mipropuesta, transforma el procesode escritura de un producto final a una herramienta activa de investigación. Esta práctica disciplinada que recomiendo requiere que el investigador articule diariamente sus hallazgos, reflexiones y análisis preliminares, creando así un registro evolutivo del proceso investigativo. He comprobado que esta escritura continua no solo documenta el progreso de la investigación, sino que también funciona como un mecanismo de procesamiento cognitivo que ayuda a identificar lagunas en el conocimiento y formular nuevas preguntas. La revisión regular de estos escritos diarios, según mi experiencia, permite al investigador rastrear la evolución de sus ideas y mantener una perspectiva crítica sobre su propio trabajo.

El tercer componente que integro, la inteligencia artificial, representa la adaptación más contemporánea de la metodología. Concibo las herramientas de IA no como sustitutos del análisis humano, sino como amplificadores de las capacidades investigativas. En mi práctica, estas herramientas pueden procesar vastos volúmenes de información documental, identificar patrones y temas a través de grandes corpus de texto, y sugerir conexiones que podrían no ser inmediatamente evidentes para el investigador humano. He encontrado que la IA también puede asistir en la traducción de documentos históricos en múltiples idiomas, en la transcripción de manuscritos difíciles de leer, y en la creación de visualizaciones de datos que revelan tendencias temporales y geográficas.

La implementación práctica de la metodología sigue un flujo de trabajo iterativo que comienza con la identificación inicial del tema siguiendo el modelo de Goskar, pero luego lo expando para incluirunabúsquedadeliberadade elementos periféricos relacionados. En el proceso, desarrollo palabras clave no solo para los temas centrales, sino también para aspectos periferales, utilizando herramientas de IA para generar términos relacionados y sinónimos históricos. Durante lafase de búsquedayrecolecciónde evidencia, aplicofiltros múltiples que evalúantanto

la relevancia central como la periferal de los documentos. Mi documentación diaria captura no solo los hallazgos, sino también las reflexiones metodológicas y las hipótesis emergentes.

La metodología que propongo en este trabajo representa una evolución necesaria de las visiones pioneras de Bush y Engelbart, adaptada específicamente a los desafíos contemporáneos de la investigación histórica digital. Esta aproximación reconoce que la verdadera transformación no reside en la simple digitalización de archivos, sino en cómo interactuamos con las fuentes históricas.

El análisis periférico, componente de esta metodología, expande deliberadamente el campo de visión investigativo más allá de los actores principales y eventos centrales. Esta técnica ha demostrado su efectividad en casos como las conexiones inesperadas entre figuras históricas puertorriqueñas aparentemente no relacionadas, revelando patrones estructurales de adaptación y resistencia que las metodologías tradicionales sistemáticamente pasan por alto. La escritura diaria, segundo elemento fundamental, transforma la documentación pasiva en un laboratorio cognitivo activo donde emergen patrones y conexiones que permanecerían latentes sin esta práctica reflexiva sistemática. La inteligencia artificial, tercer componente, no sustituye el análisis humano, sino que lo amplifica exponencialmente, permitiendo procesar corpus documentales masivos e identificar patrones cognitivamente inaccesibles mediante métodos tradicionales.

La sinergia entre estos tres elementos no solo agrega conocimiento nuevo, sino que aumenta la capacidad misma de generar conocimiento futuro. Esta metodología permite al investigador desarrollar una comprensión más profunda y multidimensional de los procesos históricos. El análisis periférico revela actores, eventos y correlaciones, la escritura diaria facilita la identificación de patrones y conexiones temáticas; y la inteligencia artificial amplifica la capacidad de procesar y analizar corpus documentales extensos. Esta metodología, cuyos valor y resultados específicos se documentarán en los capítulos siguientes a través de casos de

estudio concretos, podría expandir significativamente las posibilidades de la investigación histórica puertorriqueña.

Con esta metodología reconozco que la investigación histórica digital no es simplemente la digitalización de documentos y su lectura, sino una nueva relación de cómo interactuamos con el pasado. Esta metodología promete aumentar significativamente el intelecto colectivo puertorriqueño, no mediante la simple acumulación de información, sino a través de nuevas formas de percibir, analizar y comprender nuestra historia compartida utilizando artefactos tecnológicos.

Esta nueva relación con el pasado, mediada por artefactos tecnológicos, no comienza con la búsqueda en repositorios digitales ni con el análisis de fuentes primarias digitalizadas. Como en toda investigación histórica rigurosa, el punto de partida es el conocimiento profundo de lo que otros historiadores han investigado, debatido y concluido sobre nuestro tema de interés. El modelo H-LAM/T de Engelbart nos recuerda que los artefactos tecnológicos solo aumentan nuestra capacidad intelectual cuando se utilizan dentro de una metodología sistemática que incluye el Entrenamiento (T) en las prácticas fundamentales de la disciplina.

En la investigación histórica digital, como en la tradicional, ese primer paso metodológico es la revisión historiográfica, es conocer las investigaciones existentes, comprender los debates académicos actuales, identificar las interpretaciones establecidas y las lagunas en el conocimiento. La diferencia es que ahora los artefactos digitales permiten realizar esta revisión con mayor amplitud y profundidad, accediendo a trabajos académicos que antes habrían requerido visitas a múltiples bibliotecas universitarias. Sin embargo, la facilidad tecnológica no elimina la necesidad metodológica que antes de buscar fuentes primarias, debemos entender qué preguntas ya han sido respondidas, qué debates siguen abiertos, y dónde nuestra investigación puede contribuir genuinamente al conocimiento histórico.

El siguiente capítulo desarrolla este primer paso metodológico fundamental, mostrando cómo utilizar los artefactos digitales para realizar una revisión historiográfica comprehensiva que

establezca el contexto académico necesario para formular preguntas de investigación pertinentes y alcanzables.

II. PUNTO DE PARTIDA

La investigación histórica digital, al igual que la tradicional, comienza no con la búsqueda de fuentes primarias, sino con la comprensión del contexto historiográfico. Este primer paso metodológico representa el componente de Entrenamiento (T) del modelo H-LAM/T que es la internalización de las prácticas disciplinarias fundamentales que distinguen al historiador del simple recolector de datos. Antes de que los Artefactos digitales (repositorios de fuentes primarias) puedan aumentar nuestra capacidad investigativa, debemos entrenarnos en la práctica esencial de conocer profundamente qué han investigado, debatido y concluido otros historiadores sobre nuestro tema.

Los artefactos tecnológicos transforman cómo realizamos esta revisión historiográfica, pero no alteran su necesidad fundamental. Bases de datos académicas digitales, bibliotecas universitarias en línea, repositorios institucionales y plataformas de acceso abierto ahora permiten acceder a trabajos que antes requerirían semanas de visitas físicas a múltiples bibliotecas. Sin embargo, como Engelbart anticipó, nuevos artefactos requieren nuevo entrenamiento en su uso efectivo. Este capítulo presenta la metodología para utilizar artefactos digitales en la revisión historiográfica, estableciendo el punto de partida sólido desde el cual se construye toda investigación histórica digital rigurosa.

En este capítulo presentamos el primer paso (Punto de Partida) de la metodología propuesta para la investigación histórica digital. El Punto de Partida es la base sobre la cual se construye el proceso de investigación histórica de nuestra metodología y requiere que el investigador revise y conozca las investigaciones, debates académicos y las interpretaciones relacionadas al tema de la investigación. Al finalizar este paso el investigador tendrá una visión más amplia del contexto historiográfico de su investigación. El completar este paso es esencial para asegurar que la investigación esté bien estructurada y dirigida hacia objetivos claros y alcanzables que permitan formular las preguntas que guiarán su búsqueda y definirán los parámetros de su investigación.

Como proceso sistemático la investigación histórica comienza con la identificación y lectura de la historiografía existente. Antes de formular cualquier pregunta de investigación, el historiador está obligado a conocer las investigaciones, trabajos y estudios que han abordado su tema de interés o áreas relacionadas. La lectura y análisis de estos trabajos proporciona el contexto necesario para formular las preguntas de la investigación: ¿Quién?, ¿Qué?, ¿Cuándo?, ¿Dónde?, ¿Cómo? Y ¿Por qué?

El Punto de Partida es de suma importancia en la investigación histórica digital debido a tres factores fundamentales. Primero, la proliferación exponencial de fuentes digitalizadas ha creado lo que algunos académicos denominan "sobrecarga informativa", donde la abundancia de material puede paralizar al investigador o conducirlo por caminos improductivos. Segundo, la naturaleza interconectada de los recursos digitales permite descubrir relaciones y patrones que eran invisibles en la investigación tradicional, pero solo si el investigador cuenta con una base conceptualsólidaparainterpretarlos. Tercero,las herramientas digitales ylainteligenciaartificial requieren que el investigador formule sus preguntas con mayor precisión técnica, ya que la calidad de los resultados depende directamente de la claridad de los parámetros de búsqueda.

Los portales digitales de bibliotecas, archivos y hemerotecas han expandido exponencialmente el universo de trabajos accesibles para el investigador. Existen catálogos en línea, repositorios institucionales, bases de datos académicas y colecciones digitalizadas que nos brindan una cantidad sin precedentes de fuentes secundarias y primarias sobre cualquier tema y que pueden accederse desde cualquier lugar del mundo. Sin embargo, la gran cantidad y el fácil acceso a través de la red de recursos de referencia presenta al investigador dos desafíos: 1) Cómo establecer límites claros y criterios específicos para la búsqueda bibliográfica, 2) Cómo analizar y organizar la información que encuentra. Desde un principio se tiene que desarrollar una estrategia que permita mantener el enfoque en su tema principal, evitando que se pierda en el vasto océano de información disponible en línea. Esto implica establecer parámetros precisos para la búsqueda y para delimitar períodos históricos específicos, identificar conceptos clave,

seleccionar áreas relevantes y determinar el tipo de fuentes más pertinentes para su investigación.

Es importante reconocer que la investigación digital, aunque poderosa, presenta sus propios sesgos y limitaciones metodológicas que el investigador debe considerar constantemente. Los algoritmos de búsqueda dan prioridad a ciertos tipos de contenido y pueden crear burbujas en los filtros de búsqueda. Por ejemplo, cuando Google detecta que un investigador frecuentemente selecciona documentos de ciertos archivos o sobre temas específicos, el algoritmo comienza a mostrar más resultados similares en las primeras páginas, mientras que otras fuentes potencialmente valiosas quedan relegadas a páginas posteriores que raramente se consultan. Estas burbujas muestran constantemente información que refuerza sus búsquedas iniciales, y típicamente excluyen otras alternativas o fuentes menos visibles digitalmente. Por otro lado, el proceso de digitalización no es neutral. Las decisiones sobre qué digitalizar, con qué calidad, y cómo catalogar los materiales reflejan prioridades institucionales, recursos económicos disponibles, y prejuicios conscientes o inconscientes sobre qué merece preservación digital.

En el contexto puertorriqueño, por ejemplo, existe una sobrerrepresentación de documentos oficiales y gubernamentales archivados y digitalizados. Esto es un reflejo de la realidad, pues las organizaciones comunitarias, los movimientos de base y las voces marginadas, debido a su clandestinidad o a la falta de difusión y recursos, han enfrentado mayores obstáculos para preservar sus archivos de una forma que permita su posterior digitalización. Además, la dependencia excesivaen búsquedas por palabras clave puede hacer que el investigador pase por alto documentos relevantes que usan terminología diferente o que están mal catalogados. Por tanto, el investigador debe complementar las búsquedas digitales con visitas a archivos físicos, diversificar las plataformas y bases de datos consultadas, y mantener una actitud crítica sobre las ausencias y silencios en el registro digital, preguntándose constantemente: ¿qué voces no están representadas en estos resultados? ¿qué perspectivas faltan? ¿qué documentos permanecen inaccesibles digitalmente? ¿qué otras palabras o frases puedo utilizar?

En el proceso de revisión y análisis de material extenso, las herramientas de inteligencia artificial como NotebookLM (https://notebooklm.google/), Claude (https://claude.ai/), ChatGPT (https://chatgpt.com/) y Gemini (https://gemini.google.com/), se han convertido en asistentes valiosos para el investigador. Por ejemplo, un investigador que estudie el movimiento obrero puertorriqueño puede cargar en NotebookLM múltiples documentos digitalizados, artículos académicos, capítulos de libros, transcripciones de periódicos, y la herramienta generará automáticamente un índice temático, identificará conceptos clave recurrentes como "huelga tabaquera", "mutualismo" o "Federación Libre de Trabajadores", y creará conexiones entre documentos que mencionan los mismos eventos o personas.

Sin embargo, es crucial entender que estas herramientas son auxiliares en el proceso de investigación y no sustituyen el análisis crítico del investigador. El historiador debe siempre verificar la información generada, contrastar las interpretaciones sugeridas con las fuentes originales, y mantener una postura crítica ante las síntesis producidas por la IA.

Estas herramientas pueden ayudar a identificar patrones, temas recurrentes y conexiones entre diferentes textos, así como generar resúmenes preliminares que facilitan la organización inicial del material. Sin embargo, es crucial entender que estas herramientas son auxiliares en el proceso de investigación y no sustituyen el análisis crítico del investigador.

Una vez establecida la base bibliográfica y comprendido el panorama historiográfico existente, el investigador debe articular su investigación a través de seis preguntas fundamentales que han guiado el trabajo histórico desde sus orígenes: ¿Quiénes?, ¿Qué?, ¿Cuándo?, ¿Dónde?, ¿Cómo? Y ¿Por Qué? Estas preguntas, aunque tradicionales en su formulación, adquieren nuevas dimensiones y posibilidades en el contexto de la investigación histórica digital. La abundancia de fuentes digitalizadas y las herramientas tecnológicas disponibles no solo facilitan la búsqueda de respuestas, sinoquepermiten formular estas preguntas con mayor complejidadyprofundidad. Cada pregunta abre múltiples vías de investigación que se entrelazan y complementan, creando una red de conocimiento más rica y matizada que la que era posible construir con métodos

exclusivamente tradicionales. A continuación, exploraremos cómo cada una de estas preguntas fundamentales se transforma y potencia mediante las herramientas y recursos digitales, comenzando con la pregunta del "¿Quién?", la identificación y análisis de los actores históricos.

¿Quién?

La revisión bibliográfica debe ser sistemática y crítica, abarcando diferentes tipos de fuentes, monografías, artículos académicos, tesis doctorales, documentos de archivo previamente analizados, y otros recursos relevantes. Esta fase inicial de lectura e investigación permite al historiador comprender no solo qué se ha investigado sobre su tema de investigación, sino también los debates historiográficos existentes, y las interpretaciones que han predominado en diferentes momentos14

En la era digital, esta revisión bibliográfica se ha enriquecido enormemente gracias a los portales de bibliotecas digitales y portales académicos que se describen detalladamente en el capítulo "Seguir Las Pistas". Estas plataformas digitales, cuyas características y contenidos específicos se exploran en dicho capítulo, han transformado el acceso a vastas colecciones de libros digitalizados, permitiendo a los investigadores consultar textos históricos que anteriormente requerían visitas presenciales a múltiples instituciones. La capacidad de realizar búsquedas de texto completo dentro de los documentos ha revolucionado la forma en que identificamos menciones específicas de personas, lugares o eventos relevantes para nuestra investigación.

Complementando estas bibliotecas digitales, los portales académicos de artículos y ensayos constituyen una fuente indispensable para comprender el estado actual del conocimiento en cualquier campo histórico. Estos recursos permiten no solo acceder a investigaciones recientes sino también rastrear la evolución de los debates historiográficos a través del tiempo. Para la investigación en español y sobre América Latina y el Caribe, existen portales especializados que proporcionan acceso abierto a miles de artículos producidos en la región, muchos de los cuales

14 Nota del Autor. El trabajo de María de los Ángeles Castro, María Dolores Luque de Sánchez y Gervasio Luis García, Los primeros pasos una bibliografía para empezar a investigar la historia de Puerto Rico, a pesar de que fue publicado hace 40 años en un punto de partida para conocer los fundamentos teóricos e historiográficos.

no están disponibles en las bases de datos anglófonas tradicionales. Entre estos portales se encuentran Red de Revistas Científicas de América Latina y el Caribe, España y Portugal (REDALYC) https://www.redalyc.org/, Scientific Electronic Library Online (ScieELO) https://www.scielo.org/, Biblioteca Virtual Miguel de Cervantes ( https://www.cervantesvirtual.com/), Dialnet (https://dialnet.unirioja.es/), etc.

Es a partir de esta base sólida de conocimiento que el investigador puede entonces proceder a formularse lapregunta del "quién". Enla investigaciónhistórica, estapreguntaadquiere múltiples dimensiones que van más allá de la mera identificación de nombres. El investigador debe considerar no solo a los individuos centrales de su investigación, sino también a los grupos, organizaciones e instituciones que formaron parte del contexto de la persona y de la época bajo estudio.

Por ejemplo, al investigar el movimiento independentista puertorriqueño a finales del siglo XIX, el "quién" no se limita a figuras prominentes como Ramón Emeterio Betances. La revisión de la literatura existente revelará una red compleja de actores que incluye al liderazgo puertorriqueño en Nueva York como Julio Henna, Juan de Mata Terreforte, y Sotero Figueroa. También abarca organizaciones como la sección de Puerto Rico del Partido Revolucionario Cubano, periódicos como Patria, La Doctrina de Martí, y Gaceta del Pueblo. La comprensión de estos actores y sus interrelaciones solo es posible mediante la lectura de las investigaciones que han analizado sus roles y contribuciones.

Las memorias y autobiografías de figuras aparentemente secundarias ofrecen perspectivas invaluables sobre las redes de actores históricos. Un ejemplo de esto en la historia puertorriqueña lo constituyen las Memorias de Bernardo Vega, publicadas póstumamente en 1977 15 Vega, un tabaquero puertorriqueño que emigró a Nueva York en 1916, documenta en sus memorias no solamente sus interacciones con figuras prominentes del movimiento obrero y político, sino que proporciona un retrato detallado de la vida cotidiana de la comunidad

15 Cesar Andreu Iglesias. Memorias de Bernardo Vega. Ediciones Huracán. 1977.

puertorriqueña en la ciudad de Nueva York. Recientemente el Centro de Investigaciones Históricas de la Universidad de Puerto Rico dio a conocer el manuscrito original de las memorias el cual es muy diferente al texto publicado en 1977 16

El extenso documento original revela una compleja red de relaciones que incluía trabajadores anónimos de las fábricas de tabaco, dueños de pequeños negocios en El Barrio, activistas comunitarios que organizaban reuniones en apartamentos privados, y conexiones transnacionales con movimientos socialistas y anarquistas. Vega describe encuentros con figuras como Jesús Colón, Arturo Alfonso Schomburg, Sotero Figueroa, Antonio Vélez Alvarado, Pachín Marín, pero más significativamente, documenta las vidas de cientos de puertorriqueños cuyos nombres no aparecen en las historias oficiales pero que formaron el tejido social esencial del movimiento político puertorriqueño en Nueva York.

La investigación digital permite ahora rastrear muchas de estas figuras secundarias mencionadas por Vega a través de censos, directorios urbanos digitalizados, y registros de inmigración. Por ejemplo, los nombres de tabaqueros que Vega menciona casualmente pueden ser localizados en los manifiestos de barcos disponibles en Ellis Island Records, revelando patrones migratorios y redes familiares que enriquecen nuestra comprensión del movimiento obrero puertorriqueño transnacional.

La búsqueda digital de actores históricos debe considerar las múltiples formas en que los nombres y las identidades pueden aparecer en los documentos históricos. Un mismo individuo pude aparecer con diferentes grafías, sobrenombres, títulos o denominaciones según el contexto y la fuente. Tomemos como ejemplo a Ramón Emeterio Betances. Si fuéramos a buscar en Google quién era, podríamos encontrarlo por su nombre completo, o por “Emeterio Betances” o simplemente por Betances. Cada búsqueda resultaría en un número distinto de resultados: 16 OP.Cit. Numero 25, 2018. https://revistas.upr.edu/index.php/opcit/issue/view/2489

Tabla 1

Comparación de resultados de búsqueda para diferentes términos de 'Ramón Emeterio Betances

Una mayor cantidad de resultados no implica una mejor búsqueda. Todo lo contrario, en el ejemplo, el uso del nombre completo nos permite refinar los resultados a la persona que estamos buscando mientras que el termino con mayor cantidad de resultados incluye un gran número de enlaces que no tienen nada que ver con las personas que investigamos.

Es importante establecer que la familiaridad con las variaciones en los nombres se obtiene a través de la revisión bibliográfica y no necesariamente con la búsqueda en la internet. La integración de la revisión bibliográfica tradicional con las herramientas digitales modernas permite al historiador desarrollar una comprensión más completa y matizada de los actores históricos y sus contextos.

La investigación digital permite rastrear las redes completas de activistas, simpatizantes, opositores y observadores neutrales que formaron parte del movimiento. Con el uso de la inteligencia artificial, de la cual hablaremos más adelante, facilita la identificación de conexiones entre estos actores que podrían no ser evidentes en una lectura de las fuentes tradicionales. En la siguiente imagen podemos observar como con la ayuda de la IA y el visualizador Napkin.ai se preparó un listado de temas básicos sobre la figura de Ramon Emeterio Betances.

17 Búsqueda llevada a cabo el 30 de octubre de 2024.

18 Búsqueda llevada a cabo el 30 de octubre de 2024.

¿Qué?

La definición del objeto de estudio en la investigación digital requiere una precisión particular19

En la mayoría de los portales digitales el "qué" de la investigación histórica debe ser lo suficientemente específico para permitir búsquedas efectivas en bases de datos, pero también lo suficientemente amplio para capturar la complejidad del tema estudiado. Esta definición influye directamente en la selección de palabras clave y estrategias de búsqueda.

Cuando un investigador estudia, por ejemplo, la industria azucarera en Puerto Rico durante el siglo XIX, el "qué" incluye no solo la producción de azúcar como actividad económica, sino también las tecnologías empleadas, las relaciones laborales, los sistemas de comercio, y los impactos sociales y ambientales. Cada uno de estos aspectos requiere estrategias de búsqueda específicas en los archivos digitales.

19 Nota del Autor: Con el uso de la inteligencia artificial esta precisión puede quedar obsoleta. Los modelos de lenguaje avanzados como ChatGPT, Claude, o Gemini están revolucionando la forma en que interactuamos con la información histórica. A diferencia de los motores de búsqueda tradicionales que requieren palabras clave exactas y operadores booleanos precisos (AND, OR, NOT), la IA permite formular preguntas en lenguaje natural y conversacional. Un investigador puede ahora escribir "¿Qué pasaba en Mayagüez durante los años cuando Betances estaba en París?" en lugar de construir complejas cadenas de búsqueda. Más significativo aún, estas herramientas pueden interpretar contexto, inferir conexiones implícitas, y sugerir líneas de investigación relacionadas que el investigador no había considerado. La IA puede entender sinónimos, variaciones ortográficas históricas, y referencias contextuales, eliminando la necesidad de anticipar todas las posibles variaciones terminológicas. Sin embargo, esta aparente simplicidad introduce nuevos desafíos, como la necesidad de formular "prompts" efectivos, la verificación de las respuestas generadas, y mitigar los sesgos inherentes en los datos de entrenamiento de estos modelos. La precisión tradicional en la definición del objeto de estudio no desaparece, sino que se transforma en la habilidad de dialogar efectivamente con sistemas de IA y evaluar críticamente sus respuestas.

Ilustración 10-Diagrama conceptual que ilustra a Ramón Emeterio Betances

Continuemos con el ejemplo anterior. La investigación digital sobre Ramón Emeterio Betances requiere una estructuración cuidadosa del "qué" investigado que permita capturar la complejidad de esta figura histórica. Como se muestra en la ilustración, la figura de Ramon

Emeterio Betances abarca múltiples dimensiones: 1) Datos Personales, 2) Activismo Político, 3) Medicina, 4) Relaciones y Contactos, 5) Contexto Histórico. Para una búsqueda efectiva en archivos digitales, es necesario desarrollar estrategias específicas para cada aspecto de su vida.

La definición precisa del "qué" en la investigación histórica digital requiere desarrollar taxonomías temáticas que capturen con amplitud el objeto de estudio. Su construcción requiere una comprensión profunda tanto del tema investigado (que se obtiene con la revisión bibliográfica) como de las lógicas de organización de la información en los sistemas digitales. Es fundamental conocer que la construcción de la taxonomía va de lo general a lo especifico. Esta estructura jerárquica facilita tanto la búsqueda exploratoria inicial como la investigación detallada posterior. Por ejemplo, al investigar los movimientos sociales en Puerto Rico, el investigador puede comenzar con esta categoría general como punto de partida. Luego podría seguir con el siguiente nivel jerárquico:

1. Movimiento obrero puertorriqueño

a. Federación Libre de los Trabajadores i. Huelgas cañeras 1930’s

Esta progresión desde lo general hacia lo especifico permite al investigador mantener una visión contextual amplia mientras profundiza en los detalles específicos de su investigación.

El desarrollo de vocabularios controlados constituye otro elemento esencial en la construcción de términos efectivos. Estos vocabularios deben incluir no solo los términos principales relacionados con el tema, sino también todas las variaciones, sinónimos y términos relacionados que puedan aparecer en las fuentes históricas. Tomemos como ejemplo la investigación sobre la esclavitud en Puerto Rico. Los términos principales incluirían naturalmente palabras como esclavitud, esclavos, esclavas y el término más contemporáneo de esclavizados que reconoce la potestad y humanidad de estas personas. Sin embargo, una búsqueda comprehensiva debe también incorporar los términos legales históricos que aparecen en los documentos de época, tales como libertos para referirse a los esclavos manumitidos, coartación para el proceso de

compra gradual de la libertad, manumisión para el acto de liberación, y referencias al código negro que regulaba la institución esclavista.

Adicionalmente, el vocabulario debe incluir términos económicos como dotación para referirse al conjunto de esclavos de una hacienda y las distinciones entre bozales (esclavos recién llegados de África), y ladinos aquellos ya aculturados). Finalmente, no pueden ignorarse los términos relacionados con la libertad como, cimarrón (esclavo fugado), palenques (asentamientos de cimarrones), y alzamientos (rebeliones organizadas).

La consideración de los contextos semánticos añade una capa adicional de complejidad a la construcción de taxonomías temáticas. El investigador debe estar consciente de que el significado de los términos puede variar significativamente según el período histórico, el contexto geográfico, y el tipo de fuente consultada. Un ejemplo particularmente ilustrativo es la evolución del término "americano" en los documentos puertorriqueños. Durante el siglo XIX, antes de 1898, este término se utilizaba frecuentemente para referirse a cualquier persona originaria del continente americano, incluyendo a los propios puertorriqueños, cubanos, mexicanos o argentinos. Sin embargo, después de 1898 y la invasión estadounidense, el término adquiere un significado mucho más específico, refiriéndose casi exclusivamente a los ciudadanos de Estados Unidos. Esta transformación semántica no es trivial; puede llevar a interpretaciones erróneas si el investigador no está atento al contexto temporal del documento que examina.

Es aquí donde la Inteligencia Artificial, en especial el portal NotebookLM, nos permite representar gráfica y dinámicamente el concepto de la taxonomía y las palabras clave. Este sistema (Artefacto) permite que subas (“upload”) una serie de documentos (libros, ensayos, etc.) en PDF para ser analizados y crear un mapa mental que identifica los temas principales y los muestra como nodos centrales.

Según el sistema Gemini el concepto de mapa mental de NotebookLM es el siguiente:

“Generación automática- La herramienta analiza tus documentos (PDFs, notas, transcripciones) y crea el mapa por sí sola. Identifica los temas principales y los muestra como nodos centrales.

Interactividad- Los nodos no son simples etiquetas. Puedes hacer clic en ellos para que que NotebookLM te responda preguntas, resuma información o te muestre las citas exactas de los documentos donde se encuentra ese concepto.

Conectividad- Lo más valioso es que el mapa visualiza las conexiones entre temas de diferentes documentos. Esto te permite ver la "imagen completa" de tu investigación y descubrir relaciones que quizás no habías notado.

Diferencia de un mapa mental tradicional- Mientras que un mapa mental clásico es una herramienta que tú usas para organizar tus pensamientos, el mapa mental de NotebookLM es una herramienta que analiza y organiza tus documentos para ti, sirviendo como una interfaz para interactuar directamente con tu investigación.”20

En este momento no existe manera más efectiva de organizar la taxonomía y palabras clave que el uso de NotebookLM. Tomando como ejemplo a Ramon Emeterio Betances y el libro de Félix

Ojeda Ríos, El Desterrado de Paris el sistema preparó el mapa mental que se puede apreciar en la siguiente página21 . Lo que produce el sistema no es un simple diagrama, sino que en cada termino el investigador puede interactuar con el documento.

20 Consulta a Gemini con el concepto “¿Cuál es la definición de mapa mental en el contexto de NotebookLM ?”

21 Félix Ojeda Ríos. El Desterrado de París. Biografía del Doctor Ramón Emeterio Betances (1827-1898). Ediciones Puerto. 2006. Solamente incluimos el nivel general ya que por cuestión de espacio no se puede mostrar en su totalidad.

Ilustración 11- Primer nivel del Mapa Mental (creado con NotebookLM) sobre el libro El Desterrado de Paris Cada flecha expande a temas y subtemas

¿Cuándo?

La pregunta del "cuándo" en la investigación digital va más allá de la simple identificación de una fecha. En un archivo digital el investigador podrá acceder a una gran cantidad de información relacionada a un evento más allá del momento donde ocurrió. Existe una relación directa entre la fecha en que ocurre el evento. Por ejemplo, El grito de Lares ocurrió el 23 de septiembre de 1868 pero una búsqueda del término grito de lares o insurrección de lares nos ofrecerá información detallada de lo que ocurrió el día del evento.

Parapoderentender qué ocurrióel investigador tiene que considerar no soloel período específico de estudio, sino también los antecedentes y las consecuencias. Con la inteligencia artificial se puede desarrollar una cronología y la identificación de patrones y conexiones en el tiempo que no son evidentes cuando se maneja la documentación física.

El poder ordenar los documentos digitales cronológicamente es una de las ventajas de la investigación digital. El historiador puede acceder el catálogo y evaluar cronológicamente no solo documentos escritos, sino también fotografías, grabaciones de audio, videos, y estadísticas permitiendo una visión más amplia. Las herramientas digitales permiten visualizar relaciones cronológicas entre eventos, personas y lugares que podrían pasar desapercibidas en la lectura lineal o individual de los documentos físicos.

Las hemerotecas digitales son una de las herramientas más versátiles para poder contestar la pregunta cuándo. Estos portales permiten buscar y ordenar los resultados por la relevancia del tema, por la fecha, por lugar, o por el nombre del periódico.

Por ejemplo, si el investigador está interesado en un evento como la creación de la bandera de Puerto Rico, la combinación de preguntas sobre "quiénes" estuvieron involucrados, "qué" elementos formaron parte del proceso y "cuándo" ocurrieron ciertos hechos clave, ayuda a construir una cronología más completa. Al explorar los términos de búsqueda y aplicar filtros en los portales, se pueden identificar patrones, colaboraciones y contextos que son esenciales para comprender el significado histórico del evento.

A continuación, mostramos un ejemplo de cómo aplicamos el concepto del ¿Cuándo? a la bandera de Puerto Rico. En este ejemplo integramos las preguntas de ¿Quién? y ¿Qué? Y ¿Cuándo?:

Tabla 2

Términos de búsqueda y conceptos clave sobre la bandera de Puerto Rico

Pregunta Términos de búsqueda

Relación con los hechos ¿Quién? Antonio Vélez Alvarado, Francisco Gonzalo Marín, Juan de Mata Terreforte, Julio Henna, Roberto H. Todd, Manuel Besosa, Micaela Dalmau, Mima Besosa, Narciso López.

¿Qué? Bandera de Puerto Rico, Pabellón de Puerto Rico, Monoestrellada, Bandera de Cuba

Estos individuos están relacionados con la creación, diseño o de la bandera de Puerto Rico.

¿Cuándo? 1893, 1895, 1890-1900

Nos referimos al objeto de estudio específico que es la bandera puertorriqueña, sus variaciones en nomenclatura y su relación con otros símbolos nacionales como la bandera cubana, que sirvió de inspiración para su diseño

Estas fechas abarcan el período de creación y primeros usos de la bandera y proporcionan el contexto temporal para entender el momento histórico de su surgimiento.

La dimensión temporal en la investigación histórica digital va más allá de la simple organización cronológica de eventos. Las herramientas digitales contemporáneas permiten al investigador llevar a cabo análisis temporales sofisticados que revelan patrones, tendencias y dinámicas que permanecían ocultas en los métodos tradicionales de investigación.

Por ejemplo, el análisis de frecuencias temporales representa una innovación muy poderosa en la investigación digital. Una herramienta muy poco conocida llamada Google Ngram Viewer (https://books.google.com/ngrams/) permite rastrear con precisión matemática la evolución en

el uso de términos específicos a lo largo de extensos períodos temporales. Esta capacidad permite observar no solo cuándo aparecen o desaparecen ciertos conceptos del discurso público, sino también cómo fluctúa su relevancia en diferentes momentos históricos.

Por ejemplo, si tomamos el término “Grito de Lares” encontramos al analizar la frecuencia de aparición de esta expresión entre 1900 y 2020 que el evento histórico ha experimentado períodos de mayor y menor prominencia en el discurso público. La visualización muestra un incremento notable en las menciones a partir de la década de 1960, alcanzando picos significativos que coinciden con momentos de reafirmación de la identidad nacional puertorriqueña y debates sobre el estatus político de la isla. Este análisis cuantitativo complementa las interpretaciones cualitativas tradicionales, proporcionando evidencia empírica sobre cómo los símbolos históricos adquieren renovada relevancia en diferentes momentos.

Ilustración 12- Representación de frecuencia termino Grito de Lares (Google Ngram Viewer) Las líneas en la grafico nos muestran la frecuencia del mismo termino en mayúscula o minúscula

El sistema Ngram Viewer permite la comparación de términos en el mismo espacio temporal. Por ejemplo, la siguiente grafica muestra las menciones de Pedro Albizu Campos, Antonio R. Barceló y Luis Muñoz Marín en el periodo 1930-2022.

Ilustración 13- Representación de frecuencia de los términos Albizu Campos, Muñoz Marín, Antonio R. Barceló (Google Ngram Viewer). las líneas en la grafico nos muestran la frecuencia del mismo termino en mayúscula o minúscula

El sistema posee muchas limitaciones. La principal es que los datos provienen exclusivamente de los libros digitalizados por Google Books. Esto es una gran limitación ya que no es una muestra representativa de todo el material escrito en la historia. Además, el sistema no incluye otros tipos de materiales históricos como periódicos, revistas, cartas, diarios personales, documentos gubernamentales o manuscritos. Sin embargo, no deja de ser una manera distinta para poder visualizar términos que podrán mostrar patrones y tendencias que luego deben ser confirmados con una investigación más rigurosa.

¿Dónde?

Todo evento histórico está enmarcado en el lugar donde ocurre. Algunos archivos digitales contienen mapas históricos, fotografías aéreas y documentos cartográficos, que nos permiten rastrear cómo los espacios geográficos han cambiado a lo largo del tiempo, ya sea por

fenómenos naturales, desarrollo urbano o cambios políticos. En el contexto puertorriqueño, la investigación del espacio geográfico debe considerar las transformaciones administrativas y territoriales que han ocurrido a lo largo del tiempo. Por ejemplo, al investigar la historia de San Germán, es necesario considerar que la ciudad cambió de ubicación y extensión varias veces durante el período colonial.

La toponimia, o el estudio de los nombres de los lugares, es vital en la investigación histórica al permitir localizar sitios y conectar eventos con lugares específicos. Los nombres de lugares reflejan procesos históricos, personajes importantes, o características culturales de una época determinada. Una de las mayores ventajas de utilizar la toponimia en la investigación histórica digital es la capacidad de explorar cómo los nombres de los lugares han cambiado a lo largo del tiempo y cómo estos cambios afectan la comprensión de los eventos. En Puerto Rico, por ejemplo, algunos nombres de lugares han sido adaptados tanto al inglés como al español, lo que complica la búsqueda si no se consideran las diferentes versiones históricas de un mismo topónimo. El conocimiento de estos cambios es esencial para localizar información en archivos antiguos o digitales, ya que un nombre que existió en el siglo XIX puede haber sido modificado en el siglo XX, dificultando su búsqueda si no se tiene en cuenta la evolución del término. La localización de lugares utilizando los topónimos en la cartografía es histórica en muchos casos es evidente. En 1993, como parte de la extensión del Expreso de Diego, se encontró uno de los yacimientos indígenas más importantes de Puerto Rico y el Caribe. El yacimiento conocido como Paso del Indio se encontraba a la orilla oeste del “Rio Indio”.22 En el lugar se encontraron 149 restos humanos asociados a las culturas Arcaicos o Preceramistas (3350 a.C. al 400 d.C.), Igneri o Saladoides (400 al 600 d.C.), Ostionoides (600 al 1200 d.C) y Taínos (1200 al 1500 d.C.). En este caso, tanto los cuadrángulos topográficos como los mapas históricos documentaban consistentemente el topónimo 'Río Indio', un nombre que hablaba por sí mismo sobre la presencia indígena en el área. La cartografía histórica, a través de este topónimo revelador, había

22 Edwin Crespo. Estudio comparativo biocultural entre dos poblaciones prehistóricas en la isla de Puerto Rico: Punta Candelero y Paso del Indio. Tesis Doctoral. Universidad Nacional Autónoma de México. Facultad de Filosofía y Letras, 2000. P. 2.

preservado durante siglos la memoria del lugar donde eventualmente se descubriría el yacimiento arqueológico más importante del Caribe.

Cuadrángulo Topográfico Manatí, 1946. Recuperado de https://ngmdb.usgs.gov/topoview/viewer/#15/18.4320/66.3862

Cuadrángulo Topográfico Manatí, 1969. Recuperado de https://ngmdb.usgs.gov/topoview/viewer/#15/18.4336/66.3836

Ilustración 14-Cuadrangulos Topográficos mostrando el Rio Indio (USGS)

La cartografía histórica es una de las principales fuentes para la investigación del ¿Dónde?. La mayor cantidad de mapas y planos históricos de Puerto Rico surgen a partir del siglo XIX. En el portal del Archivo Digital de Puerto Rico (archivonacional.com) existe una gran colección de mapas y planos procedentes de la Mapoteca del Archivo General de Puerto Rico, de los distintos archivos españoles y del Servicios Geológico de los Estados Unidos.

Enel contexto digitalla investigaciónbasadaen los topónimos presenta varios retos relacionados con el Reconocimiento Óptico de Caracteres (OCR). (Para una explicación detallada de qué es el OCR, sus capacidades y limitaciones, ver sección "Errores del OCR" en el Capítulo III). El OCR frecuentemente comete errores al interpretar nombres de lugares en otros idiomas o con ortografías antiguas, lo cual puede hacer que documentos relevantes no aparezcan en las búsquedas si no se anticipan estos errores.

Para superar este problema, requiere que los investigadores usen en sus búsquedas las variaciones lingüísticas y ortográficas de los nombres de los lugares a través del tiempo. La investigación histórica no debe limitarse a los archivos tradicionales, sino que debe aprovechar el poder de los archivos digitales, las hemerotecas y las bases de datos modernas, donde la toponimia se convierte en una llave que abre puertas a una comprensión más profunda del pasado.

La integración de los Sistemas de Información Geográfica en la investigación histórica nos asiste en el análisis y comprensión de las dimensiones espaciales del pasado. Estos sistemas, conocidos como “GIS”, por sus siglas en inglés, cuando se aplican específicamente a la investigación histórica, permiten al investigador no solo visualizar información geográfica histórica, sino también realizar análisis espaciales que revelan patrones, relaciones y dinámicas que permanecían invisibles con los métodos cartográficos tradicionales. Esto abre una relación entre la tecnología geoespacial moderna y las fuentes históricas para comprender mejor el pasado.

La georreferenciación de mapas y planos históricos a mapas digitales asiste al investigador a conocer el contexto actual del lugares o sitios históricos. Mediante el uso de plataformas especializadas como ArcGIS (pago), QGIS (gratuita) o Mapwarper (https://mapwarper.net/), los investigadores pueden tomar mapas históricos y superponerlos con precisión sobre la cartografía moderna, creando capas temporales que permiten observar la evolución de los espacios a través del tiempo. Este proceso requiere identificar puntos de control comunes entre el mapa histórico y el moderno, ajustar las proyecciones cartográficas, y corregir las distorsiones inherentes a los mapas antiguos.

Un ejemplo particularmente ilustrativo de esta técnica lo encontramos en el plano histórico San Juan y Cercanía de Juan de Villalonga y Firmado por Tomás O’Daly en 1776. Esta obra cartográfica es de excepcional detalle y documentó la organización territorial y las fortificaciones y su contexto más allá de la bahía. Utilizando el sistema Mapwarper georreferenciamos este mapa histórico el cual se encuentra para consulta en:

https://mapwarper.net/maps/78460#Preview_Rectified_Map_tab .

Ilustración 15- Mapa de la plaza de Puerto Rico hecho por el ingeniero Thomas O'Daly

Al consultar este mapa de manera digital los investigadores pueden analizar con precisión los cambios en el trazado urbano, las defensas militares y la configuración territorial de la capital y sus alrededores durante más de dos siglos. Esta superposición revela, por ejemplo, cómo las antiguas fortificaciones que dominaban estratégicamente los accesos marítimos a la bahía han sido integradas en el desarrollo urbano moderno, mientras que extensas áreas que en 1776 eran

terrenos baldíos, haciendas o pequeños asentamientos experimentaron una intensa urbanización con la llegada del siglo XX. El análisis comparativo muestra también cómo la línea costera original, claramente definida en el plano de O’Daly, ha sido modificada por rellenos y obras portuarias que transformaron radicalmente la relación entre la ciudad y el mar. El mapa georreferenciado permite a arqueólogos, urbanistas e historiadores estudiar con precisión la evolución de esta región capitalina, desde su configuración como plaza fuerte española hasta su transformación en área metropolitana moderna 23

Para usar el sistema de mapwarper se requiere noción básica de geografía y un poco de sentido orientación geoespacial. Además, requiere que el plano o mapa a ser utilizado contenga elementos geográficos distinguibles, y una escala aceptable que permita su correlación. Por ejemplo, el mapa antes descrito solo poseía cuatros (4) puntos geográficos conocidos y de estos puntos el sistema logro la triangulación y georeferenciación.

El análisis espacial de eventos históricos mediante la creación de mapas temáticos permite al investigador visualizar y analizar patrones espaciales complejos que serían imposibles de detectar mediante el estudio aislado de fuentes textuales. Esta capacidad analítica se vuelve particularmente poderosa cuando se combinan múltiples capas de información geográfica para examinar la interrelación entre diferentes fenómenos históricos. Por ejemplo, le solicité a la inteligencia artificial Claude.ai que analizara una lista de las personas identificadas por José Laureano Sanz como implicados en el Grito de Lares.24 La tabla tenía el siguiente formato y un total de 545 entradas y fue transcrita de un expediente del Archivo Histórico Nacional25:

23 Desde Mapwarper el mapa puede ser exportado a Google Earth para sobreponerlo en fotografías aéreas actuales.

24 La instrucción a Calude.ai fue “Necesito un dashboard que muestre la localización (Natural) de los rebeldes del Grito de Lares. Tomando en consideración la tabla adjunta. La columna natural es el municipio de origen. Necesito que lo hagas y que lo muestres con un mapa de fondos opentreet o una imagen satelital de fondo. Tienes que hacerlo en formato de html.”

25 Archivo Histórico Nacional, Ultramar. 5111, Exp. 34, Doc.1 Estado demostrativo de los procesados comprendidos en la causa formada con motivo de la rebelión de Lares. Naturaleza, Vecindad, y profesión de aquéllos; y cargos que les resultan.

Tabla 3

Extracto de lista de implicados en el Grito de Lares

1 Agustín Rodríguez Yauco Adjuntas Papelista Se le cita por varios careos y un perjudicado como uno de los cabecillas de la rebelión Niega

2 Eusebio Ortiz Añasco Mayagüez Jornalero

Consta formo parte de los rebeldes como mero ejecutor

3 Bernardino del Rosario Mayagüez Mayagüez Jornalero Consta tomó parte en la rebelión como mero ejecutor

4 Pedro Pablo González Pepino Adjuntas Propietario Se halla probado que ocurrió a varios jornaleros de su barrio a fin de que se unieran a los rebeldes.

5 Salvador Muñiz Utuado Adjuntas Comisionado como cobrador de varias casas de comercio

6 José Dolores Álvarez Añasco Lares Jornalero

Confiesa

Se le cita por algunos testigos de haber avisado a varios jornaleros para que se dirigieran a Lares y se unieran a los rebeldes. Niega

Aparece tomó parte en la rebelión como soldado o sea de la gente de á pie.

7 Mónico de la Cruz é Echevarría Adjuntas Adjuntas Jornalero Se pensó haber formado parte de los rebeldes si bien se desvanecieron las sospechas.

8 Pantaleón Conti Aguadilla Adjuntas Jornalero Resulta tomó parte en la rebelión como mero ejecutor.

Confiesa el hecho

Negó

Confesó en un principio y después se obstino en negar

El resultado del sistema Claude.ai fue el tablero que se muestra a continuación:

https://claude.ai/public/artifacts/9a31d709-8e5c-45a5-b508-89fb0146c19d

Ilustración 16- Tablero de distribución geográfica de los rebeldes del Grito de Lares

Este tipo de visualización espacial nos permite no solo identificar dónde ocurrieron los eventos históricos, sino que también nos abre la puerta para comprender cómo se desarrollaron. Si se desarrolla la instrucción al sistema Claude, el mapa temático del Grito de Lares podría incluir patrones de movilización, redes de comunicación entre los pueblos, y las dinámicas geográficas que influyeron en el desarrollo de la insurrección. La distribución espacial de los participantes según su lugar de origen y vecindad nos sugiere rutas de reclutamiento, centros de organización y la extensión territorial del movimiento revolucionario. Es precisamente esta capacidad de los sistemas digitales para conectar el espacio con el proceso lo que nos lleva a explorar la siguiente dimensión fundamental de la investigación histórica, el cómo.

¿Cómo?

En la investigación histórica tradicional, la pregunta del "cómo" busca explicar los procesos, las motivaciones y las dinámicas que ocurrieron en el pasado. No se limita a identificar lo que ocurrió, sino que explora la complejidad de las acciones de los individuos, las causas, y los cambios a lo largo del tiempo. Para responder al "cómo", el historiador tiene que evaluar las fuentes primarias, buscando pistas en documentos oficiales, cartas personales, memorias, obras de literatura y artísticas, y cualquier otro material que permita reconstruir las circunstancias que dieron forma a un evento particular.

La era digital ha ampliado significativamente el alcance del "¿cómo?" en la investigación histórica. Si bien la pregunta básica sigue siendo la misma, las herramientas y colecciones de documentos se han transformado. El acceso a colecciones de datos digitalizados, la posibilidad de analizar grandes cantidades de información y las nuevas formas de visualizar y representar la historia le presentan al historiador una nueva manera de abordan el “cómo".

En el contexto digital, el “cómo” implica el uso estratégico de herramientas que permiten rastrear interacciones, identificar patrones y establecer vínculos entre fuentes diversas que antes permanecían dispersas. La visualización de datos, el análisis de redes sociales y los sistemas de inteligencia artificial ofrecen al investigador nuevas formas de detectar conexiones ocultas, reconstruir procesos y explorar dinámicas complejas. Sin embargo, estas herramientas no reemplazan el análisis crítico. El historiador siempre tiene que evaluar la validez de las relaciones sugeridas por los algoritmos, contrastarlas con las fuentes originales y atender a los silencios, omisiones y sesgos inherentes tanto en los documentos como en los sistemas digitales que los median. Así, responder al “cómo” no solo implica desentrañar los procesos históricos en sí, sino también reflexionar sobre los métodos empleados para hacerlo, asegurando que las interpretaciones se sostengan sobre una base crítica y rigurosa.

En el caso del Grito de Lares (1868), la pregunta del “¿Cómo?” permite pasar de la simple descripción del levantamiento a la comprensión de los procesos que lo hicieron posible. Con el uso de bases de datos digitalizadas, listas de implicados y nuevos expedientes transcritos, el investigador puede reconstruir las redes de movilización que conectaban a jornaleros, artesanos y líderes políticos en distintos pueblos de la Isla. Herramientas de análisis de redes sociales (Social Networks Analysis Tools) permiten visualizar cómo individuos como Manuel Rojas, Mathías Brugman o Eduviges Beauchamp estaban insertos en una estructura más amplia de vínculos comunitarios, económicos yfamiliares que facilitaronla organizaciónde lainsurrección.

Complementariamente, la georreferenciación de las localidades mencionadas en los expedientes revela rutas de reclutamiento y patrones de comunicación entre pueblos de la montaña, mostrando que la insurrección no fue un estallido espontáneo, sino el resultado de un proceso organizado y articulado territorialmente. Este análisis digital del “cómo” ilumina tanto la lógica interna del movimiento como las limitaciones estructurales que enfrentó, ofreciendo una comprensión más profunda de la dinámica revolucionaria.

En este mismo sentido, técnicas de visualización como los mapas mentales ayudan a responder al "cómo", al permitir representar de manera esquemática las conexiones y procesos detectados en la investigación digital. Esta técnica, que tiene casi dos milenios de antigüedad, fue popularizada en Inglaterra por el psicólogo Tony Buzan 26 . Los mapas mentales permiten la organización de la investigación partiendo del tema principal y mostrando sus componentes por asociación a través de un diagrama que incorpora palabras clave, frases, conceptos, datos y cifras relevantes27 .

La relevancia de esta técnica en la era digital radica precisamente en su capacidad para sintetizar y organizar la sobrecarga informativa que caracteriza a la investigación histórica actual. Mientras que el investigador tradicional podía mantener mentalmente las conexiones entre decenas de

26 History of Mind Mapping: The Founding Fathers. Recuperado de https://mindmappingsite.com/history/history-ofmind-mapping/

27 Mind Mapping. University of Adelaide. Recuperado de https://www.adelaide.edu.au/writingcentre/sites/default/files/docs/learningguide-mindmapping.pdf

documentos, el investigador digital debe gestionar miles de fuentes, referencias cruzadas y datos extraídos de múltiples plataformas. El mapa mental actúa como una interfaz cognitiva que traduce la complejidad digital en estructuras visuales sencillas.

Una de las ventajas de esta técnica es que, combinando la inteligencia artificial, el investigador puede tomar un ensayo o documento extenso y transformarlo en un mapa mental que revela su estructura conceptual subyacente. Por ejemplo, el mapa mental de la conferencia "El Origen de la Bandera de Lares"28 no solo organiza la información presentada en la conferencia, sino que la explica visualmente.

Ilustración 17- Mapa Mental de Conferencia El Origen de la Bandera de Lares (creado con ChatGpt y Xmind)

28 Joseph Harrison Flores. Recuperado de https://issuu.com/coleccionpuertorriquena/docs/conferencia_logia_borinquen-09-18-2024_final

Esta representación visual permite al investigador identificar nodos centrales de información, detectar vacíos en la documentación, y descubrir conexiones que podrían pasar desapercibidas en una lectura lineal de las fuentes.

El mapa mental de la conferencia El Origen de la Bandera de Lares ilustra perfectamente cómo un mito histórico puede originarse y perpetuarse sin base documental. El diagrama muestra que toda la historia de la bandera de la Lares exhibida en el Museo de la UPR se origina en un simple comunicado de prensa de Ricardo Alegría en 1954, sin ninguna documentación que respalde su autenticidad.

La estructura visual del mapa expone claramente el problema. La rama superior muestra cómo el “mito de la bandera en la UPR” carece de fuentes primarias que lo sustenten, la rama inferior presenta las “fuentes primarias” que documentan la existencia de otras banderas completamente diferentes, específicamente las banderas blanca y roja, mencionadas en los testimonios del Grito, y la bandera capturada en Camuy que fue llevada a España.

Al organizar la información de esta manera, el mapa mental funciona como una herramienta diagnóstica que expone las fallas metodológicas en la historiografía de Lares. No solo muestra que se ha aceptado como hecho una historia basada únicamente en un comunicado de prensa, sino que revela el proceso por el cual las fuentes primarias, los verdaderos cimientos de la investigación histórica, fueron sistemáticamente ignoradas porque contradecían una narrativa cómoday establecida. Elmapa mental asíresponde al "cómo"en susentido más profundo, cómo la pasión patriótica puede desplazar al método científico en la construcción del conocimiento histórico.

¿Por qué?

La pregunta del "¿por qué?" representa la culminación del proceso investigativo, donde el historiador va de la mera descripción para adentrarse en la explicación causal y la interpretación de los eventos históricos. Mientras las preguntas anteriores establecen el marco factual, quiénes

participaron, qué ocurrió, cuándo y dónde sucedieron los eventos, y cómo se desarrollaron los procesos, el "por qué" busca desentrañar las motivaciones, causas y fuerzas subyacentes que dieron forma al pasado.

La era digital ha transformado radicalmente nuestra capacidad para abordar el "por qué" histórico. Las herramientas digitales no solo permiten acceder a un volumen sin precedentes de fuentes primarias y secundarias, sino que facilitan el análisis de causalidades múltiples, la identificación de factores concurrentes y la evaluación de hipótesis alternativas con una profundidad antes imposible. El investigador digital puede ahora examinar simultáneamente causas económicas, políticas, sociales, culturales y ambientales, rastreando sus interacciones a través de miles de colecciones digitalizadas. Por ejemplo, la función de Deep Research de Gemini puede atender el porqué de una manera sorprendente. El sistema puede ayudar al investigador a sustentar o derribar su hipótesis al igual que le puede asistir en identificar y responder a nuevas hipótesis

El análisis causal en el entorno digital se beneficia particularmente de la capacidad de cruzar referencias entre múltiples tipos de fuentes. Por ejemplo, al investigar por qué fracasó el Grito de Lares, el investigador puede correlacionar datos económicos sobre la crisis agrícola de la década de 1860, correspondencia personal que revela tensiones políticas, registros militares que documentan la capacidad represiva del gobierno colonial, y testimonios judiciales que exponen las divisiones internas del movimiento revolucionario. Esta triangulación de fuentes, facilitada por las búsquedas digitales y el análisis computacional, permite construir explicaciones multicausales más sofisticadas.

Tomemos como ejemplo la pregunta de por qué la bandera del Museo de la UPR fue aceptada como auténtica durante décadas sin verificación documental. Un análisis digital revela múltiples factores incluyendo institucionales (el prestigio del Instituto de Cultura Puertorriqueña y de Ricardo Alegría), políticos (la necesidad de crear y adoptar símbolos nacionales durante el período de afirmación cultural de los 1950s), psicológicos (el deseo colectivo de tener un

artefacto tangible del Grito de Lares), y metodológicos (la ausencia de una cultura de verificación documental rigurosa en ese momento). La capacidad de rastrear digitalmente cómo esta historia se propagó a través de publicaciones académicas, libros de texto y medios de comunicación ilustra el poder de las herramientas digitales para explicar no solo por qué ocurrió algo, sino por qué ciertas interpretaciones históricas persisten a pesar de la falta de evidencia.

Los desafíos del "por qué" en la era digital incluyen la tentación de confundir correlación con causalidad, especialmente cuando los algoritmos identifican patrones. El historiador debe mantener el rigor metodológico para distinguir entre coincidencias temporales y relaciones causales genuinas. Además, la abundancia de datos puede llevar a sobre-interpretar la evidencia oaconstruirexplicaciones excesivamente complejas cuandoexplicaciones más simples podrían ser suficientes.

Las herramientas digitales facilitan esta síntesis al permitir la organización sistemática de evidencia, la construcción de argumentos respaldados por múltiples fuentes, y la evaluación de interpretaciones alternativas. Sin embargo, la explicación final del "por qué" sigue siendo fundamentalmente un acto interpretativo humano que requiere juicio histórico, comprensión contextual y sensibilidad hacia la complejidad del pasado. La tecnología amplifica nuestra capacidad analítica, pero es el historiador quien debe formular las preguntas correctas, evaluar críticamente laevidencia, yconstruirexplicaciones que iluminennosoloqué ocurrióen el pasado, sino por qué importa para nuestro presente.

La Integración de las Preguntas Fundamentales

Las seis preguntas fundamentales no operan de manera aislada en la investigación digital, sino que se entrelazan y se complementan mutuamente. La naturaleza interconectada de estas preguntas en la investigación histórica digital se puede apreciar en la capacidad de búsqueda cruzada que ofrecen las plataformas digitales modernas. Los motores de búsqueda especializados permiten ahora realizar consultas que combinan múltiples dimensiones simultáneamente. Por ejemplo, podemos buscar documentos que mencionen a personas

específicas (quién) en lugares determinados (dónde) durante períodos concretos (cuándo) relacionados con eventos particulares (qué) y que describan procesos específicos (cómo).

Esta integración metodológica requiere que el investigador desarrolle lo que han llamado la “mentalidad digital crítica".29 No se trata simplemente de trasladar los métodos tradicionales al entorno digital, sino de reconceptualizar cómo las preguntas fundamentales de la investigación histórica se transforman y potencian mediante las herramientas tecnológicas. El investigador debe mantener constantemente un equilibrio entre aprovechar las capacidades expansivas de la búsqueda digital y mantener el rigor metodológico que caracteriza a la disciplina histórica.

La síntesis de estas seis preguntas en el entorno digital no es meramente aditiva; es un cambio de paradigma. Cuando combinamos búsquedas sobre personajes históricos con análisis espaciales, cronologías digitales con redes sociales, y procesos históricos con patrones de datos, emerge una comprensión más rica y matizada del pasado. Esta síntesis nos permite no solo responder preguntas históricas tradicionales con mayor profundidad, sino formular nuevas preguntas que antes era imposible plantear.

El Punto de Partida, enriquecido por estas preguntas fundamentales y potenciado por las herramientas digitales, establece así los cimientos para una investigación histórica que es simultáneamente más ambiciosa en su alcance y más precisa en su ejecución. Ese es precisamente el puente hacia lo que planteó Engelbart. El concebir la investigación como un ensamblaje dinámico de lenguajes, herramientas y métodos (H-LAM/T) que aumenta el conocimiento del historiador y permite explicar mejor el pasado.

Al completar este primer paso, el investigador no solo habrá definido su objeto de estudio y formulado sus preguntas de investigación, sino que habrá establecido las estrategias digitales específicas para abordar cada dimensión de su investigación.

29 El termino en inglés es “critical digital mindset” y está definido en https://lifestyle.sustainabilitydirectory.com/area/critical-digital-mindset/

III. PALABRAS CLAVE EN LAS BUSQUEDAS DIGITALES

El componente de Lenguaje (L) del modelo H-LAM/T cobra especial relevancia en la investigación histórica digital. Engelbart demostró que el lenguaje no es solo un medio de comunicación, sino una herramienta cognitiva que estructura nuestro pensamiento y determina nuestra capacidad de acceder a información. En el contexto de la investigación histórica digital, el investigador debe dominar múltiples "lenguajes" simultáneamente, el lenguaje del período histórico estudiado, el lenguaje de la catalogación archivística, y el lenguaje formal de las búsquedas digitales con sus operadores booleanos y sintaxis especializada y más reciente el lenguaje de construir “prompts”.

Las palabras clave nosonsimplemente términos que escribimos el navegador de Internetcuando hacemos una búsqueda. Estas son el puente lingüístico entre nuestra pregunta de investigación y millones de documentos digitalizados. La efectividad de nuestra investigación depende críticamente de nuestra capacidad de "hablar el lenguaje" de los sistemas de búsqueda y de anticipar el lenguaje utilizado por los archiveros que catalogaron los documentos décadas o siglos después de su creación. Este capítulo explora cómo expandir y refinar nuestro vocabulario Investigativo, nuestro componente de Lenguaje, para maximizar la efectividad de las búsquedas digitales. Como Engelbart planteó, mejorar un componente del sistema H-LAM/T (en este caso, el Lenguaje) genera efectos compuestos que amplifican toda nuestra capacidad investigativa.

Las palabras clave constituyen el puente fundamental entre el investigador y las fuentes digitalizadas. En la investigación histórica digital, estas palabras funcionan como llaves que abren o cierran el acceso a vastos repositorios de información. A diferencia de la investigación tradicional, donde el historiador exploraba físicamente los documentos en su totalidad, la investigación digital depende crucialmente de la capacidad del investigador para anticipar, identificar y adaptar los términos que conectarán sus preguntas con las respuestas contenidas en millones de páginas digitalizadas. Esta dependencia convierte la selección y refinamiento de palabras clave en una competencia metodológica esencial que determina no solo qué encontramos, sino también qué permanece invisible para nuestra investigación.

La selección de palabras clave requiere conocer el contexto histórico y del período bajo investigación. Los documentos históricos son producto de su tiempo, reflejando convenciones lingüísticas y ortográficas específicas. Por ejemplo, al investigar la historia de San Juan en el siglo XVIII, es crucial considerar que la ciudad aparece en documentos históricos bajo diferentes denominaciones como "Puerto Rico" o "Ciudad de Puerto Rico", nombres comunes durante la época colonial. En cuanto a las categorías de palabras clave, los nombres propios presentan desafíos particulares. Tomemos el caso de Ramón Emeterio Betances. Su nombre puede aparecer como "Ramón E. Betances", "R.E. Betances", "Betances", "Bétances", o incluso "Betanzos" en documentos españoles. Los documentos coloniales españoles pueden presentar fechas en formato numérico, textual o utilizando numeración romana. Los períodos históricos también pueden tener diferentes denominaciones según la perspectiva historiográfica, como ilustra el caso de la "Guerra Hispanoamericana", también conocida como "Spanish-American War" o "Guerra del 98".

Las palabras clave deben considerar la evolución semántica de los términos a través del tiempo.

Un concepto puede denominarse de manera completamente diferente según el período histórico. Por ejemplo, lo que hoy llamamos "trabajador asalariado" aparece en documentos del siglo XIX puertorriqueño como "jornalero", "bracero", "peón", o "trabajador libre" (en oposición al esclavo).

El término "negro" en documentos coloniales podía referirse tanto a personas esclavizadas como libres de ascendencia africana, mientras que "pardo" y "moreno" indicaban categorías raciales específicas del sistema de castas colonial que no tienen equivalentes exactos modernos. Similarmente, las enfermedades presentan desafíos particulares. Lo que los documentos del siglo XIX llaman "fiebre amarilla", "vómito negro" o "fiebre biliosa" pueden referirse a la misma enfermedad. El investigador debe construir un glosario histórico de equivalencias que permita traducir entre el vocabulario del período estudiado y los términos modernos.

Según se va avanzando en las búsquedas el investigador tiene que refinar o modificar las palabras clave. A partir de los resultados iniciales, el investigador debe crear una nueva lista de palabras clave más específicas que reflejen el vocabulario y las categorías encontradas en los documentos históricos. Por ejemplo, una investigación sobre el comercio marítimo en el siglo XIX podría comenzar con términos generales como "comercio" y "puerto", pero los documentos encontrados podrían revelar términos más específicos como "cabotaje", o nombres de embarcaciones específicas que pueden utilizarse para refinar las búsquedas posteriores.

Desarrollo de una matriz de búsqueda sistemática

El investigador debe desarrollar una matriz sistemática de búsqueda que contemple múltiples dimensiones de variación.Estamatriz debe incluirvariaciones ortográficas históricas ymodernas, sinónimos contemporáneos al período estudiado, términos en diferentes idiomas relevantes al contexto (español, inglés, francés para el Caribe), abreviaturas y formas extendidas, y variaciones regionales o locales. Por ejemplo, al investigar el sistema de libretas de jornaleros en Puerto Rico, la matriz incluiría la "libreta de jornalero", "libreta", "papeleta de jornalero", "cédula de vecindad", "passbook" (en documentos estadounidenses post-1898), "carnet de travail" (en comparaciones con sistemas similares en colonias francesas), y las variaciones con errores de OCR como "libreta de jornalcro" o "1ibreta de jorna1ero". Este acercamiento sistemático aumenta significativamente la probabilidad de localizar documentos relevantes que de otra manera permanecerían ocultos.

La mayoría de las plataformas digitales permiten el uso de operadores booleanos y técnicas de truncamiento que multiplican la efectividad de las búsquedas. Los operadores AND, OR, y NOT permiten combinar o excluir términos estratégicamente. Por ejemplo, la búsqueda "café AND (hacienda OR plantación) NOT Brasil" localizaría documentos sobre haciendas cafetaleras evitando referencias a Brasil. El uso de comillas para frases exactas ("Real Audiencia de Puerto Rico") evita resultados irrelevantes. El truncamiento mediante asteriscos (escla* para encontrar esclavo, esclavitud, esclavista, esclavos) y el uso de comodines (wom?n para woman y women

en documentos en inglés) amplían el alcance de cada búsqueda. Sin embargo, cada plataforma digital tiene sus propios comandos. Mientras Google Books aceptael asterisco (*)como comodín, PARES utiliza el signo (%) para el mismo propósito. El investigador debe familiarizarse con las especificidades de cada sistema que utiliza regularmente.

Capacidades y Limitaciones del Reconocimiento Óptico de Caracteres (OCR)

Una de las funciones más importante en la investigación digital es la búsqueda dentro de los documentos. Bajo la investigación tradicional el historiador estaba obligado a llevar a cabo una lectura completa del documento y allí encontrar la información correspondiente a su investigación. La búsqueda tradicional por lectura de los documentos permite al investigador ampliar su conocimiento del tema o de lo leído, pero es ineficiente en comparación con el examen electrónico. La tecnología del Reconocimiento Óptico de Caracteres (OCR por sus siglas en Ingles) cambió completamente la manera de búsqueda e identificación de palabras clave. Con esta tecnología el investigador pueda buscar dentro de documentos, videos, audios etc., las palabras clave permitiendo dirigir la investigación a aquellos recursos documentales más relevantes. El investigador tiene que ser cauteloso y no depender en su totalidad de las búsquedas automatizadas ya que la tecnología es propensa a errores.

Un ejemplo del poder de las variaciones lingüísticas en las búsquedas digitales lo proporciona la investigación de Alfredo Torres Otero sobre el origen de la imprenta en Puerto Rico y el origen de la Gaceta de Puerto Rico. Durante décadas, la fecha de origen del primer periódico puertorriqueño ha sido objeto de debate, con la evidencia más antigua siendo una fotocopia de unejemplar de 1808 presentadaen la décadade 1970. Sin embargo, Torres Oterodemostró cómo una búsqueda utilizando la traducción al inglés del título nos mostró información reveladora.30 Al buscar el término "Porto Rico Gazette" en lugar del español "Gaceta de Puerto Rico" en bases de datos de periódicos norteamericanos, Torres Otero encontró referencias inesperadas. El 30 de

30 Alfredo Torres Otero. Hallazgo que reescribe la historia de la prensa en Puerto Rico. El Nuevo Día. 5 de abril de 2025. Recuperado de https://www.elnuevodia.com/opinion/punto-de-vista/hallazgo-que-reescribe-la-historia-dela-prensa-en-puerto-rico/

junio de 1806, el Aurora General Advertiser de Filadelfia citaba ediciones del "Porto-Rico Gazette" como fuente para noticias sobre la expedición de Francisco de Miranda a Venezuela. 31 Esta búsqueda en inglés reveló que periódicos estadounidenses de agosto y septiembre de 1806 citaban regularmente el periódico puertorriqueño, información que había permanecido invisible para investigadores que buscaban únicamente en español.

La investigación se fortaleció mediante el análisis matemático de los datos editoriales. Una gaceta del 23 de noviembre de 1808 indicaba ser la edición número 60 del Volumen 3.

Conociendo que el periódico se publicaba bisemanalmente (104 ediciones anuales), Torres Otero reconstruyó cronológicamente que el Volumen 3 debió comenzar en abril de 1808.

Combinando esta evidencia con las referencias de 1806 encontradas mediante la búsqueda en inglés, estableció definitivamente que la primera Gaceta de Puerto Rico se publicó el 2 de abril de 1806, adelantando en casi dos años la fecha previamente aceptada.

Este caso ilustra varios principios de la búsqueda digital efectiva. Primero, la importancia de buscar en múltiples idiomas, especialmente considerando el contexto colonial y las relaciones internacionales de la época. Segundo, cómo las fuentes indirectas (periódicos norteamericanos citando fuentes puertorriqueñas) pueden preservar información sobre documentos perdidos. Tercero, la necesidad de combinar búsquedas textuales con análisis cuantitativo de datos editoriales; y Cuarto, cómo las variaciones ortográficas históricas ("Porto Rico" vs. "Puerto Rico") pueden abrir nuevas vías de investigación. Como reflexiona Torres Otero, este hallazgo nos invita a preguntarnos cuántas otras "verdades históricas" esperan ser redescubiertas mediante el uso creativo de palabras clave y metodologías digitales contemporáneas.

https://books.google.com.pr/books?id=48FYAAAAIBAJ&pg=PA2&dq=%22porto+rico+gazette%22&article_id=6155,3 181224&hl=en&sa=X&ved=2ahUKEwjq26D4yYuLAxUtTTABHU2FMhAQ6AF6BAgLEAM#v=onepage&q=porto%20rico &f=false

Errores del OCR

El conocer los errores de OCR permite mejorar significativamente los resultados de las búsquedas. La comprensión de los patrones comunes de error en el OCR resulta fundamental para desarrollar estrategias de búsqueda efectivas. Por ejemplo, en documentos históricos en español, las letras con acentos frecuentemente presentan problemas de reconocimiento. La palabra "José" podría aparecer como "Jos6", "Jos&" o "Josó". Para mitigar esos errores el investigador al hacer una búsqueda tiene que utilizar las diferentes variantes del nombre. El Reconocimiento Óptico de Caracteres (OCR) a menudo confunde ciertos caracteres, especialmente en documentos históricos en español. Algunos de los errores más comunes donde incluyen:

Tabla 4

LETRAS QUE SE PARECEN VISUALMENTE Y QUE SUELEN

CONFUNDIRSE ENTRE SÍ

Confusión OCR Texto Original Error OCR

a → s Taínos Tsínos

o → n Borinquen Bnrinquen

y → v Mayagüez Mavagüez

a → u Caguas Cuguas

al → d alcalde dcalde

o → p Ponce Ppnce

o → q gobierno gqbiernq

b → h Isabela Isahela

b → o cabildos caoildos

c → e cacique eaeique

c → r Barceloneta Barreloneta

d → al hacienda haciendal

e → c Humacao Humaeao

e → o Real Cédula Roal Códula

Tabla 4

LETRAS QUE SE PARECEN VISUALMENTE Y QUE SUELEN CONFUNDIRSE ENTRE SÍ

Confusión OCR

Texto Original Error OCR

f → l Rafael Ralael

h → b bohío bobío

h → k Hatillo Katillo

li → h Julio Juho

m → h Ramos Rahos

m → n Manatí Nanatí

n → h Canóvanas Cahóvahas

n → o San Juan Sao Juao

n → r Loíza Loíza

r → c Gurabo Gucabo

r → n Arecibo Anecibo

t → f Capitanía Capifanía

u → a Yunque Yanque

u → n Aguadilla Agnadilla

u → o Bayamón Bayamón

i → j Inicio Jnjcio

ñ → n España Espana

ñ → ii año aiio

ñ → fl señor seflor

ñ → ñ Loíña Loina/Loifla

rn → m gobierno gobiemo

rn → nn interno intenno

rn → rri moderno moderrio

cl → d declaración dedaración

cl → ol reclamo reolamo

cl → el incluye ineluye

ch → di hacienda hadienda

Tabla 4

LETRAS QUE SE PARECEN VISUALMENTE Y QUE SUELEN CONFUNDIRSE ENTRE SÍ

Confusión OCR Texto Original Error OCR

ch → oh machete maohete

ch → ck Sanchez Sanckez

ch → eh Coamo Coamo

ll → H Humacao Humacao

ll → U Uovet Llovet

ll → il calle caile

ll → II llegar IIegar

fi → fl definitivo deflnitivo

ft → ff after affer

Tabla 5

CONFUSION ENTRE LETRAS Y NÚMEROS EN DOCUMENTOS HISTÓRICOS DE PUERTO RICO

Confusión OCR Texto Original Error OCR

1 → I 1898 I898

1 → l 1508 l508

i → 1 Aguadilla Aguad1lla

Z → 2 Zeno Gandía 2eno Gandía

B → 0 B-65 0-65

B → 8 Ley B-116 Ley 8-116

I → L ISLA LSLA

I → T RÍO PIEDRAS RTO PTEDRAS

J → 1 Juan 1uan

L → 1 Ley 54 1ey 54

S → 3

San Sebastián 3an 3eba3tián

D → O Decreto 1234 Oecreto 1234

E → B ELA BLA

E → F Edificio Fdificio

G → 6 García 6arcía

O → C

Orden 1952 Crden 1952

O → D Oficina Dficina

O → G Gobernador Gdbernaddr

O → 0 Ponce P0nce

0 → O 1950 195O

6 → G Ruta 66 Ruta G6

8 → B 1868 1B68

3 → S Ruta 3 Ruta S

2 → Z Ruta 2 Ruta Z

5 → S 1521 1S21

9 → g 1917 1g17

Tabla 5

EJEMPLOS DE COMBINACION DE LETRAS EN PALABRAS EN ESPAÑOL FRECUENTEMENTE CONFUNDIDAS POR EL OCR

Termino

Error OCR

"ñ" confundida

"Cañuelo" "Canuelo" / "Caiiuelo"

"Añasco" "Anasco" / "Aiiasco"

"La Perla del Niño"

"La Perla del Nino"

"Piñones" "Pinones" / "Piflones"

"Señor Muñoz Rivera" "Seflor Mufloz Rivera"

"rn" confundida

"Gobierno de Ponce"

"Gobiemo de Ponce"

"Jornada laboral" "Jomada laboral"

"Modernización" "Modemización"

"Gobernador Ferré" "Gobemador Ferré"

"cl" confundida

"Proclama de Lares" "Prodama de Lares"

"Declaración de San Juan" "Dedaración de San Juan"

"Incluye a Vieques" "Induye a Vieques"

"ch" confundida

"Bachillerato" "Badiillerato"

"Boliche" "Bolidie"

"Machuchal" "Madiudial"

"Chayanne" "Diayanne"

"Lechón asado" "Ledión asado"

Combinación

rr → n "barrio" "banio"

rr → ir "tierra" "tieira"

mm → nm "commencement" "conmencement"

nn → m "innato" "imato"

tt → H "Mattei" "MaHei"

ff → H "Jefferson" "JeHerson"

ss → fs "possessions" "pofsessions"

cc → oc "acceso" "aoceso"

pp → jp "Pepito" "Pejito"

bb → lb "Cabbage" "Calbage"

Los documentos históricos de Puerto Rico presentan desafíos particulares para el reconocimiento óptico de caracteres que van más allá de los errores genéricos del OCR. La toponimia puertorriqueña, con sus raíces taínas, españolas y norteamericanas, genera patrones de error sistemáticos que el investigador debe anticipar y compensar en sus estrategias de búsqueda.

Los nombres de municipios y barrios frecuentemente sufren distorsiones predecibles en el proceso de OCR. Bayamón, uno de los municipios más mencionados en documentos históricos, aparece consistentemente como "Bayamon" cuando se pierde el acento, "Bayam6n" cuando el sistema interpreta la ó como un 6, o "Bayarnón" cuando las letras minúsculas se confunden. Caguas presenta problemas similares, apareciendo como "Caquas" cuando la g manuscrita se asemeja a una q, o "Cagnas" cuando la combinación "ua" se interpreta incorrectamente. Mayagüez, con su diéresis, representa un caso particularmente problemático, manifestándose como "Mayaguez" en el mejor de los casos, pero frecuentemente como "Mayagiiez" cuando el sistema intenta interpretar los puntos diacríticos, o "Mayag0ez" cuando confunde la letra O con el número cero.

Los apellidos puertorriqueños de origen español con caracteres especiales constituyen otra categoría problemática. El apellido Muñoz aparece no solo sin la eñe como "Munoz", sino también como "Mufioz" cuando el sistema interpreta la ñ como fi, o "Muiloz" cuando la combinación se distorsiona aún más. Núñez sufre transformaciones similares, apareciendo como "Nunez", "Nuñez" con una eñe parcial, o "Nuflez" cuando la ñ se confunde con fl. Estos errores se complican cuando aparecen nombres compuestos como José María Quiñones, que puede transformarse en "Jos6 Marla Quifiones" o variaciones aún más distorsionadas.

La terminología administrativa colonial española también presenta sus propios problemas. El título "Capitán General", fundamental en documentos del período español, frecuentemente aparece sin acentos como "Capitan General", pero también puede manifestarse como "Capit4n General" cuando el sistema confunde la á con un 4, o "Capitdn General" cuando interpreta mal el acento. Los documentos oficiales como la "Cédula Real" sufren transformaciones similares, apareciendo como "Cedula Real" sin acentos, "C6dula Real" con errores numéricos, o "Cédnla Real" cuando las letras minúsculas se confunden entre sí.

El investigador debe desarrollar estrategias de búsqueda que contemplen estas variaciones. Al buscar información sobre la abolición de la esclavitud en 1873, por ejemplo, no basta con buscar el término exacto "Abolición de la esclavitud 1873". Se debe considerar "Abolicion esclavitud 1873" sin acentos, "Abolici6n esclavitud 1873" con errores numéricos, "Abolición esclavos 1873" con variaciones terminológicas, e incluso "Abolición esclavitud I873" donde el número uno se confunde con la letra I mayúscula. Esta multiplicidad de búsquedas puede parecer tediosa, pero frecuentemente revela documentos que de otra manera permanecerían ocultos.

La documentación de instituciones educativas históricas presenta problemas adicionales. El "Instituto Civil de Segunda Enseñanza" puede aparecer como "Instituto Civil de Segnnda Ensefianza" con múltiples errores de interpretación, mientras que la "Escuela Normal" podría transformarse en "Escnela Normal" o "Escuela Norrnal" con duplicación errónea de consonantes.

Los investigadores trabajando con documentos educativos deben estar particularmente atentos a estas variaciones, especialmente cuando buscan en colecciones como la Gerardo Sellés Solá.

Mitigar Errores del OCR en Búsquedas

Como se explicó anteriormente en la sección "Errores del OCR", el Reconocimiento Óptico de Caracteres presenta patrones predecibles de confusión que el investigador debe anticipar. A continuación, presentamos algunas recomendaciones prácticas para mitigar estos errores en las búsquedas:

• Realizar búsquedas con todas las variantes posibles del término (con y sin acentos, con errores numéricos comunes). Muchas bases de datos digitales proveen para hacer búsquedas con operadores booleanos (esto se explica en detalle en otro capítulo). Esta técnica de búsqueda permite combinar diferentes palabras clave usando el operador booleano OR. Al utilizar OR entre términos de búsqueda el sistema buscará todas las palabras que encuentre como se explica a continuación.

Al realizar búsquedas booleanas con OR en Google o en bases de datos históricas que tenga esta función, incluya sistemáticamente todas las variantes posibles del término:

Variantes ortográficas y de acentuación

o Con y sin acentos: Muñoz OR Munoz

o Con y sin diéresis: Mayagüez OR Mayaguez

o Con y sin eñes: España OR Espana OR Espaiia

Errores comunes de OCR:

o Confusiones de letras: gobierno OR gobiemo (rn→m)

o Confusiones numéricas: 1898 OR I898 (1→I)

o Combinaciones problemáticas: hacienda OR hadienda (ch→di)

Tabla 6

Estrategias de búsqueda

Variantes históricas del término

o Ortografía antigua y moderna: Puerto Rico OR Porto Rico

o Nombres cambiantes: Río Piedras OR Rio Piedras

o Abreviaciones: San Juan OR S. Juan OR SJ

Use paréntesis para agrupar las variantes OR y comillas para frases exactas. Esto maximiza la recuperación de documentos mal digitalizados mientras mantiene la precisión de la búsqueda. Los paréntesis agrupan términos relacionados para que Google los procese como una unidad.

Tabla7

Ejemplos de uso del OR en las búsquedas para mitigar errores de OCR Documentos con errores de digitalización: ("Tratado de París" OR "Tratado de Paris" OR "Tratado cle París" OR "Tratado de Pans") Captura documentos donde OCR confundió ri→n o cl→d.

Búsqueda de eventos históricos: (("Grito de Lares" OR "Gnto de Lares") AND (1868 OR I868 OR "23 de septiembre")) Combina variantes del evento con posibles errores en la fecha.

Búsqueda de personas con nombres complejos: (("José de Diego" OR "Jose de Diego" OR "José cle Diego") AND ("poeta" OR "político" OR "politico"))

• Truncamiento- Use búsquedas parciales cuando sea posible (ej: "Baya*" para encontrar Bayamón, Bayamon, Bayam6n)

• Combinaciones- Para nombres compuestos, buscar cada parte por separado y luego combinar resultados

• Documentación- Mantener un registro de las variantes encontradas para futuras búsquedas:

Término que se interesa buscar “Operación Manos a la Obra”:

Tabla 8 Registro de Variantes Fecha Variante encontrada Fuente Tipo de error

01/15/2024 Operation Bootstrap NY Times 1952 Traducción

01/16/2024 Operacion Manos Censo 1950 Sin tildes

01/17/2024 Op. Manos a la Obra Informe PRIDCO Abreviación

01/17/2024 Operación Mauos a la Obra Periódico local OCR: n→u

01/19/2024 Manos a la Obra Documento interno Nombre parcial

Búsqueda combinada:

(("OperaciónManosalaObra"OR"OperacionManosalaObra"OR"OperationBootstrap"OR"Op.Manosa laObra"OR"ManosalaObra"OR"Bootstrap"OR"OperaciónMauosalaObra")AND("MuñozMarín"OR "MunozMarin"OR"PRIDCO"OR"Fomento"OR"industrialization"OR"industrialización"))

Lexicón

En 1986 el entonces director del Archivo General de Puerto Rico, Luis de la Rosa público su tesis de maestría titulada Lexicón Histórico Documental De Puerto Rico (1812-1899).32 La publicación contiene el “corpus lingüístico de términos empleados en la documentación administrativa, legal-notarial, industrial, agrícola, fiscal, comercial y religiosa usados comúnmente en Puerto Rico”33 Este documento es la referencia obligada de cualquier historiador que maneje el periodo colonial español ya que el libro sirve como un diccionario de referencia de términos incluidos en la documentación histórica. Tomando como referencia ese documento preparamos un Lexicón de OCR en el cual se incluyen los términos históricos y sus variantes con errores que pueden surgir en el reconocimiento de caracteres mecanizado. El Lexicón está incluido como un anejo a este documento.

Paralelamente a este documento preparáramos otro anejo con un Lexicón de apellidos de Puerto Rico. Estos se obtuvieron de la página digital www.apellidos.de . A la lista de apellidos se le añadieron dos columnas identificando sus variantes con errores de OCR, y otra con el operador

OR lo que permite que el lector pueda copiar y pegar en aquellas plataformas que permitan los operadores booleanos reduciendo así el número de búsquedas y aumentar la posibilidad de encontrar el término.

Estos anexos representan un avance significativo en la eficiencia de la investigación digital al proporcionar de manera sistemática las variantes con errores de OCR que los investigadores normalmente descubriríansolodespués de múltiples búsquedas infructuosas. Tradicionalmente, un historiador que buscara documentos sobre Mayagüez tendría que realizar búsquedas repetidas hasta descubrir, a través de ensayo y error, que el término también aparece digitalizado como "Mayaguez", "Mayagiiez", "Mayag0ez" o "Mavagüez". Este proceso de descubrimiento de variantes consumía tiempo valioso y frecuentemente resultaba en búsquedas incompletas cuando el investigador, sin saberlo, omitía variantes importantes. Los lexicones eliminan esta

32 Luis de la Rosa. (1986). Lexicón Histórico Documental De Puerto Rico (1812-1899). Centro de Estudios Avanzados de Puerto Rico y el Caribe.

33 Idem. P.9.

ineficiencia al compilar sistemáticamente todas las variaciones conocidas de errores de OCR para cada término y apellido. El investigador ya no necesita adivinar o descubrir gradualmente estas variantes; puede consultar el lexicón correspondiente y obtener inmediatamente todas las formas en que un término histórico como "Capitán General" o un apellido como "Muñoz" podrían haber sido mal interpretados por los sistemas de reconocimiento de caracteres.

La inclusión de los operadores booleanos OR en el Lexicón de apellidos maximiza aún más la utilidad práctica de estos anexos. En lugar de tener que construir manualmente cadenas de búsqueda complejas, el investigador puede simplemente copiar y pegar la fórmula completa en cualquier plataforma que admita operadores booleanos. Por ejemplo, al buscar el apellido "Muñoz", en lugar de realizar cinco o seis búsquedas separadas (Muñoz, Munoz, Mufioz, Muiloz, Mu6oz), el investigador copia la cadena pre-construida "Muñoz OR Munoz OR Mufioz OR Muiloz OR Mu6oz" y ejecuta una sola búsqueda exhaustiva. Esta funcionalidad no solo ahorra tiempo, sino que también reduce dramáticamente la posibilidad de omitir documentos relevantes por no haber considerado alguna variante particular. La combinación de ambos lexicones, el de términos históricos y el de apellidos, proporciona al investigador un conjunto completo de herramientas para realizar búsquedas sistemáticas en repositorios digitales. Esto es especialmente valioso cuando se rastrea información sobre personajes históricos específicos en contextos documentales particulares, permitiendo búsquedas complejas como "(Muñoz OR Munoz OR Mufioz) AND (Capitán General OR Capitan General OR Capit4n General)" que capturan simultáneamente todas las variantes posibles de ambos términos.

Peligros de las palabras clave

En el año 2016 Lara Putnam público un artículo sobre los peligros de depender solamente de fuentes digitalizadas y los sesgos que estos producen.34 La autora analiza y establece que la 34 Lara Putnam. The Transnational and the Text-Searchable: Digitized Sources and the Shadows They Cast. The American Historical Review. Vol. 121, No. 2 (APRIL 2016), pp. 377-402.

digitalización, lejos de ser un proceso neutral, introduce distorsiones sistemáticas que pueden alterar significativamente nuestras interpretaciones del pasado.

Según Putnam los medios digitales sufren de una “sobrerrepresentación de fuentes” impresas y materiales producidos porélites sociales. Estesesgosurge porque los materiales más fácilmente digitalizados y accesibles a través de proyectos de digitalización son fuentes impresas los cuales fueron típicamente producidos por personas o instituciones influyentes.35 Esto es muy común en Puerto Rico ya que la historia del siglo XIX es analizada a través de la Gaceta de Puerto Rico o el Boletín Mercantil periódicos que representaban al gobierno o a la elite incondicional. Como resultado, estas fuentes proporcionan una visibilidad desproporcionada a la experiencia de los segmentos que tenían el poder político o económico de la sociedad puertorriqueña.

En contraste, los grupos marginalizados y las clases socioeconómicas bajas permanecen frecuentemente subrepresentadas en los archivos digitales. Sus historias ycontribuciones tenían menos probabilidades de ser capturadas en formato impreso o en documentos oficiales. Los testimonios orales, los manuscritos personales, las proclamas políticas clandestinas, y otros materiales que documentaban la vida de las clases trabajadoras frecuentemente no sobrevivieron o no fueron conservados. Según Putnam esta desproporción crea un sesgo en la investigación que lleva a al investigador hacia una historia con la visión de las clases dominantes dejando vacíos significativos en nuestra comprensión de las dinámicas sociales de los de abajo.

La búsqueda digital ha revolucionado la investigación histórica al proporcionar tres ventajas fundamentales. Primero, acceso inmediato y geográficamente ilimitado donde el investigador puede consultar vastas cantidades de documentos desde cualquier ubicación, eliminando las barreras geográficas. Segundo, velocidad y eficiencia extraordinaria ya que las búsquedas por palabras clave y filtros avanzados aceleran dramáticamente el proceso de localización de información específica. Tercero, capacidad de análisis a escala, donde las herramientas digitales permiten procesar corpus documentales extensos que serían inmanejables mediante métodos

tradicionales. Sin embargo, como advierte la historiadora Lara Putnam, estas ventajas vienen acompañadas de limitaciones significativas que el investigador debe comprender y mitigar activamente.

Putnam identifica como riesgo primario la dependencia del investigador en búsquedas por palabras clave. A pesar de que las herramientas de búsqueda digital aumentan dramáticamente la eficiencia para encontrar información específica, pueden inadvertidamente alentar a los investigadores a pasar por alto el contexto esencial que surge del examen físico de las fuentes.

La investigación en archivos tradicionales involucra revisar físicamente documentos página por página y frecuentemente exponen a los investigadores a materiales y temas adyacentes. Este encuentro fortuito con documentos no buscados puede dirigir al investigador a conexiones que no serían evidentes a través de búsquedas digitales por palabras clave.36

El análisis de Putnam destaca la importancia de equilibrar las herramientas digitales con prácticas de investigación física. Los historiadores deben permanecer conscientes de estos sesgos inherentes y buscar activamente fuentes que podrían no aparecer en colecciones digitalizadas. Esto requiere un esfuerzo para consultar archivos locales, colecciones privadas, y repositorios especializados que podrían no tener los recursos para la digitalización a gran escala. Al combinar la eficiencia digital con métodos tradicionales el investigador obtiene un contexto más amplio que producirá interpretaciones históricas más completas del pasado.

Mitigando los Sesgos Digitales

Para contrarrestar los sesgos identificados por Putnam, el investigador debe adoptar estrategias mitigantes. Primero, la "lectura lateral" de documentos digitalizados. Esto ocurre cuando se encuentra un documento relevante, y el investigador debe examinar las páginas anteriores y posteriores, nosolo el fragmento identificado porlapalabra clave. Segundo, mantener un registro

36 Idem. P. 392.

de "búsquedas negativas", documentar qué términos no produjeron resultados puede ser tan informativo como los que sí lo hicieron, revelando silencios en el archivo digital. Tercero, triangular entre diferentes tipos de fuentes. Si la investigación depende principalmente de periódicos digitalizados, buscar deliberadamente manuscritos, registros notariales, o correspondencia personal para equilibrar las perspectivas. Cuarto, colaborar con archiveros y otros investigadores que conocen colecciones no digitalizadas y pueden sugerir fuentes alternativas que complementen los hallazgos digitales. Finalmente, dedicar tiempo específico a la "exploración sin palabras clave", navegar colecciones digitales por fecha, lugar o tipo de documento sin términos de búsqueda específicos, permitiendo el descubrimiento fortuito que Putnam identifica como crucial para la comprensión contextual (ver capítulo de investigación periferal).

Para investigar historia en archivos digitales, necesitamos algo más que saber buscar las palabras clave. Es fundamental entender tanto en los documentos originales y los que encontramos en línea los siguiente:

• El lenguaje de la época para poder conocer cómo se escribía y qué términos se usaban en el pasado

• Cómo se clasificaron y describieron los documentos en cada archivo y quien tuvo a cargo este trabajo

• Los errores que produce el OCR

• Los sesgos de digitalización

Un buen investigador digital desarrolla múltiples estrategias de búsqueda, pero siempre mantiene una perspectiva crítica sobre los resultados. Las palabras clave son herramientas poderosas para acceder a información, pero tienen limitaciones importantes. La mejor investigación histórica digital combina lo mejor de dos mundos, la rapidez de las búsquedas digitales y el análisis que solo viene de leer y entender los documentos en su contexto histórico. No todo está digitalizado, no todo se digitalizó correctamente, y no todo se puede encontrar con una simple búsqueda.

Las palabras clave son el punto de entrada, pero la investigación verdaderamente productiva requiere desarrollar la metodología (H-LAM/T) de seguir las pistas que emergen de cada hallazgo.

IV. SEGUIR LAS PISTAS

La Metodología (M) es el componente del sistema H-LAM/T que organiza cómo utilizamos el Lenguaje y los Artefactos para resolver problemas complejos. En la investigación histórica tradicional, seguir las pistas significaba literalmente desplazarse entre archivos físicos, siguiendo referencias de un documento a otro. La investigación digital no elimina esta metodología fundamental, pero la transforma profundamente. Ahora las pistas pueden seguirse con velocidad sin precedentes, permitiendo conexiones que serían prácticamente imposibles en el archivo físico tradicional.

Este capítulo presenta la metodología sistematizada de seguir pistas en el entorno digital. En el se encontrará cómo identificar buenas referencias, cómo expandir búsquedas a partir de nombres, fechas y lugares encontrados, y cómo construir redes de documentos relacionados mediante el seguimiento sistemático de referencias cruzadas. Lo revolucionario de esta metodología digital es su naturaleza donde cada documento encontrado puede generar nuevas pistas que pueden explorarse inmediatamente sin cambiar de ubicación física. Sin embargo, como Engelbart advirtió, nuevos artefactos (repositorios digitales) requieren nuevas metodologías. La facilidad del seguimiento digital de pistas puede llevar tanto a descubrimientos extraordinarios como a dispersión improductiva si no se aplica con disciplina metodológica. Este capítulo proporciona el marco metodológico para maximizar los beneficios mientras se minimizan los riesgos de la búsqueda digital sin resultados o circulares

La investigación histórica digital, al igual que la investigación tradicional, se fundamenta en el principio de seguir las pistas que nos brindan la historiografía y los documentos. Las notas al calce en libros y ensayos, por ejemplo, representan más que simples referencias bibliográficas; constituyen puntos de entrada a la investigación digital. Cuando un investigador encuentra una referencia en un artículo, esta puede conducir no solo a la fuente citada, sino también a toda una red interconectada de documentos relacionados que están disponibles en formato digital. Por ejemplo, una nota al calce sobre el comercio azucarero en un documento del siglo XIX podría

llevar a registros comerciales, correspondencia mercantil, y documentos administrativos que amplían significativamente el alcance de la investigación. Es recomendable y esencial que al evaluar referencias a fuentes primarias tratemos de llegar al documento original de manera que podamos verificar si la interpretación de los documentos históricos no se ha distorsionado al “hablar por los muertos”.37

Las bibliografías digitalizadas ofrecen oportunidades únicas para la investigación histórica. A diferencia de las bibliografías tradicionales, las versiones digitales permiten seguir inmediatamente las referencias a través de enlaces directos o búsquedas en múltiples repositorios digitales. Esta interconectividad acelera el proceso de investigación y permite descubrir relaciones entre fuentes que podrían no ser evidentes en un formato físico.

os artículos y ensayos disponibles en internet constituyen un universo de recursos que, cuando se seleccionan adecuadamente, pueden aportar significativamente a cualquier investigación histórica. Los blogs académicos especializados se han convertido en plataformas donde investigadores y especialistas no solo comparten reflexiones actualizadas, sino que también proporcionan enlaces a documentos históricos digitalizados, bases de datos especializadas y archivos que frecuentemente permanecen invisibles en los catálogos tradicionales. Las discusiones en estas plataformas digitales pueden revelar conexiones interdisciplinarias y perspectivas metodológicas alternativas. Sinembargo, la abundancia de información requiere un proceso riguroso de evaluación crítica. Es vital examinar la procedencia de las fuentes, priorizando aquellas asociadas a instituciones académicas de prestigio, revistas con revisión por pares y autores con credenciales verificables en su campo de especialización. Esta evaluación debe considerar factores como la actualidad de la información, la calidad de las referencias citadas, la metodología empleada y la transparencia en la presentación de los datos. Además, es recomendable contrastar estas fuentes digitales con literatura académica tradicional.

37 Pedro San Miguel. Intempestivas sobre Clío, Puerto Rico, el Caribe y América Latina. Ediciones Laberinto, 1era edición, 2019. P. 86.

Sin embargo, la mayor cantidad de pistas se encuentran en los portales digitales. Es en estos donde el investigador utilizará las palabras clave desarrolladas en el paso anterior para encontrar nuevas fuentes y abrir puertas y ventanas a su tema de investigación.

La Oferta de los Portales Digitales

El primer ofrecimiento de libros digitales y material para la investigación en la Internet fue el Proyecto Gutenberg (https://www.gutenberg.org/). Este proyecto fue iniciado en 1971 por Michael Hart y permitía compartir libros digitales (ebooks) a través del protocolo de comunicación FTP (File Transfer Protocol) y el ARPANET. A pesar de que en la década de 1980 nacería la tecnología del CD-ROM para compartir libros y material audiovisual fue la llegada del World Wide Web (WWW) en la década de 1990, lo que abrió la puerta al ofrecimiento de material histórico digital.

Los portales digitales han transformado fundamentalmente el acceso a la documentación histórica, pero es crucial entender qué ofrecen realmente estos recursos y cuáles son sus limitaciones. En primer lugar, es importante reconocer que los portales digitales de las instituciones regularmente solo contienen una porción del contenido de las colecciones físicas. Dicho ofrecimiento puede estar determinado por diversos factores, incluyendo su estado de conservación, recursos económicos disponibles para la digitalización y el costo de mantener las colecciones en línea. Como resultado de la pandemia del Coronavirus, a partir de 2020, el ofrecimiento de material digital se disparó y obligó a muchas instituciones a adaptar sus servicios rápidamente para mantener su relevancia y accesibilidad durante el periodo de cierre. El cierre causado por el Coronavirus generó nuevos modelos de servicio híbridos, aceleró proyectos de digitalización que estaban engavetados, requirió fortalecer la infraestructura digital de las instituciones, pero más importante aún, cambió por completo las expectativas y la conducta de los usuarios sobre el acceso a material de las instituciones. El usuario se ha acostumbrado a acceder al material histórico de manera inmediata, creando una presión para para las instituciones que no necesariamente tienen los recursos humanos, tecnológicos o económicos para responder a dicha demanda.

Esta nueva realidad digital ha provocado una profunda crisis de identidad en muchas instituciones. Es una realidad a nivel mundial que, en el ámbito financiero, las bibliotecas y archivos enfrentan una reducción en sus presupuestos. Esta realidad se combina con el hecho de que para poder cambiar su ofrecimiento el personal requiere desarrollar nuevas destrezas tecnológicas. Esta dicotomía ha creado un conflicto ya que hay resistencia del personal al cambio combinado con un temor a la obsolescencia profesional que, si no se atiende de manera adecuada, puede llevar al cierre definitivo de los lugares donde se albergan las colecciones.

Sin embargo, la solución no reside en oponerse a la transformación digital ni en abandonar completamente las prácticas tradicionales, sino en desarrollar un modelo híbrido que saque provecho de las fortalezas de la custodia tradicional mientras aprovecha las ventajas de la tecnología digital. Este modelo ha sido adoptado con cierto nivel de éxito en la Colección Puertorriqueña (CPR) del Recinto de Río Piedras de la Universidad de Puerto Rico. El modelo utilizado por la CPR ha mantenido los estándares profesionales adaptándolos al entorno digital.

A través de un proyecto que nació espontáneamente y por la presión del COVID-19 se han desarrollado nuevos ofrecimientos sinabandonarlas políticas tradicionales de la bibliotecología.

El modelo logra la conservación de los recursos físicos y la amplia difusión a través de su ofrecimiento digital. Las instituciones que logren adaptarse exitosamente serán aquellas que abracen el cambio sin perder su identidad fundamental, desarrollen modelos híbridos sostenibles, inviertan en la capacitación de su personal y mantengan un diálogo constructivo entre lo tradicional y la tecnología emergente.

Los inventarios descriptivos y los catálogos en los portales digitales constituyen herramientas fundamentales para la investigación y son evidencia de la necesidad de los bibliotecarios y archiveros. Estos inventarios no son simples listas de documentos, sino sistemas complejos de organización que reflejan la estructura original de los archivos físicos. Un ejemplo de esto son los inventarios que ofrece el Archivo General de Puerto Rico en su portal bajo la categoría de Recursos de Búsqueda(https://www.icp.pr.gov/archivo-general/). El Archivo General de Puerto

Rico es el mayor y más importante repositorio de material histórico de Puerto Rico y es el destino obligado de cualquier investigador. En ausencia de una digitalización completa de sus fondos los inventarios digitales son una valiosa aportación al usuario. Estos inventarios brindan a los usuarios el contenido de las colecciones y fondos documentales, permitiendo a los investigadores optimizar su tiempo al planificar su búsqueda con anticipación antes de acudir físicamente al archivo. Otra ventaja es que algunos de los inventarios poseen reconocimiento de texto (OCR) lo que permite hacer búsquedas dentro de su contenido.

Los metadatos representan otro ofrecimiento de los portales digitales. Su contenido incluye información como títulos, fechas, creadores, descripciones físicas, y ubicaciones dentro de las colecciones. Sin embargo, con el advenimiento de la Inteligencia Artificial y del reconocimiento de manuscritos el uso de los metadatos para el usuario perderá relevancia en términos de búsqueda, aunque mantendrá su importancia para la organización y verificación de fuentes.

La principal función de los portales es la capacidad de descargar copias digitales de los objetos físicos. Esta funcionalidad permite al investigador obtener copias de alta resolución de documentos históricos, fotografías, mapas, planos, grabaciones sonoras, material fílmico, obras de arte, y otros materiales culturales albergados por las instituciones. La posibilidad de descargar estos recursos ha transformado la manera en que los investigadores, estudiantes y el público general interactúan con los archivos y bibliotecas y los documentos que esto albergan. Los usuarios pueden ahora acceder, guardar y analizar una amplia variedad de materiales que anteriormente requerían visitas presenciales a las instituciones. Esta capacidad de descarga se extiende a diversos formatos, desde documentos PDF hasta archivos de imagen en alta resolución, grabaciones de audio, videos y modelos tridimensionales de objetos.

Sin embargo, es importante señalar que cada institución establece sus propias políticas de descarga, que pueden incluir requisitos de registro, restricciones de uso, limitaciones por derechos de autor o la necesidad de solicitar permisos especiales para ciertos materiales. Además, la calidad y el formato de las descargas pueden variar significativamente entre instituciones, desde archivos básicos de baja resolución hasta reproducciones de calidad para

publicación, dependiendo de los recursos y políticas de cada institución. Esta funcionalidad viene acompañada de una responsabilidad metodológica importante, el dar crédito. El investigador debe mantener un registro detallado de la procedencia de cada documento descargado, incluyendo la URL de origen, la fecha de descarga, y cualquier información de catalogación relevante. La integridad en el trabajo académico exige el reconocimiento de las fuentes utilizadas. Cuando un investigador integra datos, estadísticas, gráficas, tablas o cualquier otro tipo de información que no sea de su propia creación, tiene la responsabilidad ética y profesional de documentar claramente su origen. Esta práctica no solo demuestra honestidad intelectual, sino que también fortalece la credibilidad del trabajo al permitir que otros investigadores puedan verificar y contrastar la información presentada. La documentación de fuentes debe ser precisa y completa, incluyendo todos los elementos necesarios para que los lectores puedan localizar y consultar el material original38. Al citar el material digital debe indicar su procedencia y el enlace URL del objeto.

El manejo sistemático de referencias bibliográficas en la investigación histórica digital ha evolucionado significativamente con el desarrollo de herramientas especializadas que trascienden las limitaciones de las tarjetas manuales o listas electrónicas en Word o Excel. Estas plataformas no solamente organizan las referencias, sino que transforman la manera en que los investigadores interactúan con sus fuentes, creando ecosistemas de investigación integrados que facilitan tanto el trabajo individual como la colaboración académica.

Zotero, disponible gratuitamente en www.zotero.org, representa una opción versátil para el investigador de historia puertorriqueña. Su naturaleza de código abierto garantiza su continuidad y desarrollo constante por una comunidad global de usuarios académicos. La herramienta permite la captura automática de metadatos directamente desde portales frecuentados por el investigador puertorriqueño como el “Portal de Archivos Españoles” (PARES), “Chronicling America”, “HathiTrust”, y la Biblioteca Digital del Caribe. Esta capacidad de captura automática resulta particularmente valiosa cuando se trabaja con colecciones extensas, permitiendo al

38 Ezequiel Ander-EGG. Técnicas de Investigación Social. Editorial Humanitas, Buenos Aires, 20ava edición, 1982. P. 428.

investigador concentrarse en el análisis en lugar de la transcripción manual de datos bibliográficos.

El sistema permite el almacenamiento de PDFs en la nube, aunque limitada a 300MB en la versión gratuita, permite mantener una biblioteca personal de documentos digitalizados accesible desde cualquier dispositivo. Para proyectos más extensos, Zotero permite vincular archivos almacenados en servicios externos como Google Drive o Dropbox, manteniendo la organización centralizada mientras se aprovecha el almacenamiento externo. La generación automática de citas en múltiples estilos académicos, incluyendo Chicago, MLA y APA, asegura la consistencia en las referencias a lo largo del trabajo investigativo.

Se pueden organizar los documentos por colecciones o etiquetas en Zotero. Un investigador trabajando sobre el movimiento obrero puertorriqueño podría crear colecciones separadas para cada década, con sub-colecciones para diferentes regiones geográficas, y utilizar etiquetas para marcar temas transversales como "huelgas", "legislación_laboral", o "migración". Además, el sistema permite añadir y mantener comentarios sobre cada documento o cita, lo que facilita conocer su contenido y posibilita buscarlos posteriormente.

Otro sistema que funciona de manera similar es Mendeley (www.mendeley.com). Este sistema ofrece un método distinto ya que combina el manejo de las referencias con su red social académica. Mendeley tiene un lector de PDF integrado con la función de anotar los documentos digitalizados. Las anotaciones pueden ser tan sencillas como resaltar un párrafo como añadir notas al margen y crear conexiones entre diferentes documentos o textos. Utilizando un modelo similar a la inteligencia artificial el sistema hace sugerencias automáticas de artículos relacionados, basadas en algoritmos que analizan el contenido de la biblioteca personal lo que pueden revelar conexiones entre diferentes áreas de investigación. Los chats privados de Mendeley facilitan la colaboración en proyectos de investigación sobre historia del Caribe, permitiendo compartir referencias, notas y documentos entre investigadores dispersos geográficamente.

La implementación de estas herramientas requiere el desarrollo de una estructura de organización consistente desde el inicio del proyecto. Se recomienda crear una colección o carpeta separada para cada capítulo o tema principal de la investigación, utilizando un sistema de etiquetas estandarizado que facilite la recuperación posterior de información. Las etiquetas deben ser descriptivas pero concisas, utilizando guiones bajos en lugar de espacios para mantener la consistencia. Por ejemplo: "fuente_primaria", "Puerto_Rico_sigloXIX", "manuscrito_AGPR", "periodico_ElMundo".

El campo "Extra" o "Notas" disponible en estas plataformas debe utilizarse sistemáticamente para registrar información de archivo que no encaja en los campos bibliográficos estándar. Por ejemplo, para un documento del Archivo General de Puerto Rico, se podría incluir: "AGPR, Fondo Gobernadores Españoles, Serie: Asuntos Políticos, Caja 123, Legajo 15". Esta práctica asegura que toda la información necesaria para localizar físicamente el documento original se preserve junto con la referencia digital.

Hacer backup o copias de resguardo de los documentos debe ser una disciplina del investigador para para proteger el trabajo investigativo. Se recomienda hacer copias de resguardo semanalmente, almacenando estas copias en múltiples lugares y en la nube.

Tipos de Portales

Para propósito de este trabajo hemos preparado una lista de los tipos de portales digitales que existen. Esta lista no inclusiva fue creada tomando en consideración nuestra experiencia en la investigación histórica. La clasificación presentada a continuación busca establecer las características distintivas de cada tipo de portal, reconociendo que pueden existir otras categorías o subtipos no contemplados en este análisis.

Ilustración 18- Tipos de Portales Digitales

ARCHIVOS DE DOCUMENTOS HISTÓRICOS

Estas plataformas digitales corresponden típicamente a instituciones que tienen la responsabilidad de preservar, organizar y difundir documentación histórica. En gran parte de los casos son instituciones gubernamentales, universitarias o institucionales. Como parte de su responsabilidad estas instituciones han creado portales para difundir el material que albergan permitiendo el acceso a fuentes primarias históricas a través de interfaces de búsqueda y consulta en línea.

Entre los portales principales para el investigador puertorriqueño se encuentran:

1. Archivo General de Puerto Rico

Enlaces:

https://www.icp.pr.gov/archivo-general/

https://www.coleccionesicp.pr.gov/ (portal de colecciones digitales)

Enlace Directo de Búsquedas:

https://coleccionesdigitalesagpr.icp.pr.gov/?start=0&limit=25&orderBy=recent&orderDir ection=desc&locale=es-PR

El Archivo General de Puerto Rico, adscrito al Instituto de Cultura Puertorriqueña, es la entidad responsable de custodiar y preservar los documentos históricos y oficiales de Puerto Rico. Su misión es salvaguardar el patrimonio documental de la isla, facilitando el acceso a investigadores, estudiantes y al público en general.

El portal de las Colecciones Digitales del Archivo General de Puerto Rico (basado en el sistema Omeka S) ofrece acceso en línea a una amplia variedad de documentos históricos y culturales de Puerto Rico. Este proyecto, iniciado en 2020 con el apoyo de la Fundación Andrew W. Mellon, busca preservar y facilitar el acceso a las colecciones del Archivo General de Puerto Rico (AGPR). En su primera fase, se han digitalizado más de 3,500 documentos y 190,000 páginas de manuscritos, periódicos, fotografías, gráficos, partituras y revistas. La plataforma permite realizarbúsquedas por palabras clave yaplicar filtros por colecciones, tipo de documento, idioma, fecha, tema y lugar.39

39 Para beneficio del investigador incluimos como anejo los metadatos disponibles a septiembre de 2024.

Ilustración 19- Portal del Archivo General de Puerto Rico

https://www.coleccionesicp.pr.gov/

Opciones de Filtros en el portal del Archivo General de Puerto Rico

Por colecciones- Este filtro te permite limitar tus resultados a colecciones específicas dentro del archivo.

Por Lugares- Permite filtrar los documentos por la ubicación geográfica a la que se refieren. Por ejemplo, podrías buscar documentos relacionados exclusivamente con "Puerto Rico" o con un municipio particular si esas categorías están disponibles.

Tipos de Objetos- Puede filtrar para ver solo "Fotografías", "Periódicos", "Textos", "Partituras", "Revistas", "Audio", "Imágenes en movimiento", o "Gráficos (grabados, dibujos)", entre otros.

Idioma- Permite seleccionar documentos según el idioma en el que están escritos, como "Español", "Inglés", "Francés" o "Italiano".

Fecha- Con este filtro, puedes acotar los resultados a un rango de tiempo específico. Por ejemplo, puedes buscar documentos creados entre los años "1850-1870" o "2000-2025" (o cualquier otro rango que el sistema ofrezca).

Temas- Este filtro te permite explorar documentos basándose en los temas o conceptos clave identificados por el archivero. Podrías buscar todo lo relacionado con "Alcaldes", "Nacionalismo", "Policía" o "Ferrocarriles", o por cualquier contenido temático.

Objeto Digital- Indica si el material está disponible en formato digital o no. Esto es útil si solo te interesan los recursos que puedes ver o descargar en línea.

Entidad o persona creadora- Este filtro es muy potente ya que te permite buscar documentos creados por una persona, institución u organización específica. Por ejemplo, podrías filtrar para ver solo los documentos generados por el "Municipio de San Juan" o por "Felisa Rincón de Gautier".

Entidad o persona colaboradora- Similar al anterior, pero se refiere a personas o entidades que han colaborado o contribuido al documento, sin ser necesariamente los creadores principales. Podrías encontrar trabajos donde haya colaborado "Rafael Andreu" o "Carlos Bernstein", por ejemplo.

2. Portal de Archivos Españoles (PARES)

Enlace: https://pares.cultura.gob.es/inicio.html

El Portal de Archivos Españoles (PARES) es una iniciativa del Ministerio de Cultura y Deporte de España que ofrece acceso en línea al patrimonio documental histórico español conservado en su red de archivos estatales. Este portal permite a usuarios de todo el mundo consultar descripciones y visualizar imágenes digitalizadas de documentos históricos, facilitando la investigación y difusión de la historia y cultura españolas. Entre los fondos disponibles, se destacan:

o Archivo General de Indias- Conserva documentos oficiales y correspondencia que detallan la administración y acontecimientos en Puerto Rico durante la época colonial.

o Archivo Histórico Nacional- Incluye registros sobre la gobernanza, economía y sociedad puertorriqueña bajo el dominio español.

o Archivo de la Corona de Aragón- Contiene documentos que, aunque centrados en la Corona de Aragón, pueden ofrecer información contextual sobre las políticas y relaciones que afectaron a Puerto Rico.

PARES mantiene una estructura jerárquica que refleja fielmente la organización administrativa colonial española. Esta estructura no es arbitraria, sino que preserva la lógica institucional bajo la cual se produjeron los documentos, permitiendo a los investigadores comprender el contexto administrativo e institucional de cada documento. Los materiales están organizados en fondos, series y unidades documentales que corresponden a las oficinas, ministerios y dependencias coloniales que generaron la documentación original. Esta organización facilita no solo localizar documentos específicos, sino también comprender las relaciones institucionales y los procesos administrativos del período colonial.

PARES permite a los usuarios buscar y consultar estos documentos digitalizados, facilitando la investigación y el estudio de la historia puertorriqueña. El Historiador Luis

R. Burset ofrece una excelente descripción de Pares en su ensayo El Portal de Archivos Españoles (PARES) como fuente de datos genealógicos para Puerto Rico40. En el ensayo

Burset describe a PARES como una herramienta fundamental para los genealogistas en Puerto Rico. En particular, destaca su utilidad para investigar el siglo XVII, un período para el que lamayoríade los registros eclesiásticos desaparecierondurante el ataque de Enrico a San Juan en 1625, y los que quedaron son escasos. Al utilizar los fondos de PARES, los investigadores pueden reconstruir estructuras familiares y acceder a información que de otro modo sería muy difícil de encontrar sin viajar a España.

Ilustración 20- Portal de Archivos Españoles (PARES) https://pares.cultura.gob.es/inicio.html

40 Luis R. Burset. El Portal de Archivos Españoles (PARES) como fuente de datos genealógicos para Puerto Rico. Recuperado de https://www.academia.edu/22155375/El_portal_PARES_como_fuente_de_datos_geneal%C3%B3gicos

Opciones de Filtros en PARES

Archives (Archivos)- Esta opción te permite filtrar los resultados por el archivo o institución donde se custodia el documento original. Por ejemplo, podrías seleccionar ver solo documentos del "Archivo General de la Administración" o del "Archivo Histórico Nacional". Esto es muy útil si sabes en qué archivo se encuentra la información que buscas.

Digitization (Digitalización)- Este filtro es crucial para determinar la disponibilidad digital de los documentos. Te permite distinguir entre elementos que han sido "Undigitized/Not Digitized" (no digitalizados) y los que sí están "Digitized" (digitalizados), lo que facilita el acceso directo a los materiales en línea.

Levels of description (Niveles de descripción)- Este filtro se refiere a la jerarquía archivística de los documentos. Los archivos se organizan en diferentes niveles (fondo, serie, unidad documental, etc.). Al usar este filtro, puedes especificar si quieres ver "Fondos", "Series" o "Unidades Documentales Compuestas" o "Simples", lo que te ayuda a navegar por la estructura organizativa del archivo.

Start date (Fecha de inicio) y End date (Fecha de fin)- Estos filtros te permiten acotar los resultados por el período de creación o relevancia de los documentos. Puedes especificar un siglo ("S.XVIII", "S.XIX", "S.XX") como fecha de inicio o fin, o incluso seleccionar "without date" (sin fecha) si buscas documentos sin una fecha definida.

Language (Idioma)- Permitefiltrarlos documentos por el idiomaen el que estánescritos, como "Español" o "Inglés". Es útil si buscas información en un idioma específico.

Alphabet (Alfabeto)- Aunque no es tan común en todos los portales, este filtro puede ser útil en archivos multilingües o con escrituras diversas. Aquí se puede seleccionar el "Alfabeto latino".

Writing type (Tipo de escritura)- Permite diferenciar los documentos según el tipo de escritura utilizada. Por ejemplo, puedes filtrar por "Humanística" o "Impresa", lo que puede ser relevante para estudios paleográficos o para encontrar documentos con formatos específicos.

Text (Texto)- Este es un campo de búsqueda de texto libre que te permite buscar palabras o frases específicas dentro del contenido de los documentos. La opción "Fields: All" (Campos: Todos) indica que buscará en todos los campos textuales del registro.

3. Archivo General de la Nación República Dominicana

Enlaces: https://agn.gob.do/ https://agn.gob.do/index.php/servicios/item/355-fondos-y-colecciones-digitales

El Archivo General de la Nación (AGN) es la institución archivística de la Republica Dominicana, encargada de custodiar, organizar, describir y conservar documentos que datan de la fundación de la República, la época colonial, y la historia moderna.

El AGN ofrece un servicio de consulta de documentos digitalizados a través de un portal de documentos digitales. Dicho servicio facilita el acceso a fondos y colecciones documentales digitalizados, permitiendo a investigadores, estudiantes y al público en general explorar el patrimonio documental del país. Por la estrecha relación de Puerto Rico y la Republica Dominicana este portal provee valiosa información sobre el siglo XIX y el XX incluyendo correspondencia, periódicos, y otros documentos de gran valor histórico.41

Ilustración 21- Portal del Archivo General de la Nación República Dominicana

https://agn.gob.do/

41 Para beneficio del investigador incluimos como anejo un resumen de los recursos documentales relacionados a Puerto Rico que alberga el AGN a septiembre de 2024.

4. Archivo Nacional de Dinamarca

Enlaces:

https://en.rigsarkivet.dk/

https://en.rigsarkivet.dk/news/new-path-to-sources-on-the-danish-west-indies/

El “Rigsarkivet”, o Archivo Nacional de Dinamarca, es la institución responsable de preservar y proporcionar acceso al patrimonio documental de Dinamarca. Su misión es salvaguardar documentos y datos que abarcan desde el siglo XII hasta la actualidad, provenientes tanto de entidades gubernamentales como de entidades privadas.

El archivo alberga la colección de documentos de St. Thomas y St. Croix que fueron digitalizados en el 2017 como parte del centenario de la venta de la Islas a los Estados Unidos. Este archivo posee una sección con guías y herramientas que permiten el acceso a registros de pasajeros, documentos oficiales entre el gobernador de Puerto Rico y las autoridades danesas.

El trabajar con el archivo digital del Rigsarkivet puede ser un poco complicado debido a la amplitud de sus fondos y a la organización particular de los documentos. Sin embargo, la guía que se incluye como anejo en este libro constituye una herramienta para orientarse dentro del sistema. Esta guía describe los fondos disponibles y el enlace directo a estos. Esto ayudará al investigador a localizar con mayor eficacia los registros de pasajeros, la correspondencia oficial y otros documentos relevantes.

Se incluye como un anejo el manual de referencia de los fondos disponibles el archivo danés.

Ilustración 22- Portal Archivo Nacional de Dinamarca (Colección Danish West Inidies) https://en.rigsarkivet.dk/news/new-path-to-sources-on-the-danish-west-indies/

5. Archivo Nacional Estados Unidos

Enlace: https://www.archives.gov/

Catalogo: https://catalog.archives.gov/

El Archivo Nacional de los Estados Unidos (National Archives and Records Administration, NARA) es la entidad responsable de preservar y proporcionar acceso a los documentos históricos y gubernamentales de los Estados Unidos. El archivo alberga documentos, récords legislativos, leyes aprobadas y debates legislativos, documentos del presidente, documentos judiciales, registros militares, censos y registros demográficos, mapas y planos, fotografías y grabaciones, y registros de inmigración y naturalización. Por nuestra relación política el archivo posee la documentación oficial de dicha relación y de las agencias federales a partir de 1898. Sin embargo, posee un sinnúmero de documentos relacionados a Puerto Rico como parte del proceso de relaciones exteriores con España durante el siglo XIX.

Ilustración 23- Portal del catalogo del Archivo Nacional de los Estados Unidos https://catalog.archives.gov/

6. Otros Portales

Los siguientes son archivos con documentación histórica digital sobre Puerto Rico:

Archivo Nacional Británico

https://www.nationalarchives.gov.uk/

Archivo del Historiador de la Habana

https://repositoriodigital.ohc.cu/s/repositoriodigital/page/inicio

Archivo Nacional de la Nación Colombia

https://archidocdigital.archivogeneral.gov.co/explore/agn

HEMEROTECAS DIGITALES

Las hemerotecas han sido tradicionalmente han sido repositorios importantes para la investigación histórica. Estos archivos especializados custodian periódicos, revistas y otras publicaciones periódicas que en el caso de Puerto Rico data de principios del Siglo XIX. En la era digital, este recurso documental es el que más ha experimentado una transformación que ha revolucionado la forma en que los historiadores acceden y analizan la información histórica. Las hemerotecas son las que han producido la mayor cantidad de documentos en formato digital ya que en muchos archivos sus colecciones fueron microfilmadas y la conversión de este medio análogo a la digital es uno muy rápido y eficiente.

La implementación de la tecnología de Reconocimiento Óptico de Caracteres (OCR) ha marcado un antes y un después en la funcionalidad de las hemerotecas digitales. Esta innovación tecnológica permite que se lleven a cabo búsquedas textuales dentro de los documentos digitalizados, localizando de manera inmediata la información específica en grandes volúmenes de texto. Este avance tecnológico ha establecido un nuevo paradigma en la investigación histórica, transformando radicalmente la metodología tradicional de búsqueda y análisis documental. La digitalización y el OCR han aportado numerosas ventajas para los investigadores, incluyendo una mayor accesibilidad al permitir la consulta de documentos desde cualquier ubicación con conexión a internet, una mayor eficiencia al reducir significativamente el tiempo de búsqueda y consulta, y una mejor preservación al proteger los documentos originales de la manipulación física.

En el contexto de la investigación sobre Puerto Rico, las hemerotecas digitales se han convertido en herramientas indispensables. La capacidad de utilizar palabras clave para localizar material relacionado con la isla ha facilitado enormemente la labor investigativa. Entre las hemerotecas digitales más relevantes para la investigación sobre Puerto Rico se encuentran:

1. Chronicling America

Enlaces: https://chroniclingamerica.loc.gov/ https://www.loc.gov/collections/chronicling-america/about-this-collection/

El portal Chronicling America es una iniciativa conjunta de la Biblioteca del Congreso de los Estados Unidos y la Fundación Nacional para las Humanidades, que ofrece acceso gratuito a una vasta colección de periódicos históricos de los Estados Unidos y sus territorios. El portal posee periódicos que abarcan desde 1756 hasta 1963, lo que permite un periodo de más de 200 años de historia. Varios periódicos de Puerto Rico están albergados en el sistema incluyendo:

o El Boletín Mercantil (8,581 ediciones) desde el 1 enero de 1851 hasta el 30 de abril de 1930.

o El Imparcial (1,464 ediciones) desde el 1 de noviembre de 1918 hasta el 31 de diciembre de 1923

o El Mundo (2,092 ediciones) desde el 17 de febrero de 1919 hasta 30 de septiembre de 1925.

o Gaceta de Puerto Rico (10,643 ediciones) desde 2 de enero de 1836 hasta 30 de septiembre de 1902.

o La Correspondencia de Puerto Rico (6,527 ediciones) desde el 25 de diciembre de 1890 hasta el 31 de diciembre de 1910.

o La Democracia (4,244 ediciones) desde el 7 de julio de 1891 hasta el 31 de diciembre de 1907.

La búsqueda avanzada en Chronicling America puede ofrecer al usuario recursos que no se obtienen de la búsqueda básica. El menú ofrece cinco tipos de búsqueda diferentes que se explican en el diagrama a continuación:

Búsqueda Avanzada en Chronicling America

1. All of these words (Todas estas palabras)

1. Busca periódicos que contengan TODAS las palabras ingresadas

2. Equivale a usar AND entre cada término

3. Ejemplo: si buscas "Grito Lares independencia", encontrará páginas que contengan las tres palabras

2. Any of these words (Cualquiera de estas palabras)

4. Busca páginas que contengan AL MENOS UNA de las palabras

5. Equivale a usar OR entre términos

6. Ejemplo: "ELA" o "Colonia" encontrará páginas con cualquiera de los dos términos

3. This exact phrase (Esta frase exacta) - Seleccionada actualmente

7. Busca la frase completa tal como está escrita

8. Las palabras deben aparecer juntas y en el mismo orden

9. Equivale a poner la búsqueda entre comillas

Ejemplo PR: "Estado Libre Asociado" - encontrará referencias exactas al estatus establecido en 1952

Ejemplo PR: "pueblo colonizado" - para documentos que usen específicamente esta descripción

4. These words within 5 words of each other (los términos de búsqueda a 5 palabras de distancia)

10. Busca términos que aparezcan cerca uno del otro

11. Útil para encontrar conceptos relacionados que no forman una frase exacta y que se encuentran 5 palabras de distancia

12. Ejemplo PR: "Insurrecto" y "Colombia" - encontrará textos donde se podría estar incluyendo el ataque de insurrectos colombianos en el siglo XIX.

5. These words within 10 words of each other (Estas palabras a 10 palabras de distancia)

13. Similar a la anterior pero con 10 palabras de distancia

Operador Booleano AND

El AND visible entre los campos de búsqueda indica que:

14. Se pueden combinar múltiples criterios de búsqueda

15. Los resultados deben cumplir AMBAS condiciones simultáneamente

16. Permite crear búsquedas más precisas y específicas

17. Esta combinación de opciones permite realizar búsquedas muy refinadas en la colección de periódicos históricos.

Ilustración 24- Portal de la búsqueda avanzada de Chronicling America https://www.loc.gov/collections/chronicling-america/

2. Digital Library of the Caribbean (DLOC)

Enlace: https://www.dloc.com/

La Biblioteca Digital del Caribe (dLOC) es una colaboración internacional organizada en el 2004 compuesta de Universidades, Bibliotecas y Archivos con el objetivo de proporcionar acceso abierto a materiales culturales, históricos y científicos del Caribe. Su hemeroteca digital incluye una variedad de periódicos y revistas históricas de la región, permitiendo a los usuarios explorar publicaciones que abarcan desde el siglo XIX hasta la actualidad. En el caso de Puerto Rico la Universidad de Puerto Rico a colaborado al proporcionar micropelículas que han sido digitalizadas para el proyecto de las siguientes publicaciones:

Periódicos identificados por DLOC como aportados por la Universidad de Puerto Rico Gaceta de Puerto-Rico 10,793 ediciones. El Mundo 5,150 ediciones. Correspondencia de Puerto Rico 9,069 ediciones.

Boletín mercantil de Puerto Rico 8,436 ediciones.

El Tiempo 3,472 ediciones.

Puerto Rico ilustrado 2,484 ediciones. La Democracia 4,245 ediciones.

El Buscapié 1,459 ediciones. Unión obrera 1,961 ediciones.

Puerto Rico World Journal 1,584 ediciones. Boletín eclesiástico de la Diócesis de PuertoRico 960 ediciones. San Juan News 1,172 ediciones.

El País 1,167 ediciones. Revista de Puerto-Rico 681 ediciones. Imparcial 760 ediciones. Ideal católico 745 ediciones. El unionista 445 ediciones. Ilustración española y americana 679 ediciones.

La discusión 478 ediciones. El liberal 339 ediciones. El diario de Puerto Rico 343 ediciones. El regionalista 341 ediciones. El territorio 232 ediciones. La razón 263 ediciones.

El Fénix 236 ediciones. Conciencia Libre 188 ediciones. El Diluvio 208 ediciones.

La instrucción pública 200 ediciones. El Progreso 141 ediciones. La Libertad 152 ediciones. La Balanza 144 ediciones. El Agente 132 ediciones. Vida Alegre 134 ediciones. The Vieques Times 133 ediciones. Gráfico 121 ediciones. El Investigador 128 ediciones.

El magisterio de Puerto-Rico 128 ediciones. El Deber 93 ediciones. La revista blanca 107 ediciones.

The Puerto Rico Herald 103

La Bruja 75 ediciones. Diario económico de Puerto Rico 84 ediciones.

Azucena 82 ediciones. El Nuevo Día 62 Juan Bobo 66 ediciones. El globo 65 ediciones. Heraldo Español 45 ediciones. El Avisador 56 ediciones.

Revista Mercantil 52 ediciones. Correo de Puerto Rico 36 ediciones. El combate 40 ediciones. Isla Nena 39 ediciones. La Razón 29 ediciones. La Prensa 36 ediciones.

Bandera Americana 30 ediciones. El pequeño diario 23 ediciones. El derecho 28 ediciones.

El Porvenir de Borinquén 28 ediciones. El Cautivo 17 ediciones. Página del Este 22 ediciones.

Página de Cheo 20 ediciones.

Revista de las Antillas 15 ediciones. El Domingo 14 ediciones.

Periódicos identificados por DLOC como aportados por la Universidad de Puerto Rico Claridad 15 ediciones. Don Simplicio 12 ediciones. Asimilista 11 ediciones. El Ensayo 13 ediciones. Primera Hora 10 ediciones. Balanza Mercantil de la Isla de Puerto-Rico 9 ediciones.

El Nuevo Vieques 10 ediciones. Heraldo del trabajo 9 ediciones. La verdad 9 ediciones. El Pueblo 9 ediciones. Integridad nacional 9 ediciones. El Vocero 8 ediciones. Abeja 9 ediciones. El Publicista 8 ediciones. La bomba 8 ediciones.

El Mercurio 8 ediciones. El Noticiero 6 ediciones. Revista Puertorriqueña 6 ediciones. La Voz de la Patria 8 ediciones. Don Cándido 5 ediciones. El Tacón de la Chancleta 5 ediciones. Diario del Oeste 5 ediciones. La Perla del Sur 5 ediciones. El Porvenir 4 ediciones.

El Duende 5 ediciones. Eco de las lomas 4 ediciones. La Propaganda 3 ediciones. Brisas del Caribe 4 ediciones. El Republicano puro 3 ediciones. El Comercio 2 ediciones.

La Tribuna 4 ediciones. Ecos del Tanamá 2 ediciones. La Araña 2 ediciones. La Unidad Nacional 3 ediciones. La Estrella 2 ediciones. Es Noticia 1 edición.

El Látigo 2 ediciones. El Visitante 1 edición. Escenario 1 edición.

La Unión 2 ediciones. Vieques Breeze 1 edición.

3. El Mundo

Enlace: https://gpa.eastview.com/crl/elmundo/

El Mundo Digital Archive es una colección de acceso abierto que ofrece la digitalización completa del periódico puertorriqueño El Mundo, publicado desde 1919 hasta 1990. Esta colección es parte del Global Press Archive (GPA) el cual es una iniciativa de East View Information Services quienes buscan crear la colección más completa de fuentes de noticias digitales de todo el mundo. Este archivo incluye más de 20,000 ediciones y aproximadamente 675,000 páginas, proporcionando una visión detallada de la historia y cultura de Puerto Rico durante gran parte del siglo XX. El portal permite, luego del registro del usuario, bajar los archivos en formato de PDF.

Ilustración 26- Portal del Periódico El Mundo https://gpa.eastview.com/crl/elmundo/

4. El Imparcial

Enlace: https://gpa.eastview.com/eida/

El Archivo Digital de El Imparcial es una colección de acceso abierto que ofrece la digitalización completa del periódico puertorriqueño El Imparcial, publicado desde 1937 hasta 1968. Esta colección es parte del Global Press Archive (GPA), una iniciativa de East View Information Services que busca crear la colección más completa de fuentes de noticias digitales de todo el mundo.

Este archivo incluye miles de ediciones, proporcionando una visión detallada de la historia y cultura de Puerto Rico durante la mitad del siglo XX. El portal permite, luego del registro del usuario, descargar los archivos en formato PDF.

Ilustración 27- Portal del Periódico El Imparcial https://gpa.eastview.com/eida/

5. Prensa Histórica (Puerto Rico)

Enlace: www.prensahistorica.org

El portal Prensa Histórica es una iniciativa del Archivo Digital Nacional de Puerto Rico que busca construir la memoria digital del país al ofrecer acceso en línea a una amplia colección de periódicos y revistas históricas puertorriqueñas. Este recurso permite a investigadores, estudiantes y al público en general explorar y estudiar documentos que reflejan la evolución histórica, cultural y social de Puerto Rico. El portal posee los siguientes recursos:

Alma Latina 113 Ediciones

Asomante 122 Ediciones

Diálogo 141 Ediciones El Agente Negocios 71 Ediciones

El Carnaval 230 Ediciones El Cautivo 16 Ediciones

El Deber 89 Ediciones El Domingo 14 Ediciones

El Fénix 207 Ediciones

El Imparcial 1464 Ediciones

El País 11 Ediciones El Sol 205 Ediciones

Gaceta de Puerto Rico 10010

Ediciones

Jaccuse 159 Ediciones

La Educación 114 Ediciones

Heraldo de la Mujer 9 Ediciones

La Bruja 89 Ediciones

La Junta 4 Ediciones

La Razón 148 Ediciones La Torre 19 Ediciones

Periódico El Porvenir Social 17 Ediciones

Periódico St. Croix Avis 315 Ediciones

Puerto Rico Evangélico 145 Ediciones

Puerto Rico Living 15 Ediciones

Revista Claridad 348 Ediciones

Revista Fuentes 8 Ediciones

Revista Mercantil 20 Ediciones

Sanct Thomæ Tidende 304 Ediciones

Unión Obrera 288 Ediciones

Periódico La Hora 20 Ediciones

Prisma 11 Ediciones

Puerto Rico Herald 75 Ediciones

Revista AMG 17 Ediciones

Revista El Agricultor 29 Ediciones

Revista Gráfico 21 Ediciones

Revista Puertorriqueña 2 Ediciones

Territorio 10 Ediciones

Diario Económico de Puerto Rico

52 Ediciones

El Buscapié 542 Ediciones

El Clamor del País 358 Ediciones

El Duende 45 Ediciones

El Investigador 101 Ediciones

Ensayo Obrero 37 Ediciones

Ilustración Puertorriqueña 60 Ediciones

La Democracia 3197 Ediciones

La Libertad 76 Ediciones

Liberal 148 Ediciones

Periódico Patria 591 Ediciones

Progreso 149 Ediciones

Puerto Rico Ilustrado 1679 Ediciones

Revista Blanca 145 Ediciones

Revista Escalera 12 Ediciones

Revista Guajana 10 Ediciones

Revista del Instituto de Cultura

Puertorriqueña 169 Ediciones

Teve Guía 17 Ediciones

Ilustración 28- Portal de Prensa Histórica https://www.prensahistorica.org/

6. Hemeroteca de la Biblioteca Digital de España

Enlace: https://www.bne.es/es/catalogos/hemeroteca-digital

La Hemeroteca Digital de la Biblioteca Nacional de España es una plataforma en línea que ofrece acceso gratuito a una amplia colección de prensa histórica española. Iniciada en marzo de 2007, comenzó con 143 títulos de periódicos y revistas y ha crecido significativamente desde entonces. La colección abarca desde los inicios de la prensa en España hasta mediados del siglo XX, incluyendo publicaciones políticas, satíricas, científicas, religiosas, deportivas y literarias. Los documentos están disponibles en formato PDF con reconocimiento óptico de caracteres (OCR), lo que facilita la búsqueda de texto completo dentro de las publicaciones. Posee varios periódicos de Puerto Rico incluyendo los siguientes títulos:

o El Compilador de Puerto Rico

o El Cronista (Ponce)

o El Diario popular (Mayagüez)

o El Fomento de Puerto-Rico (Puerto-Rico. 1863)

o Gaceta de Puerto-Rico

o Las Noticias de Puerto Rico

o Las Noticias (San Juan)

o El País (San Juan de Puerto Rico)

o Revista de Puerto-Rico

Ilustración 29- Portal de la Hemeroteca Digital de la Biblioteca Nacional de España https://www.bne.es/es/catalogos/hemeroteca-digital

Biblioteca Virtual de Prensa Histórica (España)

Enlace: https://prensahistorica.mcu.es/es/inicio/inicio.do

La Biblioteca Virtual de Prensa Histórica (BVPH) es una hemeroteca digital administrada por la Subdirección General de Coordinación Bibliotecaria del Ministerio de Cultura y Deporte de España. Esta hemeroteca ofrece acceso libre y gratuito a un extenso listado de periódicos históricos y revistas culturales desde el siglo XVIII hasta mediados del siglo XX. La colección incluye más de 1.3 millones de ediciones de periódicos y revistas, provenientes de 103 bibliotecas españolas, sumando aproximadamente 10 millones de páginas digitalizadas. Entre los periódicos albergados hay 453,180 menciones de Puerto Rico.

Ilustración 30- Biblioteca Virtual de Prensa Histórica https://prensahistorica.mcu.es/es/inicio/inicio.do

BIBLIOTECAS DIGITALES

Muchas bibliotecas alrededor del mundo han digitalizado sus colecciones y ofrecen a los investigadores los libros y publicaciones que albergan. Debido a las limitaciones de derechos de autor solamente están disponibles aquellos recursos que se encuentran en dominio público o donde sus autores han dado autorización para su puesta en línea. Al igual que con las hemerotecas digitales muchos portales de bibliotecas digitales permiten la búsqueda dentro de los libros.

• Biblioteca Digital Puertorriqueña de la Universidad de Puerto Rico

Enlace: https://upr.contentdm.oclc.org/

Este repositorio del Recinto de Rio Piedras de la Universidad de Puerto Rico es parte de las iniciativas de la Biblioteca Digital Puertorriqueña dirigida por el Prof. Julio Mercado. El repositorio ofrece imágenes y textos relacionados con la historia y la cultura puertorriqueña, incluyendo caricaturas, carteles, dibujos, fotografías, mapas, manuscritos y libros. La interface permite realizar búsquedas detalladas por autor, título, tema y otros criterios específicos. Además, el sistema permite la visualización en línea de los documentos y, en muchoscasos, ladescargalos mismos. Acontinuación, se presenta una descripción de algunas de las colecciones disponibles en la Biblioteca Digital Puertorriqueña de la Universidad de Puerto Rico:

• Periódicos Históricos de Puerto Rico- Presenta una selección de periódicos históricos publicados en Puerto Rico, digitalizados en colaboración con el National Digital Newspaper Program. La colección abarca el periodo entre 1836 y 1922.

• Archivo Fotográfico El Mundo (General)- Contiene una muestra de imágenes fotográficas del archivo del periódico El Mundo, adquirido en 1991 por la Universidad de Puerto Rico, que documenta gráficamente la historia de Puerto Rico y el mundo en el siglo XX.

• Archivo Fotográfico El Mundo 1940-1968- Esta colección muestra alrededor de 4,000 fotografías sobre la transformación de Puerto Rico de una sociedad agrícola a una industrial. Las fotos reflejan temas políticos, sociales y culturales, ofreciendo una visión profunda de la isla en este periodo.

• Fotografías de Atilio Moscioni Chesi (1898-1917)- En esta colección fotográfica de 267 objetos se presentan imágenes de estructuras como escuelas y centrales azucareras, capturadas por el fotógrafo italiano Atilio Moscioni Chesi.

• Fotografía de Arturo Melero- Esta colección destaca la documentación visual de la danza en Puerto Rico durante cuatro décadas, capturando presentaciones de compañías locales e internacionales. Las imágenes fueron tomadas por el fotógrafo puertorriqueño Arturo Melero. El total de imágenes digitales son 2,905 de un total de 30,000 que posee la colección análoga.

• Dibujos de Mario Brau-Contiene dibujos del caricaturistaMario Brau, que ofrecen una perspectiva satírica de la vida político-social de Puerto Rico a principios del siglo XX. Incluye publicaciones en Puerto Rico Ilustrado y otras obras significativas. La colección digital consta de 204 imágenes.

• Caricaturas- Esta colección muestra 1,127 caricaturas editoriales publicadas en el periódico El Mundo entre 1978 y 1990, realizadas por Miche Medina, y presenta comentarios gráficos sobre temas políticos, económicos y sociales.

• Carteles Puertorriqueños- Explora el desarrollo del cartel como expresión artística en Puerto Rico, especialmente en las décadas de 1930 y 1940, proporcionando una visión cultural y social de la isla. La colección posee carteles auspiciados por la División de Educación a la Comunidad (DIVEDCO) de los principales artistas gráficos puertorriqueños y del extranjero del siglo XX incluyendo a: Lorenzo Homar, Isabel Bernal, Rafael Tufiño, Julio Rosado del Valle, Irene y Jack Delano. Las 488 imágenes de los carteles, gran parte de ellas en color, están disponibles para descarga.

• Grabados- Una serie de 22 grabados creados en conmemoración del centenario de la abolición de la esclavitud en Puerto Rico (1873-1973), realizada por destacados artistas puertorriqueños como Myrna Báez y Lorenzo Homar.

• Mapas Raros- Recoge 79 mapas históricos y valiosos preparados entre los siglos XVI y XX, que ofrecen información sobre la evolución geográfica y política de Puerto Rico y el Caribe.

• Tarjetas Postales- La Biblioteca Digital Puertorriqueña ofrece en esta colección 925 imágenes de la antigua colección de tarjetas postales de Humberto Costa. Incluye tarjetas postales en blanco y negro, sepia y color, producidas entre 1900 y 1969, que muestran la vida cotidiana, el paisaje y los cambios sociales en Puerto Rico.

• Manuscritos- Esta colección digital incluye 186 manuscritos de Ana Roqué de Duprey y José De Diego, que aportan documentos históricos sobre la educación, el feminismo y la vida política en Puerto Rico. En esta colección están incluidos algunos de los

Manuscritos del militar estadounidense William H. Armstrong. Estos manuscritos incluyen fotografías, dibujos y descripciones de los municipios de Puerto Rico a comienzo del siglo XX.

• Puerto Rico Reconstruction Administration (PRRA)- Un total de 465 Fotografías documentandoproyectos de infraestructuray mejoras sociales en PuertoRicodurante los años 1930, como parte de los esfuerzos de la PRRA bajo el New Deal de Franklin D. Roosevelt.

• Doce Historias de la Biblioteca de la UPR- Presenta historias publicadas en El Mundo entre 1950 y 1980 sobre la Biblioteca de la Universidad de Puerto Rico y su comunidad, digitalizadas para promover la investigación histórica.

• Jaime Benítez - Una colección de 664 fotografías del archivo de El Mundo que documenta la vida y obra de Jaime Benítez, rector del Recinto de Río Piedras y presidente de la Universidad de Puerto Rico.

• El Mundo a Color- Recoge 2,949 fotografías en color del Puerto Rico de 1985 a 1990, capturadas en la última etapa de publicación de El Mundo.

Ilustración 31- Portal de la Biblioteca Digital Puertorriqueña de la Universidad de Puerto Rico https://upr.contentdm.oclc.org/

• Biblioteca Digital Hispánica de la Biblioteca Nacional de España

Enlace: https://www.bne.es/es/catalogos/biblioteca-digital-hispanica

La Biblioteca Digital Hispánica (BDH) es la biblioteca digital de la Biblioteca Nacional de España (BNE), que ofrece acceso libre y gratuito a miles de documentos digitalizados.

Entre estos se incluyen libros impresos, manuscritos, dibujos, grabados, folletos, carteles, fotografías, mapas, atlas, partituras, prensa histórica y grabaciones sonoras. Contiene 9,817 recursos con menciones directas de Puerto Rico desglosados de la siguiente manera:

• 4,90 revistas

• 4,722 libros

• 62 mapas

• 46 manuscritos

• 38 partituras

• 32 grabados

• 12 grabaciones

Ilustración 32- Portal de la Biblioteca Digital Hispánica de la Biblioteca Nacional de España

• Biblioteca Virtual de Defensa del Ministerio de Defensa de España

Enlace: https://bibliotecavirtual.defensa.gob.es/BVMDefensa/es/inicio/inicio.do

La Biblioteca Virtual de Defensa (BVD) es una iniciativa del Ministerio de Defensa de España que ofrece acceso en línea a reproducciones digitales de los fondos custodiados en archivos, bibliotecas y museos militares. Su objetivo es difundir el patrimonio cultural del Ministerio y facilitar la investigación sobre la actividad científica, cultural y formativa de las Fuerzas Armadas a lo largo de distintas épocas. El portal ofrece documentos digitales como libros y manuscritos, materiales cartográficos, dibujos, fotografías, partituras y piezas de museos. El sistema permite al investigados las búsquedas por títulos, autores, lugares y materias, facilitando la localización de documentos específicos. Su colección cartográfica y de planos de Puerto Rico es muy amplia. El sistema contiene referencia a 1,676 objetos digitales de Puerto Rico desde 1652 hasta el 2020. Las imágenes son de buena calidad y el sistema permite la descarga de los objetos digitales.

Ilustración 33- Portal de la Biblioteca Virtual de Defensa https://bibliotecavirtual.defensa.gob.es/BVMDefensa/es/inicio/inicio.do

• HathiTrust

Enlace: https://www.hathitrust.org/

El HathiTrust es una colección masiva de libros y documentos digitales agrupados por una colaboración de instituciones académicas y de investigación. El portal fue creado en 2008, con una misión de recopilar, organizar, preservar y compartir el registro del conocimiento humano, asegurando su disponibilidad para futuras generaciones.

A través del portal el investigador puede acceder una colección digital de 18 millones de títulos digitalizados de bibliotecas de todo el mundo. El interfaz permite búsqueda detalladas, incluyendo búsqueda por texto completo en los documentos y libros disponibles. HathiTrust permite a cualquier usuario leer títulos disponibles en el dominio público o bajo licencias de acceso abierto. Sin embargo, los títulos restringidos por leyes de derechos de autor no están disponibles para lectura o descarga general. Los usuarios de bibliotecas miembros de Hathi Trust tienen opciones de acceso adicionales.

La oferta de documentos relacionados a Puerto Rico es amplia con 1,600,448 objetos en sus registros y 559,284 objetos para revisión publica (algunos duplicados por problemas de catalogación) con fechas de publicación desde 1880 hasta 1989.

Ilustración 34- Portal Hathi Trust https://www.hathitrust.org/

• Biblioteca Digital del Archivo General de la Nación (República Dominicana)

Enlace: https://colecciones.agn.gob.do/opac/index.php?codopac=OUDIG

La Biblioteca Digital Dominicana es una iniciativa del Archivo General de la Nación (AGN) de la República Dominicana que ofrece acceso gratuito a más de 12,300 libros dominicanos y 2,160 de estos hacen mención de Puerto Rico. Esta colección abarca una amplia variedad de temas, con especial énfasis en las ciencias sociales y la historia. Los usuarios pueden consultar y descargar los libros directamente desde la plataforma digital, sin costo alguno. El interfaz de búsqueda es intuitivo pero el módulo de descarga requiere un poco de trabajo. Sin embargo, una vez que se conoce el mismo el usuario podrá buscar y descargar libros por título, autor, materia y fecha al igual que hacer búsquedas libres en el texto de los documentos.

Ilustración 35- Portal Biblioteca Digital del Archivo General de la Nación

• Biblioteca Nacional de Francia

Enlace: https://gallica.bnf.fr/

Gallica es la biblioteca digital de la Biblioteca Nacional de Francia (BnF), que ofrece acceso gratuito a millones de documentos digitalizados desde 1997. Su colección incluye libros, manuscritos, mapas, imágenes, prensa, grabaciones sonoras, partituras y objetos, abarcando diversas épocas y temáticas. El sistema permite el acceso en línea y la búsqueda libre en los textos de los periódicos y libros, y los usuarios pueden consultar y descargar documentos directamente desde la plataforma digital. Las colecciones de albergadas por Gallica abarcan una amplia variedad de temas, incluyendo literatura, historia, ciencias, artes y más.

Sus colecciones albergan gran cantidad de material de Puerto Rico (2,770 objetos) y según su catálogo este es el material sobre la Isla:

1. 1,353 revistas o periódicos

2. 1,307 libros

3. 63 imágenes

4. 19 mapas

5. 16 grabaciones

6. 10 videos

7. 2 manuscritos

Sin embargo, la búsqueda del término “Porto Rico” nos expande la cantidad de objetos disponibles a 8,685 desglosados de la siguiente manera:

8. 5,115 libros

9. 3,400 revistas o periódicos

10. 61 mapas

11. 34 grabaciones

12. 16 objetos de museo

13. 15 partituras

14. 14 imágenes

15. 11 manuscritos

Ilustración 36- Portal Biblioteca Nacional de Francia https://gallica.bnf.fr/

MAPOTECAS DIGITALES

Una mapoteca es el lugar destinado al almacenamiento y conservación de mapas, planos y documentos cartográficos. En las mapotecas los usuarios pueden obtener acceso a planos, mapas, fotografías aéreas, y otros objetos gráficos para investigación y análisis. En las mapotecas digitales se almacenan mapas y otro material cartográfico que permiten visualizar de manera rápida las representaciones geográficas del presente y el pasado.

Los mapas digitales son utilizados diariamente por gran parte de la población en herramientas como Google Earth, Google Maps, Apple Maps, Waze, ect. Estas herramientas muestran acceso a imágenes satelitales, mapas y fotografías aéreas de diferentes épocas que pueden asistir al investigador a localizar lugares y entender la transformación del paisaje urbano.

• Archivo Digital Nacional de Puerto Rico

Enlace: https://www.archivonacional.com/ https://archivonacional.com/Collection/AGPR.Mapoteca/Default.aspx?t=16SlqMIf6

El Archivo Digital Nacional de Puerto Rico probablemente posee la colección más amplia de mapas y planos correspondientes a Puerto Rico. En su portal de www.archivonacional.com se pueden accedermiles de mapas y planos incluyendo los del Centro Geográfico del Ejercito de España, La Mapoteca del Archivo General de Puerto Rico (incluyendo los fondos mapoteca general, Rio Piedras y Arecibo), los planos de Archivo Histórico Municipal de Caguas-Abelardo Díaz Alfaro, los Planos de la Colección Haydee Reichard, los cuadrángulos topográficos del Servicio Geológico de los Estados Unidos y otras colecciones cartográficas.

En Puerto Rico desde el año 2014 el Archivo Digital Nacional de Puerto Rico hizo disponible los mapas y planos correspondientes a la mapoteca del Archivo General de Puerto Rico.

La siguiente es una breve descripción de las colecciones que alberga el Archivo Digital Nacional de Puerto Rico:

• Archivo General de Puerto Rico Mapoteca 42 - La mapoteca es una colección especializada que contienen mapas, planos y dibujos de gran formato. Esta documentación proviene de diversos fondos y colecciones del Archivo General de Puerto Rico y de colección públicas y privadas. Los objetos que contiene esta colección son los siguiente:

Mapoteca- 991 juegos de planos

Mapoteca Arecibo- 186 juegos de Planos

Mapoteca Rio Piedras- 19 juegos de planos.

42 Recuperado de https://www.iberarchivos.org/wp-content/uploads/2014/12/2009-180.pdf

Ilustración 37- Portal de Mapoteca Archivo Digital Nacional de Puerto Rico

PORTALES HÍBRIDOS

Los portales híbridos combinan múltiples tipos de materiales digitales en un solo sistema de acceso, permitiendo la consulta simultánea de diversos formatos de documentos históricos (manuscritos, ensayos, mapas, audio, etc.). Esta integración facilita a los investigadores acceder de manera centralizada y organizada una amplia gama de recursos documentales desde una sola búsqueda. Últimamente muchas bibliotecas y archivos se tienen características de portales híbridos ya que combinan distintos tipos documentos históricos digitales. Sin embargo, hemos querido definir esto como una categoría separada e incluir en ella los portales más importantes y significativos que incluyen:

• Biblioteca Virtual de Puerto Rico

Enlace: http://bibliotecavirtualpr.com/

El Decano del ofrecimiento digital hibrido en Puerto Rico es la Biblioteca Virtual de Puerto Rico del Profesor Javier Almeyda (http://bibliotecavirtualpr.com/). Desde el año 1997 Almeyda ha brindado al investigador puertorriqueño y del extranjero un lugar para encontrar material digitalizado relevante a Puerto Rico. En este portal se combinan la difusión de recursos bibliográficos y documentos relacionados con la historia, cultura puertorriqueña y de la comunidad universitaria. Desde hace más de 25 años la Biblioteca Virtual de Puerto Rico ha sido el portal obligado de muchos investigadores donde pueden acceder libros, revistas, periódicos y otros documentos históricos. El sitio se actualiza regularmente con nuevas publicaciones y recursos, proporcionando a los usuarios una herramienta valiosa para la investigación y el aprendizaje sobre Puerto Rico.

Ilustración 38- Portal de Biblioteca Virtual de Puerto Rico

• Archivo Digital Nacional de Puerto Rico

Enlace: https://www.archivonacional.com/?t=16SlwZud.

El Archivo Digital Nacional de Puerto Rico (ADNPR), es una iniciativa privada que busca democratizar y facilitar el acceso a información relacionada con Puerto Rico, recopilada de archivos públicos y privados. Su misión es la difusión rápida y gratuita de documentos históricos y culturales a través de plataformas digitales y la web. A diferencia de los archivos tradicionales, que se centran en la conservación física de los fondos, el ADNPR se enfoca en la diseminación de la información digitalizada. ADNPR ha establecido acuerdos de colaboración con diversas instituciones y propietarios de colecciones privadas, asegurando que todo el material digitalizado esté disponible gratuitamente en su sitio web. Las colecciones que alberga son variadas e incluye:

Colección Haydée Richard

El Archivo Histórico de Aguadilla es el depósito de fuentes primarias y secundarias de la historiadora Oficial del Municipio, Haydée Reichard de Cancio. Esta colección posee documentos que datan del siglo XVIII hasta el presente. Los documentos de esta colección son vitales para el estudio del Municipio de Aguadilla, y de la Zona Oeste de Puerto Rico.

Entre los documentos se encuentran periódicos, planos, libros, documentos la mayoría de ellos inéditos y de gran valor histórico. A lo largo de varias décadas, la Dra. Reichard ha venido reuniendo un importante acervo archivístico, fundamentalmente recibido mediante donaciones personales y familiares. En el año 2015 se inició este proyecto que comienza a reubicar y organizar estos materiales de manera digital para hacerlos disponibles al público.

Archivo Histórico Municipal Junqueño

El Archivo Histórico de Juncos custodia un sin número de documentos que fueron digitalizados en el Archivo General de Puerto Rico. Todos los documentos de este repositorio digital provienen de varios fondos: Obras Públicas, Departamento Hacienda (Fotografía Aérea, Mapas Catastrales, Registro de Tasación Propiedad 1905-1951), Municipio de Juncos, Judicial (fuera de consulta fisica en el Archivo General), Gobernadores Españoles y Diputación Provincial. Cada fondo comprende de unas series y subseries debidamente organizadas las cuales pueden ser accesadas a través de este sistema.

Documentos del Centro Geográfico del Ejército

Los documentos de esta colección fueron digitalizados como parte de un acuerdo entre la Oficina del Historiador Oficial de Puerto Rico y el Ministerio de Defensa de España. La colección contiene la documentación relativa a Puerto Rico conservada en el Archivo Cartográfico y de Estudios Geográficos. Su volumen total asciende a 492 unidades documentales, de las cuales 108 pertenecen a la serie de Cartografía Exenta de Puerto Rico, y las 384 unidades restantes al fondo denominado Mapa Militar de la Isla de Puerto Rico. Dichos documentos fueron organizados en 67 DVD los cuales fueron distribuidos a algunas bibliotecas y archivos de Puerto Rico.

ADNPR organizó los documentos y preparó fichas digitales para que el interesado pueda acceder los mismos a través del portal. Además, los ficheros digitales individuales fueron combinados y convertidos a formato PDF para facilitar su consulta.

Documentos del Archivo General Militar de Madrid

En 1998 comenzó un proceso de negociación entre el Gobierno de Puerto Rico y el Instituto de Historia y Cultura Militar de España para levantar un inventario de la documentación de Puerto Rico en el Archivo General Militar de Madrid y que más

tarde redundaría en la digitalización de los fondos documentales. Como parte de un acuerdo de colaboración se digitalizaron los documentos en las 2,357 unidades documentales datadas entre 1596 y 1983. La mayoría de los documentos forman parte de la Capitanía General de Puerto Rico (91 cajas), y en menor medida, por la Sección de Ultramar del Ministerio de la Guerra (44 cajas), el Servicio Histórico Militar (menos de una caja), el Ministerio de Ultramar (menos de una caja), la Capitanía General de Cuba (menos de una caja) y el 12º Batallón de Artillería de Plaza de San Juan de Puerto Rico (9 cajas). Para poder hacerlos disponibles ADNPR tuvo que combinar más de 114,000 imágenes individuales que fueron convertidas a formato PDF que resultaron en 2,357 ficheros digitales que están disponibles para ser evaluados por los investigadores.

Documentos del Archivo General de la Marina Alvaro Bazán

El 26 de septiembre de 2003 se firmó el Memorándum de Entendimiento entre el Ministerio de Defensa, la Asamblea Legislativa de Puerto Rico y la Asociación Española de Archiveros, Bibliotecarios, Museólogos y Documentalistas (ANABAD) para la selección y organización de 36,000 imágenes de documentos que se encuentran en el depósito del archivo Álvaro de Bazán en España. Los documentos digitales fueron organizados en 32 discos compactos (CD) y corresponden al fondo de la Secretaría de Estado y del Despacho de Marina y el fondo del Ministerio de Marina.

Los mismos consisten de comunicaciones que diferentes autoridades de la Armada, como el comandante general de Marina del Apostadero de La Habana, del que dependía la isla, y el comandante de Marina de Puerto Rico, e incluso otros organismos gubernativos, ponían en conocimiento de la Secretaría de Estado y del Despacho de Marina o del Ministerio. Son documentos que se elevaban a los órganos superiores, con cuestiones meramente informativas, o con asuntos que necesitaban ser resueltos, por lo que daban lugar a un expediente.

Expedientes Matrimoniales Archivo Segovia

Los Archivos Militares Españoles reúnen valiosa información de los soldados que sirvieron en las distintas ramas de la milicia española. El Archivo General Militar de Segoviafue creado en 1898 y contiene documentos históricos de gran valor que son consultados constantemente por historiadores y genealogistas. Como parte de las gestiones del Historiador Oficial de Puerto Rico (Dr. Luis González Vale) se logró digitalizar 164 expedientes y más de 7,500 páginas de información de soldados que estuvieron en Puerto Rico y datan de 1782 hasta 1871. Estos documentos están disponibles para consulta.

• Internet Archive

Enlace: https://archive.org/

El internet archive es la iniciativa privada de archivo digital hibrido más grande del mundo. El portal fue creado en 1996 como un medio para hacer disponibles periódicos, libros, audios, videos, imágenes y otro contenido digital de distintas entidades públicas y privadas. Según la información provista en el portal en él se albergan:

• 835 billones de páginas web

• 44 millones de libros y manuscritos

• 15 millones de grabaciones de audio

• 255,000 conciertos musicales

• 10.6 millones de videos

• 4.8 millones de imágenes

• 1 millón de programas de computadoras

El archivo crece a diario ya que sus colaboradores continúan subiendo objetos digitales constantemente. Además, su proyecto “Wayback Machine (https://web.archive.org/) recopila el contenido de las páginas web constantemente.

Una búsqueda del término Puerto Rico nos ofrece 22,863 resultados. Sin embargo, al hacer una búsqueda de este término dentro de los documentos nos ofrece 1,407,377 resultados clasificados en el siguiente tipo de material:

• 1,394,585 Libros y documentos

• 6,359 grabaciones de audio

• 3,191 películas

• 2,357 colecciones de datos

• 453 imágenes

• 430 programas

La diversidad de archivos digitales disponibles requiere una comprensión detallada de sus características y especializaciones. Los archivos de documentos históricos, como el Archivo General de Puerto Rico o el Portal de Archivos Españoles, se concentran en la preservación y acceso a documentación administrativa, legal y gubernamental. Estos archivos mantienen la estructura jerárquica original de los documentos, permitiendo comprender las relaciones institucionales y administrativas que los produjeron.

Las hemerotecas digitales, como Chronicling America o la Biblioteca Digital de España, ofrecen acceso a publicaciones periódicas históricas. Estos recursos son particularmente valiosos para comprender la opinión pública, los debates contemporáneos y la vida cotidiana en diferentes períodos históricos. Por ejemplo, la colección de El Mundo en la hemeroteca digital permite rastrear la evolución de los debates políticos y sociales en Puerto Rico durante el siglo XX.

Las bibliotecas digitales, como la Biblioteca Digital de la Universidad de Puerto Rico o HathiTrust, proporcionan acceso a libros, tesis, y publicaciones académicas digitalizadas. Estos recursos son fundamentales para comprender el desarrollo del pensamiento académico y la producción intelectual en diferentes períodos históricos.

Los archivos híbridos, que combinan diferentes tipos de materiales, representan una tendencia creciente en ladigitalizaciónde documentos históricos. ElArchivoDigitalNacionalde PuertoRico, por ejemplo, integra documentos gubernamentales, fotografías, material audiovisual y publicaciones periódicas en una única plataforma digital.

V. INVESTIGACION PERIFERICA

La investigación periférica representa una propuesta metodológica (M) con la cual he tenido éxito al investigar digitalmente. Mientras que el Capítulo IV abordé el seguimiento sistemático de pistas directas, este capítulo explora cómo cultivar lo que podríamos llamar visión periférica investigativa. Esto es la capacidad de detectar y explorar conexiones tangenciales, contextos adyacentes y documentos relacionados indirectamente con nuestra búsqueda principal. Esta metodología reconoce que los descubrimientos más significativos frecuentemente surgen no de lo que buscábamos explícitamente, sino de lo que encontramos mientras buscábamos otra cosa.

En términos del modelo H-LAM/T de Engelbart, la investigación periférica ejemplifica cómo la interacción entre Artefactos digitales y Metodología refinada puede producir "efectos compuestos" que aumentan dramáticamente nuestra capacidad investigativa. Los repositorios digitales (Artefactos) permiten que exploremos lateralmente de manera inmediata lo que en los archivos tradicionales resultaba en semanas o meses adicionales de investigación. Este capítulo proporciona estrategias concretas para desarrollar esta capacidad metodológica.

La investigación periférica parte de una premisa simple. Ningún evento o figura histórica existe en el vacío. Sin embargo, tradicionalmente no se investigan algunas relaciones por considerarlas ajenas a nuestro objeto de estudio. Nuestro método propone explorar las conexiones sutiles, tangenciales incluso, que quizás no influyeron directamente en cómo se desarrolló la vida del personaje o el evento que estudiamos. Pero aquí está su utilidad, estos hilos aparentemente secundarios a menudo nos revelan detalles que transforman nuestra comprensión de lo que creíamos saber del personaje o del evento. Estos vínculos indirectos, no convencionales, nos llevan a documentos que nadie había considerado importantes, a historias que parecían irrelevantes, a detalles que fueron archivados y olvidados porque no encajaban en la historia principal.

La investigación histórica tradicional se concentra en los eventos principales y en los protagonistas más destacados. Sin embargo, para comprender mejor la complejidad de las figuras históricas y los acontecimientos en los que participaron, es necesario ampliar el enfoque y explorar las diversas redes de relaciones que los rodeaban. Estas conexiones, aunque a menudo no ejercen una influencia directa sobre el curso de los eventos, nos brindan una perspectiva distinta.

La historia periférica permite analizar distintos tipos de relaciones que, por su naturaleza menos evidente, permiten descubrir detalles que enriquecen el relato histórico y ofrecen una comprensión más profunda del personaje o evento bajo estudio. El fundamento teórico de la historia periférica se nutre de varias corrientes historiográficas. Primero. comparte con la microhistoria italiana de Carlo Ginzburg el interés por los detalles aparentemente insignificantes que revelan estructuras sociales más amplias. 43 Segundo, se relaciona con los “Subaltern Studies” en su cuestionamiento de las narrativas dominantes.44 Sin embargo, se distingue de estos enfoques metodológicos en que nuestro énfasis es en las conexiones laterales, las coincidencias espaciotemporales, y la serendipia como método de descubrimiento se usan para apoyar la historia principal y no para construir la historia del subalterno.

La metodología también incorpora elementos de la Teoría del Actor-Red, reconociendo que los actores históricos existen dentro de redes complejas donde elementos humanos y no humanos (documentos, espacios, tecnologías) interactúan para producir realidad histórica. 45 Nuestra propuesta no busca añadir más actores al relato, sino revelar las conexiones inesperadas que reconfiguran nuestra comprensión del pasado al analizar los actores o eventos laterales.

43 Carlo Ginzburg. El Queso y los Gusanos, El cosmos, según un molinero del siglo XVI. Traducción de Francisco Martin. Muchnik Editores S.A. (1997). P. 209.

44 Ranajit Guha. Subaltern Studies, Writings on South Asian History and Society. R Dayal, Oxford University Press. New Delhi. 1982. P. VII-VIII.

45 Josean Larrion. Teoría del actor-red. Síntesis y evaluación de la deriva postsocial de Bruno Latour. Revista Española de Sociología (RES) 2019. Federación Española de Sociología doi:10.22325/fes/res.2019.03. P. 327.

Corriente Historiográfica Elementos Compartidos Diferencias Clave

Microhistoria (Ginzburg)

Subaltern Studies

Teoría Actor-Red

Atención a detalles aparentemente insignificantes

Cuestionamiento de narrativas dominantes

Reconocimiento de redes complejas

Tipología de Relaciones Periféricas

Enfoque en conexiones laterales vs. casos individuales

Apoya historia principal vs. construir historia subalterna

Revela conexiones vs. añadir actores

La investigación histórica tradicional ha privilegiado el estudio de conexiones directas y evidentes. Entre ellas se encuentran los colaboradores inmediatos, los familiares cercanos, la correspondencia oficial y los documentos explícitamente relacionados con la figura o evento principal. Estas fuentes, de mucha importancia, representan apenas el núcleo visible de una red mucho más amplia y compleja de relaciones humanas.

La investigación periférica propone expandir sistemáticamente el campo de análisis hacia las conexiones tangenciales que rodean este núcleo. Para esto es necesario evaluar:

1. los testigos que casualmente presenciaron eventos sin participar en ellos,

2. las personas que compartieronespacios físicos en momentos críticos sinnecesariamente interactuar,

3. los documentos que mencionan al personaje solo de manera incidental,

4. las voces de aquellos que observaron desde los márgenes sin dejar testimonios directos.

Mientras la historiografía tradicional traza líneas rectas entre causa y efecto, entre protagonista y antagonista, entre evento y consecuencia, la investigación periférica analiza una serie de puntos aparentemente inconexos que, al ser conectados, revelan patrones, contextos y significados previamente invisibles.

Conexiones Directas

(Historiografía Tradicional)

1. Colaboradores directos

2. Familiares cercanos

3. Correspondencia oficial

FIGURA HISTÓRICA

PRINCIPAL

Red de Conexiones

Conexiones Periféricas

(Nueva Metodología)

4. Testigos circunstanciales

5. Coincidencias espaciales

6. Documentos marginales

Esta metodología no busca reemplazar el análisis de las conexiones directas, sino enriquecer nuestra comprensión mediante la exploración sistemática de las relaciones que han permanecido en las sombras del registro histórico.

A continuación, examinaremos las diferentes categorías de estas relaciones periféricas y su potencial para transformar nuestra comprensión del pasado.

Asociados y Colegas

Las relaciones profesionales constituyen un primer nivel de análisis fundamental. Los asociados incluyen colaboradores directos, empleados y subordinados que interactuaron regularmente con el sujeto principal. Por ejemplo, al estudiar a José Celso Barbosa, el análisis incluiría no solo sus colegas médicos y políticos más conocidos, sino también su personal de oficina, los trabajadores del periódico El Tiempo. Estos individuos presenciaron su trabajo diario y pueden proporcionar perspectivas únicas sobre sus métodos, rutinas y comportamiento profesional.

Adversarios y Rivales

Los enemigos declarados y rivales ideológicos proporcionan contrapuntos cruciales en el análisis histórico. Sus críticas, oposición y perspectivas alternativas ayudan a construir una imagen más completa y equilibrada. La rivalidad entre Luis Muñoz Rivera y José Celso

Barbosa, por ejemplo, no muestra no solo sus diferencias políticas sino también las tensiones sociales y raciales de la época.

Testigos Circunstanciales

Una categoría frecuentemente descuidada pero valiosa incluye a los observadores casuales y testigos circunstanciales. Estos individuos, que pueden haber presenciado eventos significativos sin tener una relación directa con los protagonistas, ofrecen perspectivas menos sesgadas. Los testimonios de comerciantes, vecinos o transeúntes durante eventos históricos como el Grito de Lares pueden proporcionar detalles y perspectivas ausentes en los informes oficiales.

Coincidencia Espacial

Esta categoría de la investigación periférica está basada en la investigación sistemática de coincidencias espaciales y temporales que podrían revelar conexiones históricas previamente desconocidas. Bajo este componente el investigador puede examinar los espacios compartidos y los momentos de coincidencia que podrían haber puesto en contacto al personaje primario con los personajes periféricos.

Los espacios compartidos representan uno de los elementos más significativos en la investigación periférica. Los registros de embarcaciones y rutas marítimas constituyen una fuente particularmente rica de conexiones potenciales. Al investigar figuras como Ramón Emeterio Betances, los manifiestos de pasajeros en rutas entre San Thomas, Curazao y Santo Domingo, las listas de pasajeros entre Puerto Rico y Europa, los registros de cuarentena en puertos y la documentación de aduanas sobre llegadas y salidas proporcionan información valiosa sobre posibles encuentros y conexiones. La investigación del vapor "Pelayo", que realizaba la ruta regular entre Puerto Rico y St. Thomas en la década de 1860, por ejemplo, puede revelar encuentros casuales entre independentistas, comerciantes y otros viajeros que podrían ser evaluado para tener otra visión del movimiento revolucionario de Puerto Rico.

Los registros de matrícula y graduación, las listas de estudiantes por clase y año, la documentación de sociedades estudiantiles y los registros de residencias estudiantiles ofrecen un panorama detallado de las interacciones potenciales entre diferentes actores históricos. Por ejemplo, el análisis de los registros del Massachusetts Institute of Technology (MIT) durante los años de estudio de Luis A. Ferré (1921-1924) pueden revelar conexiones previamente desconocidas con otros estudiantes latinoamericanos y estadounidenses que posteriormente influyeron en el desarrollo industrial y político de Puerto Rico. Su paso por el MIT coincidió con un período de significativa presencia latinoamericana en la institución, y el análisis de los registros del Departamento de Ingeniería Mecánica, las sociedades estudiantiles como la Sociedad de Ingenieros Mecánicos, y los directorios de residencias estudiantiles del área de Cambridge podrían ayudar a identificar conexiones con otros estudiantes que a su vez lleven a cartas o documentos inéditos que permitan describir el periodo de formación de Ferré.

La coincidencia en espacios urbanos proporciona otro contexto crucial para el análisis de la investigación periférica. Los directorios urbanos y registros residenciales, incluyendo documentación sobre propiedad y alquiler, directorios comerciales y profesionales, censos locales y registros parroquiales, permiten reconstruir patrones de proximidad física entre diferentes actores históricos. La investigación de los residentes del Lower East Side de Manhattan durante la estancia de Antonio Vélez Alvarado en Nueva York (18921895) puede revelar conexiones con otras personas menos importantes del período. Los directorios comerciales de la época pueden revela su relación comercial con otros comerciantes norteamericanos los cuales pueden narrar desde otra perspectiva la actividad política-comercial de Vélez Alvarado.

Las coincidencias temporales en eventos públicos representan otro aspecto fundamental de esta técnica. La asistencia a ceremonias oficiales, manifestaciones políticas, celebraciones culturales y eventos académicos puede revelar conexiones inesperadas entre diferentes actores históricos.

Categoría

Asociados y Colegas

Adversarios y Rivales

Testigos

Circunstanciales

Coincidencias

Espaciales

Descripción y Valor Metodológico

Colaboradores directos, empleados y subordinados que interactuaron regularmente con el sujeto principal.

Proporcionan perspectivas únicas sobre métodos de trabajo, rutinas y comportamiento profesional cotidiano.

Enemigos declarados y rivales ideológicos cuyas críticas y oposición ayudan a construir una imagen equilibrada. Revelan tensiones sociales y políticas más allá de conflictos personales.

Observadores casuales sin relación directa con protagonistas. Ofrecen perspectivas menos sesgadas que pueden contradecir o complementar narrativas oficiales.

Personas que compartieron espacios físicos en momentos específicos. Incluye pasajeros de barcos, estudiantes universitarios, vecinos urbanos.

Tipología de actores periféricos y su valor metodológico

Documentos Marginales

Los documentos marginales incluyen todo registro escrito donde la figura o evento estudiado aparece de manera incidental, tangencial o no intencional. Estos documentos no fueron creados para documentar al personaje principal, sino que lo mencionan casualmente mientras registran otros asuntos. Su valor reside precisamente en esta naturaleza no intencional que los libera de los sesgos y agendas presentes en la documentación oficial.

La importancia de los documentos marginales en la era digital queda ilustrada perfectamente con el caso de Ramón Emeterio Betances y el Grito de Lares. Durante más de un siglo, la historiografía ha situado a Betances en St. Thomas durante el levantamiento del 23 de septiembre de 1868, coordinando operaciones revolucionarias. Sin embargo, la reciente digitalización de los archivos coloniales daneses reveló que Betances llegó a St. Thomas el 14 de octubre de 1868, tres semanas después del fracaso del Grito. El documento, un registro de entrada a la isla, muestra que Betances se encontraba en Curazao durante el levantamiento, a más de 500 millas de distancia.

Este único documento marginal digitalizado obliga a reconsiderar fundamentalmente las causas del fracaso revolucionario y demuestra cómo la documentación periférica puede invalidar narrativas establecidas durante generaciones. El hallazgo fue posible gracias a

la búsqueda sistemática por fechas en los archivos digitalizados daneses, explorando registros de octubre 1868 sin buscar específicamente "Betances".46

La digitalización masiva está transformando los documentos marginales de rarezas archivísticas en recursos sistemáticamente explorables. Un investigador puede ahora, en horas, realizar búsquedas que antes requerirían años de trabajo en múltiples archivos. El caso Betances-Lares no solo corrige un error historiográfico; valida la metodología de historia periférica digital y demuestra que los documentos digitalizados del archivo contienen evidencia capaz de transformar la historiografía.

Búsqueda Aleatoria Sistemática y la Colaboración entre investigadores

La investigación periférica incorpora dos elementos metodológicos que potencian significativamente la investigación: la búsqueda aleatoria sistemática y la colaboración entre investigadores. Estos componentes, aunque aparentemente contradictorios en su naturaleza (uno aleatorio y otro estructurado), se complementan para crear una red más amplia de descubrimiento histórico.

La búsqueda aleatoria sistemática constituye una técnica donde el investigador selecciona deliberadamente documentos de un período específico sin enfocarse inicialmente en sus temas principales. Por ejemplo, al investigar la historia de la imprenta en Puerto Rico, el investigador podría examinar todos los documentos disponibles de ese año en un archivo específico, independientemente de su clasificación temática. Esta técnica puede producir hallazgos significativos en casos donde documentos aparentemente no relacionados contienen información valiosa en menciones casuales o notas marginales.

46 Nota del Autor. Como parte del Proyecto Silvestre recientemente digitalizamos el periódico Pica Pica el cual publicó una gran cantidad de cartas inéditas de la Colección de Manuel Guzmán Rodríguez sobre el prócer. En una de estas dirigida a Julio Henna y fechada 7 de agosto de 1896 Betances admite que estaba en Curazao “cuando se sublevaron en Lares”. Pica Pica, Año XXI, No. 845 edición del sábado 24 de marzo de 1982.

La metodología de búsqueda aleatoria se estructura en "expediciones de búsqueda" donde el investigador dedica sesiones específicas a explorar documentos sin un objetivo predefinido. Durante estas expediciones, el investigador registra cualquier mención de nombres, lugares o eventos que podrían conectarse con su tema de investigación principal. Esta técnica es efectiva en archivos digitales, donde la capacidad de examinar rápidamente grandes volúmenes de documentos facilita este tipo de exploración.

La colaboración entre investigadores representa el segundo pilar fundamental de esta técnica. Los historiadores que trabajan en períodos o temas relacionados forman redes de intercambio de información donde comparten no solo sus hallazgos directos sino también aquellas referencias que encuentran durante sus búsquedas aleatorias. Esta práctica puede ser especialmente valiosa cuando investigadores trabajando en diferentes archivos o países cruzan información y establecen conexiones que no serían evidentes desde una sola perspectiva de investigación.

Serendipia

La serendipia constituye un elemento primario en la metodología de la historia periférica, representando esos descubrimientos afortunados e inesperados que ocurren mientras el investigador busca algo completamente diferente. A diferencia de la búsqueda aleatoria sistemática, que es una técnica deliberada de exploración sin objetivo específico, la serendipia surge de manera genuinamente accidental durante el proceso de investigación. Estos hallazgos fortuitos frecuentemente revelan conexiones o documentos que transforman radicalmente nuestra comprensión del tema estudiado. Por ejemplo, un investigador buscando información sobre comercio marítimo en el siglo XIX podría encontrar accidentalmente una carta personal que revela una red clandestina de apoyo al movimiento independentista. La serendipia no puede ser planificada, pero el investigador puede crear las condiciones para que ocurra manteniendo una mente abierta, explorando

ampliamente las colecciones documentales, y prestando atención a detalles aparentementeirrelevantes que aparecen en los márgenes de los documentos principales. La investigación histórica periferal, aunque busca expandir las conexiones y descubrir relaciones inesperadas, requiere el establecimiento de límites claros y específicos para evitar que el investigador se pierda en un océano documental interminable. Esta delimitación metodológica es fundamental para mantener la investigación enfocada y productiva. El investigador debe mantener un balance entre la apertura a descubrimientos inesperados y la disciplina necesaria para una investigación estructurada y significativa. El éxito de la historia periférica depende tanto de saber dónde buscar como de saber cuándo detenerse.

La Búsqueda Digital y las Estrategias de Identificación Indirecta en la Historia Periférica

La implementación de la búsqueda aleatoria y la serendipia en la metodología de historia periférica se ve potenciada por el acceso a repositorios digitales como hemerotecas, archivos y bibliotecas digitales. Sin embargo, la efectividad de estas herramientas digitales requiere el desarrollo de estrategias de búsqueda sofisticadas que reconozcan que los personajes históricos raramente son mencionados por su nombre completo en la documentación cotidiana, especialmente en fuentes periféricas. Esta limitación se convierte paradójicamente en una ventaja metodológica cuando se comprende y se utiliza apropiadamente.

Lahistoriografíatradicionalfrecuentemente cae en la trampa del sesgo retrospectivo, asumiendo que las figuras históricas tenían en su época la misma prominencia que les atribuimos hoy. Además, como explicáramos previamente las descripciones son llevadas a cabo por archiveros que no necesariamente conocen a todas las personas que se describen en los documentos.47 El

47 Nota del Autor: Por ejemplo, las colecciones digitales del Archivo General de Puerto Rico, el objeto “Archivo General de Puerto Rico Fondo: Instituto de Cultura Puertorriqueña Serie: Negativos Item 00048” describe a “dos hombres con cuadros y banderas” siendo uno de estos hombres Ricardo Alegría el cual no fue identificado por el archivero.

caso de Ramón Emeterio Betances ilustra perfectamente este fenómeno. La historiografía puertorriqueña está plagada de narrativas apologéticas que presentan a Betances como una figura universalmente conocida y reconocida. Sin embargo, la realidad documental sugiere algo muy diferente. Betances era ciertamente conocido en ciertos círculos médicos, políticos y revolucionarios, pero estaba lejos de ser una figura de conocimiento general. Un pasajero casual en un vapor entre Nueva York y St. Thomas en 1867 podría haber compartido con Betances sin saber quién era, refiriéndose a él posteriormente en una carta como "un médico de Porto Rico" o "ce type de Porto Rico qui parlait beaucoup de politique."

Esta realidad obliga al investigador digital a desarrollar estrategias de búsqueda que trascienden los nombres propios. La hemeroteca digital de la Biblioteca del Congreso de los Estados Unidos (Chronicling America), permite búsquedas por proximidad y contexto que resultan valiosas. En lugar de buscar únicamente "Betances," el investigador debe emplear combinaciones de términos como "médico + Porto Rico + París + 1860s," "docteur + Antilles + révolutionnaire," o "physician + West Indies + exile." Estas búsquedas más amplias y no relacionadas frecuentemente revelan menciones tangenciales en correspondencia, reportes, o crónicas sociales donde el personaje aparece sin ser nombrado directamente.

Las bibliotecas digitales como Google Books, HathiTrust, o Internet Archive ofrecen capacidades de búsqueda de texto completo que permiten identificar patrones de referencia indirecta. La función de “n-grams” de Google Books, por ejemplo, permite rastrear la frecuencia de combinaciones de palabras como "Puerto Rican doctor" o "médecin portoricain" a través del tiempo, identificando picos que podrían corresponder a momentos de mayor actividad o visibilidad del personaje estudiado. La búsqueda por proximidad de términos permite identificar documentos donde aparecen juntas palabras clave sin estar necesariamente en la misma frase, revelando conexiones que una búsqueda exacta no detectaría.

La naturaleza multilingüe de muchas figuras históricas caribeñas añade otra capa de complejidad y oportunidad. Betances, por ejemplo, se movía fluidamente entre el español, el

francés y el inglés, y las referencias a él varían según el idioma del documento. En documentos franceses podríaaparecercomo"le docteur Bétancès"(convariaciones ortográficas), en ingleses como "Dr. B." o "the Porto Rican physician," y en españoles como "el médico mayagüezano." Las herramientas de traducción automática integradas en muchos repositorios digitales permiten ahora búsquedas translingüísticas que antes eran imposibles.

Metodología en la Practica

Las estrategias de búsqueda espacial-temporal en repositorios digitales requieren estrategias distintas. Cuando se busca evidencia de coincidencias espaciales, el investigador digital debe combinar búsquedas de fecha con términos geográficos amplios. Por ejemplo, al investigar posibles encuentros en París en 1897, las búsquedas deben incluir no solo "Paris + 1897 + Puerto Rico" sino también variaciones como “Antilles," o "quartier latin + américains,". Los periódicos digitalizados de la época frecuentemente contienen secciones de "movimientos de viajeros" o "arrivées et départs" donde los personajes aparecen listados por su puerto de origen o destino más que por su nombre.

La serendipia digital se manifiesta de formas únicas en estos repositorios. El algoritmo de "documentos relacionados" de muchas plataformas puede llevar al investigador por caminos inesperados. Un investigador buscando información sobre medicina tropical en el Caribe podría encontrarse con un informe militar que menciona casualmente una reunión de "exiliados antillanos" en un café parisino. Los errores de OCR (reconocimiento óptico de caracteres) en documentos digitalizados, pueden paradójicamente facilitar descubrimientos cuando variaciones ortográficas del mismo nombre son indexadas como términos diferentes, revelando menciones que de otra manera permanecerían ocultas.

La metodología de historia periférica en la era digital requiere, por tanto, una reconceptualización de las estrategias de búsqueda. El investigador debe abandonar la expectativa de encontrar referencias directas y explícitas, adoptando en su lugar una búsqueda menos directa que de prioridad a las referencias contextuales, las descripciones circunstanciales, y las menciones

tangenciales. Al hacerlo no solo compensa las limitaciones de las fuentes históricas, sino que las convierte en ventajas metodológicas. Al hacerlo revelamos redes de relación y contextos de acción que la historiografía tradicional no han evaluado. La historia periférica digital no busca simplemente más información sobre los personajes conocidos. Lo que realmente busca es reconstruir los espacios más comunes donde estas figuras se movían a través de actores anónimos Personajes cuyos nombres tal vez aparecen una sola vez en un registro de aduana, en una lista de pasajeros, en el margen de un documento digitalizado. Ahora las voces de estos personajes con la ayuda de las herramientas digitales pueden ser conectadas e interpretadas.

Recomendaciones practicas

La implementación práctica de la historia periférica requiere estrategias específicas que equilibren la apertura al descubrimiento con el rigor metodológico. La búsqueda aleatoria sistemática representa una técnica donde el investigador examina deliberadamente documentos de un período específico sin enfocarse inicialmente en temas predefinidos. Esta aparente contradicción entre lo aleatorio y lo sistemático se resuelve en la práctica mediante expediciones de búsqueda estructuradas donde se dedican sesiones específicas a explorar documentos sin objetivo predeterminado, registrando meticulosamente cualquier mención de nombres, lugares o eventos que podrían conectarse posteriormente con el tema principal.

La serendipia, distinta de la búsqueda aleatoria sistemática, representa los descubrimientos genuinamente accidentales que ocurren mientras se busca algo completamente diferente. Mientras que la búsqueda aleatoria es una exploración planificada sin objetivo específico, la serendipia surge de manera fortuita e inesperada. Un investigador buscando información sobre comercio marítimo podría encontrar accidentalmente una carta que revela redes clandestinas de apoyo independentista. Aunque la serendipia no puede planificarse, el investigador puede crear condiciones propicias manteniendo apertura mental y prestando atención a detalles marginales.

La colaboración entre investigadores constituye otro pilar fundamental donde historiadores trabajando en períodos o temas relacionados forman redes de intercambio que comparten no solo hallazgos directos sino también referencias encontradas durante búsquedas aleatorias. Esta práctica resulta especialmente valiosa cuando investigadores en diferentes archivos o países cruzan información estableciendo conexiones invisibles desde perspectivas individuales.

La búsqueda digital ha transformado radicalmente las posibilidades de la historia periférica. La efectividad de las herramientas digitales requiere estrategias sofisticadas que reconozcan que los personajes históricos raramente aparecen nombrados completamente en documentación cotidiana. Ramón Emeterio Betances, por ejemplo, podría aparecer en documentos franceses como "le docteur Bétancès", en ingleses como "the Porto Rican physician", y en españoles como "el médico mayagüezano". Esta variación lingüística, que antes constituía un obstáculo, ahora se convierte en ventaja metodológica mediante búsquedas translingüísticas en repositorios como Chronicling America, Google Books o HathiTrust.

Las estrategias de búsqueda digital deben trascender los nombres propios empleando combinaciones contextuales como "médico + Porto Rico + París + 1860s" o utilizando funciones de proximidad que identifican documentos donde aparecen términos relacionados sin estar necesariamente en la misma frase. Los algoritmos de documentos relacionados pueden llevar por caminos inesperados, mientras que los errores de OCR paradójicamente facilitan descubrimientos cuando variaciones ortográficas revelan menciones previamente ocultas.

La implementación de la investigación periférica requiere un enfoque sistemático pero flexible.

A continuación, mostramos un marco estructurado para aplicar esta metodología:

Fase de Preparación

PASO 1 Mapeo inicial del sujeto

Crear una cronología básica con fechas, lugares y eventos conocidos

PASO 2 Identificación de espacios

Listar todos los lugares donde el sujeto estuvo presente (ciudades, instituciones, embarcaciones)

PASO 3 Desarrollo de términos de búsqueda

Crear lista de descriptores indirectos, variacionesortográficas, términos contextuales

Fase de Exploración

Durante la fase de exploración, el investigador implementa las siguientes técnicas:

• Búsqueda Aleatoria Sistemática- Dedicar sesiones específicas a explorar documentos de un período sin objetivo predefinido. Por ejemplo, examinar todos los documentos disponibles de mayo 1869 en los Archivos Nacionales, independientemente de su clasificación temática. Esta técnica frecuentemente revela conexiones inesperadas.

• Colaboración en Red -Establecer comunicación con investigadores trabajando en períodos o temas relacionados. Compartir hallazgos marginales que podrían ser relevantes para otros proyectos. Esta red colaborativa multiplica exponencialmente las posibilidades de descubrimiento.

• Serendipia- Mantener una mente abierta y registrar sistemáticamente cualquier hallazgo inesperado, aunque parezca irrelevante inicialmente. Los descubrimientos más

transformadores frecuentemente emergen de encuentros casuales con documentos mientras se busca algo completamente diferente.

El caso Arturo Alfonso Schomburg y Roberto H. Todd

El caso de Arturo Alfonso Schomburg y Roberto H. Todd, presentado en el libro "Arturo Alfonso Schomburg: Identidad Racial y Afirmación Cultural Afrocaribeña" de Haydée E. Reichard, es un buen ejemplo de la historia periférica. 48 Cuenta en el epilogo del libro que, al finalizar su investigación sobre Schomburg, la autora recibió copia de una carta de Roberto H. Todd a sus nietos. Este documento, que parecía no tener absolutamente nada que ver con su trabajo, terminó revelando paralelos entre estos dos hombres. Aunque no hay evidencia de que estos dos personajes mantuvieron una relación en su infancia, el documento muestra que sus vidas siguieron caminos increíblemente similares.

La carta de Todd contaba una historia que era como un espejo de la infancia temprana de Schomburg. Reichard, nos explica que ambos llegaron de St. Thomas a Puerto Rico siendo niños, Todd en 1870 con Elizabeth Wells, su madre, y Schomburg dos años después con su madre llamada Mary Joseph. Las dos eran madres solteras, afroantillanas que se movieron a un mundo nuevo en la década de 1870. Lo que resulta interesante es que los registros bautismales de ambos niños fueron alterados. En el caso de Todd para cambiar su edad y ser admitido en la Casa de Beneficencia y en el caso de Schomburg para cambiar sus apellidos. Estos eventos, desconectados y de difícil detección nos muestran un ejemplo de estrategias de supervivencia entre inmigrantes afrocaribeños atados a la corrupción de un funcionario asociado a la iglesia que salió a la luz por historia periférica. La investigación revela cómo dos historias aparentemente separadas estaban unidas por patrones comunes de inmigración, adaptación y transformación social en el contexto del Caribe del siglo XIX.

48 Reichard de Cardona, Haydée E.. Arturo Alfonso Schomburg: Identidad Racial y Afirmación Cultural Afrocaribeña. Kindle Direct Publishing. 2023.

El Caso de Ramon Emeterio Betances

En 2017, aplicando la metodología de búsqueda periférica en los Archivos Nacionales de Washington, encontré unas cartas inéditas de Ramón Emeterio Betances.49 La primera carta del 15 de mayo intenta presentarse como víctima inocente de persecución política. La segunda del 24 de mayo, ante el rechazo de Fish, abandona toda pretensión y revela su estatus de un hombre sin estado. Las cartas fueron catalogadas como "Miscellaneous Letters of the Department of State". El hecho de que estas cartas estuvieran archivadas como "cartas misceláneas", una categoría residual para correspondencia considerada sin importancia suficiente para merecer clasificación específica tiene relevancia en la investigación digital.

La búsqueda periférica aplicada en 2017 no buscaba específicamente documentación con el término “Betances”. La búsqueda tenía el propósito de evaluar correspondencia miscelánea de los Estados Unidos del año 1869 asociada a Puerto Rico en especial al Grito de Lares. Un investigador siguiendo la metodología tradicional, buscando "Betances", "Puerto Rico" o “Grito de Lares” en los catálogos, jamás habría encontrado estos documentos catalogados como asunto insignificante. Pero este hallazgo tiene implicaciones que trascienden el caso individual de Betances y valida la metodología de búsqueda periférica. El caso nos demuestra que documentos importantes pueden permanecer ocultos en categorías archivísticas inesperadas, accesibles por exploración sistemática no dirigida.

El acceso digital a los Archivos Nacionales fue crucial para este descubrimiento. La capacidad de examinar sistemáticamente los rollos de microfilm digitalizados, saltando entre diferentes categorías sin las limitaciones del acceso físico, multiplicó las posibilidades de hallazgo. La búsqueda por fecha (mayo 1869) más que por tema permitió la exploración lateral que caracteriza la metodología periférica. El descubrimiento de las cartas confirma varios principios fundamentales de la historia periférica:

49 RG 59.2.3 Miscellaneous correspondence, Rollos 300 y 301 del Microcopy 179, catalogadas simplemente como "Miscellaneous Letters of the Department of State"

1. La búsqueda debe ser sistemática pero no dirigida y se deben explorar categorías completas por período más que buscar términos específicos.

2. Los fondos documentales sin importancia "Misceláneos," "Varios," "Sin Clasificar" frecuentemente contienen documentos de gran valor.

3. La marginalidad archivística refleja marginalidad histórica donde los grupos, eventos o personas que históricamente han sido ignorados, oprimidos o considerados menos importantes (es decir, que han sido "marginales") también suelen ser marginales en los archivos.

4. La serendipia y encuentros casuales con documentos requiere preparación y exploración sistemática.

Estos ejemplos demuestran el valor de la historia periféricacomo herramientametodológica para descubrir conexiones históricas significativas que van más allá de las relaciones directas o evidentes. La historia periférica representa más que una técnica metodológica, constituye un cambio de cómo concebimos y practicamos la investigación histórica. El quitarle el foco a los protagonistas principales hacia las redes de relaciones que los rodean puede resultar en revelar la complejidad y riqueza del pasado.

Limitaciones y Desafíos

Como toda metodología emergente, la investigación periférica enfrenta desafíos y limitaciones que deben ser reconocidos y abordados. El volumen masivo de documentos digitalizados puede resultar abrumador, requiriendo inversiones significativas de tiempo sin garantía de hallazgos relevantes. Los errores de OCR en documentos históricos, especialmente aquellos en malestado o con caligrafía del siglo XIX, pueden limitar la efectividad de las búsquedas digitales. Además, existe el riesgo constante de sobre interpretar coincidencias casuales como conexiones significativas, requiriendo un equilibrio cuidadoso entre apertura metodológica y rigor analítico.

Como mencionáramos al comienzo de este libro la disponibilidad desigual de archivos digitalizados crea sesgos potenciales en la investigación. Algunos repositorios están extensamente digitalizados mientras otros permanecen inaccesibles en línea, lo que puede distorsionar nuestra comprensión del pasado al privilegiar inadvertidamente ciertas fuentes sobre otras. Los investigadores deben ser conscientes de estos sesgos y trabajar para mitigarlos

mediante la combinación de investigación digital con trabajo tradicional en archivos físicos cuando sea posible.

El futuro de la historia periférica en Puerto Rico dependerá del desarrollo continuo digitalización de bibliotecas y archivos, la formación de redes colaborativas de investigación, y la voluntad de los historiadores de adoptar metodologías innovadoras. Los proyectos de digitalización masiva, las iniciativas de historia pública participativa, y las colaboraciones internacionales con archivos caribeños y latinoamericanos ampliarán las posibilidades de descubrimiento periférico.

La historia periférica nos recuerda que el pasado es infinitamente más complejo y interconectado de lo que sugieren las narrativas lineales tradicionales. Cada documento, cada nombre mencionado casualmente, cada coincidencia espaciotemporal representa una puerta potencial para comprender el pasado. En esta complejidad y riqueza reside la promesa de una historiografía puertorriqueña más completa, más justa, y más fiel a la diversidad de experiencias que han formado la isla y su gente.

VI. FILTRAR LOS RESULTADOS

El componente de Metodología (M) del sistema H-LAM/T incluye no solo las estrategias para encontrar información, sino también los criterios para evaluarla, jerarquizarla y seleccionarla. En los capítulos anteriores hemos presentado técnicas para maximizar la recuperación de documentos relevantes. En este capítulo abordamos el problema complementario de qué hacer cuando la búsqueda ha sido demasiado exitosa y nos enfrentamos a una abundancia potencialmente abrumadora de resultados. Esta es una situación nueva. Mientras que investigadores de generaciones anteriores luchaban con la escasez de fuentes accesibles, el investigador digital contemporáneo frecuentemente enfrenta el problema opuesto de sobrecarga de información.

Engelbart anticipó que cada nuevo artefacto tecnológico generaría nuevos problemas que requerirían nuevas soluciones metodológicas. La capacidad de los repositorios digitales de mostrarnos miles de resultados en segundos es simultáneamente sumayor fortaleza y un desafío metodológico significativo. Este capítulo presenta una metodología sistematizada para filtrar los documentos de manera efectiva. Al seguirla el investigador podrá establecer criterios de relevancia, cómo identificar rápidamente documentos de alta utilidad, cómo reconocer cuándo una fuente digital es suficientemente confiable, y cómo evitar los sesgos que pueden introducirse mediante el filtrado apresurado. La metodología de filtrado es tan importante como la metodología de búsqueda. El Investigador sin criterios claros para distinguir lo significativo de lo periférico, el acceso a vastos repositorios digitales puede resultar más abrumador que facilitador. El investigador tiene que desarrollar no solo la capacidad de encontrar, sino también la capacidad de discernir entre los documentos.

Los historiadores se benefician por la rápida accesibilidad a vastas cantidades de información histórica en línea. Sin embargo, esta abundancia de información presenta un reto de gran magnitud ya que el historiador tiene que saber seleccionar de los resultados que pueden ser pertinentes para su investigación. El proceso de filtrar los resultados puede ocurrir durante la

búsqueda en los portales o después que se han descargado los materiales digitales. Independientemente de cuando ocurra el investigador tiene que conocer las limitaciones del procesode búsquedadigitalpara poder maximizarlos resultadosque obtiene durante el proceso.

En este capítulo examinamos el proceso de filtrado desde tres perspectivas complementarias. Primero, las estrategias durante la búsqueda inicial; Segundo, la evaluación crítica posterior de los materiales descargados; y Tercero, los sistemas de organización que facilitan el acceso y análisis continuo de las fuentes. Cada una de estas fases requiere competencias específicas que el historiador digital debe desarrollar para manejar efectivamente el volumen de información disponible.

El proceso de filtrado y exclusión en la investigación histórica digital requiere un equilibrio entre la eficiencia de las herramientas en los portales digitales y el juicio crítico del historiador. Según Huistra y Mellink, no se trata simplemente de reducir el volumen de información, sino de utilizar métodos que permitan una evaluación más precisa y contextualizada de las fuentes históricas dirigidas a nuestra investigación50 .

El filtrado de la información puede ocurrir durante la búsqueda o luego de que se han bajado los documentos de los portales digitales. El proceso de filtrado durante la búsqueda combina las herramientas tecnológicas de filtros que ofrece el portal con el juicio del investigador. Por otro lado, el proceso de filtrado de los documentos bajados en un proceso manual y requiere la evaluación de los documentos y su organización. A continuación, explicamos brevemente este proceso:

• Búsqueda de documentos en portales o en buscadores de red

• Una vez los portales nos brindan los resultados iniciamos un proceso de lectura evaluación rápida para de acuerdo al juicio del investigador. Este proceso incluye la lectura del título, la descripción del documento, la lectura rápida del documento para evaluar su pertinencia.

50 HUISTRA, Hieke y Bram Mellink. Phrasing history: Selecting sources in digital repositories. HISTORICAL METHODS. 2016, VOL. 49, NO. 4, 220-229. Recuperado en https://www.tandfonline.com/doi/epdf/10.1080/01615440.2016.1205964?needAccess=true

• El investigador usando su juicio selecciona los documentos que parecen más relevantes a su investigación y procede a descargarlos. En este paso es necesario identificar claramente la procedencia del archivo e identificarlos de manera organizada y coherente.

• Con el documento en su computadora se lleva a cabo un proceso lectura y evaluación crítica del contenido.

• Después de la evaluación, decidimos si el documento es realmente útil para nuestra investigación. Si cumple con nuestros criterios de relevancia, lo conservamos. De lo contrario, lo descartamos y continuamos nuestra búsqueda.

• Se organiza el documento con y se integra a la investigación.

Por ejemplo, un investigador que investiga el proceso de descolonización de Puerto Rico y su asociación con la figura de Luis Muñoz Marín tiene que hacer buen uso del proceso de filtrar la información de manera tal que no se pierda en los resultados. La búsqueda simple de Luis Muñoz Marín en el portal del periódico el Mundo51 resulta en 27,591 resultados. La revisión de cada una de estas menciones es tarea imposible ya que se arriesgan a encontrar lo que se conocen como falsos positivos o falsos negativos. Un falso positivo se refiere a un resultado que aparece en los

resultados de una búsqueda de un portal digital pero que no es relevante para el tema de investigación. Por otro lado, un falso negativo, es un resultado que debería aparecer en los resultados de una búsqueda, pero no lo hace.

Es importante entender que estos problemas no son exclusivos de la búsqueda digital. En la investigación tradicional en archivos físicos, el historiador también puede pasar por alto documentos relevantes debido a una catalogación deficiente o encontrar documentos mal clasificados. Sin embargo, la escala y velocidad de la búsqueda digital amplifica tanto las oportunidades como los riesgos de estos errores.

A diario nos encontramos con falsos positivos en nuestras investigaciones. Utilizando el ejemplo anterior La búsqueda de Luis Muñoz Marín nos va a ofrecer miles de noticias que no tienen que ver con la discusión del estatus político. En estos casos el investigador tiene que filtrar la información de manera tal que pueda obtener los resultados que desea.

Para ilustrar este concepto con mayor claridad, consideremos otro ejemplo, una búsqueda de "revolución 1868" en periódicos puertorriqueños podría arrojar resultados sobre tres eventos diferentes: 1) la Revolución Gloriosa en España (septiembre), 2) el Grito de Lares en Puerto Rico (23 de septiembre), y 3) el inicio de la Guerra de los Diez Años en Cuba (10 de octubre). Aunque todos ocurrieron en el mismo año y están interconectados históricamente, cada evento requiere un análisis contextual diferente. El investigador debe poder distinguir rápidamente entre estas referencias para evitar confusiones interpretativas. Los falsos negativos no son tan comunes para el investigador digital, pero son más frecuentes que lo que se cree. El investigador muchas veces presume que el termino de búsqueda siempre aparecerá tal como se entró en la búsqueda y que la base de datos no tiene errores. En el caso de periódicos la calidad de la digitalización, incluyendo la resolución de las imágenes, la precisión del OCR y la integridad del documento original inciden en los resultados de la búsqueda. Un mal original nos brindará un mal documento digital y es muy probable que los resultados de la búsqueda no aparezcan. Gran parte de los portales digitales que poseen documentos con

reconocimiento de texto no actualizan los textos reconocidos una vez los ponen en línea. Esto provoca que si el reconocimiento óptico de caracteres fue de mala calidad el usuario jamás encontrara el termino de búsqueda a menos que lleve a cabo una lectura manual.

Otro error común es sobre confiar de los filtros de fechas en los sistemas digitales. Por ejemplo, si buscamos documentos sobre Ramon Emeterio Betances y el Grito de Lares en los periódicos correspondientes al periodo de 1867-1869 nos brindaría un resultado limitado. Esto se debe a que durante ese periodo él se encontraba fuera de Isla en un proceso de conspiración subversivo que no era público. Curiosamente el mismo termino de búsqueda en periódicos y revistas del siglo XX nos ofrece amplios resultados de cartas y otros documentos. La búsqueda en la Biblioteca Digital del Caribe (Dloc.com) nos brinda amplios resultados en El Puerto Rico

Evangélico, El Carnaval, Pica Pica y otros.

Lara Putnam nos describe en detalle las situaciones y desafíos que surgen al utilizar fuentes digitalizadas52. Según Putnam el investigador digital puede caer en los siguientes errores que afectaran su investigación:

1. Dependencia excesiva en la búsqueda digital

2. Descontextualización

3. Ceguera sistemática

4. Búsqueda rápida sin aprendizaje

5. Distorsión y pérdida de profundidad

Según Putnam el rápido y fácil acceso a colecciones digitales mal acostumbra al investigador y lo puede llevar a investigaciones sesgadas. En el caso de los periódicos los que están digitalizados son los principales. Sin embargo, estos muestran una sola cara de la historia. Por otro lado, al encontrar rápidamente los resultados el investigador puede pasar por alto la lectura completa del articulo u otros que comparten el mismo espacio, pero no fueron mostrados por los resultados de la búsqueda. En el caso de Puerto Rico la Gaceta de Puerto Rico era el órgano oficial del Gobierno en el siglo XIX. Como tal no iba en su contenido no iba a presentar una visión

52 PUTNAM, Lara. The Transnational and the Text-Searchable: Digitized Sources and the Shadows They Cast. Recuperado de https://academic.oup.com/ahr/article/121/2/377/2581842

contraria a la posición del gobernador o capitán general. Para poder conocer una visión alterna el investigador tiene obligatoriamente que recurrir a otras fuentes alternas.

Continuando con el ejemplo de la descolonización, el ampliar el número de palabras clave o la búsqueda por frases nos permite el reducir el número de resultados a evaluar. La búsqueda de Luis Muñoz Marín acompañado del término “colonia” nos reduce los resultados a 2,506, y por “descolonización” a 191. Según se aumentan los términos la búsqueda es refinada y nos ofrece unos resultados más definidos. El ampliar los términos de búsqueda funciona tanto en los portales digitales como en la búsqueda común de Google.

Filtrado durante la búsqueda

Las herramientas de búsqueda como Google y Bing, utilizan algoritmos que personalizan los resultados basándose en nuestros patrones de búsqueda y comportamiento en línea. Un asunto importante que el investigador no puede perder de vista es que, en el caso de Google y Bing, el objetivo del portal no es simplemente ofrecer resultados objetivos de búsqueda, sino también dirigir al usuario hacia productos o servicios comerciales. Los algoritmos de estos portales en todo momento rastrean las búsquedas del investigador y ofrecen resultados a fines. Por ejemplo, si el investigador lee portales o publicaciones de derecha los resultados podrían estar orientados a publicaciones o sitios con este tipo de contenido. Ante tal escenario el investigador puede utilizar buscadores alternos como duckduckgo.com y su buscador o usar el modo de incognito en su browser. Es necesario tener cautela ya que los que es conveniente al comprar un artículo puede crear sesgos invisibles en la investigación histórica.

Por otro lado, en la búsqueda de términos concretos como nombres, lugares, eventos, etc., el investigador tiene una probabilidad de éxito mayor que si está buscando conceptos más abstractos. Por ejemplo, la búsqueda del impacto de las ayudas sociales por transferencias federales (ej. Sección 8, vales de alimentos, salud), no está asociada a un término fijo ni a una simple frase. Para estos casos el investigador digital tiene que utilizar otros métodos de

búsqueda que atiendan el problema de conceptos abstractos. Por ejemplo, investigador puede preparar de antemano una lista de palabras clave flexibles y sinónimos como “ayuda federal”, “ingresos bajos”, “asistencia pública”. También podría utilizar operadores booleanos y otras técnicas de búsqueda avanzada para combinar términos y mejorar la precisión como las que presentamos a continuación.

Las siguientes técnicas de búsqueda avanzada en Google son particularmente útiles para abordar los desafíos mencionados. Cuando se investigan conceptos abstractos, la búsqueda exacta entre comillas permite forzar la aparición de frases específicas completas, reduciendo resultados irrelevantes. La exclusión de términos ayuda a eliminar contextos no deseados (por ejemplo, buscar "Luis Muñoz Rivera" pero excluyendo referencias a calles o monumentos). Y la búsqueda por sitio específico permite concentrarse en repositorios académicos o archivos digitales de alta calidad, evitando el ruido de sitios comerciales o no especializados. Estas técnicas, aplicadas estratégicamente, convierten la búsqueda general en una herramienta de investigación precisa:

• Búsqueda exacta (comillas)- Al utilizar los términos o frases entre comillas “”Google buscará las páginas que contengan el termino o la frase exacta entrada.

• Exclusión de términos (guion -)- Al utilizar los términos el guion (-) después del término de búsqueda Google excluirá las páginas que contengan su termino de búsqueda pero que también contengan el termino excluido. En este ejemplo se buscará el termino exacto Luis Muñoz Rivera excluyendo el termino Avenida.

• Búsqueda por sitio web (site:)- Entre su termino de búsqueda seguido del comando filetype: seguidode lapáginaque ustedquiere buscar, paraque Google hagasubúsqueda solamente en la página web que usted indique. En el siguiente ejemplo se buscará el termino Luis Muñoz Rivera solamente en la página de la fundación Luis Muñoz Marín.

• Búsqueda por tipo de archivo (filetype:)- Al utilizar el comando filetype: [pdf doc ppt ect] después del término de búsqueda Google buscara las páginas que contengan su termino de búsqueda con archivos del tipo que usted indique.

• Búsqueda dentro de un rango numérico (..). Para buscar paginas actualizadas en un periodo de tiempo particular utilice el termino de búsqueda seguido por las fecha primera .. fecha ultima. En este ejemplo Google buscara el termino Luis Muñoz Rivera en páginas actualizadas entre 2021 y 2024.

• Búsqueda en el título (intitle:) Al utilizar el comando intitle: seguido por el término que quiere buscar mostrará los resultados donde el término especificadoaparece en el título de la página.

• Búsqueda en el texto (intext:) Al utilizar el comando intext: seguido por el término que quiere buscar mostrará los resultados donde el término especificado aparezca en la pagina

• Búsqueda de sinónimos (~)- Para buscar los sinónimos de algún termino en la busque Utilice la tilde luego del término de búsqueda seguido por termino que se quiere buscar el sinónimo. En este caso se buscará Insurrección de Lares, pero también buscara el termino Alzamiento, Revolución, Rebelión (etc.)

Tipo de Búsqueda

Cuándo Usar

Ejemplo Concreto

Comillas ("") Necesitas una frase exacta "Grito de Lares 1868"

Guion (-) Excluir términos confusos Muñoz -Rivera

Site: Buscar en portal específico

Filetype: Necesitas formato específico

site:loc.gov "Puerto Rico census"

filetype:pdf "censo 1910 Puerto Rico"

Resultado Esperado

Solo documentos con esa secuencia exacta de palabras

Encuentra "Muñoz" pero excluye cuando aparece "Rivera"

Solo resultados de Library of Congress

Solo archivos PDF sobre el censo

Asterisco (*) Palabras con variaciones independen* Puerto Rico Encuentra independencia, independentista, independiente

OR Buscar sinónimos "insurrección" OR "rebelión" OR "alzamiento"

Documentos con cualquiera de estos términos

Intitle: Término en el título intitle:"Luis Muñoz Rivera" Solo páginas con ese nombre en el título

Tabla Comparativa de Operadores de Búsqueda

Cada uno de estos comandos se pueden acceder de manera más amigable a través de lo que se conoce como Google Advanced Search (https://www.google.com/advanced_search) o la búsqueda avanzada de Google. Esta herramienta permite llevar a cabo búsquedas más precisas y específicas en Google ofreciendo opciones para filtrar y refinar los resultados de diferentes maneras. La herramienta le da al investigador las mismas opciones que hemos explicado anteriormente, pero en una interfaz grafico que facilita la ejecución de los comandos. A continuación, mostramos la interfaz con una explicación de que se logra al completar cada encasillado:

Opción

all these words:

Resultado

Buscará todas las palabras que se entren en el encasillado de búsqueda this exact word or phrase: Buscará la frase exacta que se entre en el encasillado de búsqueda any of these words: Buscará cualquiera de las palabras que se entren en el encasillado de búsqueda none of these words: Excluirá de la búsqueda la palabra que se entren en el encasillado numbers ranging from: Permite buscar páginas que contengan números dentro de un rango específico. Por ejemplo, para buscar documentos que mencionen años entre 1890 y 1895, se usaría: 1890..1895

Opción

language:

Resultado

Podrá seleccionar el idioma del documento o la página que nos ofrece el resultado

Región: Podrá limitar a un país en específico la búsqueda

last update: Podrá limitar su búsqueda a páginas que hayan sido actualizada:

• Hace 24 horas

• Hace una semana

• Hace un mes

• Durante el pasado año site or domain: Usted puede incluir buscar en un solo sitio de internet terms appearing: Limita a que el término que uste busca se encuentre en:

• El titulo

• El texto

• La dirección digital (URL)

• En enlaces file type: Limita la búsqueda a contenido en formato:

1. PDF

2. Word

3. Excel

4. PowerPoint

5. Otros

EJEMPLO

Si investigamos la relación entre Luis Muñoz Rivera y el movimiento autonomista entre 18951897, podemos configurar la búsqueda avanzada de la siguiente manera:

• En "this exact word or phrase": Luis Muñoz Rivera y el autonomismo

• En "numbers ranging from": 1895..1897

• En "site or domain": dejar en blanco inicialmente, o usar .pr para fuentes puertorriqueñas

• En "file type": PDF (para documentos pdf)

• En "language": Spanish

Esta configuración inicial podría arrojar aproximadamente 150 resultados. Si son demasiados, podemos refinar agregando:

• En "none of these words": Rivera (hijo) para excluir referencias a Luis Muñoz Rivera (hijo)

• En"terms appearing": in the title, parapriorizar documentos centrados en el tema

Este conjunto de filtros reducirá los resultados a aproximadamente 20-30 documentos altamente relevantes, ahorrando horas de revisión manual.

Como herramienta Google Advanced Search ofrece al investigador la opción de filtrar y refinar los resultados lográndose una mayor precisión y logra el acceso a la información más actualizada. El uso de esta herramienta es fundamental para el investigador ya que le permite ahorrar tiempo en la consulta de materiales digital y muchas veces le puede dirigir a material que ni las herramientas de los portales ofrecen.

Recientemente, hemos presenciado el surgimiento de herramientas basadas en inteligencia artificial que prometen revolucionar la manera en que los historiadores abordan las búsquedas complejas. Mi experiencia trabajando con estos sistemas me ha mostrado tanto su potencial como sus limitaciones. Por ejemplo, al investigar los ataques de corsarios colombianos a las costas de Puerto Rico durante las guerras de independencia sudamericanas a principios del siglo XIX, enfrente el reto de cómo la terminología de la época puede confundir tanto a investigadores como a sistemas automatizados. Los documentos españoles de la época consistentemente

describían a estos corsarios como "insurgentes", el mismo término usado para los independentistas puertorriqueños. Una búsqueda simple por "insurgentes en Puerto Rico" mezclaba indiscriminadamente referencias a corsarios colombianos atacando Cabo Rojo con menciones de conspiraciones independentistas locales.

Los nuevos sistemas de IA pueden, en teoría, distinguir estos contextos mediante análisis semántico, pero aquí surge una advertencia crucial. En la investigación sobre estos ataques costeros, encontré que ChatGPT frecuentemente confundía a Luis Brión (corsario al servicio de Bolívar) con puertorriqueños, llegando incluso a "inventar" encuentros entre personajes que nunca existieron históricamente. Por estas razones, estas herramientas deben utilizarse como complemento, no como sustituto del análisis crítico. Es recomendable:

• Verificar siempre la IA con fuentes primarias

• Usar la IA para identificar patrones o conexiones preliminares, no como fuente definitiva

• Documentar qué herramientas de IA se utilizaron y para qué propósitos específicos

• Mantener un registro de los “prompts” utilizados que nos dan buenos resultados para reutilizarlos en el futuro

• Contrastar los resultados de diferentes sistemas de IA cuando sea posible (ChatGpt, Claude, Gemini)

Filtrar luego de la Búsqueda

Como se discutió en las secciones anteriores sobre búsqueda digital, la abundancia de resultados requiere un proceso sistemático de evaluación posterior. Este proceso complementa las estrategias de búsqueda inicial y debe considerarse como una fase igualmente crítica de la investigación. La evaluación posterior no es simplemente una revisión superficial, sino un análisis metodológico que determina la validez, relevancia y confiabilidad de cada fuente identificada.

El acceso instantáneo a fuentes primarias y secundarias permite a los historiadores evaluar rápidamente durante la búsqueda los documentos consultados digitalmente. La gran mayoría de las veces la magnitud de la información que resulta de una búsqueda no permite que el investigador evalúe profundamente el material mientras lleva a cabo la búsqueda y es necesario que lo haga posteriormente. Durante la etapa inicial de la búsqueda y debido a la abundancia de información el historiador puede sacar conclusiones apresuradas y a sobreestimar la importanciade los documentos que encuentranen línea. Hayque tenercuidadoconlaimpresión y el impacto que provoca los primeros resultados encontrados. El investigador tiene que estar conscientes de esa primera fuente encontrada no necesariamente es representativa de los hechos ni corresponden a la persona o situación investigada. Al comienzo de la investigación se tiene que tener la cautela y evaluar críticamente las fuentes que se investigan para no seguir un camino que lo lleve a un callejón sin salida. Veamos un ejemplo.

El 25 de marzo de 1885 el periodista Juan Francisco Terreforte fue asesinado en el teatro de Aguadilla. El asesino fue Ramón Méndez Quiñonez un miembro de la alta sociedad de Aguadilla que luego del asesinato huye del país. Es lógico comenzar la investigación con la búsqueda en los periódicos contemporáneos para determinar los motivos de la muerte del periodista. El resultado de esa primera búsqueda lo encontramos en dos periódicos de la península (El Día y el Noticiero) y en ambos se indica que la muerte de Terreforte no fue por razones políticas 53 . Tomando en consideración de que la línea editorial de ambos periódicos era distinta podríamos concluir que el asunto no estaba políticamente motivado. De hecho, a nivel popular se justificó la acción de Méndez Quiñonez como un lio de faldas. Sin embargo, al hacer una evaluación critica de los periódicos y ampliando su investigación a otras fuentes primarias (en archivos tradicionales) el investigador Roberto Ramos Perea encontró que el asesinato de Terreforte fue una venganza por las denuncias políticas y de corrupción que habia hecho el periodista contra el padre del asesino54

53 El Día. Núm. 1,787, edición del 2 de mayo de 1885; El Noticiero. Año III, 516, edición del 3 de mayo de 1885. Madrid.

54 RAMOS Perea, Roberto. Ramón Quiñonez Asesino. En Revista del Ateneo Puertorriqueño, Año II, Numero 4 Enero- Abril de 1992.

El problema de la identificación precisa de individuos representa otro desafío significativo en las fuentes digitales. La dificultad para distinguir entre personas con nombres similares, como padre e hijo, o rastrear los cambios de apellidos en el caso de mujeres casadas, requiere un análisis más profundo. Nuevamente tomemos como referencia a Juan Terreforte que a pesar de lo poco tradicional de su apellido tenía un hermano del mismo nombre. En el siglo XIX el periodista Juan Francisco Terreforte fue confundido con su hermano el líder revolucionario Juan de Matta Terreforte. El nombre no solo ha confundido a historiadores del presente si no que confundió a periodistas contemporáneos del siglo XIX55 .

La revolución digital ha transformado dramáticamente el acceso a fuentes históricas, pero esta accesibilidad sin precedentes trae consigo nuevos desafíos metodológicos. La crítica externa de fuentes, tradicionalmente aplicada a documentos físicos, debe adaptarse y expandirse para abordar las particularidades del entorno digital. Este proceso de evaluación crítica resulta fundamental para asegurar la integridad y confiabilidad de la investigación histórica en la era digital.

Estos ejemplos nos demuestran que el historiador debe profundizar en el análisis de las fuentes, contrastando la información con otras fuentes, considerando el contexto histórico, la autoría, el propósito y la audiencia a la que se dirige el documento. A pesar de la importancia de las fuentes digitales, el historiador nopuede limitarse aellas. Lainvestigaciónen archivos físicos, laconsulta de bibliografía impresa siguen siendo esenciales para una comprensión integral del pasado. Organización de los archivos digitales (files)

Un elemento que nos permite llevar a cabo del proceso de filtrar los resultados es el establecimiento de un sistema de nomenclatura estandarizado que priorice la organización cronológica de las fuentes primarias. Al ordenar cronológicamente las fuentes y establecer un orden preciso en los archivos digitales, el historiador puede identificar y correlacionar

55 Boletín Mercantil. Año XXXIII, Núm. 55. Edición del 9 de mayo de 1873.

documentos con mayor facilidad, minimizando el riesgo de confusión entre individuos o eventos con características similares. A continuación, presentamos el sistema que utilizamos:

• El sistema para fuentes primarias debe comenzar con la fecha del documento en formato AAAAMMDD (año/mes/día). Esta decisión metodológica responde en primer lugar a una organización automática de los archivos en cualquier sistema operativo, ya que estos se podrán ordenar de manera cronológica. Por ejemplo, un documento fechado el 27 de enero de 1895 se nombraría comenzando con "18950127- ". Esta estructura numérica sirve como identificador que facilita la localización y correlación de documentos que son contemporáneos.

• Luego de la fecha, el nombre del archivo debe incluir el código del archivo o repositorio de procedencia, utilizando abreviaturas estandarizadas. Por ejemplo, AGPR para Archivo General de Puerto Rico, AHN para Archivo Histórico Nacional, o CPR para la Colección Puertorriqueña de la Universidad de Puerto Rico. Esta información de procedencia resulta util para la verificación y citación posterior de las fuentes. Así, un documento del Archivo General de Puerto Rico fechado el 27 de enero de 1895 comenzaría como "18950127_AGPR".

• La tercera parte del nombre debe contener una descripción breve pero descriptiva del contenido del documento. Esta descripción debe ser lo suficientemente específica para identificar el documento sin necesidad de abrirlo, pero lo bastante concisa para mantener nombres de archivo manejables. Por ejemplo:

18950127_AGPR_Carta_del_alcalde_al_Gobernador_arbitrio

Este sistema de nomenclatura facilita la identificación de documentos duplicados, un problema común en la investigación histórica digital. Cuando encontramos documentos con la misma fecha provenientes de diferentes archivos, podemos compararlos rápidamente para determinar si son copias del mismo original.

Para la organización en el sistema de archivos de Windows, esta estructura de nomenclatura se complementa con una organización jerárquica de carpetas. La carpeta principal de fuentes primarias se subdivide primero por años, luego por meses, permitiendo una navegación eficiente por períodos específicos. Dentro de cada mes, los documentos se ordenan automáticamente por día gracias al formato de fecha elegido.

La correlación temporal entre documentos se ve enormemente facilitada por este sistema. Por ejemplo, si investigamos una crisis política específica, podemos identificar rápidamente todos los documentos producidos en días o semanas particulares, observando la evolución de los eventos a través de diferentes tipos de fuentes. Un decreto presidencial (18950127_AGN_DecretoEjecutivo), una carta privada (18950127_AHP_CartaConfidencial) y un artículo de prensa (18950128_BN_ElComercio) pueden revelar diferentes perspectivas sobre el mismo evento.

Para documentos que carecen de fecha precisa, utilizo una convención específica que utiliza el año conocido o aproximado seguido de "0000" para el mes y día desconocidos. Por ejemplo, un documento de 1895 sin fecha específica se nombraría "18950000_AGN_MemoriaMinisterial". Si solo se conoce el mes, se utiliza "00" para el día "18950100_AGN_InformePresupuesto".

El sistema también contempla el manejo de documentos relacionados o anexos. Cuando un documento principal tiene documentos adjuntos o relacionados, estos se identifican mediante el sufijo "_anexo" seguido de un número secuencial:

1. "18950127_AGN_InformeMinisterial" tendría sus anexos nombrados como:

a. "18950127_AGN_InformeMinisterial_anexo1"

b. "18950127_AGN_InformeMinisterial_anexo2", etc.

Para facilitar la búsqueda y recuperación, se puede mantener un registro maestro en formato Excel que cataloga todos los documentos, incluyendo columnas para la fecha normalizada, la fecha en formato legible, el archivo de procedencia, una descripción detallada y palabras clave. Este registro permite realizar búsquedas y filtros complejos que complementan la organización cronológica básica.

La implementación consistente de este sistema de nomenclatura temporal no solo facilita la organización inicial de las fuentes, sino que también agiliza el proceso de análisis histórico, permitiendo identificar rápidamente patrones temporales, establecer secuencias de eventos y

detectar vacíos en la documentación. Es un sistema que crece orgánicamente con la investigación, manteniendo su coherencia y utilidad a medida que se incorporan nuevas fuentes.

La implementación de un sistema de nomenclatura cronológica no solo organiza y facilita la correlación de documentos, sino que también permite un proceso de depuración eficiente al identificar documentos redundantes. Este proceso de organización es fundamental para manejar las fuentes rápida y coherentemente. Durante ese proceso de organización el historiador podrá eliminar documentos duplicados o versiones múltiples, manteniendo solo la más confiable o completa.

Programas para administración de Referencias Bibliográficas

Los programas de referencias bibliográficas son herramientas para el historiador digital. Estas aplicaciones no solo organizan las fuentes, sino que también facilitan la citación y el trabajo colaborativo. Los principales programas son Zotero, Mendeley, y Endnotes los cuales describimos a continuación:

Zotero (www.zotero.org)- Software gratuito y de código abierto que se integra con navegadores web y procesadores de texto. Permite capturar automáticamente metadatos de fuentes en línea, organizar referencias en colecciones, y generar bibliografías en múltiples estilos de citación. Su función de sincronización en la nube permite acceder a la biblioteca desde cualquier dispositivo.

Mendeley (https://www.mendeley.com/)- Combina el manejo de referencias bibliográficas con redes sociales académicas. Ofrece herramientas de anotación de PDFs, extracción automática de metadatos, y la posibilidad de descubrir investigaciones relacionadas. La versión gratuita incluye 2GB de almacenamiento en la nube.

EndNote-(https://endnote.com/) -Software comercial con características avanzadas para investigación profesional. Aunque requiere licencia, muchas universidades proporcionan acceso institucional. Destaca por su integración con bases de datos académicas y su capacidad de manejar bibliotecas muy grandes.

Para el historiador, estas herramientas ofrecen ventajas específicas:

1. Captura automática de metadatos desde archivos digitales.

2. Organización temática y cronológica de fuentes.

3. Generación automática de citas en formato Chicago.

4. Detección de duplicados

5. Notas y anotaciones adjuntas a cada fuente.

6. Trabajo colaborativo en proyectos de investigación grupales.

Las consideraciones técnicas y de accesibilidad también juegan un papel crucial en el proceso de eliminación. Los archivos corruptos, documentos con problemas de formato o aquellos que requieren software obsoleto deben ser descartados si no pueden ser recuperados o convertidos a formatos utilizables. De igual manera, los enlaces rotos o documentos que ya no están disponibles en línea deben ser eliminados del corpus de investigación, al igual que las fuentes que requieren suscripciones o accesos no disponibles para el investigador.

Advertencias

El investigador debe estar consciente de varios sesgos inherentes en las búsquedas digitales que pueden distorsionar significativamente los resultados de la investigación:

• Los documentos digitalizados no representan necesariamente una muestra representativa del total de documentaciónhistóricaexistente. Por ejemplo, en PuertoRico, no todos los periódicos publicados antes de 1950 están digitalizados, y estos tienden a ser los de mayor circulación urbana, excluyendo voces rurales y alternativas.

• Los períodos más recientes suelen estar mejor representados digitalmente. Mientras que podemos encontrar miles de documentos sobre el Estado Libre Asociado (post-1952), la documentación sobre el período de transición autonómica (1897-1898) es proporcionalmente escasa.

• Las instituciones con mayores recursos digitalizan más contenido. La Biblioteca del Congreso tiene más documentos digitalizados sobre Puerto Rico que el propio Archivo General de Puerto Rico, lo que puede sesgar la perspectiva hacia una visión externa de la historia puertorriqueña.

• El predominio del inglés en las digitalizaciones puede marginalizar fuentes en otros idiomas. Las búsquedas en español sobre Puerto Rico en el siglo XIX arrojan significativamente menos resultados que búsquedas equivalentes en inglés, a pesar de que el español era el idioma predominante.

• Los documentos mejor preservados tienen mayor probabilidad de ser digitalizados, potencialmente excluyendo fuentes populares o marginales que se conservaron en peores condiciones.

El filtrar los resultados en la investigación histórica digital constituye un proceso crítico que requiere tanto rigor metodológico como criterio histórico. Este proceso va más allá de la simple selección de documentos relevantes ya que representa una etapa fundamental en la construcción del conocimiento histórico a partir de fuentes digitalizadas.

La evaluación crítica de los resultados de búsqueda comienza con la verificación de la identidad histórica de las personas, lugares y eventos encontrados. Este proceso requiere una atención meticulosa a los detalles y un conocimiento profundo del contexto histórico. Por ejemplo, al investigar sobre Juan Terreforte, un líder obrero puertorriqueño, es crucial distinguir entre diferentes personas que pudieron compartir el mismo nombre en el mismo período. Esta distinción requiere la verificación cruzada de fechas, lugares y contextos en múltiples fuentes digitales.

La verificación temporal de los resultados representa otro aspecto crucial del proceso de filtrado. Los documentos históricos digitalizados pueden contener referencias a eventos o personas en diferentes momentos temporales, y es fundamental asegurar que las fechas correspondan al período de investigación específico. Por ejemplo, al estudiar la Guerra Hispanoamericana, es necesario distinguir entre documentos contemporáneos al conflicto y aquellos que lo analizan retrospectivamente, ya que cada tipo de fuente ofrece perspectivas y valores históricos diferentes.

El examen crítico de las fuentes digitales requiere una evaluación rigurosa de su confiabilidad y procedencia. En el entorno digital, esta evaluación debe considerar no solo la autenticidad histórica del documento original, sino también la calidad y fidelidad de su digitalización. Los investigadores deben examinar la procedencia institucional del documento digital, verificando la reputación y los estándares de digitalización de la institución que lo ha puesto a disposición. Por ejemplo, los documentos digitalizados por la Biblioteca del Congreso de Estados Unidos o el Portal de Archivos Españoles generalmente siguen estándares rigurosos de digitalización y catalogación.

El contexto de publicación digital también requiere un escrutinio cuidadoso. La facilidad con que se puede publicar contenido en internet ha llevado a la proliferación de sitios web que ofrecen documentos históricos sin el debido rigor académico. El investigador debe evaluar el propósito y la autoridad del sitio web que aloja el documento, considerando factores como su afiliación

institucional, sus políticas editoriales, y su adherencia a estándares académicos reconocidos. Por ejemplo, un documento histórico publicado en el sitio web de una universidad o archivo nacional generalmente merece mayor confianza que uno encontrado en un blog personal sin credenciales académicas verificables.

La integridad del documento digital en relación con su original físico constituye otro aspecto crucial de la crítica externa. El proceso de digitalización puede resultar en la pérdida de elementos contextuales importantes presentes en el documento físico, como anotaciones marginales, marcas de agua, o características materiales significativas. El investigador debe ser consciente de estas limitaciones y, cuando sea posible, contrastar el documento digital con su contraparte física o con descripciones detalladas del original.

Recientemente me tope con dos situaciones particulares relacionadas a la integridad de los documentos originales. La primera ocurrió cuando un investigador me solicitó que lo ayudara a identificar el Hospital de Santiago que se encontraba en la leyenda en un mapa de San Juan del 1766 pero que no aparecía el número en el mapa. Al evaluar el mapa me encuentro que casi todos los autores que han utilizado el mapa creado por Historic Urban Plans y que la misma habia sido modificada tanto en papel como digitalmente. 56 En contraste, al revisar la imagen original digitalizada por el Archivo del Museo Naval de Madrid, esta mostraba claramente la referencia al sur de la Plaza de Armas, lo que evidencia que la copia de Urban Plan fue objeto de modificaciones.

56 https://www.historicurbanplans.com/product/san-juan-puerto-rico-1766-souvenir-series/

Puerto Rico 1766- www.historicurbanplans.com

El segundo ejemplo tiene que ver con las ilustraciones del Naturalista Frances Augusto Ple. Resulta que la totalidad de los autores han utilizado las ilustraciones publicadas por el Instituto de Cultura Puertorriqueña57 (CITA). Estas ofrecen de por si tienen un gran valor ya que describen gráficamente los distintos pueblos de la Isla a principios del siglo XIX (1822-2823). Sin embargo, al evaluar los dibujos originales publicado por la Biblioteca Nacional de Francia, nos encontramos que los dibujos tenían valiosas anotaciones a lápiz las cuales complementan los dibujos y que debido al proceso de duplicación y por lo tenue del trazado eran ilegibles en las publicaciones del ICP.

Estos ejemplos nos muestran la importancia de implementar protocolos de verificación de los documentos digitales y la necesidad de dar prioridad, siempre que sea posible, el acceso a las fuentes más próximas al original.

57 Ricardo Alegría. Los Dibujos de Puerto Rico del naturalista francés Augusto Ple (1821-2823). En Revista Instituto de Cultura Puertorriqueña, Julio-Septiembre 1975 #68. PP 20-41.

Iglesia de Toa Alta Augusto Ple

Biblioteca Nacional de Francia http://bibliotheques.mnhn.fr/medias/doc/EXPLOITATION/IFD/MNHN_MS73_001_003/

Revista ICP

Organización de Archivos y documentos

Al igual que en la investigación histórica tradicional la clasificación y organización de las fuentes digitales localizadas durante nuestras búsquedas es esencial. La forma en que organizamos estos archivos afecta directamente nuestra capacidad para recopilar y acceder los documentos cuandoestemos listos parasulectura y análisis. Apesarde que lainvestigacióndigital nosbrinda múltiples ventajas sobre la investigación en el archivo tradicional, esta presenta problemas similares y otros particulares. Las fuentes encontradas en la investigación tradicional como en la digital tienen que ser clasificadas en criterios como el tema, la cronología, el tipo de documento o la autoría. En ambos casos, es fundamental proporcionar una descripción detallada de cada fuente, incluyendo información como el título, autor, fecha, lugar de publicación, etc. Esto facilita la identificación y la consulta futura de la información. Sin embargo, por la gran abundancia de fuentes digitales su organización tiene que ser segura, coherente y de rápido acceso.

Uno de los problemas principales de la investigación histórica digital es la volatilidad de la información. Los documentos y recursos en línea como sitios web, documentos y otros materiales pueden desaparecer o no estar disponibles cuando los necesitemos. Es vital que el historiador tome las precauciones de bajar a su computadora o imprimir los documentos en el momento que los encuentre. Al guardar cada documento de inmediato, se evita el riesgo de perder recursos que luego pueden ser difíciles o imposibles de recuperar.

Cuando encontramos un documento valioso en línea, debemos seguir estos pasos inmediatamente:

1. Guardar el documento completo

o Usar la función "Save page as:" del navegador, seleccionando "Página web, completa" para preservar todos los elementos.

2. Documentar el contexto

o Crear inmediatamente una nota con:

1. URL exacta del documento

2. Fecha y hora de acceso

3. Nombre del portal o archivo

4. Cualquier información de catalogación disponible

3. Captura de pantalla o Para documentos que pueden cambiar o desaparecer, tomar una captura que incluya la URL y la fecha visible en el navegador.

El sistema de nomenclatura que se utilice para los archivos digitales es igualmente importante. Usar nombres claros y específicos para los archivos permite al investigador identificarlos fácilmente en el futuro sin necesidad de abrir cada documento. Una técnica útil es incluir la fecha del documento en el nombre del archivo, usando un formato estandarizado como "AAAAMMDD" para que los archivos se ordenen cronológicamente. Por ejemplo, un archivo titulado “19271227El Mundo” permite identificar rápidamente la fecha del contenido, facilitando así su ubicación en el tiempo. Esto es especialmente útil cuando se trabaja con una gran cantidad de documentos históricos, pues un sistema de nomenclatura coherente ayuda a construir una visión cronológica del archivo y permite al investigador ahorrar tiempo en su búsqueda y organización.

La estructura de los “folders” en las que se almacenen los archivos también debe ser lógica y coherente. Separar los archivos en categorías específicas (por ejemplo, libros, documentos, ensayos, y fotografías) facilita la navegación y permite encontrar información relevante de forma rápida. Esta organización jerárquica no solo mejora la eficiencia en el proceso de búsqueda, sino que también facilita una visión clara de las distintas categorías de fuentes históricas. Así, en lugar de tener una carpeta desorganizada y llena de archivos sin clasificación, el investigador puede contar con una estructura bien definida que agilice el proceso de recuperación de información. Además de un buen sistema de “folders” y una nomenclatura sistemática, es recomendable llevar un registro de los documentos y archivos recopilados. Este registro, o tabla de referencia, debe actualizarse regularmente, e incluir detalles sobre el contenido y la procedencia de cada archivo. La tabla puede ser tan simple como un documento de texto o una hoja de excel, en la que se enumeren los archivos junto con información relevante sobre su origen, fecha de creación y categoría. Este tipo de documentación es como un mapa que guía al investigador a través de su archivo digital, facilitando no solo la organización, sino también la construcción de narrativas históricas coherentes.

Para quienes trabajan con archivos de imágenes y documentos descargados, el renombramiento inmediato es esencial. Cuando un archivo se guarda por primera vez, es probable que el nombre que le asigna automáticamente el sistema no sea suficientemente claro o relevante para el contenido. Renombrarlo en el momento que se baja, cuando el contexto del material está fresco en la mente del investigador, es una práctica que previene confusiones futuras. Esta rutina ayuda a evitar una acumulación de archivos con nombres predeterminados, los cuales pueden volverse confusos o incluso indescifrables con el paso del tiempo.

A lo largo de la investigación, mantener una estricta integridad en el registro de las fuentes es crucial. Es importante que el investigador documente de forma meticulosa la procedencia de sus materiales, anotando el archivo, portal o repositorio digital de donde se obtuvo cada documento. Esto no solo cumple con los estándares éticos de la investigación histórica, sino que también facilita el acceso futuro a las fuentes originales y contribuye a la transparencia y fiabilidad del trabajo. Reconocer adecuadamente las fuentes también permite a otros investigadores verificar la información o seguir líneas de investigación relacionadas.

Otro aspecto importante en la administración de archivos digitales es la redundancia en el almacenamiento. Dadoque los archivos digitales puedenperderse confacilidad, yasea por fallos en el equipo o por accidentes, es necesario mantener múltiples copias de seguridad. Al mantener varias copias de cada archivo, tanto en la nube como en dispositivos de almacenamiento físicos adicionales, el investigador protege su trabajo contra la pérdida catastrófica de información. Este principio de redundancia, encapsulado en el lema “Backup, Backup, Backup,” asegura que incluso en caso de un problema técnico, los archivos estarán seguros y accesibles.

En conclusión, organizar archivos digitales para la investigación histórica requiere una disciplina y sistematización constante. Desde la creación de un archivo inicial con estrategias de preservación hasta la implementación de nomenclatura clara, carpetas bien estructuradas, registros detallados, y un sistema de respaldo sólido, todas estas prácticas ayudan a construir un entorno digital seguro y accesible. Así, la información histórica no solo se preserva, sino que se vuelve más fácil de analizar y utilizar en la creación de conocimiento histórico.

El proceso de filtrar resultados en la investigación histórica digital representa mucho más que una simple tarea técnica de organización. Constituye una disciplina metodológica que requiere la integración de literacia tecnológica con el juicio crítico histórico tradicional. El historiador digital debe navegar entre la abundancia de información disponible y la necesidad de mantener el rigor académico, desarrollando estrategias que le permitan aprovechar las ventajas de la digitalización sin caer en sus problemas potenciales.

La experiencia nos enseña que el éxito en el filtrado de resultados digitales depende de tres factores:

1. El dominio técnico de las herramientas de búsqueda y organización

2. El conocimiento del contexto histórico que permite evaluar críticamente las fuentes

3. La disciplina sistemática en la preservación y organización de los materiales digitales.

El dominio del filtrado digital distingue al historiador competente del siglo XXI del simple recopilador de información. No se trata únicamente de encontrar datos, sino de construir un corpus coherente y verificable de fuentes que sostengan interpretaciones históricas sólidas y defendibles académicamente. Como hemos visto a través de los casos de Juan Terreforte, las ilustraciones de Augusto Plé, y los múltiples ejemplos de búsquedas sobre Luis Muñoz Marín, la diferencia entre una investigación superficial y una rigurosa radica en la aplicación sistemática y consciente de estos principios de filtrado.

A medida que las tecnologías de búsqueda e inteligencia artificial continúan evolucionando, el historiador debe mantenerse actualizado en las nuevas herramientas disponibles, sin perder de vista que estas son como estableció Engelbart un artefacto al servicio de la investigación histórica. El filtrado de resultados no es el fin, sino el medio para construir historias sólidas, fundamentadas con evidencia verificable y contextualizada apropiadamente.

El historiador digital exitoso es aquel que combina la eficiencia tecnológica con la rigurosidad metodológica, creando un equilibrio dinámico entre la velocidad de acceso que ofrecen las

herramientas digitales y la profundidad del análisis que exige la disciplina histórica. En última instancia, el filtrado es un fundamento sobre el cual se construye la credibilidad y el valor de la investigación histórica en la era digital.

VII. REDACCIÓN Y REVISIÓN DIARIA

El componente de Entrenamiento (T) del modelo H-LAM/T de Engelbart reconoce que dominar el Lenguaje, los Artefactos y la Metodología requiere práctica deliberada y desarrollo de hábitos sostenibles. El entrenamiento no es simplemente educación formal inicial, sino el proceso continuo mediante el cual internalizamos capacidades hasta que operan casi automáticamente, liberando nuestra atención consciente para enfocarse en problemas de nivel superior. En el contexto de la investigación histórica digital, uno de los aspectos más críticos del entrenamiento es el desarrollo de disciplina para la escritura regular.

Paradójicamente, mientras que la tecnología digital ha facilitado enormemente el acceso a fuentes primarias también ha creado nuevas tentaciones para postergar la escritura. La facilidad de encontrar "solo un documento más" puede llevar a una búsqueda perpetua que nunca se materializa en un documento escrito. Este capítulo aborda la necesidad de entrenar el hábito de escritura diaria como componente integral del proceso investigativo, no como fase final separada de la búsqueda. Como Engelbart demostró, el sistema H-LAM/T funciona mediante la interdependencia dinámica de sus componentes Es por eso que los mejores Artefactos y Metodologías son inefectivos sin el Entrenamiento que nos permita utilizarlos productivamente. La escritura diaria no es solo un medio para producir el manuscrito final, es una herramienta de pensamiento que clarifica nuestra comprensión, revela lagunas en nuestra investigación, y genera nuevas preguntas que guían búsquedas subsecuentes. Este capítulo proporciona estrategias prácticas para desarrollar y mantener el hábito de escritura diaria que transforma datos acumulados en conocimiento histórico articulado.

Todo historiador tiene que plasmar los resultados de su investigación en un escrito ya sea un ensayo o un libro. Paradójicamente, mientras que la búsqueda y recopilación de documentos, y el conversar sobre estos hallazgos constituyenlos aspectos más estimulantes de la investigación histórica, la redacción de estos hallazgos no lo es. Este contraste entre la emoción del descubrimiento y la dificultad de la escritura es una experiencia universal entre los historiadores.

El proceso de redacción de los resultados de una investigación histórica requiere que el historiador lo convierta en un hábito y no una obligación. Como un componente adicional a la metodología de Goska propongo que el investigador adopte la disciplina de escribir una página diaria y que a su vez revise otra escrita previamente. Nuestra propuesta no requiere que lo escrito sea perfecto y todo lo que busca es que se vayan entrelazando los conceptos e ideas de la investigación. Al hacer esto se logra una regularidad de la escritura, que reduce la ansiedad ante la página en blanco y mantiene el momentum incluso en días menos productivos. La disciplina de la redacción y revisión diaria se integra como un componente esencial del proceso investigativo. Este enfoque requiere que el investigador dedique tiempo cada día a la escritura y a la revisión de su trabajo, convirtiendo el acto de escribir en una herramienta activa de investigación y análisis.

Es común en los procesos académicos y no académicos que los investigadores no puedan llevar a cabo el proceso de escribir los resultados de la investigación y que se conoce como el termino bloqueo del escritor 58. El bloqueo se presenta con una dificultad para articular ideas o una aparente ausencia de estas que obstaculizan el proceso de escritura. Es por eso por lo que es común encontrarnos con excelentes historiadores que a pesar de conocer a cabalidad todos los pormenores de su investigación no hayan publicado sus trabajos.

El psicólogo Paul J. SiIvia es uno de los especialistas más reconocidos en los Estados Unidos que ha estudiado con profundidad los problemas de redacción y escritura en el ambiente académico. En su libro How to Write el autor explica en cómo el académico puede aumentar su productividad en la escritura mediante la implementación de un enfoque disciplinado y estructurado59. Según Silvia el escribir es una destreza no un don especial con el que nacemos y al igual que otras destrezas en la vida requiere de aprendizaje y práctica.60 El autor también critica que gran parte

58 Melanie García. Writer’s block and how to work through it. P.12. Recuperado de https://www.law.georgetown.edu/wp-content/uploads/2018/07/Writer-s-block-FinalMelanie.pdf

59 SILVIA, Paul J. How Write a Lot, A Practical Guide to Productive Academic Writing. American Psychological Association. 2007. Nota del Autor. Recomendamos la lectura de este ameno libro el cual puede ser de utilidad para escritores con poca experiencia como para el escritor más experimentado.

60 Idem. PP 5-6

de los estudiantes y profesores aprendieron a escribir de forma autodidacta y que en el proceso de formación universitaria no se fomente la redacción como un curso esencial de un grado universitario.

Silvia identifica en su libro las cuatro barreras más utilizadas para evitar escribir: 61

• No puedo encontrar tiempo para escribir;

• Necesito revisar unos documentos adicionales

• Necesito un mejor ambiente para escribir

• Solo puedo escribir cuando estoy inspirado.

Para mitigar estas barreras, el autor ofrece soluciones prácticas. Primero, ataca la idea de "encontrar tiempo". Argumenta que, al igual que la enseñanza, la escritura no es algo para lo que "encontramos" tiempo, sino algo para lo que "asignamos" tiempo. Recomienda establecer un horario fijo y regular (sin importar si es una hora al día o cuatro veces por semana) y adherirse a él. 62 Segundo, redefine la "escritura". Cualquier tarea que contribuya al proyecto (como la revisión de artículos, el análisis de documentos, o la creación de esquemas) debe llevarse a cabo dentro de ese tiempo programado. Estas tareas no son excusas para posponer la redacción, sino parte integral del proceso de escribir.63 Tercero, Silvia resta importancia al "ambiente perfecto", señalando que la productividad proviene de la disciplina y el horario, no del equipo (silla, escritorio, computadora) o el lugar. Silvia es contundente en este punto concluyendo que el equipo nunca te ayudará a escribir mucho. Solo establecer un horario y cumplirlo te hará un escritor productivo64 . Finalmente, partiendo de que la escritura es una destreza, Silvia enfatiza que la escritura no debe depender de la inspiración. De hecho, la relación es la inversa, la escritura regular es la que causa la inspiración, no al revés. Lo que realmente fomenta la productividad es el establecimiento de un horario fijo 65 . El horario tiene que mantenerse constante y no debe interferir con otras actividades programadas.

61 Idem. PP 11-28.

62 Idem. Pp. 12-13.

63 Idem. Pp. 18-19

64 Idem. Pp. 19-23

65 Idem. Pp 23-27.

Una Página Diaria

Como componente adicional y distintivo a la metodología de Goskar, propongo que el historiador digital adopte la disciplina dual de escribir una página diaria mientras simultáneamente revisa otra página escritapreviamente. Estapropuestametodológicareconoce unaverdadfundamental sobre la escritura académica, el proceso de investigación y el proceso de escritura no son secuenciales sino simultáneos e interdependientes. La página diaria no es simplemente un objetivo de producción, sino una herramienta metodologica que transforma la manera en que el historiador procesa, sintetiza y comprende la evidencia histórica que está examinando.

La teoría de la página diaria se fundamenta en el principio de que la escritura regular, aunque imperfecta, genera un momentum investigativo que es imposible de alcanzar mediante la escritura de cantazo (en grandes bloques concentrados). Cuando el historiador se compromete a escribir una página diaria, aproximadamente 250 a 300 palabras en formato académico estándar, está estableciendo un ritmo de trabajo que permite que las ideas maduren de manera orgánica. Esta página no necesita ser perfecta, de hecho, la expectativa de perfección es contraproducente al propósito fundamental del ejercicio. Lo que busca esta práctica es que el investigador vaya entrelazando los conceptos e ideas de su investigación de manera continua.

La página diaria tiene doble propósito. Por un lado, mantiene al investigador en contacto constante con su material, evitando el distanciamiento que ocurre cuando se pasan días o semanas sin escribir sobre el tema de investigación. Este contacto continuo es crucial en la investigación histórica, donde los detalles específicos, fechas, nombres, etc., pueden perderse fácilmente en la memoria si no se documentan regularmente. Por otro lado, el acto de escribir diariamente obliga al historiador a articular su pensamiento, y es en esta articulación donde frecuentemente emergen nuevas preguntas, se identifican inconsistencias en la evidencia, o se descubren patrones que no eran evidentes durante la fase de recopilación documental. La página diaria es una conversación que el historiador mantiene consigo mismo sobre su investigación.

El contenido de esta página diaria puede variar significativamente dependiendo de la fase de investigación en la que se encuentre el historiador. En las etapas iniciales, la página puede consistir en resúmenes de documentos consultados, listas de palabras clave que surjan, o cronologías preliminares de eventos. A medida que la investigación avanza, la página diaria puede transformarse en párrafos argumentativos que exploran conexiones causales entre eventos, análisis de testimonios contradictorios, o reflexiones sobre cómo ciertos hallazgos periféricos enriquecen la historia central. En las fases finales, cuando la estructura general del trabajo está más definida, la página diaria puede consistir en secciones casi completas que eventualmente se integrarán al manuscrito final. La posibilidad de variar el contenido es esencial, ya que la página diaria no se concibe como un formato estricto, sino como un lugar abierto a la exploración intelectual.

El segundo componente de esta metodología es la revisión de diaria de una página escrita previamente. La revisión diaria cumple una función que va más allá de la simple corrección de errores ortográficos o gramaticales. La revisión diaria del trabajo sirve como control de calidad constante sobre la investigación. Así, se detectan y corrigen problemas, vacíos o inconsistencias interpretativas antes de que se conviertan en obstáculos graves dentro de un manuscrito extenso. Esta práctica de revisión constante también mantiene fresco en la mente del investigador el hilo argumentativo general de su trabajo, facilitando que las nuevas páginas escritas se integren coherentemente con el material existente. La página de revisión diaria debe enfocarse particularmente en la verificación de las fuentes citadas y en la solidez de las afirmaciones históricas realizadas. En la investigación histórica digital, donde el acceso rápido a múltiples documentos puede llevar a una acumulación vertiginosa de información, es fácil cometer errores en las citas o hacer afirmaciones que no están completamente respaldadas.

La combinación de escribir una página nueva y revisar una página existente crea un ciclo de producción y refinamiento que mantiene el proyecto de investigación en constante movimiento hacia adelante. Este ciclo dual reduce la ansiedad ante la página en blanco porque el historiador sabe que no todas las páginas escritas necesitan ser definitivas desde el primer momento. Existe la seguridad de que habrá oportunidades posteriores para revisar, mejorar y, si es necesario,

reescribir completamente secciones que en su forma inicial no cumplen con los estándares deseados. Esta liberación del perfeccionismo paralizante es uno de los beneficios más significativos de la metodología de la página diaria.

En la investigación histórica digital, el investigador tiene acceso a una gran cantidad de documentos Sin un sistema de escritura regular, el historiador digital puede fácilmente acumular enormes cantidades de documentos digitalizados, capturas de pantalla, transcripciones y notas sin procesarlas adecuadamente. La disciplina de escribir diariamente fuerza al investigador a procesar, interpretar y dar sentido a la información recopilada, transformando datos brutos en conocimiento histórico articulado.

Esta metodología también se integra naturalmente con el uso de herramientas de inteligencia artificial en la investigación histórica. La página escrita diariamente puede servir como input para sistemas de IA que pueden identificar inconsistencias, sugerir conexiones con otros segmentos del texto, o señalar áreas donde se necesita más evidencia. Sin embargo, es fundamental que el historiador mantenga el control intelectual del proceso. Aunque la IA puede asistir en la identificación de problemas o en la sugerencia de mejoras estilísticas, la interpretación histórica, el juicio sobre la suficiencia de la evidencia, y la construcción del argumento central permanecen como responsabilidades del investigador.

La implementación práctica de esta metodología requiere que el historiador establezca un tiempo fijo y protegido en su horario semanal. Siguiendo lo recomendado por Silvia el tiempo separado debe ser fijo y a la misma hora. Este tiempo protegido puede ser tan breve como una hora diaria. Lo crucial no es la duración de cada sesión sino la regularidad con la que ocurren.

El sistema de la página diaria también facilita el establecimiento de metas de investigación más amplias y permite medir el progreso. Una página diaria se traduce en aproximadamente 1,500 palabras por semana (asumiendo escritura cinco días a la semana), 6,000 palabras por mes, y 72,000 palabras por año. Este volumen anual es suficiente para producir un libro completo o

múltiples artículos para revistas. Más importante aún, porque el progreso se mide en unidades pequeñas y manejables (una página), el historiador puede ver y sentir el avance continuo de su proyecto, lo cual es crucial para mantener la motivación a largo plazo.

Laintegraciónde esta metodología conlas fases anteriores del procesode investigación histórica digital es orgánica y necesaria. La escritura diaria se nutre directamente de las actividades descritas en los capítulos previos, las palabras clave identificadas mediante búsquedas sistemáticas, las pistas seguidas a través de redes documentales, los hallazgos de la investigación periférica, y los resultados del filtrado crítico de fuentes. Cada una de estas actividades genera material que debe ser procesado, interpretado y articulado mediante la escritura. Sin la disciplina de la página diaria, existe el riesgo de que toda esta investigación permanezca en forma de notas dispersas y documentos sin procesar, sin cristalizarse nunca en una historia coherente y publicable.

En los capítulos anteriores hemos presentado una metodología integral para la investigación histórica digital, desde establecer el punto de partida historiográfico, dominar el lenguaje de las búsquedas, seguir pistas sistemáticamente, desarrollar visión periférica, filtrar resultados críticamente, hasta mantener disciplina de escritura diaria. Cada capítulo ha desarrollado un aspecto del sistema H-LAM/T de Engelbart. En ellos se mostró cómo el conocimiento de los artefactos digitales disponibles, el dominio del lenguaje de búsqueda especializado, la aplicaciónde metodologías adecuadas alentornodigital yel entrenamientocontinuoconstituyen pilares fundamentales de su sistema.

Sin embargo, mientras escribimos este libro en 2024-2025, estamos presenciando el surgimiento de un nuevo tipo de Artefacto que ha transformado la investigación histórica tan profundamente como lo hicieron los repositorios digitales hace dos décadas, la inteligencia artificial. Si los capítulos anteriores abordaron cómo el investigador utiliza artefactos digitales para acceder, buscar y procesar fuentes históricas, este capítulo final explora cómo la IA representa no solo un nuevo artefacto, sino una reconfiguración potencial de todo el sistema H-LAM/T.

La introducción de nuevos artefactos no simplemente facilita el trabajo existente, transforma fundamentalmente cómo conceptualizamos y ejecutamos ese trabajo. La IA, con su capacidad de procesar, analizar y sintetizar información a escala sin precedentes, nos obliga a desarrollar nuevo Lenguaje (términos como "prompts", "alucinaciones", "RAG"), nueva Metodología (verificación crítica de outputs, estrategias de validación), y nuevo Entrenamiento (alfabetización en IA). El siguiente capítulo explora cómo integrar responsable y críticamente este nuevo artefacto en la práctica de la investigación histórica digital, manteniendo el rigor metodológico que caracteriza nuestra disciplina mientras aprovechamos las capacidades que la IA ofrece para aumentar nuestra capacidad investigativa.

VIII.INTELIGENCIA ARTIFICIAL

En este trabajo hemos trazado un recorrido metodológico que comenzó con el marco teórico de Vannevar Bush y Douglas Engelbart, y luego desarrolló cada componente del sistema H-LAM/T a través de capítulos que abordaron sucesivamente los Artefactos (repositorios digitales), el Lenguaje (palabras clave y operadores de búsqueda), la Metodología (seguimiento de pistas, visión periférica, filtrado crítico), y el Entrenamiento (disciplina de escritura diaria). Cada capítulo ha demostrado cómo la investigación histórica digital no es simplemente la versión digitalizada de la investigación tradicional, sino una práctica transformada que requiere nuevas competencias y habilidades por parte del historiador.

Ahora, en 2025, nos encontramos en un momento de transición histórica comparable a la revolución digital de los años 1990-2000. La inteligencia artificial representa un nuevo “Artefacto" (A) tan disruptivo que, siguiendo la lógica de Engelbart, está provocando una reconfiguración de todos los demás componentes del sistema H-LAM/T. Para Bush, el objetivo del Memex no era solo digitalizar información, sino diseñar sistemas capaces de operar mediante asociaciones, emulando los procesos cognitivos humanos. Su visión era de una herramienta que permitiera al investigador seguir "senderos asociativos” entre piezas de información dispares. La inteligencia artificial, específicamente los sistemas como Gemini (incluyendo NotebookLM), Claude y ChatGPT, realizan precisamente esta función de asociación semántica, pero a una escala y velocidad que Bush apenas podía imaginar. Estos nuevos artefactos transforman la práctica investigativa.

En el sistema H-LAM/T la introducción de nuevos "Artefactos" (A) , como el ratón, y hoy la IA, no solo aceleran las tareas existentes, sino que aumenta la capacidad cognitiva humana al obligar a adoptar nuevos "Lenguajes" (L), nuevas "Metodologías" (M), mediante nuevo "Entrenamiento" (T). La IA no es simplemente otra herramienta digital que agregamos a nuestro arsenal investigativo; es un artefacto que requiere reconfiguración de todo nuestro sistema de investigación.

La IA introduce un nuevo "Lenguaje" (L), con términos como "ingeniería de “prompts” , "alucinación", y "Generación Aumentada por Recuperación (RAG)". Exige una nueva "Metodología" (M), donde la verificación de la producción de la IA se vuelve tan crucial como la búsqueda original de fuentes, y donde el análisis de legajos completos reemplaza la lectura de documentos individuales. Y, fundamentalmente, requiere un nuevo "Entrenamiento" (T), donde

la alfabetización en IA se convierte en una competencia central e ineludible para el historiador del siglo XXI.66

Este capítulo analizará las funciones específicas de Gemini (incluyendo a NotebookLM), Claude y ChatGPT no como herramientas aisladas, sino como componentes integrados en el marco metodológico H-LAM/T y en los pasos de investigación (Punto de Partida, Investigación Periférica, Filtrado, Redacción) ya establecidos en este trabajo.

Conceptos de la Inteligencia Artificial

La ingeniería de prompts es el arte de diseñar y optimizar las instrucciones o preguntas que se le dan a un modelo de lenguaje para obtener los resultados deseados.

Ingeniería de prompts

Alucinación

Análisis multimodal

Generación Aumentada por Recuperación (RAG)"

Implica entender cómo funciona el modelo y cómo afecta el lenguaje que le damos. La ingeniería de prompts es fundamentalpara obtener el máximo potencialde los modelos de lenguaje.67

Un término que se usa cuando un modelo de IA genera informaciónfalsa,sinsentidooquenoestárespaldadaporsus datos de entrenamiento,pero la presenta como un hecho.68

Se refiere a los sistemas de IA que pueden "entender y generar información de múltiples fuentes: texto, imágenes, sonido y más", a diferencia de los modelos unimodales que solo procesan un tipo de formato.69

La Generación Aumentada por Recuperación (RAG) es una técnicade inteligenciaartificialquemejoralascapacidadesde los grandesmodelos de lenguaje (LLM) al combinar unsistema de recuperación de información con capacidades de generación de texto. Esta técnica permite que los modelos accedan a fuentes de datos externas y actualizadas antes de generar sus respuestas, en lugar de depender únicamente de sus datos de entrenamiento originales.70

Enel marcoconceptual H-LAM/T de Engelbart, ChatGPT, Claude y Geminirepresentan los nuevos "Artefactos" que el historiador debe dominar. Cada una de estas herramientas posee

66 Aniella Mihaela Vierru y Garbiel Petrea. (2025) The Impact of Artificial Intelligence (AI) on Students' Academic Development - MDPI, https://www.mdpi.com/2227-7102/15/3/343

67 https://www.gobierto.es/blog/inteligencia-artificial-guia-de-conceptos-esenciales

68 Idem.

69 https://eseid.com/ia-generativa-multimodal/

70 https://www.elastic.co/es/what-is/retrieval-augmented-generation

características distintivas que las hacen particularmente útiles para diferentes aspectos de la investigación histórica. El historiador debe evaluar cada herramienta periódicamente ya que sus funcionalidades cambian constantemente. Además, es recomendable su uso cruzado.

A continuación, mostramos una metodología generada por IA para el uso de las herramientas de la IA en la investigación histórica.71

71 Metodología para la Integración de Herramientas de Inteligencia Artificial en la Investigación Histórica." Respuesta generada por Claude (Claude Opus 4.1), Anthropic, 26 oct. 2025, claude.ai. Conversación con asistente de IA.

Joseph Harrison Flores

Paso 1- Acceso y Familiarización

El primer paso en la incorporación de herramientas de inteligencia artificial a la práctica historiográfica requiere un proceso sistemático de acceso y familiarización. Es recomendable la creación de cuentas en las tres plataformas principales: ChatGPT, Claude y Gemini. Luego del registro el historiador debe dedicar tiempo a explorar como opera cada herramienta y que funcionalidades ofrecen. Durante esta fase exploratoria, el investigador podrá conocer las características distintivas de cada herramienta (Ej. Deep Research, upload files, créate image, etc.). El conocer cada herramienta permitirá al historiador seleccionar posteriormente la más apropiada para cada fase específica de su investigación.

El entender las interfaces de estos sistemas de inteligencia artificial constituye un requisito para su aprovechamiento efectivo en la investigación histórica. Cada plataforma presenta una arquitectura de usuario distintiva, con herramientas y funcionalidades específicas que responden a diferentes necesidades metodológicas. El dominio de estas interfaces permitirá al historiador no solo formular consultas más precisas, sino también identificar qué sistema resulta más apropiado según la naturaleza de la tarea. Cada uno ofrece resultados distintos ya sea el análisis de fuentes primarias, la síntesis de información secundaria, la traducción de documentos, o la organización de datos de investigación. Por tanto, antes de integrar estas herramientas en el flujo de trabajo historiográfico, es imprescindible familiarizarse con los elementos básicos de navegación y las capacidades técnicas que ofrece cada plataforma.

En las siguientes páginas se presenta una descripción de las interfaces de Gemini, ChatGPT y Claude, destacando las funciones principales que cada sistema ofrece al usuario. Estas descripciones incluyen tanto los elementos básicos de la interfaz (campos de entrada, menús de navegación, selectores de modelo) como las herramientas especializadas que distinguen a cada plataforma (investigación profunda, generación de imágenes, integración con servicios externos, entre otras). El objetivo de esta sección es proporcionar al historiador un mapa funcional de cada sistema, facilitando así una selección informada de la herramienta más adecuada para cada etapa específica del proceso investigativo. Se recomienda revisar estas descripciones con detenimiento antes de proceder a las aplicaciones prácticas que se desarrollarán en los pasos subsiguientes.

Gemini72

Gemini es una familia de modelos de inteligencia artificial multimodal desarrollada por Google. Está diseñada nativamente para procesar, comprender y razonar sobre diferentes tipos de información de manera fluida, incluyendo texto, imágenes, audio, video y código. Su arquitectura está pensada para ser flexible y escalable, operando desde en centros de datos hasta en dispositivos móviles. Las versiones más recientes y estables (a finales de 2025) pertenecen a la serie Gemini 2.5. Esta familia incluye Gemini 2.5 Pro, el modelo más avanzado para tareas complejas y razonamiento; Gemini 2.5 Flash, optimizado para un equilibrio entre velocidad y rendimiento; y Gemini 2.5 Flash-Lite, enfocado en la máxima eficiencia y bajo costo para tareas de gran volumen.

Funciones

1. Campo "Ask Gemini" - Es el área de texto principal donde se escribe el “prompt” o instrucción del usuario para que el sistema responda

2. Botón "+" (izquierda) -Permite iniciar una nueva conversación o chat

3. Botón "Tools" - Da acceso a herramientas y extensiones de Gemini. Puede incluir funciones como búsqueda en Google, YouTube, Maps, Gmail, Drive, etc.

4. Selector "2.5 Pro"- Menú desplegable para seleccionar el modelo de IA en este caso "2.5 Pro" indica que estás usando la versión Pro de Gemini. Permite cambiar entre diferentes versiones del modelo (Flash, Pro, etc.)

6. Icono de micrófono (derecha)- Permite usar entrada de voz en lugar de escribir Facilita hacer preguntas habladas.

72 Gemini. (2025, 29 de octubre). Respuesta de Gemini a la instrucción del usuario “Haz un parrafo describiendo la que es Gemini, Claude y Chatgpt incluyendo sus versiones mas actualizadas. LOs parrafos deben ser individuales para cada herramienta de ia.

Opciones del menú "+":

1. Upload files (�� icono de clip)- Permite subir archivos desde tu computadora Puedes cargar documentos, imágenes, PDFs, etc. para que Gemini los analice Útil para pedirle a Gemini que lea, resuma o extraiga información de archivos

2. Add from Drive (△ icono de Drive) -Conecta con Google Drive -Permite seleccionar y adjuntar archivos directamente desde tu almacenamiento en Drive Facilita el acceso a documentos que ya tienes guardados en la nube

3. Import code (</> icono de código)- Función especializada para importar código de programación. Permite que Gemini analice, explique, depure o mejore código Útil para desarrolladores que necesitan ayuda con scripts o programas

Elementos que permanecen:

2. El botón "Tools" para acceder a extensiones

3. Selector "2.5 Pro" para cambiar el modelo

4. Icono de micrófono para entrada de voz

Este menú facilita trabajar con diferentes tipos de contenido en Gemini más allá de solo texto.

Funciones del menú "Tools":

1. Deep Research (�� icono de lupa)- Función de investigación avanzada. Al usar esta opción Gemini realiza búsquedas exhaustivas sobre un tema. Ademas recopila información de múltiples fuentes y genera un informe complete. Esto es Ideal para investigaciones académicas o profesionales También aparece como botón de acceso rápido en la parte inferior.

2. Create videos with Veo (�� icono de video) - Herramienta para generar videos usando IA "Veo" es el modelo de IA de Google para creación de video que permite crear contenido audiovisual a partir de descripciones de texto

3. Create images (�� icono con emoji de arte)- Generador de imágenes con IA. Esta opción crea ilustraciones, diseños o imágenes a partir de descripciones

4. Canvas- Espacio de trabajo colaborativo Permite crear y editar documentos de forma interactive. Gemini puede ayudarte a desarrollar contenido en este formato

5. Guided Learning (�� icono de libro)- Modo de aprendizaje guiado Gemini estructura lecciones paso a paso sobre temas específicos. Útil para aprender nuevos conceptos de manera organizada

También se observa un botón "Create Video" de acceso rápido en la parte inferior derecha.

Estas herramientas expanden las capacidades de Gemini más allá del chat simple, convirtiéndolo en una plataforma multifuncional.

Gemini

Chatgpt73

ChatGPT es el popular producto de chatbot conversacional desarrollado por OpenAI, que permite a los usuarios interactuar con sus modelos de IA subyacentes. El modelo fundamental más avanzado que impulsa las capacidades de ChatGPT (a finales de 2025) es GPT-5, lanzado en agosto de 2025. GPT-5 es un modelo multimodal con capacidades de razonamiento avanzadas, diseñado para manejar problemas lógicos, científicos y de codificación complejos. Dentro de la plataforma ChatGPT, este modelo está disponible en diferentes niveles, como GPT-5, GPT-5 mini y GPT-5 nano, que equilibran la potencia de razonamiento con la velocidad y el costo para adaptarse a diferentes tipos de usuarios y tareas.

Elementos de la interfaz de ChatGPT:

1. Campo "Ask anything"- Area de texto principal donde entras tus preguntas o prompts. Es el espacio de entrada principal para interactuar con ChatGPT

2.. Botón "+" (izquierda)- Expande las opciones de búsqueda (ver próxima imagen)

3. "Extended thinking" (menú desplegable)- Modo de razonamiento extendido- Cuando está activado, ChatGPT dedica más tiempo a "pensar" antes de responder Útil para problemas complejos que requieren análisis profundo Puedes desactivarlo para respuestas más rápidas en consultas simples.

4. Icono de micrófono (��)- Permite usar entrada de voz en lugar de escribir Facilita hacer preguntas habladas.

Chatgpt

Opciones del menú "+" en ChatGPT:

1. Add photos & files (�� icono de clip)- Permite subir archivos desde tu dispositivo Puedes adjuntar imágenes, documentos, PDFs, hojas de cálculo, etc.. ChatGPT puede analizar, leer y trabajar con estos archivos

2. Add from OneDrive (☁️ icono de OneDrive)- Integración con Microsoft OneDrive Permite acceder y adjuntar archivos directamente desde tu almacenamiento en la nube. Util para usuarios que trabajan con el ecosistema de Microsoft

3. Company knowledge (�� icono de red)- Acceso a la base de conocimientos del network si estas utilizando la version institucional. Permite que ChatGPT consulte documentos y datos permitidos por la institucion.

4. Deep research (�� icono de búsqueda)- Función de investigación profunda ChatGPT realiza búsquedas exhaustivas y genera informes detallados.

5. Agent mode (�� icono de agente)- Modo agente que permite a ChatGPT realizar tareas de forma más autónoma. Puede ejecutar acciones complejas y tomar decisions. Funciona como un asistente más proactivo

6. Create image (��️ icono de imagen)- Generador de imágenes con IA (DALL-E) Crea ilustraciones y diseños a partir de descripciones de texto

7. More (... tres puntos con flecha →)- Menú adicional con más opciones Indica que hay funciones adicionales disponibles

Este menú hace que ChatGPT sea más versátil al permitir trabajar con diferentes tipos de contenido y modos especializados.

1. Campo "How can I help you today?"- Área de texto principal donde escribes tus preguntas o prompts Espacio para iniciar la conversación con Claude

2. Botón "+" (izquierda)- Permite adjuntar archivos. Puedes subir documentos, imágenes, PDFs, etc.

3. Botón de líneas/ajustes (≈)- Posiblemente para configuraciones o ajustes de la conversación Puede controlar formato o preferencias

4. Botón de reloj (��)- Acceso al historial de conversaciones Permite ver y retomar chats anteriores

5. Selector "Sonnet 4.5" (con menú desplegable)- Permite cambiar entre diferentes modelos de Claude "Sonnet 4.5" es el modelo actual seleccionado. Otros modelos disponibles pueden incluir Opus, Haiku, etc.

6. Botón con flecha arriba (↑ en color salmón)- Botón para enviar tu mensaje Se activa cuando escribes algo en el campo de texto

Opciones del menú "+" en Claude:

1. Upload a file (�� icono de clip)- Permite subir archivos desde tu computadora o telefono. Acepta documentos, imágenes, PDFs, hojas de cálculo, etc. Claude puede leer, analizar y trabajar con estos archivos

2. Take a screenshot (�� icono de cámara)- Función para capturar pantallas directamente Permite que Claude analice lo que estás viendo en tu pantalla. Util para obtener ayuda con problemas visuales o interfaces

4. Add from GitHub (�� icono de GitHub)- Integración con GitHub- Permite importar código o repositorios directamente Ideal para desarrolladores que trabajan con proyectos en GitHub

5. Add from Google Drive (�� icono de Drive con →)- Conexión con Google Drive. Accede a documentos almacenados en tu cuenta de Drive. La flecha indica que hay un submenú con más opciones

6. Use a project (�� icono de carpeta con →)- Función de proyectos organizados. Permite trabajar en contextos específicos (cada Proyecto puede ser una investigación separada). La flecha indica opciones adicionales o proyectos guardados

Claude

Claude

Opciones del menú de herramientas en Claude:

1. Use style (��️ icono de pluma con →)-Personaliza el estilo de escritura de Claude. La flecha indica que hay un submenú con diferentes estilos disponibles

2. Extended thinking (�� con toggle ACTIVADO - azul)- Modo de razonamiento extendido. Claude dedica más tiempo a analizar antes de responder Útil para problemas complejos que requieren análisis profundo

3. Research (�� con toggle DESACTIVADO - gris)- Modo de investigación profunda.

4. Web search (�� con toggle ACTIVADO - azul)- Permite a Claude buscar información en internet Claude puede buscar info actualizada en la internet.

5. Drive search (�� Google Drive con toggle ACTIVADO - azul) Claude puede acceder a tus archivos de Drive

6. Gmail search (�� Gmail con toggle ACTIVADO - azul) -Búsqueda en Gmail habilitada Claude puede buscar en tus correos

8. Calendar search (�� Google Calendar con botón "Connect" ��)- Integración con Google Calendar Requiere conexión

9. Add connectors (+ símbolo más)- Opción para agregar nuevas integraciones. Permite conectar más servicios y herramientas para automatización.

Paso 2- La Fase de Exploración Inicial

Una vez completada la familiarización técnica, el historiador debe abordar la exploración inicial del tema de investigación mediante estas herramientas. Este proceso comienza con la formulación cuidadosa de preguntas exploratorias que permitan evaluar la profundidad y precisión del conocimiento que cada sistema posee sobre el área de estudio. Es fundamental establecer desde el principio el contexto disciplinar e historiográfico específico, proporcionando a estas herramientas el marco referencial necesario para generar respuestas académicamente relevantes. La comparación sistemática de las respuestas obtenidas de las tres plataformas no constituye un ejercicio redundante, sino una práctica metodológica esencial que permite identificar patrones comunes y divergencias significativas, revelando así los sesgos potenciales y las fortalezas particulares de cada sistema.

El “prompt”

El prompt constituye el lenguaje de comunicación entre el historiador y las herramientas de inteligencia artificial. El prompt no es una pregunta, es parte de la metodología que determina la calidad, precisión y utilidad de las respuestas que nos va a proporcionar el sistema IA. En el contexto de la investigación histórica, el prompt funciona como una traducción del pensamiento historiográfico al lenguaje computacional, requiriendo del investigador no solo claridad conceptual sino también comprensión de cómo estos sistemas procesan y generan información.

La construcción inadecuada de un promp nos puede llevar a respuestas genéricas, anacrónicas o sin utilidad. Por el contrario, un prompt bien construido maximiza el uso de la herramienta lo que incide en la calidad del resultado que nos ofrece. Es por eso que la creación prompts en una competencia metodológica, tan importante como la crítica de las fuentes o el análisis documental en la historiográfica tradicional.

La construcción de prompts requiere una estructura sistemática que integre diversos componentes metodológicos. A diferencia de una consulta informal o una pregunta espontánea, el prompt historiográfico debe articularse mediante parámetros específicos que orienten al sistema de IA hacia respuestas documentadas. Esta estructuración no limita la creatividad del investigador, sino que la canaliza hacia resultados académicamente válidos. Para facilitar este proceso, se ha desarrollado una matriz de seis parámetros fundamentales que, aplicados de manera consistente, permiten transformar una interrogante histórica en un prompt efectivo. Estos parámetros, rol, objetivo, corpus, entrega, evidencia obligatoria y criterios de redacción, funcionan como una plantilla metodológica adaptable a distintos tipos de investigación histórica, desde el análisis de fuentes primarias hasta la síntesis historiográfica comparativa.

Un buen prompt debe incluir los siguientes parámetros:

Sección

Rol

Objetivo

Corpus

Entrega

Evidencia obligatoria

Criterios de redacción

Descripción / Instrucción

Especifica la identidadexperta que asignamos al sistema de IA. Ejemplo: "Actúa como historiador especializadoen historia social del Caribe del siglo XX" o "Actúa como archivista experto en documentación colonial puertorriqueña". Define el campo de especialización, el periodo histórico y el área geográfica según tu investigación.

Define con precisión qué tarea específica necesitas que realiceel sistema. Usa verbos de acción claros: identificar, comparar, analizar, sintetizar, rastrear,evaluar, contrastar. Ejemplo: "Identifica las principales transformaciones en la legislación laboral" o "Compara las políticas educativas entre1940 y 1960". Evita objetivos vagos o múltiples en un solo prompt.

Indica al sistema qué tipo de fuentes debe priorizar o consultar. Especifica si debe usar fuentes académicas revisadas por pares, documentos institucionales, archivos específicos, o documentos que hayas subido al sistema. Puedes indicar preferencia por fuentes de Puerto Rico, el Caribe,o repositorios específicos. Si subes documentos, refiérelos explícitamente aquí.

Establece el formato y estilo de presentación de la respuesta. Define: extensión (párrafos breves, análisisextenso, lista puntual), tono (académico formal, divulgación general, educativo), estructura (cronológica, temática, comparativa), y sistema de citación (citas textuales entrecomilladas con enlaces, referencias al final, notas al pie).

Requiere que el resultado incluya datos verificables, fechas específicas,nombres de leyes o decretos, instituciones mencionadas, lugares exactos, números de documentos, páginas o folios. Instruye al sistema a responder explícitamente "no encontrado" o "evidencia insuficiente" cuando no pueda documentar una afirmación, evitando así especulaciones o generalizaciones.

Establece las normas deescritura académica que debe ofrecer el sistema. Esto incluye lenguaje preciso y sobrio, evitar anacronismos terminológicos, incluir contexto temporal cuando sea relevante, señalar contrastes o cambios históricos, traducir términos cuando sea necesario, y abstenerse completamente de especulaciones o interpretaciones sin fundamento documental.

Tomando en consideración estos parámetros presentamos en la siguiente página unos ejemplos de prompts que podrían ser utilizados en cualquiera de las plataformas de IA.

Prompt 1: Ley Jones de 1917

Rol: Actúa como asistente de investigación histórica especializado en legislación colonial estadounidense y PuertoRico (1900-1920).

Objetivo: Identificar los debates legislativos documentados en el Congreso de EE.UU. sobre la Ley Jones (1917), específicamente: argumentos a favor y en contra de extender la ciudadanía, enmiendas propuestas que fueron rechazadas, y testimonios de representantes puertorriqueños si los hubo.

Corpus: Usa fuentes del Congressional Record (1914-1917), Library of Congress, archivos de la Cámara de Delegados de Puerto Rico, y documentos del Departamento de Guerra de EE.UU.

Entrega: Responde en párrafos breves; incluye cita corta entrecomillada del Congressional Record u otra fuente primaria, con fecha exacta (día/mes/año), número de sesión y página. Enlaza a la fuente digitalizada cuando esté disponible.

Evidencia obligatoria: Menciona fecha de cada debate, nombres de congresistas, número de votos, enmiendas específicas rechazadas. Si no encuentras testimonio directo de delegados puertorriqueños en el proceso legislativo, indica "no encontrado en registros del Congreso".

Criterios: Lenguaje sobrio, 1-2 párrafos por hallazgo. No especules sobre intenciones no documentadas. Si hay múltiples interpretaciones históricas, preséntalas con sus fuentes respectivas.

Prompt 2: Administración de Rexford Tugwell

Rol: Actúa como asistente de investigación histórica especializado en gobernadores estadounidenses de Puerto Rico y New Deal caribeño.

Objetivo: Documentar reformas administrativas, económicas y sociales específicas implementadasdurantelagobernacióndeRexford Tugwell (1941-1946), comparándolas con administraciones anteriores (Winship, Leahy) en áreas medibles: presupuesto para educación, salud pública,reforma agraria, electrificación.

Corpus: Usa Annual Reports del Governor of PuertoRico(1941-1946),documentosdelaPuerto Rico Reconstruction Administration, archivos universitarios (UPR, Centro de Investigaciones Históricas), y correspondencia Tugwell-Roosevelt en FDR Library.

Entrega: Responde en párrafos breves con datos cuantitativoscuandoexistan(presupuestos, leyes aprobadas, proyectos iniciados). Incluye cita entrecomillada de informes oficiales con año y página específica.

Evidencia obligatoria: Menciona número de ley, fecha de aprobación, partida presupuestaria, o número de proyecto. Si Tugwell propuso reformas que la Legislatura rechazó, documéntalo con actas legislativas. Si no hay evidencia de colaboración o conflicto específico con otros actores políticos, indica "no documentado en fuentes consultadas".

Criterios: Lenguaje sobrio, evita valoraciones ("progresista", "visionario") sin contexto comparativo medible. 1-2 párrafos por reforma documentada.

Paso 3- Búsqueda y Verificación Bibliográfica

La búsqueda bibliográfica por la inteligencia artificial transforma los métodos tradicionales de recopilación de fuentes. El proceso se inicia solicitando a cada plataforma que proporcione referencias bibliográficas sobre el tema en cuestión. Contrario a lo que ocurre en una búsqueda típica en Google la solicitud a la IA puede incluir el contexto particular de lo que puede ser el tema de investigación. Al llevar a cabo este paso se recomienda utilizar la opción de “Deep Research” y/o “Web” en las herramientas. Esto obligara a la IA a ser más rigurosa en la búsqueda.

A continuación, mostramos un prompt modelo para la búsqueda de bibliografía:

Ejemplo de prompt

Leyes de Veteranos y Urbanización en Puerto Rico (1944-1965)

Rol: Actúa como asistente de investigación histórica especializado en desarrollo urbano, política habitacional y Puerto Rico (1940-1970).

Objetivo: Cuantificar el impacto de la legislación federal para veteranos (GI Bill/Servicemen's Readjustment Act de 1944 y sus enmiendas) en el desarrollo de urbanizaciones en Puerto Rico. Identificar: qué agencias administraron estos beneficios en PR, cuántos préstamos hipotecarios se otorgaron a veteranos puertorriqueños, en qué municipios/sectores se concentraron las viviendas construidas, y si hubo diferencias en elegibilidad o implementación comparado con estados continentales.

Corpus: Usa informes del Veterans Administration Office en Puerto Rico (si existen archivos), registros de la Administración de Veteranos (National Archives), censos de vivienda de PR (1950, 1960), documentos de la Junta de Planificación sobre zonificación, escrituras de urbanizaciones en Registro de la Propiedad, estudios del Federal Housing Administration, y prensa de época (El Mundo, periódicos regionales 1945-1960).

Entrega: Responde en párrafos breves con datos cuantitativos por década y municipio cuando existan. Para cada urbanización o proyecto identificado, incluye: nombre, municipio, año de desarrollo, número aproximado de unidades, y fuente documental específica (con año, institución archivística y número de caja/legajo si aplica). Enlaza a fuentes digitalizadas del National Archives o bibliotecas universitarias cuando estén disponibles.

Evidencia obligatoria: Menciona número de préstamos VA aprobados en PR por año (1945-1965), tasas de interés aplicadas, requisitos de elegibilidad específicos para PR, nombres de urbanizaciones documentadas como construidas con financiamiento de veteranos (ej: Villa Nevares, Country Club, extensiones urbanas). Si existieron barreras burocráticas, discriminación en tasación de propiedades, o diferencias en aplicación de la ley federal en PR vs. continente, documéntalo con correspondencia oficial, reportes de auditoría o testimonios en prensa. Si no hay estadísticas desagregadas para PR en reportes federales de VA, indica "datos específicos de Puerto Rico: no encontrados en Annual Reports de VA [años consultados]".

Criterios: Lenguaje técnico-urbano sobrio. 1-2 párrafos por hallazgo. No asumas que el GI Bill operó igual en PR que en estados sin verificar documentación. Si encuentras que ciertos beneficios no aplicaban o se implementaron tardíamente en PR, documéntalo con legislación o directivas administrativas específicas. Compara, cuando sea posible, con tasas de desarrollo urbano en municipios con baja población de veteranos para evaluar la correlación.

El paso más crítico en este proceso es la verificación de la existencia y pertinencia de las fuentes sugeridas. Esta verificación no es opcional y constituye un requisito dado que las referencias inexistentes o las atribuciones erróneas representan uno de los riesgos más significativos en el uso de IA para investigación académica.

Paso 4- Análisis de Fuentes Primarias

El trabajo con fuentes primarias por la IA requiere dar varios pasos para poder lograr resultados positivos. El proceso típicamente comienza con la transcripción de documentos originales, convirtiéndolos a formato digital para su procesamiento por las herramientas de IA. Una vez digitalizados, estos textos pueden someterse a un análisis contextual permitiendo la identificación de elementos que podrían pasar inadvertidos a simple vista. El análisis estadísticos y matemático es una de las áreas mas fuertes de la IA. Cuando se manejan conjunto de datos como pueden ser listas de personas, censos, o datos sobre exportación de producto la IA es la mejor aliada del historiador.

En el Capítulo VI ("Filtrar los resultados"), se presentó la Tabla 3: Extracto de lista de implicados en el Grito de Lares. Esa tabla, con sus columnas (Nombre, Vecindad, Profesión, Se declara), es un conjunto de datos perfecto demostrar el análisis de fuentes primarias. El investigador puede subir dicha tabla (como un archivo de Google Sheets, un CSV, o incluso como una imagen) en cualquiera de la IA y usar un prompt para llevar a cabo un análisis de datos que antes requerirían software estadístico. A continuación, mostramos un “prompt” con unas instrucciones para procesar la tabla y el resultado de dicho prompt en Gemini:

Ejemplo de prompt

Análisis de Fuentes Primarias (Grito de Lares)

Análisis Descriptivo: "Analiza esta tabla de implicados en el Grito de Lares. Genera un gráfico de barras que muestre la distribución de profesiones ('Jornalero', 'Propietario', 'Papelista', etc.)".

Análisis de Correlación: "¿Existe alguna correlación aparente en estos datos entre la 'Vecindad' del implicado y su 'Profesión'?"

Generación de Hipótesis: "Basado en la columna 'Se declara' (Confiesa/Niega), ¿qué patrones observas? ¿Qué factores podrían influir en que un implicado confiese o niegue?".

En las siguientes paginas se incluyen algunos de los resultados del análisis llevado a cabo por Gemini sobre la base de datos y las instrucciones proporcionadas

Joseph Harrison Flores

Conclusiones Principales

Composición Social Diversa pero Predominantemente Popular: El Grito de Lares fue principalmente un movimiento de jornaleros y labradores, pero incluyó participación significativa de propietarios, comerciantes y esclavos, indicando una base social amplia.

Patrones Geográficos Significativos: Existe una correlación estadísticamente significativa (p < 0.000001) entre la ubicación geográfica y la profesión de los implicados, reflejando diferentes estructuras económicas regionales.

Variabilidad en Estrategias de Defensa: Las tasas de confesión variaron significativamente por región (29% a 57%) y profesión (30% a 51%), sugiriendo múltiples factores en juego: presión judicial, evidencia disponible, capital social, y estrategias legales.

Clase Social y Acceso a Recursos Legales: Los propietarios y comerciantes mostraron mayor incidencia de estrategias legales complejas (confesiones con retractación), mientras que jornaleros y esclavos optaron por estrategias binarias (confesar o negar).

Dificultades de Coordinación: La alta variabilidad en declaraciones (68 formulaciones diferentes) sugiere que los implicados enfrentaron información asimétrica y dificultades para coordinar defensas colectivas.

Limitaciones del Análisis

Datos Incompletos: 22 casos sin registro de declaración (4.0%), 3 casos sin lugar de origen, lo que podría sesgar resultados

Categorización Subjetiva: Las 68 variaciones textuales fueron normalizadas en categorías, pudiendo perder matices importantes

Falta de Información Temporal: No se dispone de fechas exactas de arrestos o interrogatorios

Contexto Individual Desconocido: No se conocen circunstancias específicas de cada interrogatorio (presencia de tortura, duración, ubicación)

Paso 5- Construcción del Contexto Histórico

La contextualización histórica se beneficia de las capacidades asociativas y de síntesis que ofrecen la IA. La construcción de marcos cronológicos y teóricos trasciende la simple enumeración de fechas para convertirse en un ejercicio de comprensión temporal donde los eventos se entrelazan en redes causales más complejas. El establecimiento de conexiones causales y correlaciones permite al historiador visualizar patrones que podrían permanecer ocultos en un análisis tradicional. La identificación de actores, instituciones y procesos relevantes se ve potenciada por la capacidad de estas herramientas para procesar vastos volúmenes de información y detectar menciones y referencias cruzadas. El mapeo del contexto político, social y económico adquiere una riqueza multidimensional cuando se combina el conocimiento experto del historiador con las capacidades de procesamiento y síntesis de la inteligencia artificial.

En el siguiente ejemplo se le solicitó a la IA desarrollar el contexto histórico y conceptual de la Industria Petroquímica en Puerto Rico (1955-1975). El “prompt” utilizado fue el siguiente:

Ejemplo de prompt Industria Petroquímica en Puerto Rico (1955-1975)

Rol: Actúa como asistente de investigación histórica especializado en análisis contextual multidimensional y detección de redes causales complejas.

Objetivo: Construir un marco contextual comprehensivo sobre el establecimiento de la industria petroquímica en Puerto Rico (1955-1975). Identifica actores principales, instituciones relevantes, eventos políticos y económicos conectados, y patrones o correlaciones entre procesos aparentemente separados. Explica cómo factores locales, nacionales e internacionales se entrelazan para hacer posible esta transformación industrial.

Corpus: Usa fuentes académicas sobre historia económica, ambiental y social de Puerto Rico, documentos gubernamentales, estudios comparativos con otras regiones petroquímicas, y prensa de época cuando sea pertinente.

Entrega: Organiza tu análisis mostrando conexiones causales entre eventos, relaciones entre actores, y contextos que operan en diferentes escalas (internacional, nacional, local). Presenta cronología de forma que revele interdependencias, no solo secuencia. Para cada conexión causal o correlación identificada, cita fuente específica con año y página.

Evidencia obligatoria: Distingue claramente entre causalidad documentada en fuentes primarias, correlaciones temporales respaldadas por datos, e hipótesis interpretativas que requieren investigación adicional. Si propones conexión entre eventos sin evidencia directa, indícalo explícitamente: "correlación temporal sugerida, causalidad directa no documentada en fuentes consultadas".

Criterios: Lenguaje analítico sobrio. Construye explicación multicausal, no monocausal. Evita narrativas simplificadas. Señala contradicciones en fuentes o lagunas en evidencia disponible. Extensión: suficiente para presentar complejidad contextual sin redundancia (típicamente 4-6 secciones bien fundamentadas).

El resultado del prompt anterior se puede consultar en el anejo 6 de este trabajo.

Apoyo en el Proceso de Escritura

Durante la fase de redacción, las herramientas de IA funcionan como asistentes editoriales que trascienden los errores ortográficos. Su contribución más importante radica en la capacidad de generar conexiones lógicas entre las diferentes secciones del trabajo que aún están desconectadas. La IA ayuda al historiador a completar y unir diferentes partes de un trabajo de manera coherente. Como estos sistemas pueden evaluar un borrador de una tesis completa en memoria ayuda al historiador a identificar repeticiones y contradicciones inadvertidas.

Es necesario clarificar que la IA aunque puede escribir la tesis del historiador no es ético pedirle que lo haga. El conocimiento historiográfico, la interpretación crítica y la construcción del argumento central permanecen como responsabilidades del investigador. La IA amplifica el proceso de escritura, pero no debe sustituir su rol. El no hacerlo puede constituir un acto de deshonestidad académica.

Etica y la IA

La Sociedad Americana de Historia (AHA por sus siglas en inglés) estableció en 2025 unas directrices que deben guiar el uso de la IA para la investigación histórica.75 La AHA identifica varios usos aceptables de las herramientas. El historiador puede utilizar IA para pulir el lenguaje sin modificar, añadir o reemplazar los puntos principales del argumento. También resulta apropiado solicitar análisis estructural para identificar debilidades en la coherencia argumentativa, así como generar bibliografías iniciales que posteriormente deben ser verificadas exhaustivamente.

Sin embargo, existen usos que la AHA considera inaceptables y que constituyen violaciones a la integridad académica. Resulta inadmisible pedir a la IA:

1. Que escriba un ensayo o capítulo completo y presentarlo como trabajo propio

2. Usar resúmenes generados por IA de libros o artículos sin haber leído las fuentes originales.

3. Incluir referencias generadas por IA en notas al pie sin verificar los documentos originales.

75 Guiding Principles for Artificial Intelligence in History Education (2025). Agradecemos al Doctor Jose Rigau por facilitarnos copia de este documento.

La AHA establece que el incumplimiento de estas directrices no solo constituye deshonestidad académica, sino que socava la integridad de la investigación histórica y perpetúa información potencialmente errónea.

Entre las cosas que puede hacer la IA durante el proceso de escritura se encuentra:

1. Análisis Estructural

1. Identifica capítulos desconectados del argumento central

2. Detecta transiciones abruptas entre secciones

2. Consistencia Terminológica

1. Detecta variaciones en el uso de términos

2. Identifica anacronismos o conceptos mal empleados

3. Redundancia

1. Encuentra párrafos con contenido duplicado

2. Identifica ideas repetidas redactado de diferentes maneras

3. Detecta citas o referencias duplicadas

4. Mejora de Claridad

1. Señala oraciones excesivamente largas o confuses

2. Identifica párrafos que desarrollan múltiples ideas simultáneamente

3. Sugiere reformulaciones que mantengan precisión, pero mejoren legibilidad

5. Transiciones

1. Propone conexiones entre secciones desconectadas

2. Genera puentes entre capítulos

El siguiente prompt permite que la IA revise un texto completo y le sugiera al autor los cambios requeridos para mejorar su redacción y coherencia:

Ejemplo de prompt Revisión de Narrativos

Rol: Actúa como editor académico especializado en historiografía con experiencia en estructura narrativa, argumentación histórica y revisión de manuscritos.

Objetivo: Realiza una revisión integral de este borrador sobre [TITULO DEL DOCUMENTO]. Analiza y reporta sobre los siguientes aspectos:

1. Estructura y Coherencia - Coherencia entre argumento central (introducción) y desarrollo (capítulos)Desequilibrios en extensión o profundidad entre secciones - Capítulos o apartados desconectados del hilo argumentativo - Transiciones débiles o ausentes entre secciones principales

2. Consistencia Terminológica - Términos usados de manera intercambiable para el mismo conceptoVariaciones en nombres de instituciones, leyes o períodos históricos - Conceptos historiográficos definidos de manera diferente en distintas secciones - Posibles anacronismos terminológicos

3. Repeticiones y Redundancias - Párrafos o secciones con contenido sustancialmente similar - Ideas centrales presentadas múltiples veces con diferentes formulaciones - Datos, fechas o ejemplos mencionados repetidamente - Citas textuales o referencias bibliográficas duplicadas

4. Claridad Expositiva - Oraciones excesivamente largas o con estructura confusa - Párrafos que desarrollan múltiples ideas simultáneamente - Términos técnicos que requieren definición o contextualización - Uso excesivo de voz pasiva que oscurece agencia histórica

5. Necesidad de Transiciones - Secciones que requieren párrafos puente - Puntos donde se necesita recapitulación breve - Cambios de tema o período que requieren contextualización

Corpus: Analiza el documento [NOMBRE DEL DOCUMENTO]

Entrega: Organiza tu análisis en cinco secciones numeradas correspondientes a los objetivos anteriores. Para cada problema identificado proporciona:

o Ubicación específica (capítulo/sección/página)

o Descripción breve del problema

o Tipo de intervención recomendada

Verificación y Triangulación Metodológica76

La verificación constituye el pilar fundamental sobre el cual descansa la credibilidad del uso de inteligencia artificial en investigación sobre la historia de Puerto Rico. El contenido generado por cualquier plataforma de IA debe someterse a un protocolo riguroso de validación mediante fuentes primarias y secundarias tradicionales. La aparente coherencia y fluidez de las respuestas de IA no garantiza su exactitud, especialmente en temas de historia puertorriqueña donde existe documentación dispersa, debates historiográficos activos y períodos históricamente subrepresentados en fuentes digitales. La responsabilidad última sobre la veracidad de la información recae exclusivamente en el investigador, quien debe comprender las limitaciones específicas de estas herramientas al aplicarlas al contexto histórico puertorriqueño.

La investigación histórica sobre Puerto Rico presenta características específicas que afectan significativamente el uso de IA. Las plataformas de inteligencia artificial han sido entrenadas predominantemente con textos en inglés y de historia europea o estadounidense, lo que significa que la historia puertorriqueña, especialmente en fuentes en español, está significativamente subrepresentada en sus bases de datos. Esta limitación tiene consecuencias prácticas importantes. Por un lado, la IA puede confundir eventos puertorriqueños con otros del Caribe hispano y presenta vacíos notables sobre períodos como el siglo XIX temprano y la época autonómica. Por otro lado, carece de información sobre figuras históricas locales de menor proyección internacional y desconoce los debates historiográficos específicos de la academia puertorriqueña. Además, la IA tiende a reproducir narrativas más difundidas, lo que puede marginalizar perspectivas de grupos subalternos como esclavizados, trabajadores, mujeres y comunidades rurales, así como priorizar narrativas estadounidenses o españolas sobre la historiografía puertorriqueña, enfatizar historia política sobre historia económica y social, y privilegiar eventos "mayores" sobre movimientos sociales locales. El singular estatus político de Puerto Rico genera confusión adicional en las plataformas de IA, particularmente en lo que respecta a las diferencias entre territorio, colonia, commonwealth y Estado Libre Asociado, la cronología de derechos ciudadanos y cambios constitucionales, y los matices entre soberanía, autonomía y dependencia.

Cada plataforma de IA presenta características y limitaciones específicas cuando se aplica al contexto de historia puertorriqueña. Claude tiende a mostrar mayor cautela epistémica en sus respuestas, frecuentemente calificando sus afirmaciones con expresiones como "según fuentes disponibles" o "es importante verificar", sin embargo, esta prudencia no garantiza exactitud absoluta. Al consultar sobre eventos como la masacre de Ponce de 1937, Claude podría proporcionar información básica correcta, pero carecer de detalles sobre el contexto político

76 Anthropic. (2025). Claude (modelo Sonet 4.5; [Large language model]. Recuperado el 27 de octubre de 2025, de https://claude.ai/

local específico o la respuesta de organizaciones puertorriqueñas, reflejando su conocimiento limitado de fuentes en español y archivos locales. Su conocimiento tiene un corte temporal de enero de 2025, lo que significa que carece de información sobre descubrimientos historiográficos o reinterpretaciones publicadas posteriormente. Entre sus fortalezas para historia puertorriqueña se encuentran su tendencia a reconocer explícitamente cuando no tiene información suficiente, su capacidad para analizar documentos históricos que el investigador proporcione, y su utilidad para contextualizar eventos puertorriqueños en marcos históricos más amplios.

ChatGPT, por suparte, puede presentarinformaciónconmayor confianzaaparente sobre historia puertorriqueña, sinsiempre señalar las limitaciones de suconocimiento, loque genera narrativas fluidas que pueden mezclar información correcta con imprecisiones significativas. Al investigar sobre el Partido Nacionalista, por ejemplo, ChatGPT podría confundir cronologías de liderazgos, mezclar eventos del movimiento independentista de diferentes décadas, o citar fuentes académicas sobre Puerto Rico que no existen. Los riesgos específicos incluyen una tendencia a simplificar la complejidad del nacionalismo puertorriqueño, la posibilidad de "alucinar" estadísticas demográficas o económicas específicas que suenan plausibles, pero carecen de fundamento documental, y el riesgo de anacronismos al describir la identidad nacional puertorriqueña aplicando conceptos contemporáneos a períodos históricos donde no corresponden.

Gemini presenta un caso particular debido a su acceso a capacidades de búsqueda web en tiempo real, lo que representa tanto ventajas como riesgos específicos para la investigación de historia puertorriqueña. Al consultar sobre temas como la industria azucarera del siglo XIX, Gemini podría mezclar información de blogs de genealogía, Wikipedia, artículos académicos y sitios turísticos sin jerarquizar adecuadamente la confiabilidad de cada fuente. Entre las consideraciones especiales para esta plataforma se encuentra su capacidad de acceder a recursos puertorriqueños en línea actualizados, pero también el riesgo considerable de incorporar debates políticos contemporáneos en análisis histórico, así como la necesidad imperiosa de evaluar críticamente fuentes web locales de calidad variable que pueden aparecer en sus resultados.

La formulación de prompts constituye el aspecto más importante para obtener información útil y verificable de las plataformas de IA. La diferencia entre un prompt efectivo e inefectivo puede determinar la utilidad de la respuesta obtenida. Al investigar sobre la invasión estadounidense de 1898, un prompt inefectivo sería simplemente solicitar "cuéntame sobre la invasión de Puerto Rico", ya que es demasiado amplio, no especifica período ni fuentes, no solicita información verificable, y no pide que la IA señale sus propias limitaciones. En contraste, un prompt efectivo preguntaría específicamente qué eventos militares ocurrieron durante la invasión

estadounidense de Puerto Rico en julio y agosto de 1898, solicitando fechas específicas, lugares y comandantes involucrados, indicando claramente qué información puede verificarse y qué aspectos requieren consulta de fuentes primarias, y pidiendo que si se mencionan fuentes, se especifiquen autor, título y año de publicación. Este prompt funciona efectivamente porque solicita datos verificables como fechas, lugares y nombres, pide que la IA reconozca sus limitaciones, requiere especificidadque facilitaverificaciónposterior, y solicitafuentes explícitas.

Al abordar el tema del Grito de Lares de 1868, un prompt inefectivo sería preguntar simplemente si fue exitoso el levantamiento, ya que esta pregunta binaria no genera información detallada, no especifica qué significa "exitoso" en este contexto, e invita a interpretación subjetiva sin contexto histórico apropiado. Un prompt efectivo, en cambio, solicitaría una descripción de la secuencia cronológica del levantamiento del Grito de Lares en septiembre de 1868, preguntando qué pueblos estuvieron involucrados, cuántos días duró el levantamiento, qué acciones específicas tomaron las autoridades españolas, qué consecuencias legales enfrentaron los participantes, y pidiendo identificar qué aspectos de esta información provienen de fuentes históricas establecidas versus interpretaciones posteriores. Este enfoque funciona porque solicita una secuencia verificable de eventos, pide datos concretos como lugares, duración y acciones específicas, requiere distinción entre hechos documentados e interpretaciones, y genera información que puede contrastarse efectivamente con archivos históricos.

En el caso de la Carta Autonómica de 1897, preguntar simplemente qué decía el documento resulta inefectivo porque invita a un resumen genérico, no especifica qué aspectos interesan al investigador, y no solicita contexto verificable. Un prompt más efectivo preguntaría en qué fecha específica fue promulgada la Carta Autonómica que España otorgó a Puerto Rico en 1897, qué instituciones gubernamentales establecía, qué poderes retenía la Corona española, cuánto tiempo estuvo vigente antes de la invasión estadounidense, y si se menciona el texto de la Carta, que se indique si se está parafraseando o si sería necesario consultar el documento original para verificación exacta. Este prompt funciona porque solicita datos verificables como fechas e instituciones, pide estructura legal específica, requiere que la IA distinga entre paráfrasis y citas textuales, y facilita verificación contra el documento original.

Al investigar la economía azucarera del siglo XIX, preguntar simplemente cómo era la economía de Puerto Rico en ese siglo resulta problemático porque el período es demasiado amplio abarcando cien años, el tema es demasiado general, y no especifica qué aspectos económicos interesan. Un prompt efectivo se enfocaría específicamente en una década como 1870-1880 en Puerto Rico, preguntando cuáles eran las principales haciendas azucareras, qué regiones concentraban la producción, aproximadamente cuántos ingenios operaban, qué mercados internacionales eran destino de la exportación, y pidiendo que se indique qué cifras son estimaciones históricas establecidas versus datos precisos de fuentes primarias, señalando el origen de cualquier estadística mencionada. Este enfoque funciona porque delimita un período

específico, solicita información cuantificable, pide distinción entre estimaciones y datos precisos, y requiere identificación del origen de estadísticas.

Al estudiar el Huracán San Felipe de 1928, preguntar simplemente qué pasó en el huracán de 1928 no especifica qué aspectos del evento interesan, no solicita datos verificables, y puede generaranécdotas noverificables. Unpromptefectivosobre el Huracán SanFelipe de septiembre de 1928 en Puerto Rico preguntaría qué fecha exacta tocó tierra, qué regiones fueron más afectadas, si existen cifras oficiales documentadas de víctimas fatales, qué medidas tomó el gobierno, y pediría distinguir claramente entre datos de reportes oficiales contemporáneos, estimaciones de estudios históricos posteriores, e información que requeriría consultar archivos de periódicos o gubernamentales de la época para verificación. Este enfoque funciona porque solicita datos concretos como fechas y ubicaciones, pide jerarquización de tipos de fuentes, requiere distinción entre datos contemporáneos y análisis posteriores, e identifica fuentes primarias necesarias para verificación completa.

El proceso de verificación de información obtenida mediante IA requiere un protocolo sistemático que comienza con una evaluación crítica inicial de las respuestas recibidas. Existen indicadores de alerta específicos para historia de Puerto Rico que señalan la necesidad de verificación inmediata. La confusión de períodos políticos, evidenciada por la mezcla de instituciones coloniales españolas con estadounidenses, anacronismos en el uso de términos políticos como utilizar "Estado Libre Asociado" para referirse a períodos anteriores a 1952, o confusión entre autonomía española y estatus bajo Estados Unidos, constituye una señal de alerta importante. Las generalizaciones sobre el Caribe, donde la información parece aplicable a cualquier isla caribeña sin especificidad puertorriqueña, o datos de otras colonias españolas atribuidos incorrectamente a Puerto Rico, también requieren verificación cuidadosa. Las cifras demográficas o económicas sin fuente explícita, como estadísticas poblacionales específicas sin citar censos correspondientes, datos de producción agrícola sin referencia a documentos comerciales, o cifras de víctimas en eventos sin señalar el origen de la estimación, deben tratarse con especial escepticismo. Las citas o documentos no verificables, incluyendo referencias a cartas o discursos sin ubicación archivística, menciones de historiadores puertorriqueños sin nombres específicos, o citas textuales de documentos sin referencia al archivo donde pueden consultarse, constituyen señales claras de que la información requiere verificación exhaustiva antes de ser utilizada.

Para ilustrar la aplicación de estos principios, si una plataforma de IA afirma que en 1887 fueron arrestadas 234 personas durante El Componte por actividades separatistas, el investigador debe emprender un proceso de verificación que incluya determinar si existe documentación judicial española sobre el número exacto de arrestos, si la cifra proviene de reportes oficiales contemporáneos o de estimaciones historiográficas posteriores, si fuentes contemporáneas

proporcionan números diferentes, y si historiadores especializados en el período coinciden con esta cifra específica. Solo mediante este proceso exhaustivo puede determinarse la validez de la información proporcionada.

Las fuentes primarias constituyen el fundamento esencial para la verificación de información sobre historia puertorriqueña. El Archivo General de Puerto Rico en San Juan alberga documentación colonial española, registros gubernamentales bajo Estados Unidos, colecciones personales de figuras históricas, y periódicos y publicaciones de época, siendo especialmente útil para la verificación de eventos políticos, documentos oficiales y correspondencia. La Colección Puertorriqueña de la Universidad de Puerto Rico proporciona acceso a periódicos históricos digitalizados, tesis y disertaciones sobre historia puertorriqueña, y manuscritos y documentos raros, resultando invaluable para contextualización cultural y verificación de debates intelectuales. El Archivo General de Indias en Sevilla, España, contiene documentación colonial española de los siglos XVI al XIX, correspondencia entre autoridades coloniales y la Corona, y registros comerciales, tributarios y militares, siendo fundamental para la verificación de eventos del período colonial español. Los National Archives and Records Administration de Estados Unidos resguardan documentos del gobierno militar estadounidense del período 18981900, correspondencia gubernamental estadounidense sobre Puerto Rico, y registros del Departamento de Guerra, siendo esenciales para verificar información del período bajo gobierno estadounidense. La Biblioteca Digital Puertorriqueña ofrece acceso remoto a periódicos digitalizados, documentos gubernamentales y fotografías históricas, facilitando la investigación desde cualquier ubicación.

La estrategia de verificación debe adaptarse al período histórico investigado. Para eventos del período español anterior a 1898, el investigador debe consultar primero la información proporcionada por la IA, luego verificarla en obras de referencia como las de Abbad y Lasierra, Tapia y Rivera o Acosta, contrastar con documentación del Archivo de Indias, y finalmente corroborar con historiografía contemporánea especializada como las obras de Scarano, Picó o Sued Badillo. Para eventos del período estadounidense posterior a 1898, el proceso implica consultarlainformaciónde IA, verificarla en obras de referenciade autores comoDietz, Meléndez o Ayala, contrastar con documentos de los National Archives, y corroborar con periódicos contemporáneos digitalizados. Esta aproximación escalonada garantiza múltiples niveles de verificación que minimizan el riesgo de error.

La documentación sistemática del proceso de verificación resulta fundamental para mantener el rigor académico y la transparencia metodológica. El investigador debe mantener un registro que incluya para cada dato o afirmación proporcionada por IA la plataforma utilizada, el prompt específico empleado, las fuentes primarias consultadas para verificación, las fuentes secundarias que corroboran o contradicen la información, el estado de verificación alcanzado, y observaciones relevantes sobre discrepancias o matizaciones necesarias. Por ejemplo, si la IA

afirma que el Grito de Lares ocurrió el 23 de septiembre de 1868, el registro debe documentar la pregunta exacta formulada, que la verificación se realizó mediante el Archivo General de Puerto Rico en expedientes judiciales y la obra de Picó de 2006 en la página 234, que el dato fue verificado y que la fecha es correcta. Si la IA menciona 600 participantes en Lares, el registro debe consignarque no se localizóestacifra específicaen archivos, que Scaranoen 2008 estima "varios cientos" sin especificar un número exacto, que el dato es impreciso, y que la IA proporcionó un número específico sin fuente verificable. Cada entrada debe incluir la fecha de consulta a la IA, la pregunta exacta formulada, la respuesta textual relevante, las fuentes consultadas para verificación, el resultado de verificación indicando si fue verificado, si contiene error o si no es verificable, y la corrección aplicada cuando corresponda.

El manejo de información no verificable requiere decisiones metodológicas claras por parte del investigador. Cuando la información proporcionada por IA no puede corroborarse mediante fuentes confiables, debe descartarse completamente de la investigación sin importar cuán convincente parezca la narrativa o cuán coherente resulte con el resto del conocimiento disponible. Si la información parece plausible pero no puede verificarse completamente, debe indicarse explícitamente como no verificada, presentarse con lenguaje condicional utilizando expresiones como "según algunas versiones", "se sugiere que" o "podría haber", acompañarse de explicación sobre la limitación de las fuentes disponibles, y no utilizarse como base para conclusiones principales del trabajo. En algunos casos, la información no verificable puede orientar investigación adicional señalando áreas poco estudiadas que requieren investigación archivística original, lagunas en la historiografía existente, o la necesidad de consultar archivos adicionales o colecciones especializadas que no han sido examinadas previamente.

La verificación de interpretaciones y análisis proporcionados por IA requiere atención especial porque las plataformas no solo proporcionan datos sino también interpretaciones históricas que pueden estar marcadas por perspectivas ideológicas particulares. En el caso de historia puertorriqueña, existen áreas especialmente sensibles que requieren cuidado particular. La naturaleza del estatus político de Puerto Rico es una de estas áreas, donde debe evaluarse críticamente si la IA utiliza términos como "colonia" versus "territorio", si reconoce que estos términos son objeto de debate político y académico, y si presenta múltiples perspectivas sobre el estatus en lugar de adoptar una posición particular. La identidad nacional puertorriqueña constituye otra área sensible donde el investigador debe evaluar si la IA impone conceptos anacrónicos de nación, si reconoce la complejidad y evolución histórica de la identidad, y si presenta la identidad como monolítica o reconoce su diversidad interna y temporal. Los movimientos de resistencia representan un tercer ámbito donde debe analizarse críticamente si la IA romantiza o demoniza movimientos independentistas, si proporciona contexto completo sin juicios morales anacrónicos, y si reconoce la diversidad dentro de los movimientos políticos en lugar de tratarlos como bloques homogéneos.

Solicitar reconocimiento explícito de limitaciones por parte de la IA constituye otra estrategia importante. Los prompts deben incluir peticiones como indicar qué información puede proporcionarse con confianza versus qué requiere verificación archivística, señalar si hay debates historiográficos sobre el tema consultado, e identificar qué fuentes serían necesarias para verificar completamente la información proporcionada. La comparación temporal, consultando a la IA sobre el mismo tema en sesiones diferentes, permite identificar inconsistencias en respuestas que revelan áreas donde el conocimiento de la plataforma es menos confiable. La documentación transparente en el trabajo final debe incluir una nota metodológica sobre el uso de IA explicando cómo y para qué se utilizó, una descripción del proceso de verificación empleado, y reconocimiento explícito de información que permanece incierta o debatida incluso después de la verificación.

Los recursos especializados para historia puertorriqueña facilitan el proceso de verificación. Bibliotecas y archivos con acceso digital como la Biblioteca Digital Puertorriqueña accesible en bibliotecadigital.uprrp.edu, la colección digital de La Correspondencia de Puerto Rico, y el portal de archivos históricos de la Universidad de Puerto Rico proporcionan acceso remoto a fuentes primarias. Revistas académicas especializadas como Op. Cit., revista del Centro de Investigaciones Históricas de la UPR, Caribbean Studies del Instituto de Estudios del Caribe de la UPR, y Centro Journal del Centro de Estudios Puertorriqueños de Hunter College, publican investigación actualizada sobre historia puertorriqueña que puede utilizarse para verificar y contextualizar información. Bases de datos como JSTOR con filtros para Puerto Rico y Caribbean Studies, Project MUSE con colecciones de Hispanic Caribbean Studies, y el Handbook of Latin American Studies de la Library of Congress proporcionan acceso a investigación académica revisada por pares.

La inteligencia artificial puede servir como punto de partida para la investigación de historia puertorriqueña, pero nunca como fuente definitiva o autoridad final. Las limitaciones inherentes de estas herramientas se amplifican significativamente cuando se trata de historias nacionales menos representadas en sus datos de entrenamiento, como es el caso de Puerto Rico. El investigador de historia puertorriqueña que utiliza IA debe formular prompts específicos y detallados que soliciten información verificable en lugar de narrativas generales, consultar sistemáticamente fuentes primarias puertorriqueñas y archivos especializados para validar cada dato importante, contrastar con historiografía puertorriqueña establecida antes de aceptar interpretaciones proporcionadas por la IA, documentar rigurosamente el proceso de verificación para garantizar transparencia metodológica, reconocer explícitamente el uso de IA y sus limitaciones en trabajos académicos para mantener estándares éticos, mantener un escepticismo informado sobre la coherencia narrativa aparente que puede ocultar imprecisiones,

y priorizar fuentes locales sobre narrativas externas sobre Puerto Rico que pueden carecer de matices importantes.

Solo mediante este enfoque crítico, sistemático y culturalmente informado puede la inteligencia artificial convertirse en una herramienta útil para la investigación histórica puertorriqueña sin comprometer el rigor académico ni perpetuar narrativas simplificadas o erróneas sobre la compleja historia de Puerto Rico. La responsabilidad final siempre recae en el investigador de conocer profundamente tanto las herramientas digitales emergentes como los métodos tradicionales de investigación histórica y los debates específicos de la historiografía puertorriqueña. El historiador contemporáneo debe desarrollar competencia dual: dominio técnico de herramientas de IA combinado con comprensión profunda de metodología histórica tradicional, conocimiento de archivos y repositorios relevantes, familiaridad con debates historiográficos actuales, y compromiso inquebrantable con la verificación rigurosa. La tentación de confiar en la coherencia narrativa y la aparente autoridad de las respuestas de IA debe resistirse sistemáticamente mediante protocolos rigurosos de verificación que reconozcan que estas herramientas, por más sofisticadas que sean, permanecen como asistentes preliminares que aceleran ciertos procesos de búsqueda inicial pero nunca sustituyen la investigación seria basada en fuentes verificables y el análisis crítico fundamentado en conocimiento historiográfico profundo. El futuro de la investigación histórica puertorriqueña depende de la capacidad de los investigadores de navegar efectivamente entre la innovación tecnológica y la fidelidad a los principios metodológicos que han sustentado la investigación histórica rigurosa durante generaciones, manteniendo siempre como prioridad absoluta la veracidad, la transparencia y el compromiso con la comprensión matizada y contextualizada del pasado puertorriqueño.

Generación Aumentada por Recuperación (Retrieval-Augmented Generation)

La aplicación de IA más alineada con la visión original de Bush y Engelbart es NotebookLM, una herramienta de Google que utiliza a Gemini como su motor de análisis. Como se mencionó en el Capítulo II, NotebookLM funciona como un asistente de investigación. Su verdadera fortaleza metodológica es que opera bajo un principio de "Generación Aumentada por Recuperación" (RAG): el "Humano" (H) carga sus propias fuentes verificadas (libros en PDF, transcripciones, documentos, notas). La IA queda solamente maneja ese corpus y solo puede responder usando la información que el investigador le ha proporcionado.

La calidad de las fuentes son el pilar de la credibilidad en la investigación histórica. Sin embargo, los modelos IA tradicionales enfrentan el problema de la alucinación NotebookLM, es una plataforma de inteligencia artificial que utiliza los algoritmos de Gemini, aborda este problema utilizando el concepto de la Generación Aumentada por Recuperación (RAG). Esto reduce el riesgo de que en nuestra investigación se incluyan errores por fuentes que no existen, o que se citan incorrectamente. La Generación Aumentada por Recuperación (RAG Generation) es un

método que se utiliza para mejorar la fiabilidad de los sistemas de IA al integrar solamente los documentos que el investigador le indica al sistema que utilice. En la práctica, cuando un investigador introduce una consulta, el sistema RAG busca los documentos más relevantes en el repositorio de fuentes del usuario. Estos fragmentos se utilizan como contexto para guiar al sistema, anclando sus respuestas en hechos y documentos verificados en lugar de depender únicamente de los patrones estadísticos de su entrenamiento general.

NotebookLM aplica esta metodología de mitigación de errores de dos maneras cruciales para la verificación histórica:

1. Primero, garantiza la trazabilidad de la fuente. NotebookLM genera respuestas que incluyen citas explícitas, las cuales remiten al usuario a los pasajes específicos de los documentos originales que respaldan la afirmación generada. Esta funcionalidad es esencial para la verificación, ya que le permite al historiador contrastar la afirmación de la IA directamente con el material de origen proporcionado.

2. Segundo, permite la curación del conocimiento histórico específico del dominio. Los investigadores pueden cargar una amplia gama de documentos de confianza, como diarios transcritos, archivos digitales o datos de periódicos históricos. Esta capacidad para crear un repositorio personalizado de contenido verificado asegura que el modelo se base en información precisa y relevante para la consulta histórica en cuestión, reduciendo la probabilidad de que improvise o se desvíe. Además, las versiones avanzadas, como NotebookLM Plus, han demostrado la capacidad de analizar manuscritos históricos escritos a mano cargados como fuentes (imágenes escaneadas o PDF), realizando transcripciones detalladas y análisis contextuales. Esto facilita enormemente el acceso y la verificación de fuentes primarias difíciles.

Si bien el RAG reduce significativamente los problemas de verificación al proporcionar precisión y contextualización, es fundamental reconocer las limitaciones inherentes. La fiabilidad de la información histórica recuperada a través de RAG depende de la calidad y credibilidad de las fuentes proporcionadas por el investigador, las cuales podrían contener sesgos o imprecisiones. Además, las consultas amplias o complejas aún pueden resultar en respuestas incompletas o ligeramente erróneas, lo que requiere un perfeccionamiento algorítmico continuo. Por lo tanto, aunque NotebookLM, mediante el RAG, ofrece una herramienta potente para generar respuestas fiables y trazables, la responsabilidad última sobre la veracidad de la información recae exclusivamente en el investigador, quien debe ejercer un pensamiento crítico y una evaluación constante.

¿Cómo funciona NotebookLM?

NotebookLM es un avanzado asistente de investigación y redacción, impulsado por los algoritmos de Inteligencia Artificial (IA) de Google y basado en modelos como Gemini en sus versiones más recientes. Su diseño está optimizado para procesar, sintetizar y analizar críticamente grandes volúmenes de informacióndocumental, convirtiéndose en unaherramienta indispensable para el historiador en la era digital.

La fortaleza de NotebookLM reside en su capacidad para crear un corpus documental digital privado. El investigador sube sus propias fuentes (documentos, artículos, transcripciones, fuentes primarias o secundarias, etc.), y la IA trabaja exclusivamente con ese material. Esto es crucial en la investigación histórica, ya que las respuestas y la interacción generada por el sistema están siempre fundamentadas con citas directas y exactas a los fragmentos dentro de los documentos originales cargados. Este enfoque garantiza la verificabilidad y el rigor metodológico, permitiendo al historiador enfocarse en el análisis crítico. El sistema permite una interacción integral con múltiples formatos como documentos PDF, Google Docs, presentaciones, enlaces web, y contenidos multimodales como vídeos de YouTube, imágenes, gráficos y diagramas. Los límites de fuentes varían:

1. Versión Estándar (Gratuita/Básica): Generalmente, el límite es de 50 fuentes por cuaderno.

2. Versión Premium (AI Premium/Avanzados): Este límite puede ascender hasta 300 fuentes por cuaderno.

Adicionalmente, cada fuente individual tiene un límite que suele rondar las 500,000 palabras por documento, ideal para manejar libros, archivos digitalizados o expedientes extensos. El investigador puede interactuar con una fuente individual o con la totalidad del corpus documental a la vez. Al subir múltiples libros o artículos sobre un mismo tema, la IA los trata como una fuente agregada, permitiendo:

1. Síntesis Temática - Generar resúmenes de todo el corpus.

2. Detección de Patrones y Brechas - Pedir a la IA que identifique similitudes, contradicciones, tendencias recurrentes o vacíos en el conocimiento a través de todas las fuentes.

3. Comparación de Perspectivas - Solicitar un análisis comparativo entre las teorías o narrativas presentadas por diferentes autores dentro del corpus.

4. Organización de Datos Primarios - Estructurar la información de documentos históricos en formatos útiles como líneas de tiempo, listas de personajes clave, o índices temáticos. NotebookLM complementa la investigación con funcionalidades prácticas:

1. Resúmenes de Audio- Permite convertir hallazgos clave o resúmenes en formato de audio (tipo podcast), facilitando la revisión y el aprendizaje en movimiento.

2. Organización de Notas- Ayuda a transformar las ideas e información extraída en guías de estudio, preguntas frecuentes o dossiers estructurados.

3. Capacidades Multimodales (Avanzado)- La capacidad de hacer preguntas sobre imágenes y gráficos en las fuentes es invaluable para analizar iconografía, mapas históricos, diagramas o estadísticas demográficas.

A todo el ambiente de trabajo del sistema se le llama “notebooks” o libreta. Es en esta que el investigador lleva a cabo su trabajo e interactúa para aumentar su conocimiento y permitir la interpretación del pasado.

La utilidad de NotebookLM trasciende la simple lectura de documentos e impacta la metodología de la historia. Durante la fase heurística, la herramienta facilita el inventario y catalogación inicial de fuentes, permitiendo al historiador generar rápidamente resúmenes ejecutivos de documentos extensos para determinar su relevancia antes de invertir tiempo en lecturas exhaustivas. En la fase hermenéutica o de crítica de fuentes, NotebookLM se convierte en un asistente para la comparación sistemática, identificando coincidencias y divergencias entre múltiples documentos sobre un mismo acontecimiento histórico, lo cual es fundamental para establecer la fiabilidad de las fuentes.

La herramienta también potencia el trabajo con fuentes primarias complejas. Al cargar transcripciones de archivos históricos, cartas, diarios personales o documentos administrativos, el historiador puede formular preguntas específicas sobre personajes, fechas, lugares o eventos concretos, permitiendo una navegación no lineal del material que habría requerido horas de lectura manual. Esta capacidad es particularmente valiosa cuando se trabaja con corpus documentales masivos.

NotebookLM permite al investigador cargar la bibliografía secundaria completa sobre un tema (artículos académicos, capítulos de libros, tesis) y solicitar análisis transversales. Por ejemplo, puede identificar qué autores han abordado una problemática específica, cuáles son las principales escuelas interpretativas, dónde se encuentran los debates más intensos, y qué aspectos permanecen poco estudiados. Esta funcionalidad no solo ahorra tiempo, sino que ofrece una visión panorámica del campo de estudio que sería difícil de conseguir mediante lectura secuencial.

La capacidad de detectar contradicciones y lagunas historiográficas es especialmente valiosa. El sistema puede señalar cuando diferentes fuentes secundarias presentan interpretaciones incompatibles sobre un mismo fenómeno, o cuando todas las fuentes cargadas ignoran cierto aspecto del problema, sugiriendo así posibles aportaciones originales que el investigador podría desarrollar en su trabajo.

Para el historiador que trabaja con fuentes en múltiples idiomas, NotebookLM ofrece ventajas significativas al permitir consultas en el idioma preferido del investigador, independientemente del idioma original de las fuentes. Aunque la herramienta respeta el texto original y proporciona citas exactas, puede ofrecer explicaciones y síntesis en el idioma de trabajo del historiador, facilitando la investigación.

La capacidad multimodal amplía el alcance de la herramienta más allá del texto escrito. Al analizar mapas históricos, fotografías de época, grabados, pinturas o diagramas estadísticos incluidos en las fuentes, NotebookLM puede responder preguntas sobre elementos visuales, ayudar a descifrar información cartográfica, o analizar la representación iconográfica de eventos históricos. Esta funcionalidad es particularmente útil para historiadores del arte, de la cultura visual, o aquellos que trabajan con geografía histórica.

NotebookLM excede las funciones de búsqueda y recuperación de información al actuar como asistente en la organización conceptual del conocimiento histórico. Puede generar

automáticamente cronologías detalladas a partir de múltiples fuentes, crear prosopografías (listas de personajes con sus roles y relaciones), elaborar glosarios de términos específicos de una época o contexto, y construir índices temáticos que estructuren el material según las categorías analíticas que el historiador considere relevantes.

La función de Audio es sorprendente para el contexto historiográfico. Esta característica permite convertir los hallazgos de investigación en presentaciones orales tipo podcast, donde dos voces de IA dialogan sobre el contenido, destacando los puntos principales, debates y conclusiones. Para el historiador, esto no solo facilita la revisión del material mientras realiza otras actividades, sino que puede servir como borrador inicial para presentaciones académicas, clases, o divulgación histórica.

A pesar de sus capacidades, es necesario que el historiador mantenga una postura crítica frente a las síntesis y análisis generados por NotebookLM. La herramienta no sustituye el juicio experto del investigador ni su capacidad de interpretación contextualizada. La IA puede identificar patrones textuales, pero carece de la comprensión profunda del contexto histórico, las sutilezas culturales, y las implicaciones teóricas que solo un historiador entrenado puede aportar. Las respuestas generadas deben ser verificadas, las citas comprobadas en su contexto original, y las interpretaciones contrastadas con el conocimiento disciplinar del investigador.

NotebookLM materializa, con tecnología contemporánea, el Memex de Vannevar Bush. El sistema es un archivo personal, navegable y asociativo en el que el investigador recorre “rutas” entre fragmentos relevantes. Al mismo tiempo, NotebookLM valida la tesis de Engelbart sobre el aumento del intelecto humano ya que crea un conjunto de lenguaje, herramientas y método que eleva la eficacia del trabajo intelectual.

A continuación, explicamos brevemente el proceso de registro y de uso del sistema:

Paso 1. Registro

Para registrarse en NotebookLM accede el siguiente enlace: https://notebooklm.google/

Paso 2. Crear una libreta nueva

Una vez te registra y quieres comenzar a subir documentos (libros, ensayos, documentos, audios, videos, etc.) puedes ir a la opción de Create New Notebook.

Paso 3- Subir las Fuentes

Una vez creas la nueva libreta NotebookLM te solicita que subas las fuentes. En esta función tienes tres opciones:

1. Le indicas directamente todas las fuentes que quieres utilizar que incluye documentos en PDF, Word, Audios (mp3), Videos, ect., o le das direcciones de páginas de web o de youtube.

2. Permites que el sistema identifique fuentes por ti.

3. Combinación de las opciones 1 y 2.

Paso 4. Interactuar con las fuentes

Una vez se suben las fuentes la pantalla se divide en tres áreas principales. En este ejemplo utilizamos documentos relacionados al Grito de Lares. A la izquierda se encuentran las fuentes subidas al sistema con las que va a interactuar el historiador. En el centro está el “Chat” donde el historiador hace las preguntas al sistema. A la derecha se encuentra el área de estudio donde el investigador tiene las siguientes opciones avanzadas:

1. Audio Overview (Resumen en Audio) -Genera una conversación tipo podcast entre dos voces de IA que discuten y explican el contenido de todas tus fuentes. En tu caso, crearían una conversación sobre el Grito de Lares basándose en los 11 documentos que has cargado. Es útil para revisar el material de forma audible mientras haces otras actividades.

2. Video Overview (Resumen en Video)- Similar al audio, pero en formato visual. Crea una presentación o explicación en video del contenido de tus fuentes, facilitando la comprensión visual del tema.

3. Mind Map (Mapa Mental)- Genera un mapa conceptual visual que organiza las ideas principales, conexiones y temas clave de tus fuentes sobre el Grito de Lares. Ayuda

a visualizar las relaciones entre conceptos, personajes, eventos y causas del levantamiento.

4. Reports (Informes)-Crea documentos estructurados tipo informe académico basados en tus fuentes. Puede generar análisis formales, síntesis o documentos profesionales sobre el tema que estás investigando.

5. Flashcards (Tarjetas de Estudio)-Genera tarjetas de estudio con preguntas y respuestas extraídas de tus documentos. Perfecto para memorizar fechas clave, personajes importantes, conceptos y eventos del Grito de Lares.

6. 6. Quiz - Crea “quizes” interactivos con preguntas de opción múltiple o de otro tipo basadas en el contenido de tus fuentes, útil para evaluar tu comprensión del material histórico.

Cada una de estas herramientas incluye un ícono de edición (lápiz) que te permite personalizar y modificar el contenido generado según tus necesidades específicas de investigación.

La integración metodológica de ChatGPT, Claude y Gemini en la investigación histórica representa una evolución significativa en las prácticas académicas tradicionales. Sin embargo, esta integración debe entenderse dentro de un marco epistemológico que reconozca tanto las potencialidades como las limitaciones de estas herramientas. El historiador del siglo XXI debe desarrollar una nueva alfabetización digital que le permita navegar este territorio con rigor metodológico. No obstante, debe recordar que estas herramientas amplifican, pero no sustituyen, las competencias fundamentales de la disciplina, como el pensamiento crítico, la interpretación contextualizada y la responsabilidad ética en el manejo de la información histórica.

Recomendaciones

Prácticas para Historiadores

Equilibrio entre Potencial y Riesgo

Ningún modelo es perfecto ni un sustituto absoluto del trabajo humano especializado. Los tres sistemas representan la vanguardia del procesamiento natural multimodal, pero destacan en campos diferentes. Lo más productivo en 2025 es utilizar una estrategia combinada según la naturaleza del trabajo histórico:

1. Para redacción académica, generación textual avanzada y análisis estadístico con apoyo visual sencillo, ChatGPT sigue siendo la mejor opción por su versatilidad, adaptabilidad y amplia documentación en español y otros idiomas. Su rendimiento es especialmente superior en la estructuración de documentos, generación de código para análisis históricos y revisión de estilos argumentativos.

2. Para análisis masivo de textos académicos, procesamiento y auditoría de corpus extensos, y generación de código explicado y documentado, Claude se destaca por su robustez en el razonamiento, seguridad y precisión en el análisis de contextos muy largos, así como por su transparencia y la presencia de sistemas robustos de citas verificables. Es especialmente recomendable en tareas de revisión documental extensa y para auditar proyectos de digitalización de archivos históricos.

3. Para paleografía, análisis de imágenes históricas, procesamiento cartográfico avanzado e integración con flujos de trabajo empresariales o en la nube, Gemini es la opción más potente, capaz de manejar archivos visuales, textos, audios y videos en una sola sesión, con contexto prácticamente ilimitado e integración exhaustiva con los servicios Google. Resulta ideal para investigadores que requieren análisis visual/cuantitativo y acceso masivo a fuentes y bases de datos.

Uso Responsable

1. Validación Cruzada: Toda información generada debe ser contrastada con fuentes fiables y repasar posibles alucinaciones, especialmente en resultados de referencia específica o inferencias históricas complejas.

2. Segmentación de Proyectos: Aprovechar la ventana de contexto del modelo para evitar truncamientos y pérdidas de coherencia. Claude y Gemini admiten documentos monumentales, pero requieren prompts claros sobre qué analizar.

3. Complementación Multimodal: Para proyectos que requieren componentes visuales, textuales y estadísticos, sugerimos trabajar en migración entre modelos: ChatGPT para prototipado, Claude para auditoría y Gemini para procesamiento de corpus visuales y contextos extremadamente extensos

4. Documentación y Argumentación Transparente: Claude y Gemini tienden a explicar sus procesos, pero es importante establecer procedimientos de trazabilidad y citar siempre fuentes verificables en la interpretación de datos y plagio académico.

5. Optimización de Costes y Recursos: Para usuarios individuales o equipos con presupuesto limitado, ChatGPT Plus o Gemini Advanced ofrecen balance de costebeneficio y aprendizaje acelerado; para proyectos de digitalización a gran escala, Claude Pro y Gemini Cloud son imbatibles.

6. Supervisión Ética y Legal: Claude lidera en privacidad y control de datos sensibles; siempre es necesario configurar la plataforma según lo requiera la legislación local (p.ej., protección de datos personales en archivos históricos).

Métodos para análisis de documentos en IA

1. Escenario 1: Digitalización y análisis de un archivo colonial (SIGLO XVIII)

• Preprocesamiento y OCR en Gemini.

• Carga de corpus en Claude para auditoría y extracción de información relevante.

• Síntesis, comparación y estructuración de resultados en ChatGPT.

• Revisión crítica y validación manual por parte del equipo, antes de publicar resultados.

2. Escenario 2: Ensayo historiográfico sobre representaciones visuales

• Análisis de imágenes con Gemini para atributos visuales, contexto y datación.

• ChatGPT para redacción de ensayos, argumentación y comparación de fuentes secundarias.

• Claude para auditoría de citas, generación de tablas comparativas y revisión argumental.

Alucinaciones, Sesgos y Metodologías de Mitigación

El poder de estos "Artefactos" (A) es innegable, pero su uso indiscriminado y si sin revisión es metodológicamente catastrófico. El "Entrenamiento" (T) del historiador digital debe centrarse ahora en el manejo de los riesgos inherentes que son las alucinaciones y los sesgos. La "alucinación" en la IA ocurre cuando la herramienta genera un escrito o narrativo que está correctamente argumentado y detallado pero que es parcial o totalmente fabricado. En otras palabras, es incorrecto. Los modelos de IA, en su esfuerzo por predecir la siguiente palabra más probable, pueden "inventar" fechas, eventos, citas y, lo más peligroso para un historiador, fuentes yreferencias bibliográficas que noexisten. Lacolecciónpuertorriqueñade la Universidad de Puerto Rico ha visto un aumento en el número de consultas bibliográficas de fuentes que no existen pero que fueron producidas en una consulta con la IA. 77 Para una disciplina que se basa en la veracidad y la procedencia de la fuente, una alucinación no es un simple error; es un veneno metodológico.

Las herramientas de IA se entrenan en vastos corpus de texto extraídos de Internet. Como resultado, heredan y amplifican todos los sesgos sociales, culturales, de género y raciales presentes en esos datos. En el Capítulo III, se discutió el análisis de Lara Putnam sobre cómo la digitalización sobrerrepresenta las fuentes de las élites, creando un sesgo en la investigación. La IA representa una versión exponencial de este mismo problema. Si los archivos digitales que alimentan a la IA ya están sesgados hacia las voces oficiales y las élites, la IA amplificará esa visión del pasado, haciendo que las voces subalternas y los temas de la "investigación periférica" sean aún más difíciles de encontrar. Tomemos en cuenta que IA maneja cientos de miles de fuentes al momento de preparar una respuesta y si estas estaban sesgadas la herramienta producirá una nueva versión aún más comprometida.78

77 Conversación con Javier Almeyda. Julio 2025.

78 Nota del Autor. En un caso judicial reciente Anthropic tuvo que pagar 1.5 billones de dólares por haber utilizado 500,000 libros y documentos de la internet.

Para mitigar esta problemática el historiador no puede ser un usuario pasivo y tiene que usar el pensamiento crítico y su experiencia como investigador. Al usar la IA el historiador tiene que añadir a su "Metodología" (M) estrategias de mitigación como los siguientes:

1. Estrategia 1- Verificación

Esta es la regla de oro. La IA puede usarse para investigar, analizar y redactar, pero nunca se debe citar un hecho, dato, fecha o fuente proporcionada por una de las herramientas que no haya sido leído y verificado por el "Humano" (H)

2. Estrategia 2- Utilizar prompts específicos y detallados

La calidad de la salida depende de la calidad de la entrada. Un prompt vago ("Háblame del Grito de Lares") resultara en una mayor alucinación. Por el contrario, un prompt específico la reduce Cuando se prepare el prompt se debe incluir en el texto que para que cite sus fuentes, restrinja su alcance y proporcione contexto.79

3. Estrategia 3 – Usar herramientas de Generación Aumentada por Recuperación (RAG):

Esta es la solución metodológica que permite al historiador mitigar mejor la alucinación. La RAG es una técnica que limita las fuentes a evaluar (corpus de documentos) en lugar de permitir que la herramienta consulte todo el internet. Como dijéramos a comienzos de este capítulo el uso de NotebookLM es el mejor ejemplo del uso del RAG el cual limita a los documentos subidos por el historiador. Cuando se interactúa con el sistema tiene prohibido buscar la respuesta en otro lugar y fuera de esas fuentes. Esto mitiga drásticamente el riesgo de alucinaciones y centra la IA en el archivo validado por el investigador.

4. Estrategia 4- Citación Transparente de la IA:

El uso de la IA debe ser metodológicamente transparente. Nuevas guías de estilo, como las de la MLA, ahora proporcionan formatos estándar para citar el uso de la IA en la investigación. Es mandatorio y ético citar la IA cuando esta es utilizada para el uso de las investigaciones históricas. A continuación, presentamos ejemplos de cómo citar la IA utilizando los principales estilos aceptados80:

79 Understanding and Mitigating AI Hallucination | DigitalOcean . Https://www.digitalocean.com/resources/articles/ai-hallucination

80 " Claude Opus 4.1, Anthropic, respuesta a "Puedes hacer una descripción de como citar AI en publicaciones académicas," 25 de octubre de 2025, https://claude.ai

La citación apropiada de IA en publicaciones académicas es un área en desarrollo. Es importante mantenerse actualizado con las últimas directrices de tu campo específico y las políticas de las revistas donde planeas publicar.

Consideraciones éticas

El uso de inteligencia artificial en la investigación histórica tiene serias connotaciones éticas.

¿Quién es el autor del resultado de la IA, el sistema o quien construye el Prompt? La mayoría de los estándares académicos actuales consideran que el investigador humano que diseña las consultas proporciona el contexto, interpreta los resultados y verifica la información mantiene la autoría del trabajo, pero también es responsable de sus alucinaciones. 81 La ética requiere que los historiadores divulguen el uso de IA. Esta divulgación no implica que el trabajo sea menos válido, sino que permite a otros investigadores comprender completamente la metodología utilizada y evaluar apropiadamente los resultados.

Las cuestiones de sesgo y representación también merecen atención cuidadosa. Los modelos de IA se entrenan con datos que pueden contener sesgos históricos o contemporáneos. Al utilizar IA para analizar fuentes históricas, particularmente aquellas relacionadas con grupos marginados o temas sensibles, el investigador debe estar atento a cómo los sesgos potenciales del modelo pueden influir en el análisis. La interpretación crítica humana sigue siendo esencial para identificar y corregir estos sesgos.

La privacidad y confidencialidad de las fuentes también requiere consideración. Al trabajar con documentos históricos que contienen información sensible sobre personas identificables, particularmente en historia contemporánea o historia oral, el investigador debe considerar cuidadosamente qué información puede compartir apropiadamente con servicios de IA basados en la nube. Las regulaciones sobre protección de datos, los acuerdos de acceso a archivos, y las consideraciones éticas pueden limitar o prohibir el uso de ciertos documentos con herramientas de IA.

El Futuro de la IA en la Investigación Histórica

El campo de la inteligencia artificial está evolucionando con extraordinaria rapidez. Las capacidades que hoy parecen impresionantes probablemente parecerán limitadas en comparación con las herramientas disponibles en los próximos años. El investigador histórico debe desarrollar no solo competencia con las herramientas actuales, sino también la agilidad intelectual para adaptarse a nuevas herramientas y metodologías a medida que emergen.

Las tendencias futuras probables incluyen mejoras significativas en la precisión de transcripción de manuscritos históricos, capacidades mejoradas para análisis de contexto histórico complejo, integración más profunda con archivos digitales y bases de datos, y herramientas especializadas diseñadas específicamente para investigación histórica. La colaboración entre historiadores y

desarrolladores de IA será crucial para asegurar que las herramientas futuras aborden realmente las necesidades y desafíos de la investigación histórica.

A medida que estas herramientas se vuelvan más capaces, será cada vez más importante que la educación en historia incluya formación en literacia de IA, no solo cómo usar estas herramientas, sino cómo evaluarlas críticamente, comprender sus limitaciones, y integrarlas apropiadamente en la práctica historiográfica. El historiador del futuro necesitará ser tanto tradicionalmente erudito como digitalmente competente, capaz de moverse fluidamente entre archivos físicos y digitales, entre lectura humana y análisis asistido por IA.

IX. HACIA UNA METODOLOGÍA HÍBRIDA

Estelibroha presentadouna metodologíapara lainvestigaciónhistóricadigital que es, en esencia, una espiral evolutiva. Comenzamos con los fundamentos conceptuales de los pioneros de la computación. Vannevar Bush, en 1945, identificó el problema central de la investigación moderna, la sobrecarga de información y la incapacidad de nuestros sistemas de archivo lineales para procesarlas. Su solución teórica, el "Memex", no era una biblioteca digital, sino un sistema basado en el nocimiento humano creando vínculos en información dispersa.

Las metodologías presentadas en los capítulos intermedios de este trabajo representan la una manera de implantar esa visión. La identificación de "Palabras Clave" (Capítulo III) es el primer paso para crear un vínculo. El "Seguimiento de Pistas" (Capítulo IV) a través de notas al calce y bibliografías es el acto de seguir un sendero asociativo creado por otro investigador. La "Investigación Periférica" (Capítulo V) es el arte de descubrir vínculos ocultos o tangenciales que otros pasaron por alto. El "Filtrado" (Capítulo VI) y la "Redacción Diaria" (Capítulo VII) son los procesos humanos de síntesis donde estos vínculos se convierten en ensayos o libros.

La Inteligencia Artificial (Capítulo VIII) no es una ruptura de este proceso; es su aceleración y automatización. Los Grandes Modelos de Lenguaje son motores de asociación semántica a una escala masiva, capaces de identificar y crear millones de vínculos asociativos en segundos, cumpliendo la promesa técnica del "Memex" de Bush.

Al cerrar este trabajo volvemos al marco teórico del sistema “H-LAM/T” de Douglas Engelbart. La Inteligencia Artificial no reemplaza al historiador, todo lo contrario, aumenta su intelecto, y al hacerlo, redefine el sistema completo.

5. H (Humano): El historiador sigue siendo el componente principal de la investigación histórica. De hecho, su rol se vuelve más crítico. Como hemos visto a lo largo del documento la inteligencia artificial acelera la búsqueda, la transcripción y el análisis de patrones. Sin embargo, el juicio crítico, la interpretación de las fuentes (sea esta un documento del siglo XVIII o un análisis de ChatGPT), la identificación de alucinaciones, al igual que el escrito final, siguen siendo responsabilidad del investigador.

6. L (Lenguaje): El lenguaje del historiador se expande. A la terminología de la historiografía y se añade ahora un lenguaje técnico como lo son los “prompts” , la "mitigación de sesgos" y el "RAG” Dominar este nuevo lenguaje es esencial para operar el artefacto.

7. A (Artefacto): La IA se une al “mouse”, a las bases de datos de PARES y Chronicling America, como el artefacto más potente del investigador.

8. (M) La Metodología del historiador evoluciona hacia un enfoque híbrido. Antes, el impedimento principal era el acceso y el encontrar los documentos. Posteriormente, en la etapa digital previa a la IA, el impedimento fue filtrar enormes volúmenes de datos. Hoy, con la IA, el encontrar documentos ya no es el impedimento, lo es la verificación y la validación. En consecuencia, la como parte de la Metodología del historiador aumentado debe basarse en un protocolo verificación de los resultados de la IA y usar los sistemas de RAG para mantener la IA anclada a repositorios y fuentes comprobadas.

9. T (Entrenamiento): El entrenamiento de los futuros historiadores debe cambiar irrevocablemente. La "literacia digital" que se discutió en la introducción 1 ya no es suficiente. El nuevo estándar es la "literacia en IA": la capacidad de usar estas herramientas de manera efectiva, comprender sus arquitecturas de sesgo y aplicar protocolos de verificación críticos.

La Inteligencia Artificial nos ofrece una capacidad sin precedentes para procesar la totalidad de nuestros archivos digitalizados, para transcribir manuscritos ilegibles y para descubrir las voces ocultas en la "periferia" La promesa de la "Investigación Periférica", encontrar conexiones entre un Schomburg y un Todd, o un Betances y un pasajero anónimo, se ve exponencialmente magnificada por su capacidad Al mismo tiempo, esta tecnología conlleva el peligro de crear textos con alucinaciones que citan fuentes que nunca existieron y que parecen tan reales como un documento de archivo. Además, existe el riesgo de hacer más grandes los sesgos del pasado. Esto puede ocurrir cuando las herramientas de IA utilizan datos para su entrenamiento que están sesgados y que invisibilizan aún más a los subalternos y marginados.

Este trabajo cierra, entonces, con un llamado a la acción. El historiador "aumentado" por la IA no es aquel que confía ciegamente en el "Artefacto" (A) para obtener respuestas. El historiador aumentado es el "Humano" (H) que, con un profundo "Entrenamiento" (T) y una "Metodología" (M) crítica y escéptica, domina la herramienta.

La tecnología es un medio, no un fin. El objetivo sigue siendo el mismo que se planteó en la introducción de esta obra, hacer preguntas más profundas, contar historias más ricas y complejas y, al hacerlo, aumentar el intelecto colectivo puertorriqueño. La IA es la herramienta más poderosa que hemos tenido para esa tarea, y dominarla es ahora nuestra responsabilidad metodológica fundamental.

X.ANEJOS

ANEJO 1-

LEXICON DE TEMINOS ERRORES OCR MINUSCULA

https://drive.google.com/file/d/1jkELIMHc3H5N93nEddBOvAeGcjQhqH0N/view? usp=sharing

ANEJO 2-

LEXICON DE APELLIDOS DE PUERTO RICO CON ERRORES OCR Y CON OR PARA BUSQUEDA

https://drive.google.com/file/d/13s1nC00YdQt6jxAouEYJRHHcTNaxwT51/view?us p=sharing

ANEJO 3

METADATA ICP ARCHIVO DIGITAL

https://drive.google.com/file/d/1KOuA51JYOHn0drWjcXpUjhXnm90BWD6M/view ?usp=sharing

ANEJO 4

RESULTADO DE BUSQUEDA PUERTO RICO ARCHIVO GENERAL DE LA NACION REPUBLICA DOMINANA

https://drive.google.com/file/d/1K7DpGp35cxuDGD4jleJhqkADVy1icWXW/view?u sp=sharing

ANEJO 5

INDICE DE DOCUMENTOS ST THOMAS ARCHIVOS DANESES

https://drive.google.com/file/d/1RAfuk-1uL2Wju1RznZMhS95pU4ypJaT/view?usp=sharing

ANEJO 6

RESULTADO DEL PROMPT INDUSTRIA PETROQUÍMICA PUERTO RICOCONTEXTO

https://drive.google.com/file/d/1ELEb9odiqUcfUUFQiA0P8u6a_wW4OkjX/view?u sp=sharing

BIBLIOGRAFÍA

Alegría, R. (1975). Los dibujos de Puerto Rico del naturalista francés Augusto Plée (1821-1823). Revista del Instituto de Cultura Puertorriqueña, (68), 20-41.

Ander-Egg, E. (1982). Técnicas de investigación social (20ª ed.). Editorial Humanitas.

Andreu Iglesias, C. (1977). Memorias de Bernardo Vega. Ediciones Huracán.

Anthropic. (2025). Claude (modelo Sonnet 4.5) [Large language model]. https://claude.ai/

Archivo Histórico Nacional. (s.f.). Estado demostrativo de los procesados comprendidos en la causa formada con motivo de la rebelión de Lares [Ultramar. 5111, Exp. 34, Doc.1].

Bardini, T. (2000). Bootstrapping: Douglas Engelbart, coevolution, and the origins of personal computing. Stanford University Press.

Boletín Mercantil, 33(55), 9 de mayo de 1873.

Burset, L. R. (s.f.). El Portal de Archivos Españoles (PARES) como fuente de datos genealógicos para Puerto Rico. Academia.edu. https://www.academia.edu/22155375/El_portal_PARES_como_fuente_de_datos_genealógicos

Bush, V. (1945, julio). As we may think. The Atlantic, 176(1), 101-108.

Committee on Publication Ethics. (s.f.). Authorship and AI tools. https://publicationethics.org/guidance/cope-position/authorship-and-ai-tools

Crespo, E. (2000). Estudio comparativo biocultural entre dos poblaciones prehistóricas en la isla de Puerto Rico: Punta Candelero y Paso del Indio [Tesis doctoral, Universidad Nacional Autónoma de México].

De la Rosa, L. (1986). Lexicón histórico documental de Puerto Rico (1812-1899). Centro de Estudios Avanzados de Puerto Rico y el Caribe.

El Día, 1787, 2 de mayo de 1885.

DigitalOcean. (s.f.). Understanding and mitigating AI hallucination. https://www.digitalocean.com/resources/articles/ai-hallucination

Elastic. (s.f.). ¿Qué es la generación aumentada de recuperación (RAG)? https://www.elastic.co/es/what-is/retrieval-augmented-generation

El Noticiero, 3(516), 3 de mayo de 1885.

Engelbart, D. (1962, octubre). Augmenting human intellect: A conceptual framework. Stanford Research Institute.

ESEID. (s.f.). IA generativa multimodal https://eseid.com/ia-generativa-multimodal/ Flores, J. H. (2024). [Conferencia Logia Borinquen]. Issuu. https://issuu.com/coleccionpuertorriquena/docs/conferencia_logia_borinquen-09-182024_final

García, M. (2018). Writer's block and how to work through it. Georgetown University Law Center. https://www.law.georgetown.edu/wp-content/uploads/2018/07/Writer-s-blockFinalMelanie.pdf

Ginzburg, C. (1997). El queso y los gusanos: El cosmos, según un molinero del siglo XVI (F. Martín, Trad.). Muchnik Editores. (Obra original publicada en 1976)

Gobierno de España. (s.f.). Inteligencia artificial: Guía de conceptos esenciales. https://www.gobierto.es/blog/inteligencia-artificial-guia-de-conceptos-esenciales

Goskar, T. (s.f.). How to do historical research online. Curatorial Research Centre. https://curatorialresearch.com/services/research/how-to-do-historical-research-online/

Guha, R. (1982). Subaltern Studies: Writings on South Asian history and society. Oxford University Press.

Historic Urban Plans. (s.f.). San Juan, Puerto Rico 1766 https://www.historicurbanplans.com/product/san-juan-puerto-rico-1766-souvenir-series/

Huistra, H., & Mellink, B. (2016). Phrasing history: Selecting sources in digital repositories. Historical Methods, 49(4), 220-229. https://doi.org/10.1080/01615440.2016.1205964

Larrión, J. (2019). Teoría del actor-red: Síntesis y evaluación de la deriva postsocial de Bruno Latour. Revista Española de Sociología (RES), 28(2), 323-339. https://doi.org/10.22325/fes/res.2019.03

Mind Mapping Site. (s.f.). History of mind mapping: The founding fathers. https://mindmappingsite.com/history/history-of-mind-mapping/

National History Education Clearinghouse. (2025). Guiding principles for artificial intelligence in history education

Ojeda Ríos, F. (2006). El desterrado de París: Biografía del Doctor Ramón Emeterio Betances (1827-1898). Ediciones Puerto.

OP.Cit., (25). (2018). https://revistas.upr.edu/index.php/opcit/issue/view/2489

Pica Pica, 21(845), 24 de marzo de 1982.

Putnam, L. (2016). The transnational and the text-searchable: Digitized sources and the shadows they cast. The American Historical Review, 121(2), 377-402. https://doi.org/10.1093/ahr/121.2.377

Ramos Perea, R. (1992). Ramón Quiñonez asesino. Revista del Ateneo Puertorriqueño, 2(4), [páginas].

Reichard de Cardona, H. E. (2023). Arturo Alfonso Schomburg: Identidad racial y afirmación cultural afrocaribeña. Kindle Direct Publishing.

San Miguel, P. (2019). Intempestivas sobre Clío, Puerto Rico, el Caribe y América Latina (1ª ed.). Ediciones Laberinto.

Silvia, P. J. (2007). How to write a lot: A practical guide to productive academic writing. American Psychological Association.

Stanford Research Institute. (1968). The mother of all demos [Video]. YouTube. https://youtu.be/UhpTiWyVa6k?si=7Kpi1ZhyX2Oet0kX

Sustainability Directory. (s.f.). Critical digital mindset. https://lifestyle.sustainabilitydirectory.com/area/critical-digital-mindset/

Torres Otero, A. (2025, 5 de abril). Hallazgo que reescribe la historia de la prensa en Puerto Rico. El Nuevo Día. https://www.elnuevodia.com/opinion/punto-de-vista/hallazgo-que-reescribe-lahistoria-de-la-prensa-en-puerto-rico/

University of Adelaide. (s.f.). Mind mapping https://www.adelaide.edu.au/writingcentre/sites/default/files/docs/learningguidemindmapping.pdf

Vierru, A. M., & Petrea, G. (2025). The impact of artificial intelligence (AI) on students' academic development. Education Sciences, 15(3), 343. https://doi.org/10.3390/educsci15030343

En una era donde los archivos digitales transforman el acceso al conocimiento histórico, esta obra se presenta como una guía metodológica indispensable para navegar el vasto universo de fuentes documentales en línea Desde los fundamentos teóricos propuestos por Vannevar Bush en 1945 hasta las aplicaciones de inteligencia artificial, Joseph Harrison Flores desarrolla una metodología integral que combina el rigor académico tradicional con las herramientas tecnológicas del siglo XXI.

El autor introduce conceptos innovadores como la "investigación periférica", técnicas avanzadas de búsqueda digital y sistemas de organización documental que permiten optimizar el trabajo con fuentes históricas digitalizadas. Con ejemplos aplicados al contexto puertorriqueño e hispanoamericano, el texto propone un modelo híbrido que enriquece las metodologías tradicionales con las posibilidades del entorno digital. Investigación Histórica Digital representa una contribución esencial al desarrollo de las humanidades digitales en Puerto Rico y Latinoamérica, ofreciendo herramientas concretas para democratizar el acceso a la historia a través de la tecnología.

JOSEPH HARRISON FLORES es investigador puertorriqueño y fundador del Archivo Digital Nacional de Puerto Rico. Con formación en la Universidad de Puerto Rico, el Centro Nacional de Restauración de La Habana y Cornell University, se especializa en historia puertorriqueña, particularmente el Grito de Lares. Como columnista de El Nuevo Día y director del ADNPR, democratiza el acceso a información histórica. Su obra incluye títulos premiados como La Identidad de Brazo de Oro, Hacienda Lealtad, Cinco Hallazgos en torno a Lares, El sistema defensivo costanero de Puerto Rico y la Historia de la Bandera Puerto Rico. Se enfoca en el revisionismo histórico, aportando nuevas fuentes que desafían versiones establecidas con la convicción de que "la historia no se repite: se investiga, se debate y, cuando es necesario, se corrige."