Busque entre los 168899 recursos disponibles en el repositorio
Mostrar el registro sencillo del ítem
dc.date.accessioned | 2019-12-04T14:03:53Z | |
dc.date.available | 2019-12-04T14:03:53Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | http://sedici.unlp.edu.ar/handle/10915/86748 | |
dc.description.abstract | Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR | es |
dc.language | es | es |
dc.subject | datos de investigación | es |
dc.subject | Humanidades | es |
dc.title | Los datos de investigación en las Humanidades – periódicos decimonónicos | es |
dc.type | Objeto de conferencia | es |
sedici.creator.person | Galina Russell, Isabel | es |
sedici.creator.person | Peña Pimentel, Miriam | es |
sedici.creator.person | Priani Saisó, Ernesto | es |
sedici.subject.materias | Bibliotecología | es |
sedici.subject.materias | Ciencias Informáticas | es |
sedici.description.fulltext | true | es |
mods.originInfo.place | Universidad Nacional Autónoma de México | es |
sedici.subtype | Objeto de conferencia | es |
sedici.rights.license | Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) | |
sedici.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
sedici.date.exposure | 2019-07 | |
sedici.relation.event | IX Conferência Internacional sobre Bibliotecas e Repositórios Digitais da América Latina BIREDIAL – ISTEC Anais das sessões temáticas (São Paulo, 2019) | es |