Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2019-12-04T14:03:53Z
dc.date.available 2019-12-04T14:03:53Z
dc.date.issued 2019
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/86748
dc.description.abstract Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR es
dc.language es es
dc.subject datos de investigación es
dc.subject Humanidades es
dc.title Los datos de investigación en las Humanidades – periódicos decimonónicos es
dc.type Objeto de conferencia es
sedici.creator.person Galina Russell, Isabel es
sedici.creator.person Peña Pimentel, Miriam es
sedici.creator.person Priani Saisó, Ernesto es
sedici.subject.materias Bibliotecología es
sedici.subject.materias Ciencias Informáticas es
sedici.description.fulltext true es
mods.originInfo.place Universidad Nacional Autónoma de México es
sedici.subtype Objeto de conferencia es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/
sedici.date.exposure 2019-07
sedici.relation.event IX Conferência Internacional sobre Bibliotecas e Repositórios Digitais da América Latina BIREDIAL – ISTEC Anais das sessões temáticas (São Paulo, 2019) es


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)