Creación y evaluación de una herramienta para la conversión por lote de archivos PDF/A

Calamante, Lorenzo; Vila, María Marta; Villalba, Mariano Ezequiel; De Giusti, Marisa Raquel; Nusch, Carlos Javier; Villarreal, Gonzalo Luján

Buscar material

Busque entre los 171224 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Eventos
→
Conferencia Internacional BIREDIAL-ISTEC
→
2024 | XIII BIREDIAL

Creación y evaluación de una herramienta para la conversión por lote de archivos PDF/A

Pertenece al libro: Actas BIREDIAL-ISTEC 2024: Conferencia Internacional BIREDIAL-ISTEC

2024

Tipo de documento: Objeto de conferencia

Resumen

Presentación del problema: Los repositorios institucionales realizan cosechas de grandes cantidades de contenidos dispersos en la red, es necesario que esos contenidos cumplan con estándares de preservación digital, sin dejar de lado la eficacia en el uso de los tiempos, por lo que es necesario contar con un método de normalización de lotes de archivos conforme a esos estándares. En este trabajo se presenta una herramienta para el procesamiento por lote de archivos PDF en conformidad con el estándar PDF/A. Materiales y metodología: Se desarrolló un script escrito en python llamado PlusUltraPDF. Consiste en una estructura de control que recorre un directorio padre, sus posibles subdirectorios y archivos PDF y analiza de forma recurrente sucesivos informes de conformidad con el estándar PDF/A (realizados con veraPDF). Luego se invocan dos programas de manipulación de PDF (Ghostscript y OCRmyPDF) que generan nuevos archivos PDF/A-2b derivados de los PDF originales. Resultados: La evaluación de PlusUltraPDF dió buenos resultados: procesó el 97,9% de los archivos y generó un PDF/A-2b válido en el 94,5% de los casos, en comparación con otro script desarrollado en el repositorio que implementa 3-Heights (con mejores posibilidades de conversión), resulta un buen complemento.

Información general

Fecha de exposición: octubre 2024

Fecha de publicación: 2024

Idioma del documento: Español

Evento: XIII Conferencia Internacional de Bibliotecas y Repositorios Digitales (BIREDIAL-ISTEC) (Santiago de Chile, 22 al 24 de octubre de 2024)

Institución de origen: Ibero-American Science and Technology Education Consortium; Dirección PREBI-SEDICI

ISBN: 978-9968-08-017-0

Páginas: 188-202

Palabras claves: Preservación digital ; procesamiento por lotes ; estándar PDF/A ; Digital preservation ; Batch processing ; PDF/A standard

Materias: Ciencias Informáticas

Descargar archivos

Documento completo
Descargar archivo (226.6Kb) - PDF

BASE

GoogleScholar

Creado el: 19 de junio de 2025

Disponible en SEDICI desde: 19 de junio de 2025

Por favor, utilice uno de estos identificadores(URI) para citar o enlazar este ítem:

http://sedici.unlp.edu.ar/handle/10915/180659

Mostrar el registro completo del ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Conferencia Internacional BIREDIAL-ISTEC → 2024 | XIII BIREDIAL

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution 4.0 International (CC BY 4.0)

Iniciar sesión