Presentación del problema: Los repositorios institucionales realizan cosechas de grandes cantidades de contenidos dispersos en la red, es necesario que esos contenidos cumplan con estándares de preservación digital, sin dejar de lado la eficacia en el uso de los tiempos, por lo que es necesario contar con un método de normalización de lotes de archivos conforme a esos estándares. En este trabajo se presenta una herramienta para el procesamiento por lote de archivos PDF en conformidad con el estándar PDF/A.
Materiales y metodología: Se desarrolló un script escrito en python llamado PlusUltraPDF. Consiste en una estructura de control que recorre un directorio padre, sus posibles subdirectorios y archivos PDF y analiza de forma recurrente sucesivos informes de conformidad con el estándar PDF/A (realizados con veraPDF). Luego se invocan dos programas de manipulación de PDF (Ghostscript y OCRmyPDF) que generan nuevos archivos PDF/A-2b derivados de los PDF originales.
Resultados: La evaluación de PlusUltraPDF dió buenos resultados: procesó el 97,9% de los archivos y generó un PDF/A-2b válido en el 94,5% de los casos, en comparación con otro script desarrollado en el repositorio que implementa 3-Heights (con mejores posibilidades de conversión), resulta un buen complemento.