Entre las responsabilidades de un repositorio institucional se encuentra la preservación de sus contenidos, con el objeto de asegurar su localización y accesibilidad en el largo plazo. Si bien esta función de preservación suele estar ligada a diferentes aspectos políticos, económicos o técnicos, el presente trabajo se enfocará en los aspectos técnicos relacionados con la monitorización y evaluación de los ítems del repositorio.
La evaluación de cada ítem permite determinar su grado de preservación, a partir de su estado actual y tomando como referencia criterios establecidos por el repositorio. No obstante, los cambios en las políticas y la evolución tecnológica constante hacen que estos criterios deban revisarse permanentemente, dificultando la automatización de las tareas de evaluación. Si bien estas tareas pueden realizarse manualmente, es una labor que demanda mucho tiempo y, como todo proceso manual e iterativo, es propenso a fallas.
En este trabajo se presenta una herramienta que permite evaluar e informar “estado actual de preservación” de los elementos del repositorio. Esta herramienta, que funciona sobre DSpace, realiza la evaluación automatizada de los ítems del repositorio a partir de la aplicación de una tarea de curación. Si bien las posibilidades de evaluación son muy amplias, al momento de su primera aplicación se consideraron ciertos elementos establecidos por la norma OAIS: procedencia, contexto, referencia, integridad y derechos. Los criterios de evaluación son agrupados en recetas: cada receta consiste de una serie de reglas de evaluación a las que se les ha dado un peso en el contexto de la receta. Estas recetas, con sus reglas y pesos, pueden ser especificadas fácilmente mediante un archivo de configuración. Los resultados de las evaluaciones se almacenan en reportes, que permiten identificar qué aspectos de cuáles elementos deben adecuarse.
Se considerará aquí el SEDICI como contexto de aplicación. Desde su creación en el año 2003, el repositorio institucional de la Universidad Nacional de La Plata ha evolucionado tanto en las políticas como las tecnologías que utiliza. En la actualidad reúne cerca de 35.000 obras, provenientes de toda la UNLP, con tipologías muy variadas. En este escenario, la evaluación manual resulta demasiado costosa y muy difícil de llevar a cabo. Al aplicarse sobre el repositorio SEDICI, esta herramienta permitió identificar elementos que no superaron alguna validación y por consiguiente se implementó un flujo de trabajo desde la administración en el cual se realizan las correcciones pertinentes sobre tales los elementos. Por otro lado, la información contenida en los reportes permitirá generar a futuro análisis estadísticos sobre el estado de preservación del repositorio, e incluso permitiría estudiar su evolución en el tiempo. Asimismo, este desarrollo promueve la generación rápida de nuevas reglas de evaluación gracias a su diseño estructural, y sienta las bases para la implementación de un mecanismo que permita a cualquier administrador del repositorio definir y ejecutar reglas de validación, por ejemplo mediante un lenguaje simple de utilizar.