n el dominio de la educación gran cantidad y diversidad del material utilizado en el proceso de enseñanza-aprendizaje se encuentra publicado pero disperso en Internet; la recuperación de dicho material se realiza haciendo uso de buscadores, pero actualmente existen otras formas más estructuradas de acceder a la información. Bajo este contexto aparecen cuatro conceptos fundamentales que enmarcan esta realidad educativa: objetos de aprendizaje, metadatos, estándares y repositorios institucionales.
En general, este trabajo ofrece una perspectiva sobre el estado actual de las investigaciones acerca de extracción automática de metadatos, estableciendo las bases para futuras investigaciones en el marco concreto de objetos de aprendizaje en repositorios institucionales de acceso abierto. Primero se presenta lo relacionado con los estándares para metadatos; luego se elabora un diagnóstico sobre la historia y situación actual de los repositorios institucionales en Argentina y Colombia; posteriormente se evalúan diferentes propuestas actuales de extracción automática de metadatos, a la luz del cumplimiento de estándares y algunos aspectos relevantes para el análisis y diseño de sistemas de extracción automática; finalmente, se presentan las conclusiones y trabajos futuros en el área.