Uno de los problemas en el crecimiento del desarrollo de software basado en componentes es la dificultad para localizar y recuperar componentes de software existentes. Las características particulares de los Sistemas de Información Geográficos (SIG) provocan que las composiciones de componentes no puedan construirse sólo como simples piezas de un producto, sino como un conjunto de elementos pre-ensamblados lo que hace la identificación de candidatos particularmente compleja. En ese contexto, este artículo presenta un proceso para publicar información sobre componentes SIG almacenada en repositorios Web, estructurándola en base a un esquema de información normalizado y enriquecido por medio de técnicas de Procesamiento del Lenguaje Natural. Se describen los principales elementos de la herramienta que automatiza este proceso y se evalúan los resultados experimentales de un caso de estudio.