La Recuperación de Información de la Web es uno más de los problemas de buscar en un conjunto los elementos más cercanos a una consulta dada bajo un cierto criterio de similitud. Es de interés aprovechar las cualidades de los espacios métricos con el objeto de resolver una consulta de manera efectiva y eficiente.
El objetivo de este proyecto es mejorar la recuperación y extracción de información no estructurada, utilizando recursos lingüísticos para la preparación de una estrategia de búsqueda.
Para esto, se consideran aportes desde la lingüística para el refinamiento semántico de los conceptos; y desde la matemática y las ciencias de la computación para la búsqueda por similitud.
Además, se pretende lograr un marco unificador para describir y analizar soluciones para el problema de la búsqueda en bases de datos no estructuradas.