En la actualidad, la Web se ha convertido en una herramienta fundamental en cualquier tipo de organización, empresa o individuo, los cuales se ven directamente beneficiados con la utilización de este recurso. Debido al continuo aumento en la utilización de Internet y de la migración casi total de los sistemas tradicionales de la arquitectura Web, es que se invierten grandes cantidades de recursos, ya sean humanos y/o económicos, en optimizar la utilización de los recursos existentes, así como también en prestar la mayor cantidad de servicios a los usuario.
Una de las herramientas más importantes para recuperar información desde la Web son las máquinas de búsquedas. La mayoría de estas máquinas utilizan técnicas de recuperación de información para rankear las páginas Web en un cierto orden de relevancia para una determinada consulta. Comparados con los sistemas de recuperación de información bibliográfica de los años 70 y 80, los nuevos motores de búsqueda deben tratar con información más heterogénea, variada en calidad, y mas distribuida y relacionada entre sí.