La Web es un recurso de información global y distribuido, que contiene una gran cantidad de datos relevantes. El volumen de estos datos ha tenido un aumento importante en los últimos años, lo que provoca que resulte cada vez más difícil encontrar información de interés. Actualmente la búsqueda de información se realiza por medio de distintos index-servers, la mayoría de ellos muy conocidos como puede ser el buscador AltaVista, cada uno tiene su propio conjunto de parámetros para iniciar una búsqueda y ofrecen diferentes posibilidades. Esta diversidad de lenguajes de interrogación propios de los index-servers dificulta la creación de consultas precisas que retomen la información buscada y no una cantidad excesiva de respuestas donde encontramos una gran cantidad de información irrelevante. Encontrar formas de consultas más eficientes para la Web es lo que nos motiva a investigar nuevas técnicas que proponen la utilización de un lenguaje standard como es SQL, las cuales permiten formular las consultas utilizando un lenguaje conocido y con los beneficios propios de éste.
Nuestro estudio se basa en investigar herramientas desarrolladas en esta dirección y realizar una evaluación de una de ellas, WebSQL, para lo cual implementamos una interfaz para embeber la librería WebSQL, ambas desarrolladas en lenguaje JAVA.
Hay dos aspectos que se verán reflejados durante el estudio y evaluación de esta herramienta. Uno, es como el filtrado automático de información podría ser útil para encontrar información relevante, evitando la navegación manual que se vuelve un proceso lento y tedioso. Mostraremos como se puede filtrar información sobre las respuestas obtenidas de algún Índex-server consultado, utilizando la librería WebSQL. El otro aspecto que mostraremos es cómo encontrar la información buscada simulando la navegación manual, este proceso consiste en realizar consultas a partir de una URL conocida, y siguiendo sus links aprovechando la estructura hipermedial de la Web.
Las herramientas estudiadas tienen diferentes enfoques pero todas apuntan a dar una nueva ventaja en las formas actuales de recuperar información desde la Web. El objetivo de esta tesis es dar un punto de partida en esta dirección, y puede ser ampliado como proponemos en el capítulo “Conclusiones y Trabajos Futuros”.