La gran cantidad y variedad de información disponible en formato digital, junto con la evolución de las tecnologías de información y comunicación, han llevado al surgimiento de nuevos repositorios no estructurados de información, en los cuales los datos son no estructurados y no se adaptan fácilmente al modelo relacional. A tipos de datos tales como texto libre, imágenes, audio, video, secuencias biológicas de ADN o proteínas, entre otros; no se los puede estructurar fácilmente en claves y registros (tanto manual como computacionalmente), o tal estructuración carece de sentido practico , y restringe de antemano los tipos de consultas que luego se pueden realizar. Por lo tanto, es cada vez mas evidente en la actualidad la necesidad de procesar grandes conjuntos de datos, para obtener información útil a partir de ellos.
Así, dada una base de datos y una consulta, el objetivo de un sistema de recuperación de información es obtener, desde la base de datos, lo que podría ser útil o relevante para el usuario, usando alguna estructura de almacenamiento sobre dichos datos que permita responder a la consulta de manera eficiente. Estas estructuras necesitan ser diseñadas especialmente para ese propósito.