En la actualidad, el acceso a la información y el descubrimiento del conocimiento se convirtieron en tareas fundamentalmente necesarias en todos los ámbitos. El desarrollo de métodos inteligentes capaces de representar la información disponible se volvió indispensable.
Si bien continuamente se generan datos en diferentes formatos, la mayoría de los sistemas y aplicaciones actuales producen y almacenan texto. Este formato resulta menos atractivo que otros tales como el sonido, las imágenes y el video, pero, sin duda, resulta ser el principal medio de comunicación entre los seres humanos en la actualidad. Cada correo electrónico enviado, cada búsqueda realizada en Internet y cada publicación subida a la red implica, en mayor o menor medida, datos en formato texto.
Desde la invención de la escritura en la antigüedad, los seres humanos almacenan el conocimiento en textos. Desde entonces, la cantidad de documentos disponibles ha aumentado exponencialmente mientras el costo de generar, almacenar, duplicar y compartir información fue disminuyendo. En los últimos sesenta años a partir del trabajo de Luhn, muchos investigadores se han esforzado por construir en forma automática resúmenes de documentos.