En este artículo se describe un proyecto de investigación relacionado al análisis y procesamiento de información textual, tal como el reconocimiento de paráfrasis o la implicación de textos.
En ese contexto se describe la creación de una herramienta para construir corpus lingüísticos que pueden ser utilizados como material de entrenamiento para sistemas de minería de datos y de extracción de información, en especial sobre texto no estructurado.