En este proyecto se busca utilizar técnicas de aprendizaje automático para analizar y procesar textos que pueden estar en formato estructurado como no estructurado. Se han desarrollado un conjunto de herramientas que pueden ser utilizadas en el área de computación lingüística para diversos fines, entre los que se encuentran construcción de material de entrenamiento, procesamiento de datos estructurados y detección de similitudes entre fragmentos de textos.
Los problemas que se abordan en este proyecto son, entre otros, reconocimiento de implicación de textos e identificación de paráfrasis.
En este artículo se presenta la línea de investigación en la que se encuentra el proyecto, y se describen tres herramientas desarrolladas en el mismo.