En este artículo se describen las actividades desarrolladas y los subsistemas que conforman el proyecto de investigación denominado Desarrollo de Sistemas de Análisis de Texto.
Este proyecto aborda la problemática del desarrollo de herramientas que permitan recolectar, tabular, y etiquetar, textos en diferentes formatos y de diferentes fuentes de información con el propósito de someterlos a un posterior análisis utilizando aprendizaje automático y técnicas de minería de datos. Además del desarrollo de estas herramientas, el proyecto contempla el desarrollo de sistemas de análisis de texto que puedan abordar problemas como el reconocimiento de paráfrasis, es decir identificar oraciones (o párrafos) que tengan el mismo significado, o bien identificar oraciones-párrafos que estén semánticamente relacionados entre sí mediante una relación de implicación.
Las líneas de investigación en la que se encuadra el proyecto es dentro de las áreas de lingüística computacional y de aprendizaje automático. En particular, el proyecto se enfoca en modelos que utilizan redes neuronales artificiales (RNA) para analizar y procesar textos no estructurados.