En este proyecto se busca utilizar técnicas de aprendizaje automático (machine learning), especialmente utilizando Redes Neuronales Artificiales (RNA) para analizar texto (por ejemplo un artículo de diario) y en base a ello determinar la existencia de texto (oraciones o párrafos) que tengan el "mismo sentido" es decir que presenten la misma semántica, o bien oraciones/párrafos que estén semánticamente relacionadas entre sí. Este problema es comúnmente conocido como identificación y reconocimiento de parafrases. El fenómeno es particularmente difícil de detectar por procedimientos automáticos especialmente por la ambigüedad del lenguaje y por la gran variabilidad léxica que se utiliza para expresar las mismas ideas.