La categorización automática de textos (CAT) es una tarea de gran relevancia debido a la necesidad de procesar y analizar volúmenes cada vez mayores de información textual disponible en la Web y en las empresas. La CAT, usualmente implementada mediante técnicas de aprendizaje automático (AA), se ha convertido en una de las pocas alternativas realistas al análisis manual de documentos, con resultados de alto impacto en áreas como la detección de spams, filtrado de noticias, detección de plagios, análisis de opinión y tendencias, organización de páginas web, determinación del perfil de autores, etc.
Sin embargo, en muchos dominios como la detección de spam, fraudes, plagio, intrusos, etc., la CAT debe enfrentar un problema cada vez más frecuente: la presencia de adversarios, personas o sistemas automáticos, que deliberada y maliciosamente intentan detectar y explotar las vulnerabilidades propias de los sistemas de CAT en beneficio propio.
Esta área de investigación, denominada categorización con adversarios ha sido aplicada en enfoques tales como la detección de spams, fraude, intrusos en una red, virus, etc. pero, hasta donde sabemos, no ha sido analizada en el contexto de los sistemas de detección de plagio. Esta nueva área, que surge de la intersección de la categorización con adversarios y la detección de plagios, la denominaremos detección de plagio con adversarios y constituye el eje central de esta línea de investigación.