La categorización de documentos de textos es una aplicación de la minería de textos que pretende extraer información de texto no estructurado o semi estructurado. La justificación de su aplicación se debe a que se estima que alrededor del 80% de los datos de las organizaciones son no estructurados. El presente trabajo de tesis de la carrera Licenciatura de Sistemas de la UM pretende analizar los títulos de las tesis realizadas en la cátedra para categorizarlas según su área temática mediante minería de textos y evaluar la eficacia de la técnica utilizada al hacerlo. Antes de comenzar con la construcción de modelos de minería de textos, se construyó el estado del arte mediante un mapeo sistemático de la literatura (en inglés, systematic mapping study o SMS). Se presentan los resultados logrados mediante el desarrollo del SMS y se describen las actividades definidas para la finalización del trabajo de tesis.
Notas
Short Paper - Alumnos
Información general
Fecha de exposición:octubre 2022
Fecha de publicación:2023
Idioma del documento:Español
Evento:XXVIII Congreso Argentino de Ciencias de la Computación (CACIC) (La Rioja, 3 al 6 de octubre de 2022)
Institución de origen:Red de Universidades con Carreras en Informática
Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)