Tópicos avanzados en categorización de textos

Errecalde, Marcelo Luis; Ingaramo, Diego Alejandro; Rosas, María Verónica; Asensio, Amparito

Buscar material

Busque entre los 169024 recursos disponibles en el repositorio

Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

Red de Universidades con Carreras en Informática (RedUNCI)
→
Eventos
→
WICC
→
WICC 2009

Tópicos avanzados en categorización de textos

Autores: Errecalde, Marcelo Luis | Ingaramo, Diego Alejandro | Rosas, María Verónica | Asensio, Amparito

2009

Tipo de documento: Objeto de conferencia

Resumen

Este artículo describe, en forma resumida, los trabajos de investigación y desarrollo que se están llevando a cabo en la línea “Agentes y Sistemas Inteligentes” del LIDIC, en el área de categorización de textos. Otras líneas de investigación del LIDIC, también abordan problemas de categorización pero, en nuestro caso, nos centramos en problemas que involucran documentos. Por este motivo, en nuestra línea se presta especial atención a técnicas vinculadas al procesamiento del lenguaje natural, la lingüistica computacional y la recuperación de la información. En este sentido, buena parte de los desarrollos en estos temas, se han realizado en forma conjunta con grupos de investigación con una experiencia considerable en el procesamiento del lenguaje natural, como por ejemplo, el NLEL de la Universidad Politécnica de Valencia, España. Los enfoques utilizados en nuestra línea de trabajo, buscan mejorar los procesos de categorización automática de textos en base a dos mecanismos principales: 1) el uso de técnicas de representación de textos más elaboradas, 2) el uso de algoritmos de categorización más eficientes y efectivos. Respecto al primer punto, nuestros trabajos incluyen el uso de representaciones que incorporan información semántica (conceptos) a los métodos tradicionales basados en términos y representaciones basadas en LSI (Latent Semantic Indexing). Las soluciones algorítmicas por su parte, incluyen el ensamblaje de clasificadores y los métodos de optimización bio-inspirados.

Notas

Eje: Agentes y Sistemas inteligentes

Información general

Fecha de exposición: mayo 2009

Fecha de publicación: 2009

Idioma del documento: Español

Evento: XI Workshop de Investigadores en Ciencias de la Computación

Institución de origen: Red de Universidades con Carreras en Informática (RedUNCI)

Páginas: 75-79

Palabras claves: TIC ; Intelligent agents ; información ; Text analysis ; textos ; categorización ; representación

Materias: Ciencias Informáticas

Descargar archivos

Documento completo
Descargar archivo (90.61Kb) - PDF

BASE

GoogleScholar

Creado el: 14 de agosto de 2012

Disponible en SEDICI desde: 14 de agosto de 2012

Por favor, utilice uno de estos identificadores(URI) para citar o enlazar este ítem:

http://sedici.unlp.edu.ar/handle/10915/19673

Mostrar el registro completo del ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

WICC → WICC 2009

Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)

Iniciar sesión