La clasificación multi-etiquetas es un paradigma de aprendizaje supervisado que generaliza las técnicas clásicas de clasificación para abordar problemas en donde cada instancia de una colección se encuentra asociada a múltiples etiquetas. La mayor parte de los trabajos de investigación han sido realizados en contextos de aprendizaje por batch. Los ambientes de flujo continuo de datos (o streaming) presentan nuevos desafíos a esta área debido a las limitaciones de tiempo de respuesta y almacenamiento que acarrean. Se aplicaron algoritmos de clasificación multi-etiqueta a diversas colecciones de datos no estructuradas de referencia a partir de las cuales se simularon los streamings de datos. En este trabajo propone una estrategia de ensamble de algoritmos de clasificación multi-etiquetas con el objetivo de conseguir mejoras en la predicción. Los resultados han sido alentadores y la propuesta de ensambles utilizando algoritmos clásicos de clasificación multi-etiquetas mostraron rendimientos competitivos que mejoran en varios escenarios al estado del arte.
Información general
Fecha de exposición:octubre 2021
Fecha de publicación:2021
Idioma del documento:Español
Evento:VII Simposio Argentino de Ciencia de Datos y GRANdes DAtos (AGRANDA 2021) - JAIIO 50 (Modalidad virtual)
Institución de origen:Sociedad Argentina de Informática e Investigación Operativa
Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)