Muchos de los conjuntos de datos (data sets) existentes u obtenidos en investigaciones científicas contienen valores faltantes (MVs: Missing Values) y anomalías (outliers) asociados a procedimientos de entrada manuales deficientes, mediciones incorrectas o errores en los instrumentos de medición. En minería de datos (DM: Data Mining) estas imperfecciones pueden afectar negativamente la calidad del proceso de aprendizaje supervisado o el rendimiento de algoritmos de agrupamiento de datos. La imputación es una técnica para reemplazar MVs con valores sustituidos. Pocos estudios informan una evaluación global de los métodos existentes con el fin de proporcionar directrices para hacer la elección metodológica más apropiada en la práctica. El propósito general de este trabajo es determinar un modelo de decisión que permita encontrar los métodos de imputación más adecuados para completar información faltante en un conjunto de datos mediante la utilización de algoritmos de DM.
Notas
Eje: Bases de Datos y Minería de Datos.
Información general
Fecha de exposición:abril 2018
Fecha de publicación:2018
Idioma del documento:Español
Evento:XX Workshop de Investigadores en Ciencias de la Computación (WICC 2018, Universidad Nacional del Nordeste).
Institución de origen:Red de Universidades con Carreras en Informática
Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)