En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de las máquinas y a su bajo costo de almacenamiento. Sin embargo, dentro de estas enormes masas de datos existe una gran cantidad de información “oculta”, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. La Minería de Datos implica “escabar”en esa inmensidad de datos, en búsqueda de patrones, asociaciones o predicciones que permitan transformar esa maraña de datos en información útil. Una de las tareas utilizadas en minería de datos es el clustering (agrupamiento) y un algoritmo muy popular y simple usado en esta tarea es K-means.
A pesar de su popularidad el mencionado algoritmo sufre de algunas dificultades. K-means requiere varias iteraciones sobre todo el conjunto de datos, lo cual puede hacerlo muy costoso computacionalmente cuando se lo aplica a grandes bases de datos, el número de clusters K debe ser suministrado por el usuario y la búsqueda es propensa a quedar atrapada en mínimos locales.
Se pretende a través de esta línea de investigación desarrollar técnicas avanzadas o mejoradas de minería de datos, particularmente en la tarea de clustering y además, proponer mejoras al algoritmo de K-means basándose en la aplicación de técnicas Metaheurísticas.