Esta línea de investigación se centra en el estudio y desarrollo de Sistemas Inteligentes para la resolución de problemas de Big Data y Minería de Datos utilizando técnicas de Aprendizaje Automático. Los sistemas desarrollados se aplican particularmente al procesamiento de grandes volúmenes de información y al procesamiento de flujo de datos.
Las investigaciones correspondientes al procesamiento de datos masivos están enfocadas en dos temas: el estudio y desarrollo de técnicas de selección de características y el diseño de librerías que faciliten el procesamiento masivo de datos. En lo referido a selección de características, el foco está puesto en la reducción de los tiempos de cómputo. La optimización puede realizarse tanto en la mejora de la ejecución en un entorno distribuido, como en la propuesta de nuevas técnicas que permitan obtener un subconjunto óptimo de atributos.
Por otro lado, se está desarrollando una librería con el objetivo de facilitar el manejo de bases de datos de progenie en entornos de Big Data.
El objetivo de esta librería es brindar una API simple para que cualquier investigador con pocos conocimientos de programación pueda utilizarla de manera simple.
En cuanto a las investigaciones relacionadas con el análisis de flujos de datos se centran en la construcción de modelos que faciliten la interpretación de los patrones obtenidos y la posterior extracción del conocimiento. En particular el énfasis está puesto en la resolución de dos problemas de sumo interés en distintas áreas: el mantenimiento de máquinas industriales basado en su condición de funcionamiento y el análisis de trayectorias GPS a fin de identificar las características del flujo vehicular en un período de tiempo dado.