Se expone la línea de investigación que lleva adelante el Grupo de Investigación y Desarrollo en Data Mining del Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan los resultados del proyecto de investigación “Data Mining y Simulación en Evaluaciones de Biodiversidad”, C141 del Programa de Incentivos, y las perspectivas de un nuevo proyecto, “Aplicaciones de Data Mining al estudio del Microbioma Humano”, que se inicia dentro del mismo programa institucional.
Las modernas técnicas de secuenciación de ADN transforman su estructura química en secuencias informáticas de símbolos cada una de las cuales puede ser vista como una instancia de una base de datos. Es posible entonces aplicar métodos para clasificar casos y predecir patrones de comportamiento de forma similar a como se lo hace sobre otros dominios. Dentro de esta línea de trabajo se desarrolló un algoritmo que permite evaluar la cantidad de especies distintas en una comunidad microbiana, mejorando la eficiencia de otras estimaciones estadísticas a partir de muestras. Actualmente se trabaja en las formas de agrupamientos (clustering) que resulten compatibles con la evaluación clínica del metagenoma humano (microbioma), el cual sufre importantes variaciones en presencia de patologías. Se pretende desarrollar un clasificador de enterotipos, conjuntos de genes asociados a diferentes vías metabólicas, que permita determinar y predecir variaciones debidas al curso de una enfermedad.