En estos últimos años el constante incremento del volumen de datos generados y almacenados por los sistemas de información sumados a su volatilidad y variedad. Este fenómeno es conocido como Big Data, y ha motivado la necesidad de nuevas técnicas que permitan procesar y obtener información útil de dichos datos en un tiempo razonable; siendo a su vez cada vez más necesario el procesamiento de datos en tiempo real.
Esta tesis presenta una propuesta innovadora para la minería temporal de datos cuando hay requerimiento de respuesta en tiempo real. El modelo de Sistemas Armónicos Difusos (Fuzzy Harmonic Systems, FHS) se implementa con un algoritmo simple y liviano, y constituye una extensión del modelo de Sistemas Armónicos. Se enfoca en la temporalidad de los eventos y no en las características del evento en sí, como otras técnicas tradicionales. Permite la detección y/o predicción de comportamientos anómalos o eventos específicos cuando éstos ocurren y no necesariamente post-mortem. El modelo FHS utiliza patrones difusos y reglas de inferencias difusas que le permiten contextualizar las variables y detectar conocimiento implícito en las mismas. Ésto le otorga al modelo flexibilidad y robustez suficiente como para tratar problemas donde es necesario interpretar los datos con sentido semántico. Así, el modelo de comportamiento es dinámico y representa complejidades más sutiles. El mecanismo de resonancia de patrones permite ajustar la sensibilidad del modelo realizando un aprendizaje cada vez que éste resuena, es decir cuando detecta un caso positivo. Por otra parte, el uso de los filtros del modelo reduce el tiempo de procesamiento y la complejidad computacional de los mismos. Ésto se traduce en una mejora en el tiempo de respuesta y la posibilidad del tratamiento en tiempo real de los datos.
Como parte de este trabajo, también se presenta el prototipo Kronos Móvil que implementa el modelo FHS para la predicción del nivel riesgo en tránsito vehicular y peatonal. Este prototipo está codificado en Android, permitiendo evaluar el rendimiento y la eficiencia del modelo propuesto en un entorno real y dinámico, donde intervienen una gran cantidad de variables de diverso tipo (climatológicas, geográficas, fisiológicas del usuario, vehiculares, características del desplazamiento, etc.).
Los estudios de campo y análisis estadísticos realizados permiten asegurar que la propuesta no sólo es performante sino también aplicable de manera satisfactoria para los entornos en que se plantea.