En los últimos años surgió el término Big Data, en el contexto de Data Mining, para referirse a conjuntos de datos tan grandes y complejos que se vuelven difíciles de procesar en un tiempo razonable con aplicaciones tradicionales de análisis de datos. En general, los analistas necesitan analizar datos con variabilidad, por ej., datos que resultan de la agregación de registros individuales en grupos de interés, o datos que representan entidades abstractas como especies biológicas, o regiones como un todo. El Análisis Simbólico de Datos, al ofrecer la posibilidad de agregación de datos al nivel de granularidad elegido por el usuario, mientras se mantiene la información sobre la variabilidad intrínseca, puede desempeñar un papel importante en este contexto. Esta metodología resulta particularmente interesante para el estudio de Economía y Gestión, Marketing, Ciencias Sociales, Geografía, estadísticas sobre datos oficiales, así como para Biología y análisis de datos Geológicos.
Por otra parte, existen campos de la actividad humana; tales como economía, meteorología, administración de empresas; donde parte de los problemas y su solución se presentan en un contexto dinámico. Esto requiere analizar las variables relevantes del problema a resolver a partir de datos recogidos secuencialmente a intervalos regulares de tiempo.
El presente proyecto tiene como finalidad investigar sobre las metodologías estadísticas apropiadas para el tratamiento de grandes bases de datos; en particular del Análisis Simbólico de Datos; como así también estudiar modelos aleatorios para el tratamiento de variables indexadas en el tiempo. Es claro que existen problemas provenientes de diversas áreas del conocimiento donde se necesita de ambos tipos de herramientas, por ejemplo cuando aparecen series temporales o de espacio-tiempo que toman valores en intervalos o incluso distribución de valores. Las metodologías se aplicarán a datos reales.