En la actualidad, la incorporación de las Tecnologías de la Información y la Comunicación (TIC) en el ámbito de empresas y organizaciones como un elemento clave para mejorar su competitividad e impulsar su crecimiento económico, ha producido un crecimiento considerable en el volumen de datos generados por diferentes sistemas y actividades, lo que hace dificultoso mantenerse al día con los resultados y genera la necesidad de modificar, optimizar y desarrollar métodos y modelos de almacenamiento y tratamiento de datos que suplan las falencias que presentan las bases de datos y los sistemas de gestión de datos tradicionales.
Aunque, se pueda contar con grandes repositorios de datos flexibles y multi-estructurados, que están disponibles a costos bajos o gratuitos y listos para ser explotados por procesos informacionales, la gestión de múltiples tipos de datos (incluidos los datos estructurados, semi-estructurados y no estructurados) se vuelve compleja, por la variedad o existencia de diferentes tipos y fuentes de datos. A lo que se suma, la necesidad de las organizaciones de integrar y analizar datos en un complejo abanico de fuentes de información tradicional y no tradicional, que son producidos tanto internamente como por fuera de la empresa.
El proceso de entrega (delivery) de datos para la toma de decisiones, continúa desempeñando un papel de innovación y, por lo general, se confunde con extracciones manuales de datos, repeticiones costosas de procesos, informes propensos a errores y una integridad de datos no mensurable. Pero en realidad facilita la comprensión de los datos al transformarlos en información útil y ayuda a las organizaciones, a responder preguntas esenciales para la toma de decisiones que le permitan obtener ventajas competitivas y mejorar su posición en el mercado.
En este orden de ideas, cabe agregar como bien sostienen Jerry Held, Michael Stonebraker, Thomas H. Davenport, Ihab Ilyas, Michael L.
Brodie, Andy Palmer, y James Markarian, 2016, que “la unificación de datos es una estrategia emergente, que cataloga el conjunto de datos, combina los datos de toda la empresa y los publica, para facilitar su consumo”. Es decir, se trata de tener el manejo y control de la información, a fin de tener asegurada una vista única de los datos, que provienen de fuentes funcionalmente distintas (bases corporativas, bases propias, sistemas externos, etc.), ya que los usuarios finales no tienen la necesidad de aprender a utilizar diferentes sistemas de acceso y manipulación de los datos. El uso de la unificación de datos como una estrategia frontend puede acelerar el suministro de datos altamente organizados en sistemas, como ETL (Extract, Transform and Load) y MDM (Master Data Management) y lagos de datos (data lake), aumentando el valor de estos sistemas y los conocimientos que permiten. De lo expuesto precedentemente, se desprende el propósito del presente proyecto como una investigación exploratoria de las estrategias del proceso de unificación y delivery de grandes volúmenes de datos organizacionales.