Un cambio importante con respecto a depósitos de datos tradicionales, es que en los Sistemas Big Data (SBDs) la naturaleza no estructurada de algunos datos puede provenir de diversas fuentes, entre ellas sensores, redes sociales, entorno y la misma empresa. La diversidad de esos datos puede analizarse abordando distintas características. Precisamente, la propiedad de los SBDs con respecto a diversidad de los datos se denomina Variedad.
La variedad en SBDs ha sido relacionada con diversas propiedades como interoperabilidad, seguridad, reusabilidad, etc. En este contexto, y respondiendo a la pregunta de investigación:
¿Cómo puede modelarse la variedad de la información de dominio de manera de incorporar reusabilidad en el desarrollo de SBDs? , nuestro proyecto propone modelar variedad a modo de líneas de productos. A diferencia de otras propuestas, la nuestra toma como partida una estructura de actividades asociadas al desarrollo de SBDs, instanciada en artefactos software producidos durante esas actividades e incorpora el modelado de variedades de manera similar a líneas de productos.