En español
Hace ya más de dos décadas, se registra un esfuerzo sostenido en el tiempo por definir un modelo de proceso que guíe el desarrollo de proyectos de Ingeniería de Explotación de Información. Sin embargo, las propuestas existentes presentan una visión parcial e incompleta, conduciendo a una tasa de fracaso cercana al 60% [Gondar, 2005; Marbán et al., 2009], a partir de lo cual los siguientes autores [Kurgan y Musilek, 2006; Mariscal et al., 2010; Kdnuggets, 2014] señalan la necesidad de definir un modelo de proceso que resuelva las limitaciones existentes. En este contexto, la presente investigación tiene como objetivo desarrollar un modelo de proceso integral, el cual presente una visión unificada, integrando los procesos orientados al producto y a la gestión, completa y detallada, describiendo las actividades involucradas y sus dependencias.
Como resultado del trabajo, se propone MoProPEI, un modelo de proceso integrado por los subprocesos de Desarrollo y Gestión, y descompuesto en un mayor grado de detalle en fases y actividades, para las cuales se propone el uso de distintas técnicas y procedimiento que describen las tareas a realizar. La correcta integración de la propuesta fue verificada a partir de su aplicación en tres proyectos pertenecientes a las áreas de educación, salud y análisis web. Las características estáticas fueron evaluadas mediante el marco comparativo de metodologías para proyectos de explotación de información [Moine, 2013]. Finalmente, se implementa la validación mediante un experimento controlado, replicando el único experimento reproducible identificado en la disciplina [Sharma, 2008]. De los resultados derivados de las estrategias de evaluación utilizadas, se observa que MoProPEI presenta una diferencia significativa con respecto a las propuestas antecesoras.
En inglés
For more than two decades, there has been a sustained effort over time to define a process model that guides the development of Information Mining Engineering projects. However, the existing proposals present a partial and incomplete vision, leading to a failure rate close to 60% [Gondar, 2005; Marbán et al., 2009]. Several authors [Kurgan and Musilek, 2006; Mariscal et al., 2010; Kdnuggets, 2014] pointed out the need to define a process model that resolves existing limitations. In this context, this research aims to develop a comprehensive process model, which presents a unified vision, integrating the product-oriented and management processes, complete and detailed, describing the activities involved and their dependencies.
This thesis proposes MoProPEI, a process model integrated by the Development and Management subprocesses, and decomposed in a greater degree of detail into phases and activities. For each activity, at least one technique or procedure is selected, describing the tasks to be performed. The correct integration of the proposal was verified from its application in three projects belonging to the areas of: education, health and web analysis. We evaluate the static characteristics through the comparative framework of methodologies for information mining projects [Moine, 2013]. Finally, we carried out a controlled experiment to validate the proposal, replicating the only reproducible experiment identified in the discipline [Sharma, 2008]. From the results derived from the evaluation strategies used, we observed that MoProPEI presents a significant difference with respect to its predecessors.