La mayor parte de la literatura sobre análisis de rendimiento de programas paralelos está orientada a la optimización a cargo del programador. Por lo tanto, supone conocimiento de los algoritmos empleados, su orden de complejidad, su forma de implementación, y en definitiva, asume acceso a los fuentes de esos programas. El instrumental disponible de análisis de rendimiento se basa mayormente, entonces, en propiedades estructurales de los programas, que sólo se hacen evidentes a partir del código fuente.
Sin embargo, en ocasiones el analista de rendimiento en Cómputo de Altas Prestaciones se enfrenta al problema de optimizar la ejecución de aplicaciones en cuyo desarrollo no ha intervenido, y de las cuales sólo se tiene la versión final ejecutable. Otras veces se dispone de los fuentes, pero su interpretación es de todos modos costosa, debido a la complejidad de estudiar código escrito por terceros, o debido a la dificultad de comprender el dominio del problema. Si se dispone únicamente de los programas en su versión binaria, las técnicas de predicción de prestaciones que se apoyan en el conocimiento de los fuentes no pueden ser aplicadas, y el analista debe normalmente proceder por ensayo y error. El trabajo que se propone intenta identificar una metodología conveniente para obtener conocimiento acerca de las aplicaciones, en ausencia del código fuente, que permita hacer inferencias sobre su rendimiento en diferentes plataformas, existentes o hipotéticas, con el fin de seleccionar las mejores plataformas para cada aplicación.