La Computación de Altas Prestaciones a través de clusters de computadores basados en Workstation y redes convencionales, posibilitó la construcción y uso de computadores paralelos. En las arquitecturas paralelas el objetivo principal es el aumento de prestaciones, utilizando el potencial ofrecido por gran número de procesadores.
La construcción de un cluster tiene tres retos: Alto Rendimiento, Alta Disponibilidad y Alta Productividad. Manejar eficientemente un número elevado de computadores en ambientes heterogéneos no es trivial, por ello requiere un cuidadoso diseño de la arquitectura y funcionalidad. Respecto a la alta disponibilidad, debemos considerar la probabilidad de los fallos o desconexión de nodos, reduciendo el tiempo medio entre fallos del computador paralelo como un todo.
Este proyecto pretende definir la configuración adecuada de tolerancia a fallos para diferentes tipos de aplicaciones, teniendo en cuenta los requerimientos de rendimiento y prestaciones del usuario, definir y validar un modelo genérico de aplicación-prestación-tolerancia a fallos.