Este trabajo realiza una comparación del uso de dos arquitecturas multiprocesador, tomando como caso de aplicación un problema con alta demanda computacional como el de N-body. Se presentan las implementaciones paralelas con memoria compartida (usando Pthreads) y pasaje de mensajes (con MPI) en cluster de multicore, y una solución sobre GPU (con CUDA). Se describen y analizan los resultados experimentales obtenidos, que muestran la buena performance lograda con el uso de GPU.