Se presenta la implementación paralela de las Transformadas Coseno Discreta y Seno Discreta en GPU, utilizadas en procesamiento de señales. Se analiza la performance, y el grado de aceleración obtenido en relación a la solución secuencial. A modo de referencia, se compara con la paralelización en un cluster de multicores. Como herramientas de programación se utilizaron CUDA en GPU y MPI para la versión en cluster de multicore. Los resultados experimentales muestran una buena respuesta de las soluciones en GPU en relación a las restantes alternativas.