Desde la aparición de las arquitecturas clusters de multicore, la programación híbrida surgió como una herramienta importante para el aprovechamiento de la nueva jerarquía de memoria que la arquitectura impone. Partiendo de un mismo caso de estudio, este trabajo se enfoca en la comparación de dos soluciones híbridas (donde se combina pasaje de mensajes y memoria compartida) que resuelven el problema en cuestión utilizando diferentes estrategias de paralelización. Las mismas utilizan de distinta manera la jerarquía de memoria presente en la arquitectura de experimentación (cluster de multicore), en particular haciendo un uso diferente del nivel L1 de cache. El caso de estudio elegido es el problema clásico de multiplicación de matrices, utilizado para demostrar el impacto de la utilización óptima de la jerarquía de memoria existente en una arquitectura paralela.