Un área de investigación relativamente reciente en el área de procesamiento de señales genómicas es el de la clasificación de fenotipos basado en información genotípica, en especial SNPs (single nucleotide polymorfisms), usando combinaciones de SNPs para predecir una característica fenotípica. En su mayor parte los datos para un estudio son recolectados sin considerar la probabilidad a priori de las clases a clasificar. Por ejemplo en el contexto de casos vs. controles, donde los casos pueden representar individuos expresando alguna enfermedad y los controles representan individuos sanos, es común que haya más muestras de control que de casos. En este trabajo analizamos las razones para utilizar las técnicas de balance de datos para los estudios de predicción de fenotipos basado en genotipos, mostrando como estas técnicas pueden mejorar los resultados, generando clasificadores más robustos.