El aumento de las herramientas bioinformáticas para el análisis de grandes volúmenes de datos a partir de la década de 1980 propició la aparición de nuevas metodologías para el análisis de datos moleculares. Tanto las zonas codificantes, exones, como las no codificantes, intrones, del ADN se utilizan en estudios filogenéticos, pero no las denominadas hipervariantes o ADN altamente repetitivo, las cuales son utilizadas para otros tipos de estudios. La selección de los genes que se van a estudiar depende del objetivo del estudio. Si el objeto de estudio son taxones superiores se usan genes ribosomales y de cloroplastos que tienen bajas tasas de mutación. En cambio, si el estudio emplea taxones inferiores, como por ejemplo especies próximas, se estudiarán genes con tasas de mutación más alta, menos conservados, por ejemplo los mitocondriales como la Citocromo Oxidasa I y II (COI y COII, respectivamente).
Los análisis que incluyen datos moleculares para la construcción de hipótesis filogenéticas puede llevarse a cabo aplicando los métodos de la parsimonia, por ejemplo utilizando el TNT como se ha visto en el capítulo anterior, pero también se pueden aplicar técnicas que surgen de la estadística. Estas técnicas para el análisis de datos moleculares tienen una fuerte raíz en métodos probabilísticos y entre ellas se destacan: Máxima Verosimilitud, Inferencia Bayesiana y métodos de distancia como el Neighbor-Joining. Una característica común entre estas metodologías es que comienzan trabajando con secuencias alineadas. Estos alineamientos, como se explicó en el capítulo 4, sirven para inferir que sitios o posiciones son primariamente homólogos entre los taxones analizados. Existen dos grandes aproximaciones: los alineamientos de a pares de secuencias y los alineamientos múltiples. Los alineamientos de a pares fueron los primeros en desarrollarse y permiten alinear de a dos secuencias por vez. Los algoritmos usados para este tipo de alineamiento son simples pero no se pueden utilizar si se pretende alinear muchas secuencias. En cambio, los alineamientos múltiples (MSA por sus siglas en inglés de multiple sequence analysis) permiten alinear más de dos secuencias al mismo tiempo, lo cual es ideal al momento de construir filogenias donde hay gran cantidad de taxones. Los MSA son los más usados en la actualidad y utilizan sus propios algoritmos para producir los alineamientos. Estos algoritmos fueron complejizándose con el tiempo siendo CLUSTAL el más usado durante la década de 1990 y MAFFT y MUSCLE a partir de la década de los 2000.