LOS MÉTODOS WPGMA Y UPGMA
WPGMA
WEIGHTED PAIR GROUP METHOD USING ARITHMETIC AVERAGE
Este es el método más sencillo de reconstrucción de árboles, originalmente fue diseñado para la construcción de fenogramas (diagramas que reflejan las similitudes fenotipicas entre los OTU's), pero también se puede utilizar para la construcción de árboles filogenéticos si la tasa de evolución entre los OTU's es aproximadamente constante.
UPGMA asume:
UPGMA utiliza un algoritmo de agrupamiento (clustering) partiendo del par de OTU's que más de parecen.
PROCEDIMIENTO:
| A |
B |
C |
|
| B |
dAB | ||
| C |
dAC | dBC | |
| D |
dAD | dBD | dCD |
|
|
Modificamos la tabla 1 con los nuevos OTU's:
| AB |
C |
|
| C |
d(AB)C | |
| D |
d(AB)D | dCD |
|
|
||||
|
|
|
Ejemplo:
Se tiene 5 OTU's.
| 1. AGTAGTTC |
| 2. AGTAGTTA |
| 3. AGTAGTAA |
| 4. AGTAGGGG |
| 5. AGTAGGGC |
La matriz de sustituciones es:
| |
1 |
2 |
3 |
4 |
| 2 |
1 |
. |
. |
. |
| 3 |
2 |
1 |
. |
. |
| 4 |
3 |
3 |
3 |
. |
| 5 |
2 |
3 |
3 |
1 |
Tabla 4.
Escogemos cualquiera de los pares 12, 23 ó 45. Para el ejemplo se ha seleccionado el par 23. Ver figura 4.
d(23) = 1/2
|
|
Construimos la nueva matriz.
d(23,1) = (d12 + d13) = ( 1 +
2 ) /2 = 3/2
d(23,4) = (d42 + d43) = ( 3 + 3)
/2 = 3
d(23,5) = (d52 + d53) = ( 3 + 3)
/2 = 3
| |
1 |
2,3 |
4 |
| 2,3 |
3/2 |
. |
. |
| 4 |
3 |
3 |
. |
| 5 |
2 |
3 |
1 |
Tabla 5.
Nuevamente buscamos los OTU's con el menor número de cambios, los agrupamos y actualizamos la tabla de sustituciones. Estos pasos se ilustran en la figura 5 y en la tabla 6 respectivamente.
|
|
d(45,1) = (d14 + d15) = ( 3 +
2) /2 = 5/2
d(45,23) = (d23,4 + d23,5) = (
3 + 3) /2 = 3
| |
1 |
2,3 |
| 2,3 |
3/2 |
. |
| 4,5 |
5/2 |
3 |
Tabla 6.
Por último, agrupamos los OTU's 1 y 2,3. En la figura 6 se ilustra el cluster y la tabla 7 muestra los nuevos OTU's.
|
|
d(123,45) = (d45,1 + d45,23) = ( (5/2)+ 3) /2 = 11/4
| |
1,23 |
| 4,5 |
11/4 |
Tabla 7.
Por último unimos el árbol de la figura 6 con el árbol de la figura 5.
|
Figura 7. |
Si no deseamos trabajar con el simple promedio de las distancias (WPGMA), entonces podemos aplicar una variante denominada UPGMA.
La distancia entre un par de OTU's se calcula así:
donde:
d(ku) = (Ti*d(ki)) + Tj*d(kj))/(Ti + Tj)
Ejemplo.
Vamos a suponer que estamos reconstruyendo un árbol y que en un momento dado nos encontramos con los datos de las tablas 8, 9 y 10.
| |
1 |
2 |
3 |
4 |
| 2 |
1 |
. |
. |
. |
| 3 |
5 |
6 |
. |
. |
| 4 |
5 |
6 |
1 |
. |
| 5 |
6 |
6 |
1 |
2 |
Tabla 8.
| |
12 |
3 |
4 |
| 3 |
11/2 |
. |
. |
| 4 |
11/2 |
1 |
. |
| 5 |
6 |
1 |
2 |
Tabla 9.
| |
12 |
34 |
| 34 |
11/2 |
. |
| 5 |
6 |
3/2 |
Tabla 10.
En la tabla 10 agrupamos el OTU 34 con el 5 por tener la menor distancia.
La distancia entre 34 y 5 es:
d(34,5) = (3/2)/2= 3/4
Actualizando nuestra tabla de sustituciones tenemos:
Aplicando WPGMA tenemos:
d(345,12) = (d12,34 + d12,5) = ( 11/2 + 6) /2 = 23/4
Con UPGMA se calcula así:
Cluster i, con dos OTU's (Ti = 2)
d(12,34) = (d(12,3) + d(12,4)) =
( 11/2 + 11/2 )/2 = 11/2
Cluster j, con un OTU (Tj = 1)
d(12,5) = (d(1,5) + d(2,5)) = ( 6 + 6 )/2 = 6
= [(2*(11/2))+(1*(6))]/(2+1)
= [ 11 + 6 ] / 3
= 17/3
REFERENCIAS:
MOLECULAR EVOLUTION, Wen-Hsiung Li 1997, Sinauer Associates, Inc., Publishers.