cap. 2 alineamiento

 

MATRIZ PAM

Las matrices PAM (Percent Accepted Mutation) fueron descritas por Daykoff et al. (1978) están basadas en el alineamiento global de secuencias de proteínas estrechamente relacionadas y asumen que una modificación en algún sitio depende solamante del aminoácido presente en ese sitio. La PAM1 por ejemplo es la matriz calculada a partir de comparaciones de secuencias con no más del 1% de diferencias.

Procedimiento para construir una matriz PAM:

  1. Alinear un conjunto de secuencias que tengan una identidad no inferior al 85%.
  2. Reconstruir un árbol filogenético de las secuencias alineadas con el fin de inferir ancestros.
  3. Calcular Aij: Aij representa el número de veces en las cuales el aminoácido j fue reemplazado por el aminoácido i en todas las comparaciones (las secuencias se comparan por pares y los cambios encontrados se presumen que se han presentado por selección natural).
  4. Calcular la mutabilidad del aminoácido j (mj): Es la propensión que dado un aminoácido j sea reemplazado por cualquier otro aminoácido.
  5. Combinar los resultados obtenidos de los numerales 3 y 4 para generar una matriz de probabilidad de mutación para un PAM de distancias evolutivas, la matriz se calcula con la siguiente formula:

    Algunas propiedades de una matriz de probabilidad de mutación:
    1. La probabilidad que un aminoácido sea sustituido es del orden del 1%.
    2. La suma de mj para toda j es igual a un (1).
    3. La matriz M1 establece una unidad de cambio evolutivo. (La PAM 1 acepta una mutación cada 100 aminoácidos).
    4. Aplicaciones sucesivas de una matriz M1 a una secuencia produce matrices M2, M3, ..., Mn.
    5. Los elementos de la matriz PAM 0 son 1 para Mii y 0 para Mij.

  6. Calcular la matriz "Log Odds" de similaridad: Se divide cada elemento de la Matriz de probabilidad de Mutación (M), entre la frecuencia de occurrencia de cada aminoácido:
    Rij = Mij/fi
    Donde:
    R es la matriz "Relatedness Odds".
    fi es la frecuencia del aminoácido i.
    La Matriz "Log Odds" (S) se calcula a partir de la matriz "Relatedness Odds" (R) de la siguiente forma:
    S ij = Log (Rij)

Como ejemplo de una matriz PAM se tiene la matriz PAM250.

MATRIZ PAM

AMINOÁCIDO ORIGINAL
A
R
N
D
C
Q
E
G
H
I
L
K
M
F
P
S
T
W
Y
V
A (Ala)
13
6
9
9
5
8
9
12
6
8
6
7
7
4
11
11
11
2
4
9
R (Arg)
3
17
4
3
2
5
3
2
6
3
2
9
4
1
4
4
3
7
2
2
N (Asn)
4
4
6
7
2
5
6
4
6
3
2
5
3
2
4
5
4
2
3
3
D (Asp)
5
4
8
11
1
7
10
5
6
3
2
5
3
1
4
5
5
1
2
3
C (Cys)
2
1
1
1
52
1
1
2
2
2
1
1
1
1
2
3
2
1
4
2
Q (Gln)
3
5
5
6
1
10
7
3
7
2
3
5
3
1
4
3
3
1
2
3
E (Glu)
5
4
7
11
1
9
12
5
6
3
2
5
3
1
4
5
5
1
2
3
G (Gly)
12
5
10
10
4
7
9
27
5
5
4
6
5
3
8
11
9
2
3
7
H (His)
2
5
5
4
2
7
4
2
15
2
2
3
2
2
3
3
2
2
3
2
I (Ile)
3
2
2
2
2
2
2
2
2
10
6
2
6
5
2
3
4
1
3
9
L (Leu)
6
4
4
3
2
6
4
3
5
15
34
4
20
13
5
4
6
6
7
13
K (Lys)
6
18
10
8
2
10
8
5
8
5
4
24
9
2
6
8
8
4
3
5
M (Met)
1
1
1
1
0
1
1
1
1
2
3
2
6
2
1
1
1
1
1
2
F (Phe)
2
1
2
1
1
1
1
1
3
5
6
1
4
32
1
2
2
4
20
3
P (Pro)
7
5
5
4
3
5
4
5
5
3
3
4
3
2
20
6
5
1
2
4
S (Ser)
9
6
8
7
7
6
7
9
6
5
4
7
5
3
9
10
9
4
4
6
T (Thr)
8
5
6
6
4
5
5
6
4
6
4
6
5
3
6
8
11
2
3
6
W (Trp)
0
2
0
0
0
0
0
0
1
0
1
0
0
1
0
1
0
55
1
0
Y (Tyr)
1
1
2
1
3
1
1
1
3
2
2
1
2
15
1
2
2
3
31
2
V (Val)
7
4
4
4
4
4
4
4
5
4
15
10
4
10
5
5
5
72
4
17

250 [1]


Referencias:

  1. Atlas of Protein Sequence and Structure, Suppl 3, 1978, M.O. Dayhoff, ed. National Biomedical Research Foundation, 1979

 



Universidad Nacional de Colombia
Carrera 30 No 45-03 - Edificio 477
Bogotá D.C. - Colombia
PBX: 3165000
webmaster@unal.edu.co

Aviso Legal - Copyright
Gobierno en LíneaAgencia de Noticias UN