cap. 2 alineamiento

 

MATRICES DE SUSTITUCIÓN

Características:

  1. Una matriz de sustitución se elabora bajo una teoría de evolución.
  2. El resultado de la comparación de dos o más secuencias depende fuertemente de la matriz de sustitución que se haya seleccionado.
  3. Las matrices de sustitución son utilizadas en los análisis comparativos de secuencias.
  4. Los algoritmos de alineamiento (comparación ) funcionan igual con una matriz de distancias o con una matriz de sustitución (aunque se pueden obtener diferentes resultados).
  5. Una matriz de distancias es muy útil en la reconstrucción de un árbol filogenético, mientras que una matriz de sustitución es utilizada para realizar busqueda en bases de datos.

MATRICES DE SUSTITUCIÓN PARA ÁCIDOS NUCLEICOS:

  1. Matriz Identidad de similaridad:
  2. A
    C
    G
    T
    A
    1
    0
    0
    0
    C
    0
    1
    0
    0
    G
    0
    0
    1
    0
    T
    0
    0
    0
    1

  3. Matriz BLAST de similaridad
  4. A
    C
    G
    T
    A
    5
    -4
    -4
    -4
    C
    -4
    5
    -4
    0
    G
    -4
    -4
    5
    -4
    T
    -4
    -4
    -4
    5

  5. Matriz de transiciones/transversiones
  6. A
    C
    G
    T
    A
    0
    5
    5
    1
    C
    5
    0
    1
    5
    G
    5
    1
    0
    5
    T
    1
    5
    5
    0

MATRICES DE SUSTITUCIÓN PARA PROTEÍNAS:

  1. Matriz identidad: Cuando se presenta una coincidencia en un aminoácido en las secuencias de proteínas analizadas se le asigna un peso de 10 y a las no coincidencias se les da un peso de 0.
  2. C
    10
    S
    0
    10
    T
    0
    0
    10
    P
    0
    0
    0
    10
    A
    0
    0
    0
    0
    10
    G
    0
    0
    0
    0
    0
    10
    N
    0
    0
    0
    0
    0
    0
    10
    D
    0
    0
    0
    0
    0
    0
    0
    10
    E
    0
    0
    0
    0
    0
    0
    0
    0
    10
    Q
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    H
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    R
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    K
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    M
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    I
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    L
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    V
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    F
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    Y
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    W
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10
    C
    S
    T
    P
    A
    G
    N
    D
    E
    Q
    H
    R
    K
    M
    I
    L
    V
    F
    Y
    W

  3. Matriz de sustitución con base en el código genético: Ésta matriz se obtiene calculando el número mínimo de sustituciones necesarias para convertir el aminoácido de la i-ésima fila en el aminoácido de j-ésima columna. Es de notar que el único cambio que requiere una sustitución en cada una de las posiciones del codón es de Metionina a Triptófano.
  4.  
    A
    S
    G
    L
    K
    V
    T
    P
    E
    D
    N
    I
    Q
    R
    F
    Y
    C
    H
    M
    W
    Z
    B
    X
    A (Ala)
    0
    1
    1
    2
    2
    1
    1
    1
    1
    1
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    S (ser)
    1
    0
    1
    1
    2
    2
    1
    1
    2
    2
    1
    1
    2
    1
    1
    1
    1
    2
    2
    1
    2
    2
    2
    G (Gly)
    1
    1
    0
    2
    2
    1
    2
    2
    1
    1
    2
    2
    2
    1
    2
    2
    1
    2
    2
    1
    2
    2
    2
    L (Leu)
    2
    1
    2
    0
    2
    1
    2
    1
    2
    2
    2
    1
    1
    1
    1
    2
    2
    1
    1
    1
    2
    2
    2
    k (Lys)
    2
    2
    2
    2
    0
    2
    1
    2
    1
    2
    1
    1
    1
    1
    2
    2
    2
    2
    1
    2
    1
    2
    2
    V (Val)
    1
    2
    1
    1
    2
    0
    2
    2
    1
    1
    2
    1
    2
    2
    1
    2
    2
    2
    1
    2
    2
    2
    2
    T (Thr)
    1
    1
    2
    2
    1
    2
    0
    1
    2
    2
    1
    1
    2
    1
    2
    2
    2
    2
    1
    2
    2
    2
    2
    P (Pro)
    1
    1
    2
    1
    2
    2
    1
    0
    2
    2
    2
    2
    1
    1
    2
    2
    2
    1
    2
    2
    2
    2
    2
    E (Glu)
    1
    2
    1
    2
    1
    1
    2
    2
    0
    1
    2
    2
    1
    2
    2
    2
    2
    2
    2
    2
    1
    2
    2
    D (Asp)
    1
    2
    1
    2
    2
    1
    2
    2
    1
    0
    1
    2
    2
    2
    2
    1
    2
    1
    2
    2
    2
    1
    2
    N (Asn)
    2
    1
    2
    2
    1
    2
    1
    2
    2
    1
    0
    1
    2
    2
    2
    1
    2
    1
    2
    2
    2
    1
    2
    I (Ile)
    2
    1
    2
    1
    1
    1
    1
    2
    2
    2
    1
    0
    2
    1
    1
    2
    2
    2
    1
    2
    2
    2
    2
    Q (Gln)
    2
    2
    2
    1
    1
    2
    2
    1
    1
    2
    2
    2
    0
    1
    2
    2
    2
    1
    2
    2
    1
    2
    1
    R (Arg)
    2
    1
    1
    1
    1
    2
    1
    1
    2
    2
    2
    1
    1
    0
    2
    2
    1
    1
    1
    1
    2
    2
    2
    F (Phe)
    2
    1
    2
    1
    2
    1
    2
    2
    2
    2
    2
    1
    2
    2
    0
    1
    1
    2
    2
    2
    2
    2
    2
    Y (Try)
    2
    1
    2
    2
    2
    2
    2
    2
    2
    1
    1
    2
    2
    2
    1
    0
    1
    1
    3
    2
    2
    1
    2
    C (Cys)
    2
    1
    1
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    1
    1
    1
    0
    2
    2
    1
    2
    2
    2
    H (His)
    2
    2
    2
    1
    2
    2
    2
    1
    2
    1
    1
    2
    1
    1
    2
    1
    2
    0
    2
    2
    2
    1
    2
    M (Met)
    2
    2
    2
    1
    1
    1
    1
    2
    2
    2
    2
    1
    2
    1
    2
    3
    2
    2
    0
    2
    2
    2
    2
    W (Trp)
    2
    1
    1
    1
    2
    2
    2
    2
    2
    2
    2
    2
    2
    1
    2
    2
    1
    2
    2
    0
    2
    2
    2
    Z (Glx)
    2
    2
    2
    2
    1
    2
    2
    2
    1
    2
    2
    2
    1
    2
    2
    2
    2
    2
    2
    2
    1
    2
    2
    B (Asx)
    2
    2
    2
    2
    2
    2
    2
    2
    2
    1
    1
    2
    2
    2
    2
    1
    2
    1
    2
    2
    2
    1
    2
    X (???)
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2
    2

  5. Matrices "log odds":
    Sij = log (qij / (pi * pj)).
    Donde:
    S es la proporción "log odds" de dos probabilidades:
    1. La probabilidad que los aminoácidos i y j esten alineados por descendencia.
    2. La probabilidad que los aminoácidos i y j esten alineados por casualidad.
    qij es la frecuencia observada en secuencias conocidas en las que se alinearon los aminoácidos i y j.
    pi y pj son la frecuencias observadas de los aminoácidos i y j en el conjunto de secuencias.
    Como ejemplo de estas matrices se tiene la PAM y la BLOSUM.

 



Universidad Nacional de Colombia
Carrera 30 No 45-03 - Edificio 477
Bogotá D.C. - Colombia
PBX: 3165000
webmaster@unal.edu.co

Aviso Legal - Copyright
Gobierno en LíneaAgencia de Noticias UN