cap. 2 alineamiento

 

ALINEAMIENTO GLOBAL DE UN PAR DE SECUENCIAS POR MEDIO DEL ALGORITMO DE NEEDLEMAN & WUNSCH

Este algoritmo encuentra el alineamiento global de dos secuencias via Programación Dinámica.

Procedimiento:

Dadas dos secuencias A y B. 

A=a1a2...an y B=b1b2...b

Se define:

  1. Inicialización: Se inicializa con ceros la primera fila y la primera columna del ma matriz H.
  2. Llenado de Matriz (scoring): La posición Hij es la máxima similitud de dos segmentos que terminan en ai y bj respectivamente.  El valor de Hij depende únicamente del los valores H(i-1,j-1) , H(i-1, j) y H(i, j-1) como se ilustra en la figura 1.


    Figura 1. Cálculo del valor en la posición Hij.

     
  3. Recuperación de la solución (Backtracking): Consiste en tomar la última coincidencia del alineamiento y comenzar a buscar el camino que maximice la función. El retroceso comienza en la posición i+1,j+1 de la matriz, es en ésta posición donde se presenta el máximo puntaje del alineamiento.
    El algoritmo recorre los vecinos de la celda actual para identificar sus predecesores, es decir observa el vecino a la izquierda , el vecino en la diagonal y el vecino de arriba, y se selecciona el vecino que presente el valor más alto. Es de notar que en el caso que se presente un empate en posible obtener diferentes alineamientos para las mismas secuencias.

Ejemplo:

Alinear las siguientes secuencias:
A = GAATTCAGTTA
B = GGATCGA

Parámetros:
Coincidencias = 1
No coincidencias = 0
Huecos = 0

  1. Inicialización:(Tabla 1)

  2. 1
    2
    3
    4
    5
    6
    7
    G
    G
    A
    T
    C
    G
    A
    0
    0
    0
    0
    0
    0
    0
    0
    1
    G
    0
                 
    2
    A
    0
     
     
     
     
     
     
     
    3
    A
    0
     
     
     
     
     
     
     
    4
    T
    0
     
     
     
     
     
     
     
    5
    T
    0
     
     
     
     
     
     
     
    6
    C
    0
     
     
     
     
     
     
     
    7
    A
    0
     
     
     
     
     
     
     
    8
    G
    0
     
     
     
     
     
     
     
    9
    T
    0
     
     
     
     
     
     
     
    10
    T
    0
     
     
     
     
     
     
     
    11
    A
    0
     
     
     
     
     
     
     

    Tabla 1. Inicialización.

  3. Llenado de la Matriz: (Tabla 2)

  4. 1
    2
    3
    4
    5
    6
    7
    G
    G
    A
    T
    C
    G
    A
    0
    0
    0
    0
    0
    0
    0
    0
    1
    G
    0
    1
    1
    1
    1
    1
    1
    1
    2
    A
    0
    1
    1
    2
    2
    2
    2
    2
    3
    A
    0
    1
    1
    2
    2
    2
    2
    3
    4
    T
    0
    1
    1
    2
    3
    3
    3
    3
    5
    T
    0
    1
    1
    2
    3
    3
    3
    3
    6
    C
    0
    1
    1
    2
    3
    4
    4
    4
    7
    A
    0
    1
    1
    2
    3
    4
    4
    5
    8
    G
    0
    1
    2
    2
    3
    4
    5
    5
    9
    T
    0
    1
    2
    2
    3
    4
    5
    5
    10
    T
    0
    1
    2
    2
    3
    4
    5
    5
    11
    A
    0
    1
    2
    3
    3
    4
    5
    6

    Tabla 2. Llenado de la matriz.

  5. Recuperación de la solución (Backtracking):
  6. (Tabla 3)
    1
    2
    3
    4
    5
    6
    7
    G
    G
    A
    T
    C
    G
    A
    0
    0
    0
    0
    0
    0
    0
    0
    1
    G
    0
    1
    1
    1
    1
    1
    1
    1
    2
    A
    0
    1
    1
    2
    2
    2
    2
    2
    3
    A
    0
    1
    1
    2
    2
    2
    2
    3
    4
    T
    0
    1
    1
    2
    3
    3
    3
    3
    5
    T
    0
    1
    1
    2
    3
    3
    3
    3
    6
    C
    0
    1
    1
    2
    3
    4
    4
    4
    7
    A
    0
    1
    1
    2
    3
    4
    4
    5
    8
    G
    0
    1
    2
    2
    3
    4
    5
    5
    9
    T
    0
    1
    2
    2
    3
    4
    5
    5
    10
    T
    0
    1
    2
    2
    3
    4
    5
    5
    11
    A
    0
    1
    2
    3
    3
    4
    5
    6

    Tabla 3. Recuperación de la solución.

    Alineamiento:
    [x=11,y=7], [x=10,y=6], [x=9,y=6], [x=8,y=6], [x=7,y=5], [x=6,y=5], [x=5,y=4], [x=4,y=4], [x=3,y=3], [x=2,y=3], [x=1,y=2], [x=1,y=1], [x=0,y=0]

    G¬AATTCAGTTA
    GGA¬T¬C¬G¬¬A

     

Referencias:

  1. The Needleman-Wunsch algorithm (J. Mol. Biol. 48, 443-453 [1970])

 



Universidad Nacional de Colombia
Carrera 30 No 45-03 - Edificio 477
Bogotá D.C. - Colombia
PBX: 3165000
webmaster@unal.edu.co

Aviso Legal - Copyright
Gobierno en LíneaAgencia de Noticias UN