El algoritmo de Smith and Waterman (1981) encuentra el segmento mejor alineado entre un par de secuencias.
Descripción:
Dadas dos secuencias A y B.
A=a1a2...an y B=b1b2...bm
Se define:
Características:
Procedimiento:

Figura 1. Cálculo del valor de Hij
Hij = max { Hi-1,j-1 + S(ai,bj) , maxk>1 {Hi-k,j - Wk}, maxl>1 {Hi,j-l - Wl } , 0 }
con 1<i<n y 1<j<m y Wk = A + B*k Wl = A + B* l.
El segmento mejor alineado se obtiene de la matriz H ubicando en esta matriz la posición con el valor más alto y por medio de un procedimiento traceback se recuperan los residuos que conforman el segmento, el traceback se detiene cuando encuentra un cero en la diagonal de la matriz. Este procedimiento se puede aplicar de nuevo a la matriz con el fin de recuperar un nuevo segmento alineado.
Por ejemplo, si se tienen las siguientes secuencias:
Secuencia A: CAGCCUCGCUUAG, m= 13Parámetros:
|
.
| j |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
| i
| . |
C |
A |
G |
C |
C |
U |
C |
G |
C |
U |
U |
A |
G |
| 1
| A |
0.0 |
1.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
1.0 |
0.0 |
| 2
| A |
0.0 |
1.0 |
0.7 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
0.0 |
1.0 |
0.7 |
| 3
| U |
0.0 |
0.0 |
0.7 |
0.3 |
0.0 |
1.0 |
0.0 |
0.0 |
0.0 |
1.0 |
1.0 |
0.0 |
0.7 |
| 4
| G |
0.0 |
0.0 |
1.0 |
0.3 |
0.0 |
0.0 |
0.7 |
1.0 |
0.0 |
0.0 |
0.7 |
0.7 |
1.0 |
| 5
| C |
1.0 |
0.0 |
0.0 |
2.0 |
1.3 |
0.3 |
1.0 |
0.3 |
2.0 |
0.7 |
0.3 |
0.3 |
0.3 |
| 6
| C |
1.0 |
0.7 |
0.0 |
1.0 |
3.0 |
1.7 |
1.3 |
1.0 |
1.3 |
1.7 |
0.3 |
0.0 |
0.0 |
| 7
| A |
0.0 |
2.0 |
0.7 |
0.3 |
1.7 |
2.7 |
1.3 |
1.0 |
0.7 |
1.0 |
1.3 |
1.3 |
0.0 |
| 8
| U |
0.0 |
0.7 |
1.7 |
0.3 |
1.3 |
2.7 |
2.3 |
1.0 |
0.7 |
1.7 |
2.0 |
1.0 |
1.0 |
| 9
| U |
0.0 |
0.3 |
0.3 |
1.3 |
1.0 |
2.3 |
2.3 |
2.0 |
0.7 |
1.7 |
2.7 |
1.7 |
1.0 |
| 10
| G |
0.0 |
0.0 |
1.3 |
0.0 |
1.0 |
1.0 |
2.0 |
3.3 |
2.0 |
1.7 |
1.3 |
2.3 |
2.7 |
| 11
| A |
0.0 |
1.0 |
0.0 |
1.0 |
0.3 |
0.7 |
0.7 |
2.0 |
3.0 |
1.7 |
1.3 |
2.3 |
2.0 |
| 12
| C |
1.0 |
0.0 |
0.7 |
1.0 |
2.0 |
0.7 |
1.7 |
1.7 |
3.0 |
2.7 |
1.3 |
1.0 |
2.0 |
| 13
| G |
0.0 |
0.7 |
1.0 |
0.3 |
0.7 |
1.7 |
0.3 |
2.7 |
1.7 |
2.7 |
2.3 |
1.0 |
2.0 |
| 14
| G |
0.0 |
0.0 |
1.7 |
0.7 |
0.3 |
0.3 |
1.3 |
1.3 |
2.3 |
1.3 |
2.3 |
2.0 |
2.0 |
Tabla 1. Matriz H.
El máximo score de la matriz H (Tabla 1) es 3.3 y se encuentra en la posición (10,8); a partir de este sitio se empieza a recorrer la matriz hacia atrás (camino en rojo) hasta se encuentra un cero en la diagonal (posición (3,2)).
El segmento alineado es:
| GCCAUUG |
| GCC_UCG |
Este algoritmo fue modificado mas tarde por Waterman y Eggert en 1987. La modificación fue la siguiente:
Hij = max { Hi-1,j-1 + S(ai,bj) , Eij , Fij , 0 }
Eij = max {Hi,j-l - (u+v), Ei,j-l - v }
Fij = max {H i-l,j - (u+v), Fi-l,j - v }
Donde l es el tamaño posible del indels.
REFERENCIAS: