2. DEFINICIÓN
DE MODELOS OCULTOS DE MARKOV
Un modelo oculto de Markov es una cadena de q
junto con un proceso estocástico que toma valores en un alfabeto
S y el cual depende de q. Estos sistemas evolucionan en el tiempo pasando aleatoriamente de estado
a estado y emitiendo en cada momento al azar algún símbolo del alfabeto
S. Cuando se encuentra en el estado qt-1 = i, tiene la probabilidad
aij de moverse
al estado qt = j en el siguiente instante
y la probabilidad bj(k) de emitir el símbolo ot = vk en
el tiempo t.
Sólamente los símbolos emitidos por el proceso q son observables, pero no la ruta o secuencia
de estados q, de ahí el
calificativo de "oculto" de Markov, ya que el proceso
de Markov q es no observado.
El siguiente
ejemplo ilustra un proceso q
independiente del tiempo. Supóngase que en un salón se encuentra
un número N muy grande de urnas de vidrio. Dentro de cada
urna se tiene una cantidad M de bolas de colores. Un mago está
en el salón y de acuerdo con algún procedimiento aleatorio elige
una urna inicial. De ésta saca al azar una bola y
registra su color como una observación. La bola es retornada
a la urna de la cual fué seleccionada. A continuación selecciona
una nueva urna de acuerdo con un procedimiento aleatorio que depende
de la urna actual y la elección de alguna bola es repetida. Este
proceso completo se realiza en un tiempo T y genera una secuencia de observación finita de colores O
de longitud T, la cual puede modelarse como la salida observable de un HMM.
Se asume que las urnas son seleccionadas independientemente.
Figura.
1.1 Modelo de urnas y bolas
de N
estados que ilustra el caso general de un HMM con símbolos discretos.
Los siguientes son ejemplos de posibles secuencias de observación del
modelo de las urnas y las bolas:O1 = (amarillo, verde, azul, verde, rojo, amarillo, naranja,
rojo, verde, azul, amarillo),O2 = (amarillo, rojo, verde, rojo, azul, naranja, verde,
rojo, azul, amarillo, rojo, verde),O3 = (rojo, azul, amarillo, rojo, azul, vede, rojo, amarillo,
naranja, naranja, verde, rojo),O4 = (rojo, verde, naranja, rojo, rojo, azul, verde,
amarillo, azul, rojo, verde, rojo).
El alfabeto es: S = íverde, azul, rojo, amarillo, naranjaý
Los estados ocultos son: Q = {1,2,...,N}
Las
probabilidades de obtener un color en cada urna son:
| urna
1 |
urna
2 |
.
. . |
urna
N |
| P(rojo) = b1(1) |
P(rojo) = b2(1) |
.
. . |
P(rojo) = bN(1) |
|
P(azul) = b1(2) |
P(azul) = b2(2) |
.
. . |
P(azul) = bN(2) |
|
P(verde) = b1(3) |
P(verde) = b2(3) |
.
. . |
P(verde) = bN(3) |
|
P(amarillo)
= b1(4) |
P(amarillo)
= b2(4) |
.
. . |
P(amarillo)
= bN(4) |
|
.
. . |
.
. . |
.
. . |
.
. . |
|
P(naranja)
= b1(M) |
P(naranja) = b2(M) |
.
. . |
P(naranja) = bN(M) |
Las probabilidades de pasar de una urna a otra son:
| P(1,1)
= a11 |
P(2,1)
= a21 |
P(3,1)
= a31 |
.
. . |
P(N,1)
= aN1 |
|
P(1,2)
= a12 |
P(2,2)
= a22 |
P(3,2)
= a32 |
.
. . |
P(N,2)
= aN2 |
|
.
. . |
.
. . |
.
. . |
.
. . |
.
. . |
|
P(1,N)
= a1N |
P(2,N)
= a2N |
P(3,N)
= a3N |
.
. . |
P(N,N)
= aNN |
El primer problema consiste en decidir cual proceso es representado por
los estados y después decidir cuantos estados pueden estar en el
modelo.
Como se ilustró antes, el HMM más
simple que corresponda al comportamiento de este proceso es aquel
en el cual cada estado representa una urna específica y cada color
representa un posible símbolo de observación. Por cada estado se
define una probabilidad de extraer una bola (color) y una probabilidad
de pasar a la siguiente urna.
Los colores de las bolas dentro de cada urna pueden o no
ser los mismos y pueden existir números diferentes de bolas de cada
color en cada urna. Por lo tanto, una observación aislada de un
color en particular no dice inmediatamente de cuál urna procede.
Figura
1.2 Arquitectura del grafo del modelo de urnas y bolas
|