# 4.4 Modelos de Markov Ocultos

> __Idea general:__

+ Generalizan las cadenas de Markov.


+ Suponemos que existe una cadena de Markov en el modelo pero sus __estados no son observables__ (son ocultos).


+ Las transiciones ocurren __entre estados__ y las __observaciones dependen del estado__.


:::{figure-md} markdown-fig.4.04.1
<img src="./images/markov_hmm-cadena.png" width="600px">

HMM
:::

## Ejemplos

### Sacar bolas de urnas

En un cuarto que no es visible para el observador hay un genio. En el cuarto están las urnas $X_1,X_2,X_3$ cada una de las cuales contiene una mezcla de bolas de colores _conocida_, y las bolas están numeradas $s_1,\ldots,s_4$,

El genio elige una urna y saca una bola aleatoriamente de ella. Después muestra la bola al observador, que solamente podrá ver la sucesión de bolas que han sido extraídas.

El genio escoge las bolas con el siguiente procedimiento: la elección de la urna en el paso $n$ depende únicamente de la urna que escogió en el paso $n-1$ (proceso de Markov), mientras que la elección de la bola en la urna depende de un número aleatorio.

No podemos observar el proceso de Markov, solamente la sucesión de bolas extraídas.

### Adivinar el tiempo

Una persona realiza una de tres actividades (dar un paseo, ir de compras o limpiar la casa) en función del tiempo que hace ese día (soleado, lluvioso). Esa persona apunta sus actividades en un diario.

Un investigador, en el futuro, lee el diario de la persona anterior y quiere adivinar el tiempo que hacía cada día.

El tiempo varía según una cadena de Markov, mientras que la elección de la actividad depende de un número aleatorio que varía según el tiempo que hace.

:::{figure-md} markdown-fig.4.04.2
<img src="./images/markov_hmm_ejemploTiempo.png" width="400px">

HMM
:::


### Estado emocional oculto

Un profesor se despierta cada día en uno de tres estados ($x_1=$contento, $x_2=$triste, $x_3=$enfadado). El estado de un día depende únicamente del estado del día anterior. En profesor se pone siempre un jersey de color o verde ($s_1$), o azul ($s_2$) o marrón ($s_3$). La elección del color depende de un número aleatorio que depende del estado en el que se encuentra esa mañana.

Los alumnos conocen la sucesión de estados y colores que ha tenido el profesor a lo largo de lo que llevan de curso. La pregunta que se hacen los alumnos es, dado el color de jersey que lleva el profesor hoy, ¿cuál es su estado emocional?

## Aplicación a la estructura secundaria de proteínas

+ Tres estructuras (__estados__): $\{H, E , C \}$ (hélice, hoja, resto).


+ Las transiciones entre estados conforman la estructura secundaria.


+ En cada paso se emiten __sı́mbolos__ (aminoácidos) que dan lugar a la __secuencia observada__.


## Definiciones HMM

+ Denotaremos como $X_t$ a los estados ($X_t\in\mathcal{X}=\{x_1, x_2, \ldots , x_r \}$) y $S_t$ a
las observaciones ($S_t\in \mathcal{S}=\{s_1, s_2, \ldots , s_m\}$) en la iteración $t$.


+ Al igual que en cadenas de Markov, necesitamos un vector de probabilidad inicial $\pi_0$ y una matriz de transiciones $P$, de dimensión $r \times r$ , que da las probabilidades condicionadas

$$
p_{ij} = \mathbb{P}\{X_t = x_j|X_{t−1} = x_i\}.
$$


+ Hay que definir las __probabilidades de emisión__, es decir, la probabilidad condicionada de que el estado $x_i$ emita el sı́mbolo $s_j$:

$$
e_{ij} = \mathbb{P}\{S_t = s_j|X_t = x_i\}.
$$


+ La matriz de emisión es $E = (e_{ij} )$, donde las __filas__ se refieren a los __estados__ y las __columnas__ a los __sı́mbolos__ emitidos (dimensión $r \times m$). 


+ También es __estocástica__.

### Ejemplo HMM
$$
\pi^{(0)}=\left(\stackrel{H}{0.6},\quad 
\stackrel{C}{0.4}
\right),\quad
P=
\begin{matrix}
H \\C
\end{matrix}
\stackrel{H\quad C}{%
    \begin{bmatrix}
    0.6 & 0.4 \\
    0.3 & 0.7 
    \end{bmatrix}%
  },\quad
E=
\begin{matrix}
H \\C
\end{matrix}
\stackrel{G\quad W\quad M}{%
    \begin{bmatrix}
    0.6 & 0.3 & 0.1 \\
    0.2 & 0.4 & 0.4 
    \end{bmatrix}%
  }
$$


:::{figure-md} markdown-fig.4.04.3
<img src="./images/hmm-esquema.png" width="600px">

Esquema de HMM
:::

## Análisis de un HMM

En un modelo de Markov oculto conocemos las secuencias de sı́mbolos $\{s_1 , s_2 , \ldots , s_n \}$ pero las
secuencias de estados son __desconocidas__ en principio.

> Tres preguntas básicas:

+ __Aprendizaje__: dada una lista de secuencias de sı́mbolos, ¿podemos __aprender__ los parámetros $(\pi^{(0)} , P, E )$ de un HMM? __Algoritmo de Baum-Welch__.


+ __Evaluación__: una vez que el modelo está ajustado, ¿cuál es la verosimilitud de una secuencia dada? __Algoritmo “forward”__.


+ __Descodificación__: una vez que el modelo está ajustado, ¿cuál es el la secuencia de estados __más probable__ para generar de una secuencia de sı́mbolos dada? __Algoritmo de Viterbi__.
