9.5: Cadenas Ocultas de Markov
- Page ID
- 54568
Un juguete Hidden Markov Model es un enfoque generativo para modelar este comportamiento. Cada emisión del HMM es una base/letra de ADN. Los estados ocultos del modelo son intergénicos, exón, intrón. Mejorar este modelo implicaría incluir los estados ocultos DonOrg y Donort. Los estados DonOrg y Donort utilizan la información de que los exones son delineados por GT al final de la secuencia antes del inicio de un intrón. (Ver Figura 9.4 para la inclusión de DonOrg y DonORT en el modelo)
La e en cada estado representa probabilidades de emisión y las flechas indican las probabilidades de transición.
Aparte de los supuestos iniciales, evidencia adicional como la conservación evolutiva y los datos de ARNm experi- mental pueden ayudar a crear un HMM para modelar mejor el comportamiento. (Ver Figura 9.5)
Combinando todas las líneas de evidencia discutidas anteriormente, podemos crear un HMM con emisiones compuestas en que cada valor emitido es una “tupla” de valores recolectados. (Ver Figura 9.6)
Algunos supuestos de este modelo compuesto son que cada nueva “característica” de emisión es independiente del resto. Sin embargo, esto crea el problema de que con cada nueva característica, la tupla aumenta de longitud, y el número de estados del HMM aumenta exponencialmente, lo que lleva a una explosión combinatoria, lo que significa un pobre escalado. (En la Figura 9.7 se pueden encontrar ejemplos de HMM más complejos que pueden dar como resultado una mala escala)