8.2: Ajuste de modelos Mk a datos comparativos
- Page ID
- 54270
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Las ecuaciones del Capítulo 7 nos dan suficiente información para calcular la probabilidad de datos comparativos en un árbol. Para entender cómo se hace esto, primero podemos considerar el caso más simple, donde conocemos el estado inicial de un carácter, la longitud de la rama y el estado final. Luego podemos aplicar el método a través de un árbol entero usando un algoritmo de poda, que permitirá calcular la probabilidad de los datos dado el modelo y el árbol filogenético.
Imagine que un carácter de dos estados cambia de un estado de 0 a un estado de 1 en algún momento a lo largo de un intervalo de tiempo de t = 3. ¿Cuál es la probabilidad de estos datos bajo el modelo Mk? Como hicimos en la ecuación 7.17, podemos establecer un parámetro de tasa q = 0.5 para calcular una matriz de probabilidad:
\[ \mathbf{P}(t) = e^{\mathbf{Q} t} = exp( \begin{bmatrix} -0.5 & 0.5 \\ 0.5 & -0.5 \\ \end{bmatrix} \cdot 3) = \begin{bmatrix} 0.525 & 0.475 \\ 0.475 & 0.525 \\ \end{bmatrix} \label{8.1}\]
Para este sencillo ejemplo, empezamos con el estado 0, así que miramos la primera fila. A lo largo de esta rama, terminamos en el estado 1, por lo que debemos mirar específicamente a p 12 (t): la probabilidad de comenzar con el estado 0 y terminar con el estado 1 a lo largo del tiempo t. Este valor es la probabilidad de obtener los datos dado el modelo (es decir, la verosimilitud): L = 0.475.
Esta probabilidad se aplica al proceso evolutivo a lo largo de esta sola rama.
Cuando tenemos datos comparativos la situación es más compleja. Si conociéramos los estados de carácter ancestral y estados en cada nodo del árbol, entonces el cálculo de la probabilidad general sería sencillo —podríamos simplemente aplicar el enfoque anterior muchas veces, una vez por cada rama del árbol. Sin embargo, hay dos problemas. Primero, desconocemos el estado inicial del personaje en la raíz del árbol, y debemos tratarlo como un desconocido. Segundo, estamos modelando un proceso que está ocurriendo independientemente en muchas ramas de un árbol filogenético, y solo observamos los estados al final de estas ramas. Se desconocen todos los estados de carácter en los nodos internos del árbol. La probabilidad que queremos calcular tiene que ser sumada a través de todas estas posibilidades de estado de carácter desconocido en las ramas internas del árbol.
Agradecidamente, Felsenstein (1973) proporciona un algoritmo elegante para calcular las probabilidades de caracteres discretos en un árbol. Este algoritmo, llamado algoritmo de poda de Felsenstein, se describe con un ejemplo en el apéndice de este capítulo. El algoritmo de poda de Felsenstein fue importante en la historia de la filogenética porque permitió a los científicos calcular de manera eficiente las probabilidades de datos comparativos dados un árbol y un modelo. Luego se puede maximizar esa probabilidad cambiando los parámetros del modelo (y quizás también la topología y las longitudes de las ramas del árbol; ver Felsenstein 2004).
La poda también da una idea de cómo podemos calcular las probabilidades en los árboles; muchos otros problemas en los métodos comparativos se pueden abordar utilizando diferentes algoritmos de poda.
El algoritmo de poda de Felsenstein avanza hacia atrás en el tiempo desde las puntas hasta la raíz del árbol (ver apéndice, sección 8.8). En la raíz, debemos especificar las probabilidades de cada estado de carácter en el ancestro común de la especie en el clado. Como se menciona en el Capítulo 7, existen al menos tres métodos posibles para hacer esto. Primero, se puede suponer que cada estado puede ocurrir en la raíz con igual probabilidad. Segundo, se puede suponer que los estados se extraen de su distribución estacionaria, tal como lo da el modelo. La distribución estacionaria es una distribución de probabilidad estable de estados que es alcanzada por el modelo después de un largo período de tiempo. Tercero, uno podría tener alguna información sobre el estado radicular —tal vez de fósiles, o información sobre estados de carácter en un conjunto de taxones externos— que se puede utilizar para asignar probabilidades a los estados. En la práctica, los dos primeros de estos métodos son más comunes. En el caso discutido anteriormente —un modelo Mk con todas las tasas de transición iguales— la distribución estacionaria es aquella en la que todos los estados son igualmente probables, por lo que los dos primeros métodos son idénticos. En general, sin embargo, estos tres métodos pueden dar resultados diferentes.