Saltar al contenido principal
LibreTexts Español

9.2: Más allá del modelo Mk

  • Page ID
    54104
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En el Capítulo 8 se consideró la evolución de caracteres discretos en árboles filogenéticos. Estos modelos caen dentro de la categoría general de modelos Markov de tiempo continuo, que consideran un proceso que puede ocupar dos o más estados. Las transiciones ocurren entre esos estados en tiempo continuo. El inmueble de Markov significa que, en algún momento t, lo que sucede a continuación en el modelo depende únicamente del estado actual del proceso y no de nada que haya venido antes.

    En biología evolutiva, el trabajo más detallado sobre modelos de Markov en tiempo continuo se ha centrado en datos de secuencias de ADN o proteínas. Como se mencionó anteriormente, un conjunto extremadamente grande de modelos están disponibles para modelar y analizar estas secuencias moleculares. También se pueden elaborar estos modelos agregando heterogeneidad de tasa entre sitios (por ejemplo, el parámetro gamma, como en GTR + γ), u otras complicaciones relacionadas con los mecanismos de evolución de secuencias (para una revisión, ver Liò y Goldman 1998).

    Sin embargo, existen dos diferencias importantes entre los modelos de evolución de secuencias y los modelos de cambio de carácter en árboles que hacen que nuestra tarea sea distinta de la tarea de modelar secuencias de ADN o aminoácidos. Primero, al analizar secuencias moleculares, normalmente se tienen datos para muchos miles (o millones) de caracteres. Los conjuntos de datos para otros caracteres —como los caracteres fenotípicos de las especies— suelen ser mucho más pequeños (y más difíciles de recolectar). Segundo, el análisis de secuencias muy a menudo asume que cada personaje evoluciona independientemente de todos los demás personajes, pero que todos los personajes (o al menos ciertos subconjuntos grandes de esos personajes) evolucionan bajo un modelo compartido (Liò y Goldman 1998; Yang 2006). Esto significa que, por ejemplo, la frecuencia de transiciones entre A y C en una ubicación en una secuencia génica aporta información sobre la misma transición en una ubicación diferente en la secuencia.

    Desafortunadamente, al analizar la evolución morfológica de los personajes, a menudo nos interesan los caracteres individuales, y el uso de modelos compartidos entre personajes parece imposible de justificar. Por lo general, no hay equivalencia entre diferentes estados de caracteres para diferentes caracteres: una A es una A para secuencias, pero un “1” en una matriz de caracteres generalmente corresponde a la presencia de dos caracteres completamente diferentes. La consecuencia de esta diferencia se refleja en la propiedad estadística de los datos multivariados. Para problemas de secuencia génica, agregar más datos en forma de caracteres adicionales (sitios) facilita el ajuste de modelos, ya que cada sitio agrega información sobre el modelo general (compartido) entre sitios. Con los datos de caracteres, los caracteres adicionales no facilitan el problema, ya que cada personaje viene con sus propios parámetros de modelo. De hecho, veremos que al considerar las correlaciones de caracteres usando un modelo Mk generalizado, agregar caracteres en realidad hace que el problema sea cada vez más difícil. Tal vez estos problemas expliquen parcialmente el lento ritmo de desarrollo del modelo para ajustar caracteres discretos a los árboles. Existen algunas soluciones potenciales, como los modelos de umbral [Felsenstein (2005); Felsenstein (2012); discutidos a continuación]. Se necesita desesperadamente más trabajo en esta área.

    En este capítulo, primero discutiremos extensiones de modelos Mk que nos permiten agregar complejidad a este sencillo modelo. También discutimos modelos de umbral, un enfoque relativamente nuevo en métodos comparativos que es distinto de los modelos Mk y tiene cierto potencial para el desarrollo futuro.


    This page titled 9.2: Más allá del modelo Mk is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by Luke J. Harmon via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.