Saltar al contenido principal
LibreTexts Español

11.3: Balance de árboles

  • Page ID
    54394
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Como discutimos en el Capítulo 10, el balance de árboles considera cuán “equilibradas” están las ramas de un árbol filogenético. Es decir, si miramos cada nodo del árbol, ¿son los dos clados hermanos del mismo tamaño (balanceados) o tremendamente diferentes (desequilibrados)?

    Los árboles de nacimiento-muerte tienen cierta cantidad de “equilibrio”, tal vez un poco menos de lo que tu intuición podría sugerir (ver capítulo 10). Podemos mirar a árboles reales para ver si la cantidad de saldo coincide con lo que esperamos bajo los modelos de nacimiento-muerte. Un patrón menos equilibrado en árboles reales sugeriría que la tasa de especiación y/o extinción varía entre linajes más de lo que cabría esperar. Por el contrario, árboles más equilibrados sugerirían una diversificación más uniforme y predecible a través del árbol de la vida de lo esperado bajo los modelos de nacimiento-muerte. Este enfoque se remonta a Raup y sus colegas, quienes aplicaron modelos estocásticos de nacimiento-muerte a la paleontología en una serie de artículos influyentes en la década de 1970 (por ejemplo, Raup et al. 1973, Raup y Gould (1974)). Mostraré cómo hacer esto tanto para nodos individuales como para árboles enteros en las siguientes secciones.

    Sección 11.3a: Los clados hermanos y el equilibrio de los nodos individuales

    Para los nodos individuales, ya sabemos que la distribución de la riqueza de especies de taxones hermanos es uniforme sobre todas las divisiones posibles de N n especies en dos clados de tamaño N a y N b (Capítulo 11). Esta idea lleva a una simple prueba de si la distribución de especies entre dos clados hermanos es inusual comparada con la expectativa bajo un modelo de nacimiento-muerte (Slowinski y Guyer 1993). Esta prueba se puede utilizar, por ejemplo, para probar si la diversidad de clados excepcionales, como las aves paseriformes, es mayor de lo que cabría esperar en comparación con su clado hermano. Esta es la medida más simple del equilibrio del árbol, ya que solo considera un nodo en el árbol a la vez.

    Slowinsky y Guyer (1993) desarrollaron una prueba basada en calcular un valor P para una división al menos tan extrema como se ve en una comparación particular de clados hermanos. Consideramos N n especies totales divididas en dos clados hermanos de tamaños N a y N b, donde N a < N b y N a + N b = N n. Entonces:

    Si N aN b:

    \[ P = \frac{2 N_a}{N_n - 1} \label{11.7}\]

    Si N a = N b o P > 1, entonces establezca P = 1

    Por ejemplo, podemos evaluar la diversificación en los representantes andinos del género leguminoso Lupinus (Hughes y Eastwood 2006). Este género incluye una radiación joven de 81 especies andinas, abarcando una amplia gama de formas de crecimiento. El probable clado hermano de esta espectacular radiación andina es un clado de especies de Lupinus en México que incluye 46 especies (Drummond et al. 2012). En este caso N a = 81 − 46 = 35, y luego podemos calcular un valor P probando la hipótesis nula de que ambos clados tienen la misma tasa de diversificación:

    \[ P = \frac{2 N_a}{N_n - 1} = \frac{2 \cdot 35}{81 - 1} = 0.875 \label{11.8} \]

    No podemos rechazar la hipótesis nula. De hecho, trabajos posteriores sugieren que el aumento real en la tasa de diversificación para Lupinus ocurrió más profundo en el árbol filogenético, en el antepasado de un clado del Nuevo Mundo más amplio (Hughes y Eastwood 2006; Drummond et al. 2012).

    A menudo, nos interesa probar si un rasgo en particular -digamos, la dispersión en el Páramo- es responsable del incremento en la riqueza de especies que vemos en algunos clados. En ese caso, una sola comparación de clados hermanos puede ser insatisfactoria, ya que los clados hermanos casi siempre difieren en muchos personajes, más allá de solo el rasgo de interés. Incluso si el clado con nuestra presunta “innovación clave” es más diverso, es posible que aún no tengamos confianza en inferir una correlación a partir de una sola observación. Necesitamos replicación.

    Para abordar este problema, muchos estudios han utilizado réplicas naturales a través del árbol de la vida, comparando las riquezas de especies de muchos pares de clados hermanos que difieren en un rasgo de interés determinado. Siguiendo a Slowinsky y Guyer (1993), podríamos calcular un valor p para cada clado, y luego combinar esos valores p en una prueba general. En este caso, un clado (con diversidad N 1) tiene el rasgo de interés y el otro no (N 0), y nuestra fórmula es la mitad de la ecuación 11.5 ya que consideraremos esto una prueba de una cola:

    \[ P = \frac{N_0}{N_n - 1} \label{11.9} \]

    Al analizar comparaciones de clados replicados -por ejemplo muchos clados hermanos, donde en cada caso uno tiene el rasgo de interés y el otro no- Slowinsky y Guyer (1993) recomendaron combinar estos valores p usando la prueba de probabilidad combinada de Fisher, de manera que:

    \[χ^2){combined} = −2∑\ln (P_i) \label{11.10}\]

    Aquí, los valores de P i son de comparaciones de clados hermanos independientes, cada una usando la ecuación 11.9. Bajo la hipótesis nula donde el carácter de interés no incrementa las tasas de diversificación, el estadístico de prueba, χ 2 c o m b i n e d, debe seguir un chi- distribución cuadrada con 2 k grados de libertad donde k es el número de pruebas. Pero antes de usar este enfoque de probabilidad combinada, ¡vea qué sucede cuando lo aplicamos a un ejemplo real!

    Como ejemplo, considere los siguientes datos, que comparan la diversidad de muchos pares hermanos de plantas. En cada caso, un clado tiene frutos carnosos y el otro seco (datos de Vamosi y Vamosi 2005):

    Clado de fruta carnosa n f l e s h y Clado de fruta seca n d r y
    A 1 B 2
    C 1 D 64
    E 1 F 300
    G 1 H 89
    I 1 J 67
    K 3 L 4
    M 3 N 34
    O 5 P 10
    Q 9 R 150
    S 16 T 35
    U 33 V 2
    W 40 X 60
    Y 50 Z 81
    AA 100 BB 1
    CC 216 DD 3
    EE 393 FF 1
    GG 850 HH 11
    II 947 JJ 1
    KK 1700 LL 18

    Los clados de la tabla anterior son los siguientes: A: Pangium, B: Acharia + Kigellaria, C: Cyrilla, D: Clethra, E: Roussea, F: Lobelia, G: Myriophylum + Haloragis + Penthorum, H: Tetracarpaea, I: Austrobaileya, J: Ilicium+Schisandra, K: Davidsonia, L: Bauera, M: Mitchella, N: Pentas, O: Milligania , P: Borya, P: Sambucus, R: Viburnum, S: Pereskia, T: Mollugo, U: Decaisnea + Sargentodoxa + Tinospora + Menispermum + Nandina Caulophyllum + Hydrastis + Glaucidium, V: Euptelea, W: Tetracera, X: Dillenia, Y: Osbeckia, Z: Mouriri, AA: Hipócratea, BB: Plagiopteron, CC: Cyclanthus + Sphaeradenia + Freycinetia , DD: Petrosavia + Japonlirion, EE: Bixa, FF: Theobroma + Grewia + Tilia + Sterculia + Durio, GG: Impatiens, HH: Idria, II: Lamium + Clerodendrum + Callicarpa + Phyla + Pedicularis + Paulownia, JJ: Eutistachys , KK: Callicarpa + Phyla + Pedicularis + Paulownia + Solanum, LL: Solanum.

    Los clados individuales muestran un soporte mixto para la hipótesis, con solo 7 de las 18 comparaciones mostrando mayor diversidad en el clado carnoso, pero 6 de esas 7 comparaciones significativas a P < 0.05 usando la ecuación 11.9. La prueba de probabilidad combinada da un estadístico de prueba de χ 2 c o m b i n e d = 72.8. Comparando esto con una distribución χ 2 con 36 grados de libertad, obtenemos P = 0.00027, un resultado altamente significativo. Esto implica que los frutos carnosos, de hecho, resultan en una mayor tasa de diversificación.

    Sin embargo, si probamos la hipótesis opuesta, vemos un problema con la prueba de probabilidad combinada de la ecuación 11.10 (Vamosi y Vamosi 2005). Primero, observe que 11 de 18 comparaciones muestran mayor diversidad en el clado no carnoso, con 4 significativas a P < 0.05. La prueba de probabilidad combinada da χ 2 c o m b i n e d = 58.9 y P = 0.0094. Entonces rechazamos la hipótesis nula y concluimos que los frutos no carnosos se diversifican a un ritmo más alto! Es decir, podemos rechazar la hipótesis nula en ambas direcciones con este ejemplo.

    ¿Qué está pasando aquí? Resulta que esta prueba es muy sensible a los valores atípicos, es decir, clados con diferencias extremas en la diversidad. Estos clados son muy diferentes de lo que cabría esperar bajo la hipótesis nula, lo que lleva al rechazo del nulo -y, en algunos casos con dos caracteres, cuando hay valores atípicos en ambos lados (por ejemplo, la proporción de especies en cada estado tiene una distribución en forma de U; Paradis 2012) podemos mostrar que ambos personajes aumentan significativamente la diversidad (Vamosi y Vamosi 2005)!

    Afortunadamente, hay una serie de métodos mejorados que se pueden utilizar que son similares en espíritu a la prueba original de Slowinsky y Guyer pero más robustos estadísticamente (por ejemplo, Paradis 2012). Por ejemplo, podemos aplicar la “prueba de riqueza Yule” como se describe en Paradis (2012), a los datos de Vamosi et al. (2005). Esta es una versión modificada de la prueba McConway-SIMS (McConway y Sims 2004), y compara la probabilidad de un modelo de yule de tasa igual aplicado a todos los clados con un modelo donde un rasgo se asocia con tasas de diversificación mayores o menores. Esta prueba requiere conocimiento de edades de clados, que no tengo para estos datos, pero Paradis (2012) muestra que la prueba es robusta a esta suposición y recomienda sustituir una edad grande e igual por cada clado. Elegí 1000 como edad arbitraria, y encontré una prueba de razón de verosimilitud significativa (modelo nulo l n L = −215.6, modelo alternativo l n L = −205.7, P = 0.000008). Este método estima una mayor tasa de diversificación para frutos carnosos (ya que la edad del clado es arbitraria, las tasas reales no son significativas, pero su relación estimada λ 1/λ 0 = 1.39 sugiere que los linajes de frutos carnosos tienen una diversificación tasa casi 40% más alta).

    Sección 11.3b: Balance de árboles filogenéticos enteros

    Podemos evaluar el balance general de un árbol filogenético completo usando estadísticas de balance de árboles. Como se discutió, describiré solo una estadística común, la I de Colless, ya que otras métricas capturan el mismo patrón de maneras ligeramente diferentes.

    Para calcular Colles' I, podemos usar la Ecuación 10.18. Este resultado dependerá fuertemente del tamaño de los árboles, por lo que no es comparable entre árboles de diferentes tamaños; para permitir comparaciones, I c generalmente se estandariza restando la media esperada para árboles de ese tamaño bajo un modelo aleatorio (ver más abajo), y dividiendo por desviación estándar. Ambos pueden calcularse analíticamente (Blum et al. 2006), y estandarizar I c calculados usando una pequeña aproximación (siguiendo a Bortolussi et al. 2006) como:

    \[ I^{'}_c = \frac{I_c-n*log(n)-n(\gamma-1-log(2))}{n} \label{11.11} \]

    Dado que las estadísticas de prueba se basan en descripciones de patrones en árboles en lugar de procesos particulares, ¡la relación entre el desequilibrio y los procesos evolutivos puede ser difícil de desenredar! Pero todos los índices de balance de árboles permiten rechazar la hipótesis nula de que el árbol se generó bajo un modelo de nacimiento-muerte. En realidad, los patrones esperados de equilibrio de árboles son absolutamente idénticos bajo una clase más amplia de modelos llamados modelos “Equal-Rates Markov” (ERM) (Harding 1971; Mooers y Heard 1997). Los modelos ERM especifican que las tasas de diversificación (tanto de especiación como de extinción) son iguales en todos los linajes para cualquier punto particular en el tiempo. Sin embargo, esas tarifas pueden o no cambiar a través del tiempo. Si no cambian a través del tiempo, entonces tenemos un modelo de tasa constante de nacimiento-muerte, como se describió anteriormente, por lo que los modelos de nacimiento-muerte son modelos ERM. Pero los modelos ERM también incluyen, por ejemplo, modelos donde las tasas de natalidad se ralentizan a través del tiempo, o las tasas de extinción aumentan con el tiempo, y así sucesivamente. Siempre que los cambios en las tasas ocurran exactamente de la misma manera en todos los linajes en cualquier momento, entonces todos estos modelos predicen exactamente el mismo patrón de equilibrio de árboles.

    Los pasos típicos para usar índices de balance de árboles para probar la hipótesis nula de que el árbol se generó bajo un modelo ERM son los siguientes:

    1. Calcular el balance de árboles usando una estadística de balance de árboles.
    2. Simular árboles de nacimiento puros para generalizar una distribución nula del estadístico de prueba. Estamos considerando el conjunto de modelos ERM como nuestro nulo, pero como el nacimiento puro es simple y aún así ERM podemos usarlo para obtener la distribución nula correcta.
    3. Comparar el estadístico de prueba real con la distribución nula. Si el estadístico de prueba real está en las colas de la distribución nula, entonces sus datos se desvían de un modelo ERM.

    El paso 2 es innecesario en los casos en los que conocemos analíticamente distribuciones nulas para estadísticas de balance de árboles, cierto para algunas (pero no todas) métricas de balance (por ejemplo, Blum y François 2006). También hay algunos ejemplos en la literatura de considerar distribuciones nulas distintas a ERM. Por ejemplo, Mooers y Heard (1997) consideran otros dos modelos nulos, PDA y EPT, que consideran diferentes distribuciones estadísticas de formas de árboles (pero ambas son difíciles de relacionar con cualquier proceso evolutivo en particular).

    Por lo general, los árboles filogenéticos están más desequilibrados de lo esperado bajo el modelo ERM. De hecho, esta es una de las generalizaciones más robustas que se pueden hacer sobre los patrones macroevolutivos en árboles filogenéticos. Esta desviación significa que las tasas de diversificación varían entre los linajes del árbol de la vida. Discutiremos cómo cuantificar y describir esta variación en capítulos posteriores. Todas estas pruebas son similares en que utilizan múltiples comparaciones no anidadas de la riqueza de especies en clados hermanos para calcular un estadístico de prueba, que luego se compara con una distribución nula, generalmente basada en un proceso de tasas constantes de nacimiento-muerte (revisado en Vamosi y Vamosi 2005; Paradis 2012).

    Como ejemplo, podemos aplicar el enfoque de equilibrio de árbol entero al árbol de Lupinus (Drummond et al. 2012). Para este árbol, que tiene 137 puntas, calculamos I c = 1010 y I c = 3.57. Esto es mucho mayor de lo esperado por casualidad bajo un modelo de ERM, con P = 0.0004. Es decir, nuestro árbol está significativamente más desequilibrado de lo esperado bajo un modelo de ERM, que incluye tanto el nacimiento puro como el nacimiento-muerte. Podemos concluir con seguridad que hay variación en las tasas de especiación y/o extinción entre linajes en el árbol.


    This page titled 11.3: Balance de árboles is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by Luke J. Harmon via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.