1.3: Una breve introducción a los árboles filogenéticos
- Page ID
- 53967
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Es un trabajo duro reconstruir un árbol filogenético. Este punto se ha hecho muchas veces (por ejemplo, ver Felsenstein 2004), pero vale la pena repetir aquí. Hay una enorme cantidad de formas de conectar un conjunto de especies por un árbol filogenético, y el número de árboles posibles crece extremadamente rápido con el número de especies. Por ejemplo, hay alrededor de 5 × 10 38 formas de construir un árbol filogenético 1 de 30 especies, que es muchas veces mayor que el número de estrellas en el universo. Adicionalmente, el problema matemático de reconstruir árboles de manera óptima a partir de los rasgos de las especies es un ejemplo de un problema que es “NP-completo”, una clase de problemas que incluyen algunos de los más difíciles computacionalmente en el mundo. Construir filogenias es difícil.
La dificultad de construir filogenias se refleja actualmente en el reto de reconstruir el árbol de la vida. Algunas partes del árbol de la vida aún están sin resolver incluso con las tremendas cantidades de datos genómicos que ahora están disponibles. En consecuencia, los científicos han dedicado un esfuerzo enfocado a resolver este difícil problema. Actualmente hay una gran cantidad de programas informáticos rápidos y eficientes destinados únicamente a reconstruir árboles filogenéticos (por ejemplo, MrBayes: Ronquist y Huelsenbeck 2003; BEAST: Drummond y Rambaut 2007). En consecuencia, el número de árboles filogenéticos bien resueltos disponibles también está aumentando rápidamente. A medida que comenzamos a llenar los vacíos del árbol de la vida, estamos desarrollando una idea mucho más clara de los patrones de evolución que han ocurrido en los últimos 4.5 mil millones de años en la Tierra.
Una razón central por la que los árboles filogenéticos son difíciles de reconstruir es que son ricos en información 2. Un solo árbol contiene información detallada sobre los patrones y el momento de los eventos de ramificación evolutiva a través de la historia de un grupo. Cada rama de un árbol nos habla de la ascendencia común de un clado de especies, y la hora de inicio, la hora de finalización y la longitud de la rama nos informan sobre el momento de los eventos de especiación en el pasado. Si combinamos un árbol filogenético con algunos datos de rasgos —por ejemplo, el tamaño corporal medio para cada especie en un género de mamíferos— entonces podemos obtener aún más información sobre la historia evolutiva de una sección del árbol de la vida.
Los métodos más comunes para reconstruir árboles filogenéticos utilizan datos sobre los genes y/o rasgos de las especies. La información básica sobre la relación filogenética de las especies se transporta en caracteres derivados compartidos; es decir, caracteres que han evolucionado nuevos estados que se comparten entre todas las especies en un clado y no se encuentran en los parientes cercanos de ese clado. Por ejemplo, los mamíferos tienen muchos caracteres derivados compartidos, incluyendo el pelo, las glándulas mamarias y los huesos especializados del oído interno.
Los árboles filogenéticos a menudo se construyen sobre la base de datos genéticos (o genómicos) utilizando algoritmos informáticos modernos. Se pueden utilizar varios métodos para construir árboles, como la parsimonia, la máxima verosimilitud y los análisis bayesianos (ver Capítulo 2). Todos estos métodos tienen suposiciones distintas y pueden dar resultados diferentes. De hecho, incluso dentro de un marco estadístico dado, diferentes paquetes de software (por ejemplo, MRBayes y BEAST, mencionados anteriormente, son ambos enfoques bayesianos) pueden dar resultados diferentes para los análisis filogenéticos de los mismos datos. Los detalles de la reconstrucción filogenética de árboles están fuera del alcance de este libro. Los lectores interesados pueden leer “Inferring Phylogenies” (Felsenstein 2004), “Computational Molecular Evolution” (Yang 2006), u otras fuentes para mayor información.
Para muchos métodos comparativos actuales, tomamos un árbol filogenético para un grupo de especies como un dado, es decir, suponemos que el árbol es conocido sin error. Esta suposición casi nunca se justifica. Existen muchas razones por las que los árboles filogenéticos se estiman con error. Por ejemplo, estimar longitudes de rama a partir de unos pocos genes es difícil, y las longitudes de rama que estimamos deben considerarse inciertas. Como otro ejemplo, los árboles que muestran las relaciones entre los genes (árboles genéticos) no siempre son los mismos que los árboles que muestran las relaciones entre especies (especies árboles). Debido a esto, los mejores métodos comparativos reconocen que los árboles filogenéticos siempre se estiman con cierta incertidumbre, tanto en términos de topología como de longitudes de ramas, e incorporan esa incertidumbre en el análisis. Describiré algunos métodos para lograrlo en capítulos posteriores.
¿Cómo le damos sentido a las enormes cantidades de información que contienen los grandes árboles filogenéticos? La definición de “grande” puede variar, pero ya tenemos árboles con decenas de miles de puntas, y creo que podemos anticipar árboles con millones de puntas en un futuro muy cercano. Estos árboles son demasiado grandes para caber cómodamente en un cerebro humano. Los trucos actuales para tratar con árboles —como bancos de monitores de computadora o impresiones largas y grabadas juntas— son ineficientes y no funcionarán para los enormes árboles filogenéticos del futuro. Necesitamos técnicas que nos permitan tomar grandes árboles filogenéticos y extraer información útil de ellos. Esta información incluye, pero no se limita a, estimar las tasas de especiación, extinción y evolución de rasgos; probar hipótesis sobre el modo de evolución en un grupo; identificar radiaciones adaptativas, innovaciones clave y otras explicaciones macroevolutivas para la diversidad; y muchas otras cosas.