6: Diversidad neutra y estructura poblacional

Última actualización
Guardar como PDF

Page ID: 58140

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\dsum}{\displaystyle\sum\limits} \)

\( \newcommand{\dint}{\displaystyle\int\limits} \)

\( \newcommand{\dlim}{\displaystyle\lim\limits} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\(\newcommand{\longvect}{\overrightarrow}\)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

¿Cómo se construye la diferenciación genética entre poblaciones estrechamente relacionadas? ¿Cómo actúa la migración para reducir la diferenciación? Estas preguntas son claves para entender las condiciones bajo las cuales las poblaciones (y especies) pueden comenzar a divergir genéticamente entre sí. Para responder a estas preguntas, primero lo consideraremos en el contexto de los alelos neutros, y luego volveremos a pensar en la selección y diferenciación en capítulos posteriores. Hemos considerado alelos neutros extraídos de una población de apareamiento aleatorio y divergencia entre alelos extraídos de dos poblaciones distantes relacionadas. Pasaremos ahora para considerar la divergencia entre poblaciones más estrechamente relacionadas. Al pensar en la coalescencia dentro de las poblaciones, asumimos que cualquier par de linajes es igualmente probable que se fusionen entre sí. Sin embargo, cuando hay estructura poblacional se viola esta suposición, ya que es probable que el progenitor de un alelo se encuentre en la misma población que su hijo y así los linajes en diferentes poblaciones tienen menos probabilidades de fusionarse.

Para desarrollar modelos de aproximadamente la estructura poblacional utilizaremos el estadístico\(F_{\mathrm{ST}}\), que introdujimos en la Sección [Sección:F_estadisticas] de discusión de resumir la estructura poblacional en frecuencias alélicas. Anteriormente hemos escrito la medida de la estructura poblacional\(F_{\mathrm{ST}}\) como

\[F_{\mathrm{ST}} = \frac{H_T-H_S}{H_T}\]

donde\(H_S\) es la probabilidad de que dos alelos muestreados al azar de una subpoblación difieran, y\(H_T\) es la probabilidad de que dos alelos muestreados al azar de la población total difieran.

Un modelo simple de división de población

Imagínese una población de tamaño constante de individuos\(N_e\) diploides que\(T\) generaciones en el pasado dividieron en dos poblaciones hijas (subpoblaciones) cada una de tamaño\(N_e\) individuos, que posteriormente no intercambian migrantes. En el día actual se muestrea un número igual de alelos de ambas subpoblaciones.

Cambio en las frecuencias alélicas tras una división poblacional.

Considere un par de alelos muestreados dentro de una de nuestras subpoblaciones y piense en su heterocigosidad por sitio. Estos alelos han experimentado una población de tamaño\(N_e\) y así la probabilidad de que difieran es\(H_S \approx 4N_e \mu\) (suponiendo que\(N_e \mu \ll 1\), usando nuestra Ecuación\ ref {eqn:hetero} para heterocigosidad dentro de una población).

La heterocigosidad en nuestra población total es un poco más complicada de calcular. Suponiendo que se muestrea por igual ambas subpoblaciones, cuando extraemos dos alelos de nuestra muestra total,\(50\%\) del momento en que se extraen de la misma subpoblación y\(50\%\) del momento en que se extraen de diferentes subpoblaciones. Por lo tanto, nuestra heterocigosidad total viene dada por

\[H_T = \half H_S + \half H_B\]

donde\(H_B\) está la probabilidad de que un par de alelos extraídos de nuestras dos subpoblaciones diferentes difieran entre sí. Un par de alelos de diferentes subpoblaciones no pueden encontrar un ancestro común entre sí durante al menos\(T\) generaciones en el pasado, ya que están en poblaciones distintas (no conectadas por migración). Una vez que nuestros alelos se encuentran de nuevo en la población ancestral combinada, les lleva en promedio\(2N\) generaciones fusionarse. Entonces la oportunidad total de mutación entre nuestro par de alelos muestreados de diferentes poblaciones es\(2 (T + 2N )\) generaciones de meiosis, tal que la probabilidad de que nuestros pares de alelos sean diferentes es

\[H_B \approx 2\mu ( T + 2 N) %\left( 1-(1-\mu)^{2T} \right) + (1-\mu)^{2T} %\frac{\theta}{\theta+1}\]

Podemos enchufar esto en nuestra expresión para\(H_T\), y luego eso a su vez en\(F_{\mathrm{ST}}\). Al hacerlo, encontramos que

\[F_{\mathrm{ST}} \approx \frac{ \mu T}{\mu T + 4N_e\mu } = \frac{ T}{ T + 4N_e } \label{eqn:FST_split}\]

Tenga en cuenta que\(\mu\) cancela fuera de esta ecuación. En este modelo de juguete simple,\(F_{\mathrm{ST}}\) está aumentando debido a que la cantidad de diversidad entre poblaciones aumenta con el tiempo de divergencia de las dos poblaciones (inicialmente linealmente con\(T\)). \(F_{\mathrm{ST}}\)crece a un ritmo dado por\(\frac{T}{(4N_e)}\) para que la diferenciación sea mayor entre poblaciones separadas por largos tiempos de divergencia o con pequeños tamaños efectivos de población.

Ejercicio\(\PageIndex{1}\)

El genoma amplio\(F_{ST}\) entre las muestras de especies de orangután borneo y sumatra (Pongo pygmaeus y Pongo abelii) es\(\approx 0.37\), representando una profunda división poblacional entre las especies (potencialmente con poco gen posterior flujo). Dentro de las poblaciones, el promedio de Watterson en todo el genoma\(\theta\) es\(\theta_W=1.4\) kb\(^{-1}\), estimado a partir del número de sitios segregantes. Asumir un tiempo de generación de 20 años, y una tasa de mutación\(2 \times 10^{-8}\) por base por generación. ¿Hasta qué punto en el pasado divergen las dos poblaciones?

Un modelo sencillo de migración entre una isla y el continente.

También podemos usar el coalescente para pensar en patrones de diferenciación bajo un modelo simple de equilibrio migración-deriva. Consideremos una pequeña población insular que está relativamente aislada de una gran población continental, donde ambas poblaciones son de tamaño constante. Supondremos que la heterocigosidad esperada para un par de alelos muestreados en el continente es\(H_M\).

Nuestra isla tiene un tamaño\(N_{I}\) de población muy pequeño en comparación con nuestra población continental. Cada generación, una fracción baja\(m\) de nuestros individuos en la isla tiene padres migrantes del continente la generación anterior. Nuestra isla también puede enviar migrantes de regreso al continente, pero estos son una gota en el océano en comparación con el gran tamaño de la población en el continente y su efecto puede ser ignorado.

Si tomamos muestras de un alelo en la isla y trazamos su linaje ancestral hacia atrás en el tiempo, cada generación nuestro alelo ancestral tiene una baja probabilidad\(m\) de descender del continente en la generación anterior (si retrocedemos lo suficiente el alelo eventualmente tiene que ser descendido de un alelo en el continente). La probabilidad de que un par de alelos muestreados en la isla desciendan de un alelo ancestral común reciente compartido en la isla es la probabilidad de que nuestro par de alelos se fusione antes de que uno de los linajes migre. Pues nuestro par de linajes se fusiona con probabilidad\(\frac{1}{2N_I}\) en una generación dada y, asumiendo que la tasa de migración no es demasiado alta (\(m \ll 1\)), la probabilidad de que uno u otro linaje migre en una generación dada es\(2m\). Entonces la probabilidad de que nuestros linajes se fusionen antes de migrar es

\[\frac{\frac{1}{(2N_I)}}{\frac{1}{(2N_I)} + 2m},\]

que sigue como un argumento exactamente análogo a nuestra probabilidad de que un par de linajes se fusionen antes de una mutación, [eqn:coal_no_mut], que usamos para derivar la heterocigosidad esperada.

Condicional a que uno u otro de nuestros alelos migren al continente, ambos de nuestros alelos representan sorteos independientes del continente y, por lo tanto, difieren entre sí con probabilidad\(H_M\). Por lo tanto, el nivel de heterocigosidad en la isla viene dado por

\[H_I = \left(1 - \frac{\frac{1}{(2N_I)}}{\frac{1}{(2N_I)} + 2m} \right)H_M\]

Entonces la reducción de la heterocigosidad en la isla en comparación con el continente es

\[F_{IM} = 1- \frac{H_I}{H_M} = \frac{\frac{ 1}{(2N_I)}}{\frac{1}{(2N_I)} + 2m} = \frac{ 1 }{1 + 4N_Im}. \label{eqn:FIM}\]

El nivel de endogamia en la isla en comparación con el continente será alto si la tasa de migración es baja y el tamaño efectivo de la población de la isla es bajo, ya que las frecuencias alélicas en la isla están a la deriva y la diversidad en la isla no se está reponiendo por la migración. El parámetro clave aquí es el número de individuos en la isla reemplazados por inmigrantes del continente cada generación (\(N_I m\)), incluso algunos migrantes que llegan a la isla una generación es suficiente para evitar que se acuñe mucha diferenciación de frecuencias alélicas.

Hemos enmarcado este problema como la reducción de la diversidad genética en la isla en comparación con el continente. Sin embargo, si consideramos recolectar individuos en la isla y el continente en proporción a su tamaño poblacional, el nivel total de heterocigosidad sería\(H_T=H_M\), ya que las muestras de nuestro continente superarían en gran medida a las de nuestra isla. Por lo tanto, considerando a la isla como nuestra subpoblación, hemos derivado otro modelo sencillo de\(F_{ST}\).

Ejercicio\(\PageIndex{1}\)

Se está investigando a una pequeña población fluvial de sticklebacks, que recibe migrantes poco frecuentes de una población marina muy grande. En un conjunto de marcadores bialélicos putativamente neutros, la población de agua dulce tiene frecuencias:

0.2, 0.7, 0.8

en los mismos marcadores la población marina tiene frecuencias:

0.4, 0.5 y 0.7.

A partir del estudio de patrones de heterocigosidad en una gran colección de marcadores, ha estimado que el tamaño efectivo a largo plazo de su población de agua dulce es de 2000 individuos.

¿Cuál es su estimación de la tasa de migración de las poblaciones marinas al río?

Clasificación incompleta de linajes

A menudo, cuando estudiamos múltiples poblaciones, por ejemplo, especies, nos interesa el orden subyacente en el que las poblaciones se separan entre sí y el momento de estos eventos. En el caso de que las poblaciones se separen entre sí sin flujo génico posterior, podemos representar este patrón de división por un árbol poblacional. Debido a que un polimorfismo puede tardar mucho tiempo en derivar hacia arriba o hacia abajo en frecuencia, pueden ocurrir múltiples divisiones de población durante el tiempo que un alelo aún se está segregando. Esto puede conducir a incongruencia entre el árbol poblacional general y la información sobre las relaciones presentes en loci individuales. Como hemos visto en los capítulos anteriores las relaciones entre alelos muestreados en un locus están representadas por árboles coalescentes, a veces llamados árboles génicos en el contexto de linaje incompleto y más generalmente en filogenética. En la Figura [Fig:Noils_poly] y [Fig:ILS_Poly] mostramos una simulación de tres poblaciones donde la población inferior se separa de las otras dos primeras, seguida de la posterior división de las poblaciones superior y media. Iniciamos ambas simulaciones con un alelo rojo recién introducido siendo polimórfico en la población ancestral combinada. El destino más probable de este alelo es que se pierde rápidamente de la población, pero a veces el alelo puede derivar en frecuencia y ser polimórfico cuando las poblaciones se dividen, como lo ha hecho el alelo en nuestras dos figuras. Si el alelo se perdió/fija en las poblaciones descendientes antes de la siguiente división poblacional, nuestra configuración alélica coincidirá con el árbol poblacional, como lo hace en la Figura [Fig:Noils_poly], y así también el árbol génico coincidirá con el árbol poblacional (como se muestra en el lado izquierdo de la Figura [ Fig:ILS_Cartoon]). Sin embargo, si el alelo persiste como polimorfismo en la población ancestral hasta que las poblaciones superior y media se dividen, entonces el alelo podría fijarse en una de estas poblaciones y no en la otra. Tal evento conduce a un patrón de sustitución que no está de acuerdo con el árbol poblacional, como en la Figura [Fig:ILS_Poly]. Si construyéramos una filogenia usando la variación en este sitio, veríamos un desacuerdo entre el árbol génico y el árbol poblacional. En la Figura [Fig:ILS_Poly] un alelo dibujado de las poblaciones superior e inferior están necesariamente más estrechamente relacionados entre sí que cualquiera de los dos con un alelo extraído de la población 2; rastreando nuestros linajes alélicos desde las poblaciones superior e inferior a través del tiempo, deben unirse con cada otro antes de llegar al punto donde surgió la mutación roja; en contraste, un linaje de la población media no puede haberse fusionado con ninguno de los otros linajes hasta pasado el momento en que surgió la mutación roja. Un ejemplo de esta 'clasificación de linaje incompleto' en términos del árbol subyacente se muestra en el lado derecho de la Figura [Fig:ILS_Cartoon].

Una analogía natural del pedigrí con la clasificación incompleta del linaje es el hecho de que si bien dos hermanos biológicos están más estrechamente relacionados entre sí genealógicamente que cualquiera de ellos con su primo, en cualquier locus dado uno de los hermanos puede compartir una EII alelo con su primo que no comparten con los suyos hermano, debido a la aleatoriedad de la segregación mendeliana en su pedigrí. En estos casos, la relación promedio de los individuos/poblaciones no está de acuerdo con los patrones de relación en un locus particular.

Como ejemplo empírico de clasificación incompleta de linajes, consideremos el trabajo de quien secuenció un solo alelo de tres especies diferentes de pinzones herbáceos australianos (Poephila): dos especies hermanas de pinzones de cola larga (Poephila acuticauda y P. hecki) y el pinzón garganta negra (Poephila cincta, ver Figura [Fig:Poephila_cincta]). Recolectaron datos de secuencia para 30 genes y construyeron árboles genéticos filogenéticos en cada uno de estos loci, resultando en 28 árboles génicos bien resueltos. Dieciséis de los árboles génicos mostraron P. acuticauda y P. hecki como hermanas con P. cincta) (el árbol ((A, H), C)), mientras que para doce genes el árbol genético fue discordante con el árbol poblacional: para siete de sus genes P. hecki cayó como un grupo externo a los otros dos y a los cinco P. acuticauda cayó como un grupo externo (los árboles ((A, C), H) y ((H, C), A) respectivamente).

Usemos el coalescente para entender esta discordancia entre árboles genéticos y árboles de especies. Supongamos que dos poblaciones hermanas (A y B) dividieron\(t_1\) generaciones en el pasado, con una división más profunda de una tercera población externa (C)\(t_2\) generaciones en el pasado. Asumiremos que no hay flujo de genes entre nuestras poblaciones después de cada división. Podemos rastrear los linajes ancestrales de nuestros tres alelos. La primera oportunidad para que los linajes A & B se fusionen es hace\(t_1\) generaciones. Si se unen entre sí en su población ancestral compartida antes\(t_2\) en el pasado (lado izquierdo de la Figura [Fig:ils_cartoon]) su árbol genético definitivamente coincidirá con el árbol poblacional. Entonces, la única manera para que el árbol genético no esté de acuerdo con el árbol poblacional es que los linajes A & B no se fusionen en su población ancestral compartida entre\(t_1\) y\(t_2\); esto sucede con probabilidad\(\left(1 - \frac{1}{2N}\right)^{t_2-t_1}\). Obtendremos un árbol genético discordante si A & B regresa a la población ancestral compartida con C sin fusionarse, y luego uno u otro de ellos se une con el linaje C antes de que se fusionen entre sí. Esto sucede con la probabilidad\(2/3\), ya que en el primer evento coalescente por parejas hay tres posibles pares de linajes que podrían fusionarse, dos de los cuales (A & C y B & C) dan como resultado un árbol discordante. Entonces la probabilidad de que obtengamos un árbol coalescente que sea discordante con el árbol poblacional es

\[\frac{2}{3} \left(1 - \frac{1}{2N}\right)^{t_2-t_1}. \label{eqn:ILS_coal}\]

Esta ecuación permite relacionar la fracción de loci que muestran una clasificación incompleta del linaje con los parámetros genéticos poblacionales de la población ancestral.

Volvamos a's ejemplo de pinzones de pasto australianos. Estimaron que el tamaño de la población ancestral de nuestros dos pinzones de cola larga era de cuatrocientos mil. ¿Cuál es su mejor estimación del tiempo entre especiaciones, es decir\(t_2-t_1\)?

La fracción de loci que muestra ILS, eqn [EQN:ILS_Coal], depende de los tiempos entre divisiones poblacionales (\(t_2-t_1\)) Por lo tanto, debemos esperar la discordancia gene-árbol-población arbórea cuando las poblaciones se dividen en rápida sucesión y/o los tamaños de población son grandes.

Pruebas para el flujo de genes

A menudo queremos probar si el flujo de genes ha ocurrido entre poblaciones. Por ejemplo, podríamos querer establecer un caso en el que se produjo el mestizaje entre humanos y neandertales o demostrar que el flujo génico ocurrió después de que dos poblaciones comenzaron a especiarse. Se han diseñado una amplia gama de métodos para evaluar el flujo de genes y estimar los caudales de genes basados en expectativas neutras. Aquí vamos a discutir brevemente un método basado en algunas ideas coalescentes simples. Arriba asumimos que la discordancia de la población gene-árbol-árbol se debió a una clasificación incompleta del linaje debido a que las poblaciones se dividieron rápidamente. Sin embargo, el flujo de genes entre las poblaciones también puede conducir a la discordancia gene-árbol. Si bien tanto el ILS como el flujo génico pueden conducir a la discordancia, bajo suposiciones simplificadoras, ILS implica más simetría en cómo se manifiestan estas discordancias.

Echa un vistazo a Figura [Fig:Abba_baba]. En ambos casos los linajes de 1 y 2 no logran fusionarse en su población ancestral compartida inicial, y uno u otro de ellos se fusiona con el linaje de 3 antes de que se fusionen entre sí. Cada opción es igualmente probable; por lo tanto, los patrones mutacionales ABBA y BABA son igualmente probables que ocurran bajo ILS, pero el flujo diferencial de genes romperá la simetría.

Para probar este efecto del flujo génico, podemos muestrear una secuencia de cada una de nuestras 4 poblaciones y contar el número de sitios que muestran los dos patrones mutacionales consistentes con la discordancia del árbol génico\(n_{ABBA}\) y\(n_{BABA}\) y calcular

\[\frac{n_{ABBA}-n_{BABA}}{n_{ABBA}+n_{BABA}} \label{eqn:ABBA_BABA}\]

Este estadístico tendrá expectativa cero si la discordancia gene-árbol se debe a ILS. Si hay flujo génico entre 2 y 3, eso excluye 1, ver Figura [Fig:ABBA_BABA_Introgresión], habrá un exceso de ABBA y así el estadístico ABBA-BABA estará sesgado positivamente (e inversamente sesgará negativamente si el flujo génico ocurrió entre 3 y 1). En la práctica, si esto es significativamente diferente de cero se juzga construyendo un estadístico Z con un error estándar encontrado al recalcular el estadístico en conjunto de datos remuestreados computacionalmente de grandes ventanas genómicas.

El clado de grandes felinos (Panthera) es una radiación reciente, con una cantidad considerable de variación genética compartida que aún se segrega en todo el grupo. examinó los patrones de divergencia genómica, clasificación incompleta del linaje y flujo de genes a través de este clado usando pruebas ABBA-BABA con un Domestic secuencia cat como el grupo externo. Un ejemplo, para leopardo de las nieves, tigre y león se muestra a continuación. Los leopardos de las nieves y los tigres se conocen más estrechamente relacionados entre sí que cualquiera de los dos con los leones. Los SNP contados donde las secuencias de leopardo de las nieves y leones compartieron un alelo derivado con exclusión del tigre (ABBA) y aquellos donde las secuencias de tigre y león compartieron un alelo derivado con exclusión del leopardo de las nieves ( BABA) y encontró:

Leopardo de nieve	Tiger	León	Gato doméstico	Recuentos
A	B	B	A	1,434,106
B	A	B	A	1,250,134

El estadístico calculado de ABBA-BABA, [EQN:Abba_baba], es\(0.07 \pm 0.0026~s.e.\), que es altamente significativamente diferente de cero. La dirección de esta estadística con un fuerte exceso de SNP derivados donde la secuencia del tigre está más cerca de la secuencia del león que el leopardo de las nieves, es consistente con el flujo de genes entre tigres y leones después de que los tigres se separaron de los leopardos de las nieves (Figura [Fig:Big_cat_ils]). Históricamente, los leones tenían un amplio rango geográfico, por lo que este mestizaje profundo en el pasado es plausible.

Resumen

Desarrollamos modelos simples de estructura poblacional neutra y desarrollamos expectativas de diferenciación de frecuencias alélicas según se mide\(F_{\mathrm{ST}}\) bajo estos modelos.
Bajo un modelo simple de aislamiento poblacional, la diferenciación de frecuencia alélica se acumula debido a la deriva genética en proporción al tiempo dividido por el tamaño de la población.
Solo un pequeño número de migrantes entre poblaciones por generación es suficiente para evitar la acumulación de diferenciación de frecuencias alélicas neutras.
La clasificación incompleta del linaje de la variación ancestral es una fuente de desacuerdo entre población/especies-árboles y árboles genéticos. Ocurre cuando los tiempos de división entre poblaciones están en sucesión lo suficientemente rápida como para que los linajes no tengan tiempo de coalescencia entre poblaciones más estrechamente relacionadas.
El flujo génico también puede conducir a patrones similares a la clasificación incompleta del linaje. Podemos probar entre un modelo de clasificación incompleta de linaje y flujo génico usando pruebas como ABBA-BABA.

Ejercicio\(\PageIndex{4}\)

Estás estudiando dos especies de peces (peces rojos y peces azules), y secuenciando un conjunto de pseudogenes. Aquí hay algunos datos que ha recopilado:

Una tercera especie de peces (peces negros) divergió del ancestro común del pez rojo/azul hace 3 millones de años. Asumir 1 generación de peces por año. Entre peces rojos y negros hay en promedio 1 sustitución cada 100 pares de bases.
En estos pseudogenes, dentro de los peces rojos, estimas que la heterocigosidad dentro de los peces rojos es\(10^{-4}\) por par de bases.
\(F_{ST}\)entre peces rojos y peces azules es 0.1.
No ha habido flujo de genes entre ninguna de estas especies después de su división.

¿Cuál es la tasa de mutación por base?
¿Cuál es el tamaño efectivo de la población de peces rojos?
¿Cuándo se dividieron las poblaciones de peces rojos y azules? Supongamos que tienen tamaños de población iguales.

Ejercicio\(\PageIndex{5}\)

Con referencia al árbol poblacional mostrado en la Figura [Fig:Abba_Neanderthal]:

En el árbol poblacional las líneas discontinuas muestran una filogenia génica incompleta (para un solo alelo extraído de cada población). En un locus, el linaje Chimp tiene el alelo A. Completar una genealogía génica de una manera que fuera consistente con linajes neandertales y europeos que comparten un alelo B derivado, con exclusión del linaje africano (ABBA). Marcar la rama en la que\(A \rightarrow B\) debe ocurrir una mutación para generar este patrón (asumiendo una sola mutación).
¿Cuál es la probabilidad de observar un árbol génico consistente con el que dibujó en la parte A bajo el modelo coalescente? Pista: Recuerde que la clasificación incompleta del linaje se debe a que no se fusionan dentro de una población ancestral. Asumir un tiempo de generación de 30 años, y un tamaño de población efectiva de 10,000 en todas las poblaciones. Además, supongamos que los linajes muestreados de las poblaciones neandertales y humanas modernas definitivamente se fusionarán entre sí ante la población ancestral común con chimpancé.

Search

Text Color

Text Size

Margin Size

Font Type

Ejercicio\(\PageIndex{1}\)

Ejercicio\(\PageIndex{1}\)

Ejercicio\(\PageIndex{4}\)

Ejercicio\(\PageIndex{5}\)