Saltar al contenido principal
LibreTexts Español

10.2: Procesos de ramificación

  • Page ID
    150242
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Antecedentes Históricos

    En esta sección aplicamos la teoría de la generación de funciones al estudio de un importante proceso de azar llamado

    Hasta hace poco se pensaba que la teoría de los procesos de ramificación se originó con el siguiente problema planteado por Francis Galton en el en 1873. 1

    Problema 4001: Una nación grande, de la cual sólo nos ocuparemos de los machos adultos,\(N\) en número, y que cada uno lleva apellidos separados, coloniza un distrito. Su ley de población es tal que, en cada generación,\(a_0\) por ciento de los varones adultos no tienen hijos varones que alcancen la vida adulta;\(a_1\) tienen uno de esos hijos varones;\(a_2\) tienen dos; y así sucesivamente hasta\(a_5\) que tengan cinco.

    Encontrar (1) qué proporción de los apellidos se habrá extinguido después de\(r\) generaciones; y (2) cuántas instancias habrá del mismo apellido en poder de\(m\) personas.

    El primer intento de solución lo dio el reverendo H. W. Watson. Debido a un error en álgebra, concluyó incorrectamente que un apellido siempre se extinguiría con probabilidad 1. No obstante, los métodos que empleó para resolver los problemas fueron, y siguen siendo, la base para obtener la solución correcta.

    Heyde y Seneta descubrieron una comunicación anterior de Bienaymé (1845) que anticipaba a Galton y Watson por 28 años. Bienaymé demostró, de hecho, que estaba al tanto de la solución correcta al problema de Galton. Heyde y Seneta en su libro 2 dan la siguiente traducción de la ponencia de Bienaymé:

    Si... la media del número de hijos varones que reemplazan al número de varones de la generación anterior fuera menor que la unidad, fácilmente se percataría que las familias están desapareciendo por la desaparición de los integrantes de los que están compuestas. No obstante, el análisis muestra además que cuando esta media es igual a la unidad las familias tienden a desaparecer, aunque con menor rapidez...

    El análisis también muestra claramente que si la relación media es mayor que la unidad, la probabilidad de extinción de familias con el paso del tiempo ya no se reduce a la certeza. Sólo se acerca a un límite finito, que es bastante sencillo de calcular y que tiene la característica singular de estar dada por una de las raíces de la ecuación (en la que el número de generaciones se hace infinito) que no es relevante para la pregunta cuando la relación media es menor que la unidad. 3

    Si bien Bienaymé no da su razonamiento para estos resultados, sí indicó que pretendía publicar un artículo especial sobre el problema. El artículo nunca fue escrito, o al menos nunca se ha encontrado. En su comunicación Bienaymé indicó que estaba motivado por el mismo problema que se le ocurrió a Galton. El párrafo inicial de su ponencia traducido por Heyde y Seneta dice:

    Se ha dado mucha consideración a la posible multiplicación de los números de la humanidad; y recientemente se han publicado diversas observaciones muy curiosas sobre el destino que supuestamente pende sobre las clases aristocráticas y medias; las familias de hombres famosos, etc. Este destino, se alega, voluntad inevitablemente traen consigo la desaparición de los llamados 4

    Una discusión mucho más extensa sobre la historia de los procesos de ramificación se puede encontrar en dos ponencias de David G. Kendall. 5

    Los procesos de ramificación han servido no solo como modelos crudos para el crecimiento de la población sino también como modelos para ciertos procesos físicos como las reacciones en cadena químicas y nucleares.

    Problema de extinción

    Pasamos ahora al primer problema que plantea Galton (es decir, el problema de encontrar la probabilidad de extinción para un proceso de ramificación). Comenzamos en la 0ª generación con 1 progenitor masculino. En la primera generación tendremos 0, 1, 2, 3,... descendencia masculina con probabilidades\(p_0\),\(p_1\),\(p_2\),\(p_3\),... Si en la primera generación hay\(k\) descendencia, entonces en la segunda generación habrá\(X_1 + X_2 +\cdots+ X_k\) descendencia, donde,\(X_1\),...\(X_2\),\(X_k\) son variables aleatorias independientes, cada una con la distribución común\(p_0\),\(p_1\),\(p_2\),... Esta descripción nos permite construir un árbol, y una medida de árbol, para cualquier número de generaciones.

    Ejemplo\(\PageIndex{1}\)

    Supongamos que\(p_0 = 1/2\)\(p_1 = 1/4\),, y\(p_2 = 1/4\). A continuación, la medida de árbol para las dos primeras generaciones se muestra en la Figura [fig 10.1].

    Solución

    Tenga en cuenta que utilizamos la teoría de sumas de variables aleatorias independientes para asignar probabilidades de rama. Por ejemplo, si hay dos crías en la primera generación, la probabilidad de que haya dos en la segunda generación es

    \[\begin{aligned} P(X_1 + X_2 = 2) &=& p_0p_2 + p_1p_1 + p_2p_0 \\ &=& \frac12\cdot\frac14 + \frac14\cdot\frac14 + \frac14\cdot\frac12 = \frac 5{16}\ .\end{aligned}\]

    Ahora estudiamos la probabilidad de que nuestro proceso se extingue (es decir, que en alguna generación no haya descendencia).

    \(d_m\)Sea la probabilidad de que el proceso se agote por la generación\(m\) th. Por supuesto,\(d_0 = 0\). En nuestro ejemplo,\(d_1 = 1/2\) y\(d_2 = 1/2 + 1/8 + 1/16 = 11/16\) (ver Figura [fig 10.1]). Tenga en cuenta que debemos agregar las probabilidades para todos los caminos que conducen a 0 por la generación\(m\) th. De la definición queda claro que\[0 = d_0 \leq d_1 \leq d_2 \leq\cdots\leq 1\ .\] De ahí,\(d_m\) converge a un límite\(d\),\(0 \leq d \leq 1\), y\(d\) es la probabilidad de que el proceso finalmente se extingue. Es este valor el que deseamos determinar. Comenzamos expresando el valor\(d_m\) en términos de todos los resultados posibles en la primera generación. Si hay\(j\) descendencia en la primera generación, entonces para morir por la generación\(m\) th, cada una de estas líneas debe morir en\(m - 1\) generaciones. Ya que proceden de manera independiente, esta probabilidad es\((d_{m - 1})^j\). Por lo tanto

    \[d_m = p_0 + p_1d_{m - 1} + p_2(d_{m - 1})^2 + p_3(d_{m - 1})^3 +\cdots\ . \label{eq 10.2.1}\]Dejar\(h(z)\) ser la función generadora ordinaria para el\(p_i\):\[h(z) = p_0 + p_1z + p_2z^2 +\cdots\ .\] Usando esta función generadora, podemos reescribir la ecuación [eq 10.2.1] en la forma

    \[d_m = h(d_{m - 1})\ . \label{eq 10.2.2}\]

    Ya que\(d_m \to d\), por la Ecuación [eq 10.2.2] vemos\(d\) que el valor que estamos buscando satisface la ecuación

    \[d = h(d)\ . \label{eq 10.2.3}\]

    Una solución de esta ecuación es siempre\(d = 1\), ya que\[1 = p_0 + p_1 + p_2 +\cdots\ .\] aquí es donde Watson cometió su error. Supuso que 1 era la única solución a la Ecuación [eq 10.2.3]. Para examinar esta pregunta con más detenimiento, primero observamos que las soluciones a la Ecuación [eq 10.2.3] representan intersecciones de las gráficas de\[y = z\] y\[y = h(z) = p_0 + p_1z + p_2z^2 +\cdots\ .\] Así necesitamos estudiar la gráfica de\(y = h(z)\). Tomamos nota de eso\(h(0) = p_0\). También,\[h'(z) = p_1 + 2p_2z + 3p_3z^2 +\cdots\ , \label{eq 10.2.4}\] y\[h''(z) = 2p_2 + 3 \cdot 2p_3z + 4 \cdot 3p_4z^2 + \cdots\ .\] De esto vemos que para\(z \geq 0\),\(h'(z) \geq 0\) y\(h''(z) \geq 0\). Así para los no negativos\(z\),\(h(z)\) es una función creciente y es cóncava hacia arriba. Por lo tanto, la gráfica de\(y = h(z)\) puede intersectar la línea\(y = z\) en como máximo dos puntos. Como sabemos que debe intersectar la línea\(y = z\) en\((1,1)\), sabemos que solo hay tres posibilidades, como se muestra en la Figura [fig 10.2].

    En el caso (a) la ecuación\(d = h(d)\) tiene raíces\(\{d,1\}\) con\(0 \leq d < 1\). En el segundo caso (b) sólo tiene la única raíz\(d = 1\). En el caso (c) tiene dos raíces\(\{1,d\}\) donde\(1 < d\). Ya que estamos buscando una solución\(0 \leq d \leq 1\), vemos en los casos (b) y (c) que nuestra única solución es la 1. En estos casos podemos concluir que el proceso se extinguirá con probabilidad 1. Sin embargo en el caso (a) estamos en duda. Debemos estudiar este caso con más detenimiento.

    De la Ecuación [eq 10.2.4] vemos que\[h'(1) = p_1 + 2p_2 + 3p_3 +\cdots= m\ ,\] donde\(m\) está el número esperado de descendencia producida por un solo progenitor. En el caso (a) tenemos\(h'(1) > 1\), en (b)\(h'(1) = 1\), y en (c)\(h'(1) < 1\). Así nuestros tres casos corresponden a\(m > 1\),\(m = 1\), y\(m < 1\). Asumimos ahora eso\(m > 1\). Recordemos que\(d_0 = 0\)\(d_1 = h(d_0) = p_0\),,\(d_2 = h(d_1)\),..., y\(d_n = h(d_{n - 1})\). Podemos construir estos valores geométricamente, como se muestra en la Figura [fig 10.3].

    Podemos ver geométricamente, como se indica para\(d_0\),\(d_1\)\(d_2\), y\(d_3\) en la Figura [fig 10.3], que los puntos siempre\((d_i,h(d_i))\) estarán por encima de la línea\(y = z\). Por lo tanto, deben converger a la primera intersección de las curvas\(y = z\) y\(y = h(z)\) (es decir, a la raíz\(d < 1\)). Esto nos lleva al siguiente teorema.

    [thm 10.3] Considera un proceso de ramificación con función generadora\(h(z)\) para el número de descendencia de un progenitor dado. \(d\)Sea la raíz más pequeña de la ecuación\(z = h(z)\). Si el número medio\(m\) de descendencia producida por un solo progenitor es\({} \leq 1\), entonces\(d = 1\) y el proceso se extingue con probabilidad 1. Si\(m > 1\) entonces\(d < 1\) y el proceso se extingue con probabilidad\(d\).

    A menudo vamos a querer conocer la probabilidad de que un proceso de ramificación se extingue por una generación en particular, así como el límite de estas probabilidades. \(d_n\)Sea la probabilidad de morir por la generación\(n\) th. Entonces eso lo sabemos\(d_1 = p_0\). Sabemos además que\(d_n = h(d_{n - 1})\) dónde\(h(z)\) está la función generadora para el número de crías producidas por un solo progenitor. Esto facilita el cálculo de estas probabilidades.

    El programa Rama calcula los valores de\(d_n\). Hemos ejecutado este programa por 12 generaciones para el caso de que un padre pueda producir como máximo dos crías y las probabilidades para el número producido son\(p_0 = .2\),\(p_1 = .5\), y\(p_2 = .3\). Los resultados se dan en la Tabla [cuadro 10.1].

    Probabilidad de morir.
    1 .2
    2 .312
    3 .385203
    4 .437116
    5 .475879
    6 .505878
    7 .529713
    8 .549035
    9 .564949
    10 .578225
    11 .589416
    12 .598931

    Vemos que la probabilidad de morir por 12 generaciones es de aproximadamente .6. Veremos en el siguiente ejemplo que la probabilidad de eventualmente desaparecer es de 2/3, por lo que incluso 12 generaciones no son suficientes para dar una estimación precisa de esta probabilidad.

    Ahora asumimos que a lo sumo se pueden producir dos crías. Entonces\[h(z) = p_0 + p_1z + p_2z^2\ .\] en este simple caso la condición\(z = h(z)\) produce la ecuación\[d = p_0 + p_1d + p_2d^2\ ,\] que se satisface por\(d = 1\) y\(d = p_0/p_2\). Así, además de la raíz\(d = 1\) tenemos la segunda raíz\(d = p_0/p_2\). El número medio\(m\) de crías producidas por un solo progenitor es\[m = p_1 + 2p_2 = 1 - p_0 - p_2 + 2p_2 = 1 - p_0 + p_2\ .\] Así, si\(p_0 > p_2\),\(m < 1\) y la segunda raíz es\({} > 1\). Si\(p_0 = p_2\), tenemos una doble raíz\(d = 1\). Si\(p_0 < p_2\),\(m > 1\) y la segunda raíz\(d\) es menor que 1 y representa la probabilidad de que el proceso se extingue.

    [examen 10.2.3] Keyfitz 6 compiló y analizó datos sobre la continuación de la línea familiar femenina entre las mujeres japonesas. Sus estimaciones en la distribución de probabilidad básica para el número de niñas nacidas de mujeres japonesas de 45 a 49 años en 1960 se dan en la Tabla [tabla 10.2].

    \[\begin{array}{rl} p_0 &= .2092 \\ p_1 &= .2584 \\ p_2 &= .2360 \\ p_3 &= .1593 \\ p_4 &= .0828 \\ p_5 &= .0357 \\ p_6 &= .0133 \\ p_7 &= .0042 \\ p_8 &= .0011 \\ p_9 &= .0002 \\ p_{10} &= .0000\ \end{array}\]

    El número esperado de niñas en una familia es entonces de 1.837 por lo que la probabilidad\(d\) de extinción es menor a 1. Si ejecutamos el programa Sucursal, podemos estimar que\(d\) es de hecho sólo alrededor de .324.

    Distribución de la descendencia

    Hasta el momento sólo hemos considerado el primero de los dos problemas planteados por Galton, a saber, la probabilidad de extinción. Consideramos ahora el segundo problema, es decir, la distribución del número\(Z_n\) de crías en la generación\(n\) th. Se desconoce la forma exacta de la distribución salvo en casos muy especiales. Veremos, sin embargo, que podemos describir el comportamiento limitante de\(Z_n\) as\(n \to \infty\).

    Primero mostramos que la función generadora\(h_n(z)\) de la distribución de se\(Z_n\) puede obtener de\(h(z)\) para cualquier proceso de ramificación.

    Recordamos que el valor de la función generadora en el valor\(z\) para cualquier variable aleatoria\(X\) puede escribirse como Es\[h(z) = E(z^X) = p_0 + p_1z + p_2z^2 +\cdots\ .\] decir,\(h(z)\) es el valor esperado de un experimento que tiene resultado\(z^j\) con probabilidad\(p_j\).

    Let\(S_n = X_1 + X_2 +\cdots+ X_n\) donde cada uno\(X_j\) tiene la misma distribución de valor entero\((p_j)\) con función generadora\(k(z) = p_0 + p_1z + p_2z^2 +\cdots.\) Let\(k_n(z)\) ser la función generadora de\(S_n\). Luego usando una de las propiedades de las funciones generadoras ordinarias discutidas en la Sección [sec 10.1], tenemos\[k_n(z) = (k(z))^n\ ,\] ya que los\(X_j\)'s son independientes y todos tienen la misma distribución.

    Consideremos ahora el proceso de ramificación\(Z_n\). Dejar\(h_n(z)\) ser la función generadora de\(Z_n\). Entonces\[\begin{aligned} h_{n + 1}(z) &=& E(z^{Z_{n + 1}}) \\ &=& \sum_k E(z^{Z_{n + 1}} | Z_n = k) P(Z_n = k)\ .\end{aligned}\] Si\(Z_n = k\), entonces\(Z_{n + 1} = X_1 + X_2 +\cdots+ X_k\) donde\(X_1\),\(X_2\),...,\(X_k\) son variables aleatorias independientes con función generadora común\(h(z)\). Así

    \[E(z^{Z_{n + 1}} | Z_n = k) = E(z^{X_1 + X_2 +\cdots+ X_k}) = (h(z))^k\ ,\]

    y

    \[h_{n + 1}(z) = \sum_k (h(z))^k P(Z_n = k)\ .\]Pero\[h_n(z) = \sum_k P(Z_n = k) z^k\ .\]

    Por lo tanto,\[h_{n + 1}(z) = h_n(h(z))\ . \label{eq 10.2.5}\]

    Si diferenciamos la ecuación [eq 10.2.5] y usamos la regla de la cadena tenemos\[h'_{n+1}(z) = h'_n(h(z)) h'(z) .\]

    Poniendo\(z = 1\) y usando el hecho de que\(h(1) = 1\)\(h'(1) = m\),, y\(h_n'(1) = m_n = {}\) el número medio de descendencia en la\(n\) 'ésima generación, tenemos\[m_{n + 1} = m_n \cdot m\ .\] Así\(m_2 = m \cdot m = m^2\),,\(m_3 = m^2 \cdot m = m^3\), y en general\[m_n = m^n\ .\]

    Así, para un proceso de ramificación con\(m > 1\), el número medio de crías crece exponencialmente a una velocidad\(m\).

    Ejemplo\(\PageIndex{2}\)

    Para el proceso de ramificación del Ejemplo [examen 10.2.1] tenemos\[\begin{aligned} h(z) &=& 1/2 + (1/4)z + (1/4)z^2\ , \\ h_2(z) &=& h(h(z)) = 1/2 + (1/4)[1/2 + (1/4)z + (1/4)z^2] \\ &=& + (1/4)[1/2 + (1/4)z + (1/4)z^2]^2 \\ &=& 11/16 + (1/8)z + (9/64)z^2 + (1/32)z^3 + (1/64)z^4\ .\end{aligned}\] Las probabilidades para el número de crías en la segunda generación concuerdan con las obtenidas directamente de la medida del árbol (ver Figura 1).

    Es claro que incluso en el caso simple de como máximo dos crías, no podemos llevar a cabo fácilmente el cálculo de\(h_n(z)\) por este método. No obstante, hay un caso especial en el que esto se puede hacer.

    Ejemplo\(\PageIndex{2}\)

    Supongamos que las probabilidades\(p_1\),\(p_2\),... forman una serie geométrica:\(p_k = bc^{k - 1}\),\(k = 1\),, 2,..., con\(0 < b \leq 1 - c\) y\(0 < c < 1\). Entonces tenemos\[\begin{aligned} p_0 &=& 1 - p_1 - p_2 -\cdots \\ &=& 1 - b - bc - bc^2 -\cdots \\ &=& 1 - \frac b{1 - c}\ .\end{aligned}\] La función generadora\(h(z)\) para esta distribución es\[\begin{aligned} h(z) &=& p_0 + p_1z + p_2z^2 +\cdots \\ &=& 1 - \frac b{1 - c} + bz + bcz^2 + bc^2z^3 +\cdots \\ &=& 1 - \frac b{1 - c} + \frac{bz}{1 - cz}\ .\end{aligned}\] A partir de esto nos\[m = h'(1) = \frac b{(1 - c)^2}\ .\] encontramos\[h'(z) = \frac{bcz}{(1 - cz)^2} + \frac b{1 - cz} = \frac b{(1 - cz)^2}\] y sabemos que si\(m \leq 1\) el proceso seguramente se extinguirá y\(d = 1\). Para encontrar la probabilidad\(d\) cuando\(m > 1\) debemos encontrar una raíz\(d < 1\) de la ecuación\[z = h(z)\ ,\] o\[z = 1 - \frac b{1 - c} + \frac{bz}{1 - cz}.\] Esto nos lleva a una ecuación cuadrática. Sabemos que\(z = 1\) es una solución. El otro se encuentra para ser\[d = \frac{1 - b - c}{c(1 - c)}.\] Es fácil verificar que\(d < 1\) justo cuando\(m > 1\).

    Es posible en este caso encontrar la distribución de\(Z_n\). Esto se hace encontrando primero la función generadora\(h_n(z)\). 7 El resultado para\(m \ne 1\) es:\[h_n(z) = 1 - m^n \left[\frac{1 - d}{m^n - d}\right] + \frac{m^n \left[\frac{1 - d}{m^n - d}\right]^2 z} {1 - \left[\frac{m^n - 1}{m^n - d}\right]z}\ .\] Los coeficientes de las facultades de\(z\) dar la distribución para\(Z_n\):

    \[P(Z_n = 0) = 1 - m^n\frac{1 - d}{m^n - d} = \frac{d(m^n - 1)}{m^n - d}\]y\[P(Z_n = j) = m^n \Bigl(\frac{1 - d}{m^n - d}\Bigr)^2 \cdot \Bigl(\frac{m^n - 1}{ m^n - d}\Bigr)^{j - 1},\]

    para\(j \geq 1\).

    [examen 10.2.4.5] Volvamos a examinar los datos de Keyfitz para ver si una distribución del tipo considerado en el Ejemplo [examen 10.2.4] podría razonablemente utilizarse como modelo para esta población. Tendríamos que estimar a partir de los datos los parámetros\(b\) y\(c\) para la fórmula\(p_k = bc^{k - 1}\). Recordemos eso\[m = \frac b{(1 - c)^2} \label{eq 10.2.7}\] y la probabilidad de\(d\) que el proceso se agote es\[d = \frac{1 - b - c}{c(1 - c)}\ . \label{eq 10.2.8}\] Resolver Ecuación [eq 10.2.7] y [eq 10.2.8] para\(b\) y\(c\) da\[c = \frac{m - 1}{m - d}\] y\[b = m\Bigl(\frac{1 - d}{m - d}\Bigr)^2\ .\]

    Usaremos el valor 1.837 para\(m\) y .324 para el\(d\) que encontramos en el ejemplo de Keyfitz. Usando estos valores, obtenemos\(b = .3666\) y\(c = .5533\). Tenga en cuenta que\((1 - c)^2 < b < 1 - c\), según se requiera. En la Tabla [tabla 10.3] damos para comparación las probabilidades\(p_0\) a través de\(p_8\) las calculadas por la distribución geométrica versus los valores empíricos.

    Comparación de frecuencias observadas y esperadas.
    Geométrico
    \(p_j\) Datos Modelo
    0 .2092 .1816
    1 .2584 .3666
    2 .2360 .2028
    3 .1593 .1122
    4 .0828 .0621
    5 .0357 .0344
    6 .0133 .0190
    7 .0042 .0105
    8 .0011 .0058
    9 .0002 .0032
    10 .0000 .0018

    El modelo geométrico tiende a favorecer el mayor número de crías pero es lo suficientemente similar como para mostrar que esta distribución geométrica modificada podría ser apropiada para su uso en estudios de este tipo.

    Recordemos que si\(S_n = X_1 + X_2 +\cdots+ X_n\) es la suma de variables aleatorias independientes con la misma distribución entonces la Ley de Números Grandes establece que\(S_n/n\) converge a una constante, a saber\(E(X_1)\). Es natural preguntarse si existe un teorema limitante similar para los procesos de ramificación.

    Considera un proceso de ramificación con la\(Z_n\) representación del número de crías después de\(n\) generaciones. Entonces hemos visto que el valor esperado de\(Z_n\) es\(m^n\). Así podemos escalar la variable aleatoria\(Z_n\) para que tenga el valor esperado 1 considerando la variable aleatoria\[W_n = \frac{Z_n}{m^n}\ .\]

    En la teoría de los procesos de ramificación se demuestra que esta variable aleatoria\(W_n\) tenderá a un límite como\(n\) tiende al infinito. Sin embargo, a diferencia del caso de la Ley de Números Grandes donde este límite es una constante, para un proceso de ramificación el valor limitante de las variables aleatorias\(W_n\) es en sí mismo una variable aleatoria.

    Aunque no podemos probar este teorema aquí podemos ilustrarlo por simulación. Esto requiere un poco de cuidado. Cuando sobrevive un proceso de ramificación, el número de crías es apto para llegar a ser muy grande. Si en una generación dada hay 1000 crías, las crías de la siguiente generación son el resultado de 1000 eventos fortuitos, y tardará un tiempo en simular estos 1000 experimentos. Sin embargo, dado que el resultado final es la suma de 1000 experimentos independientes podemos usar el Teorema del Límite Central para reemplazar estos 1000 experimentos por un solo experimento con densidad normal que tenga la media y varianza apropiadas. El programa BranchingSimulation lleva a cabo este proceso.

    Hemos corrido este programa para el ejemplo de Keyfitz, realizando 10 simulaciones y graficando los resultados en la Figura [fig 10.4].

    El número esperado de crías femeninas por hembra es de 1.837, por lo que estamos graficando el resultado para las variables aleatorias\(W_n = Z_n/(1.837)^n\). Para tres de las simulaciones el proceso se extinguió, lo que es consistente con el valor\(d = .3\) que encontramos para este ejemplo. Para las otras siete simulaciones el valor de\(W_n\) tiende a un valor limitante que es diferente para cada simulación.

    [examen 10.2.4.6] Ahora examinamos la variable aleatoria\(Z_n\) más de cerca para el caso\(m < 1\) (ver Ejemplo [examen 10.2.4]). Fijar un valor\(t > 0\); dejar\([tm^n]\) ser la parte entera de\(tm^n\). Entonces\[\begin{aligned} P(Z_n = [tm^n]) &=& m^n (\frac{1 - d}{m^n - d})^2 (\frac{m^n - 1}{m^n - d}) ^{[tm^n] - 1} \\ &=& \frac1{m^n}(\frac{1 - d}{1 - d/m^n})^2 (\frac{1 - 1/m^n} {1 - d/m^n})^{tm^n + a}\ ,\end{aligned}\] donde\(|a| \leq 2\). Así, como\(n \to \infty\),\[m^n P(Z_n = [tm^n]) \to (1 - d)^2 \frac{e^{-t}}{e^{-td}} = (1 - d)^2 e^{-t(1 - d)}\ .\] For\(t = 0\),\[P(Z_n = 0) \to d\ .\] Podemos comparar este resultado con el Teorema de Límite Central para sumas\(S_n\) de variables aleatorias independientes de valor entero (ver Teorema [thm 9.3.5]), que establece que si\(t\) es un entero y\(u = (t - n\mu)/\sqrt{\sigma^2 n}\), entonces como\(n \to \infty\), \[\sqrt{\sigma^2 n}\, P(S_n = u\sqrt{\sigma^2 n} + \mu n) \to \frac1{\sqrt{2\pi}} e^{-u^2/2}\ .\]Vemos que la forma de estas declaraciones es bastante similar. Es posible probar un teorema límite para una clase general de procesos de ramificación que establece que bajo hipótesis adecuadas, como,\[m^n P(Z_n = [tm^n]) \to k(t)\ ,\] para\(n \to \infty\), y\[P(Z_n = 0) \to d\ .\] Sin embargo\(t > 0\), a diferencia del Teorema de Límite Central para sumas de variables aleatorias independientes, la función\(k(t)\) dependerá sobre la distribución básica que determina el proceso. Su forma es conocida por sólo unos pocos ejemplos similares al que hemos considerado aquí.

    Problema de letras en cadena

    [examen 10.2.5] Un ejemplo interesante de un proceso de ramificación fue sugerido por Free Huizinga. 8 En 1978, una carta en cadena llamada “Círculo de Oro”, que se cree que comenzó en California, encontró su camino a través del país hasta el distrito teatral de Nueva York. La cadena requería que un participante comprara una carta que contenía una lista de 12 nombres por 100 dólares. El comprador entrega 50 dólares a la persona a quien le fue comprada la carta y luego envía 50 dólares a la persona cuyo nombre está en la parte superior de la lista. El comprador luego tachó el nombre en la parte superior de la lista y agrega su propio nombre en la parte inferior de cada letra antes de que se vuelva a vender.

    Supongamos primero que el comprador puede vender la carta sólo a una sola persona. Si compras la carta querrás calcular tus ganancias esperadas. (Estamos ignorando aquí el hecho de que el paso de cartas en cadena a través del correo es un delito federal con ciertas sanciones obvias resultantes.) Supongamos que cada persona involucrada tiene una probabilidad\(p\) de vender la carta. Entonces recibirás 50 dólares con probabilidad\(p\) y otros 50 dólares si la carta se vende a 12 personas, desde entonces tu nombre habría subido a lo más alto de la lista. Esto ocurre con probabilidad\(p^{12}\), y así lo son tus ganancias esperadas\(-100 + 50p + 50p^{12}\). Así la cadena en esta situación es un juego altamente desfavorable.

    Sería más razonable permitir que cada persona involucrada haga una copia de la lista e intente vender la carta a al menos otras 2 personas. Entonces tendrías la oportunidad de recuperar tus 100 dólares en estas ventas, y si alguna de las cartas se vende 12 veces recibirás un bono de 50 dólares por cada uno de estos casos. Podemos considerar esto como un proceso de ramificación con 12 generaciones. Los miembros de la primera generación son las cartas que vendes. La segunda generación consiste en las cartas vendidas por los miembros de la primera generación, y así sucesivamente.

    Supongamos que las probabilidades de que cada individuo venda letras a 0, 1 o 2 otras son\(p_0\)\(p_1\), y\(p_2\), respectivamente. \(Z_{12}\)Sea\(Z_1\),\(Z_2\),..., el número de letras en las primeras 12 generaciones de este proceso de ramificación. Entonces tus ganancias esperadas están\[50(E(Z_1) + E(Z_{12})) = 50m + 50m^{12}\ ,\] donde\(m = p_1 + 2p_2\) está el número esperado de letras que vendiste. Así para ser favorables acabamos de tener\[50m + 50m^{12} > 100\ ,\] o\[m + m^{12} > 2\ .\] Pero esto será cierto si y sólo si\(m > 1\). Hemos visto que esto ocurrirá en el caso cuadrático si y sólo si\(p_2 > p_0\). Supongamos por ejemplo eso\(p_0 = .2\),\(p_1 = .5\), y\(p_2 = .3\). Entonces\(m = 1.1\) y la cadena sería un juego favorable. Su beneficio esperado sería\[50(1.1 + 1.1^{12}) - 100 \approx 112\ .\]

    La probabilidad de que recibas al menos un pago de la 12ª generación es\(1 - d_{12}\). Encontramos de nuestro programa Sucursal que\(d_{12} = .599\). Así,\(1 - d_{12} = .401\) es la probabilidad de que recibas algún bono. El máximo que podrías recibir de la cadena sería\(50(2 + 2^{12}) = 204{,}900\) si todos vendieran con éxito dos letras. Por supuesto que no siempre se puede esperar tener tanta suerte. (¿Cuál es la probabilidad de que esto suceda?)

    Para simular este juego, solo necesitamos simular un proceso de ramificación durante 12 generaciones. Utilizando una versión ligeramente modificada de nuestro programa BranchingSimulation realizamos veinte simulaciones de este tipo, dando los resultados mostrados en la Tabla [tabla 10.4].

    Tenga en cuenta que tuvimos bastante suerte en algunas carreras, pero salimos adelante solo un poco menos de la mitad del tiempo. El proceso se extinguió por la duodécima generación en 12 de los 20 experimentos, en buena concordancia con la probabilidad\(d_{12} = .599\) que calculamos utilizando el programa Branch.

    \[\begin{tabular}{rrrrrrrrrrrrr} $Z_{1}$&$Z_{2}$&$ Z_{3}$& $Z_{4}$& $Z_{5}$& $Z_{6}$& $Z_{7}$& $Z_{8}$& $Z_{9}$&$ Z_{10}$&$ Z_{11}$& $Z_{12}$& Profit\\\hline 1 &0 &0 &0 &0 & 0 & 0 &0 &0 &0 &0 &0 &-50\\ 1 &1 &2 &3 &2 & 3 & 2 &1 &2 &3 &3 &6 &250\\ 0 &0 &0 &0 &0 & 0 & 0 &0 &0 &0 &0 &0 &-100\\ 2 &4 &4 &2 &3 & 4 & 4 &3 &2 &2 &1 &1 & 50\\ 1 &2 &3 &5 & 4 & 3 & 3 &3 &5 &8 &6 &6 & 250\\ 0 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 &-100\\ 2 &3 &2 &2 & 2 & 1 & 2 &3 &3 &3 &4 &6 & 300\\ 1 &2 &1 &1 & 1 & 1 & 2 &1 &0 &0 &0 &0 & -50\\ 0 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 &-100\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 2 &3 &2 &3 & 3 & 3 & 5 &9 &12 &12 &13 &15 & 750\\ 1 &1 &1 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &2 &2 &3 & 3 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &1 &1 &1 & 2 & 2 & 3 &4 &4 &6 &4 &5 & 200\\ 1 &1 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &1 &2 &3 & 3 & 4 & 2 &3 &3 &3 &3 &2 & 50\\ 1 &2 &4 &6 & 6 & 9 &10 &13 &16 &17 &15 &18 & 850\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ \end{tabular}\]

    Modifiquemos los supuestos sobre nuestra carta en cadena para permitir que el comprador venda la carta a tantas personas como pueda en lugar de a un máximo de dos. Supondremos, de hecho, que una persona tiene un gran número\(N\) de conocidos y una pequeña probabilidad\(p\) de persuadir a cualquiera de ellos para que compre la carta. Entonces la distribución por el número de letras que venda será una distribución binomial con media\(m = Np\). Dado que\(N\) es grande y\(p\) es pequeño, podemos suponer que la probabilidad de\(p_j\) que un individuo venda la carta a la\(j\) gente viene dada por la distribución de Poisson\[p_j = \frac{e^{-m} m^j}{j!}\ .\] La función generadora para la distribución de Poisson es\[\begin{aligned} h(z) &=& \sum_{j = 0}^\infty \frac{e^{-m} m^j z^j}{j!} \\ &=& e^{-m} \sum_{j = 0}^\infty \frac{m^j z^j}{j!} \\ &=& e^{-m} e^{mz} = e^{m(z - 1)}\ .\end{aligned}\]

    El número esperado de letras que un individuo transmite es\(m\), y nuevamente para ser favorables debemos tener\(m > 1\). Supongamos de nuevo eso\(m = 1.1\). Entonces podemos encontrar de nuevo la probabilidad\(1 - d_{12}\) de un bono de Branch. El resultado es .232. Aunque las ganancias esperadas son las mismas, la varianza es mayor en este caso, y el comprador tiene más posibilidades de obtener una ganancia razonablemente grande. Se realizaron nuevamente 20 simulaciones utilizando la distribución de Poisson con media 1.1. Los resultados se muestran en la Tabla [cuadro 10.5].

    \[\begin{tabular}{rrrrrrrrrrrrr} $Z_{1}$&$Z_{2}$&$ Z_{3}$& $Z_{4}$& $Z_{5}$& $Z_{6}$& $Z_{7}$& $Z_{8}$& $Z_{9}$&$ Z_{10}$&$ Z_{11}$& $Z_{12}$& Profit\\\hline 1 &2 &6 &7 &7 & 8 & 11 &9 &7 &6 &6 &5 & 200\\ 1 &0 &0 &0 &0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &0 &0 &0 &0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 1 &1 &1 &0 &0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 0 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -100\\ 1 &1 &1 &1 & 1 & 1 & 2 &4 &9 &7 &9 &7 & 300\\ 2 &3 &3 &4 & 2 & 0 & 0 &0 &0 &0 &0 &0 & 0\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 2 &1 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & 0\\ 3 &3 &4 &7 & 11 & 17 & 14 &11 &11 &10 &16 &25 & 1300\\ 0 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -100\\ 1 &2 &2 &1 & 1 & 3 & 1 &0 &0 &0 &0 &0 & -50\\ 0 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -100\\ 2 &3 &1 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & 0\\ 3 &1 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & 50\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ 3 &4 &4 &7 &10 &11 & 9 &11 &12 &14 &13 &10 & 550\\ 1 &3 &3 &4 & 9 & 5 & 7 &9 &8 &8 &6 &3 & 100\\ 1 &0 &4 &6 & 6 & 9 &10 &13 &0 &0 &0 &0 & -50\\ 1 &0 &0 &0 & 0 & 0 & 0 &0 &0 &0 &0 &0 & -50\\ \end{tabular}\]

    Observamos que, como antes, salimos adelante menos de la mitad del tiempo, pero también tuvimos una gran ganancia. En solo 6 de los 20 casos recibimos alguna ganancia. Esto vuelve a estar de acuerdo razonable con nuestro cálculo de una probabilidad .232 para que esto suceda.

    i [exer 10.2.1] Dejar\(Z_1\),,...\(Z_2\),\(Z_N\) describir un proceso de ramificación en el que cada progenitor tiene\(j\) descendencia con probabilidad\(p_j\). Encuentra la probabilidad de\(d\) que el proceso finalmente se agote si

    1. \(p_0 = 1/2\),\(p_1 = 1/4\), y\(p_2 = 1/4\).

    2. \(p_0 = 1/3\),\(p_1 = 1/3\), y\(p_2 = 1/3\).

    3. \(p_0 = 1/3\),\(p_1 = 0\), y\(p_2 = 2/3\).

    4. \(p_j = 1/2^{j + 1}\), para\(j = 0\), 1, 2,...

    5. \(p_j = (1/3)(2/3)^j\), para\(j = 0\), 1, 2,...

    6. \(p_j = e^{-2} 2^j/j!\), para\(j = 0\), 1, 2,... (estimar\(d\) numéricamente).

    i [exer 10.2.2] Dejar\(Z_1\),,...\(Z_2\),\(Z_N\) describir un proceso de ramificación en el que cada progenitor tiene\(j\) descendencia con probabilidad\(p_j\). Encuentra la probabilidad de\(d\) que el proceso se agote si

    1. \(p_0 = 1/2\),\(p_1 = p_2 = 0\), y\(p_3 = 1/2\).

    2. \(p_0 = p_1 = p_2 = p_3 = 1/4\).

    3. \(p_0 = t\),\(p_1 = 1 - 2t\),\(p_2 = 0\), y\(p_3 = t\), donde\(t \leq 1/2\).

    i [exer 10.2.3] En el problema de la letra en cadena (ver Ejemplo [examen 10.2.5]) encuentra tu beneficio esperado si

    1. \(p_0 = 1/2\),\(p_1 = 0\), y\(p_2 = 1/2\).

    2. \(p_0 = 1/6\),\(p_1 = 1/2\), y\(p_2 = 1/3\).

    Demuestre que si\(p_0 > 1/2\), no se puede esperar obtener ganancias.

    i [exer 10.2.4] Let\(S_N = X_1 + X_2 +\cdots+ X_N\), donde los\(X_i\)'s son variables aleatorias independientes con distribución común teniendo función generadora\(f(z)\). Supongamos que\(N\) es una variable aleatoria de valor entero independiente de todos los\(X_j\) y que tiene función de generación\(g(z)\). Demostrar que la función generadora para\(S_N\) es\(h(z) = g(f(z))\).: Utilizar el hecho de que\[h(z) = E(z^{S_N}) = \sum_k E(z^{S_N} | N = k) P(N = k)\ .\]

    i [exer 10.2.5] Hemos visto que si la función generadora para la descendencia de un solo progenitor es\(f(z)\), entonces la función generadora para el número de crías después de dos generaciones viene dada por\(h(z) = f(f(z))\). Explique cómo esto se desprende del resultado del Ejercicio [exer 10.2.4].

    i [exer 10.2.6] Considerar un proceso de cola tal que en cada minuto ya sea 1 o 0 clientes lleguen con probabilidades\(p\) o\(q = 1 - p\), respectivamente. (El número\(p\) se llama el.) Cuando un cliente inicia el servicio termina en el siguiente minuto con probabilidad\(r\). El número\(r\) se llama el.) Así, cuando un cliente comienza a ser atendido terminará de ser atendido en\(j\) minutos con probabilidad\((1 - r)^{j -1}r\), para\(j = 1\), 2, 3,...

    1. Encuentre la función generadora\(f(z)\) para el número de clientes que llegan en un minuto y la función generadora\(g(z)\) por el tiempo que una persona pasa en servicio una vez que inicia el servicio.

      i [exer 10.2.7] Considera a al considerar que la descendencia de un cliente son los clientes que llegan mientras ella está siendo atendida. Usando Ejercicio [exer 10.2.4], mostrar que la función generadora para nuestro proceso de ramificación de clientes es\(h(z) = g(f(z))\).

      i [exer 10.2.8] Si iniciamos el proceso de ramificación con la llegada del primer cliente, entonces el tiempo hasta que el proceso de ramificación se agote será el para el servidor. Encuentre una condición en términos de la tarifa de llegada y tarifa de servicio que asegure que el servidor finalmente tendrá un momento en el que no esté ocupado.

    i [exer 10.2.9] Dejar\(N\) ser el número total esperado de crías en un proceso de ramificación. \(m\)Sea el número medio de descendencia de un solo progenitor. Demostrar eso\[N = 1 + \left(\sum p_k \cdot k\right) N = 1 + mN\] y de ahí que\(N\) sea finito si y sólo si\(m < 1\) y en ese caso\(N = 1/(1 - m)\).

    i [exer 10.2.10] Considerar un proceso de ramificación tal que el número de descendencia de un progenitor sea\(j\) con probabilidad\(1/2^{j + 1}\) para\(j = 0\), 1, 2,...

    1. Usando los resultados del Ejemplo [examen 10.2.4] muestran que la probabilidad de que haya\(j\) descendencia en la generación\(n\) th es\[p_j^{(n)} = \left \{ \begin{array}{ll} \frac{1}{n(n + 1)} (\frac {n}{n + 1})^j, & \mbox{if $ j \geq 1$}, \\ \frac {n}{n + 1}, & \mbox{if $ j = 0$}.\end{array}\right.\]

    2. Mostrar que la probabilidad de que el proceso se extingue exactamente a la generación\(n\) th es\(1/n(n + 1)\).

    3. Demuestre que la vida esperada es infinita aunque\(d = 1\).


    This page titled 10.2: Procesos de ramificación is shared under a GNU Free Documentation License 1.3 license and was authored, remixed, and/or curated by Charles M. Grinstead & J. Laurie Snell (American Mathematical Society) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.