Saltar al contenido principal
LibreTexts Español

12.8: Proceso de Urna de Pólya

  • Page ID
    151909
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \(\newcommand{\P}{\mathbb{P}}\)\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\R}{\mathbb{R}}\)\(\newcommand{\N}{\mathbb{N}}\)\(\newcommand{\bs}{\boldsymbol}\)\(\newcommand{\var}{\text{var}}\)\(\newcommand{\cov}{\text{cov}}\)\(\newcommand{\cor}{\text{cor}}\)

    Teoría Básica

    El Modelo

    El esquema de urna de Pólya es un modelo de muestreo dicotómico que generaliza el modelo hipergeométrico (muestreo sin reemplazo) y el modelo Bernoulli (muestreo con reemplazo). El proceso de urna de Pólya lleva a un famoso ejemplo de una secuencia de variables aleatorias que es intercambiable, pero no independiente, y tiene profundas conecciones con el proceso beta-Bernoulli.

    Supongamos que tenemos una urna (¡qué más!) que inicialmente contiene bolas\(a\) rojas y\(b\) verdes, donde\(a\) y\(b\) son enteros positivos. En cada momento discreto (prueba), seleccionamos una bola de la urna y luego regresamos la bola a la urna junto con\(c\) nuevas bolas del mismo color. Ordinariamente, el parámetro\(c\) es un entero no negativo. No obstante, el modelo realmente tiene sentido si\(c\) es un entero negativo, si interpretamos esto para significar que quitamos las bolas en lugar de agregarlas, y asumiendo que hay suficientes bolas del color adecuado en la urna para realizar esta acción. En cualquier caso, el proceso aleatorio se conoce como proceso de urna de Pólya, llamado así por George Pólya.

    En cuanto a los colores de las bolas seleccionadas, el esquema de urna de Pólya generaliza los modelos estándar de muestreo con y sin reemplazo.

    1. \(c = 0\)corresponde a muestreo con reemplazo.
    2. \(c = -1\)corresponde a muestreo sin reemplazo.

    En su mayor parte, asumiremos que no\(c\) es negativo para que el proceso pueda continuar indefinidamente. Ocasionalmente consideramos el caso\(c = -1\) para que podamos interpretar los resultados en términos de muestreo sin reemplazo.

    Las variables de resultado

    Dejar\(X_i\) denotar el color de la bola seleccionada en el momento\(i\), donde 0 denota verde y 1 denota rojo. Matemáticamente, nuestro proceso aleatorio básico es la secuencia de variables indicadoras\(\bs{X} = (X_1, X_2, \ldots)\), conocido como el proceso Pólya. Como con cualquier proceso aleatorio, nuestro primer objetivo es calcular las distribuciones dimensionales finitas de\(\bs{X}\). Es decir, queremos computar la distribución conjunta de\((X_1, X_2, \ldots, X_n)\) para cada uno\(n \in \N_+\). Alguna notación adicional realmente ayudará. Recordemos la fórmula de permutación generalizada en nuestro estudio de estructuras combinatorias: para\(r, \, s \in \R\) y\(j \in \N\), definimos\[ r^{(s,j)} = r (r + s) (r + 2 s) \cdots [r + (j-1)s] \] Tenga en cuenta que la expresión tiene\(j\) factores\(r\), comenzando con, y con cada factor obtenido sumando\(s\) al factor anterior. Como es habitual, adoptamos la convención de que un producto sobre un conjunto de índices vacío es 1. De ahí\(r^{(s,0)} = 1\) para cada\(r\) y\(s\).

    Recordemos que

    1. \(r^{(0,j)} = r^j\), un poder ordinario
    2. \(r^{(-1,j)} = r^{(j)} = r (r - 1) \cdots (r - j + 1)\), un poder descendente
    3. \(r^{(1,j)} = r^{[j]} = r (r + 1) \cdots (r + j - 1)\), un poder ascendente
    4. \(r^{(r,j)} = j! r^j\)
    5. \(1^{(1,j)} = j!\)

    El siguiente resultado simple resultará bastante útil.

    Supongamos que\( r, \, s \in (0, \infty) \) y\( j \in \N \). Entonces\[ \frac{r^{(s, j)}}{s^j} = \left(\frac{r}{s}\right)^{[j]} \]

    Prueba

    Es solo cuestión de agrupar los factores:\ begin {align*}\ frac {r^ {(s, j)}} {s^j} & =\ frac {r (r + s) (r + s) (r + 2 s)\ cdots [r + (j - 1) s]} {s^j}\\ & =\ left (\ frac {r} {s}\ right)\ left (\ frac {r} {s} + 1\ derecha)\ izquierda (\ frac {r} {s} + 2\ derecha)\ cdots\ izquierda [\ frac {r} {s} + (j - 1)\ derecha] =\ izquierda (\ frac {r} {s}\ derecha) ^ {[j]} \ end {alinear*}

    Las distribuciones dimensionales finitas son fáciles de calcular usando la regla de multiplicación de probabilidad condicional. Si conocemos el contenido de la urna en un momento dado, entonces la probabilidad de un desenlace en la próxima vez es casi trivial.

    Vamos\( n \in \N_+ \),\((x_1, x_2, \ldots, x_n) \in \{0,1\}^n\) y vamos\(k = x_1 + x_2 + \cdots + x_n\). Entonces\[ \P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n) = \frac{a^{(c,k)} b^{(c, n - k)}}{(a + b)^{(c,n)}} \]

    Prueba

    Por la regla de multiplicación para probabilidad condicional, Por\[ \P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n) = \P(X_1 = x_1) \P(X_2 = x_2 \mid X_1 = x_1) \cdots \P(X_n = x_n \mid X_1 = x_1, \ldots, X_{n-1} = x_{n-1}) \] supuesto, si sabemos que la urna tiene, digamos, bolas\(r\) rojas y\(g\) verdes en un momento determinado, entonces la probabilidad de una bola roja en el siguiente sorteo es\(r / (r + g)\) mientras la probabilidad de una bola verde es\(g / (r + g)\). El lado derecho de la ecuación mostrada arriba tiene\(n\) factores. Los denominadores son el número total de bolas en los\(n\) tiempos, y forman el producto\((a + b) (a + b + c) \ldots [a + b + (n - 1) c] = (a + b)^{(c,n)}\). En los numeradores,\(k\) de los factores corresponden a probabilidades de seleccionar bolas rojas; estos factores forman el producto\(a (a + c) \cdots [a + (k - 1)c] = a^{(c,k)}\). \(n - k\)Los factores restantes en los numeradores corresponden a la selección de bolas verdes; estos factores forman el producto\(b (b + c) \cdots [b + (n - k - 1)c] = b^{(c, n-k)}\).

    La probabilidad conjunta en el ejercicio anterior depende\((x_1, x_2, \ldots, x_n)\) únicamente a través del número de bolas rojas\(k = \sum_{i=1}^n x_i\) en la muestra. Así, la distribución conjunta es invariante bajo una permutación de\((x_1, x_2, \ldots, x_n)\), y por lo tanto\(\bs{X}\) es una secuencia intercambiable de variables aleatorias. Esto quiere decir que para cada una\(n\), todas las permutaciones de\((X_1, X_2, \ldots, X_n)\) tienen la misma distribución. Por supuesto la distribución conjunta se reduce a las fórmulas que hemos obtenido anteriormente en los casos especiales de muestreo con reemplazo (\(c = 0\)) o muestreo sin reemplazo (\(c = - 1\)), aunque en este último caso debemos tener\(n \le a + b\). Cuando\( c \gt 0 \), el proceso Pólya es un caso especial del proceso beta-Bernoulli, estudiado en el capítulo sobre los ensayos de Bernoulli.

    El proceso Pólya\( \bs X = (X_1, X_2, \ldots) \) con parámetros\( a, \, b, \, c \in \N_+ \) es el proceso beta-Bernoulli con parámetros\( a / c \) y\( b / c \). Es decir, para\( n \in \N_+ \)\((x_1, x_2, \ldots, x_n) \in \{0,1\}^n\), y con\(k = x_1 + x_2 + \cdots + x_n\),\[ \P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n) = \frac{(a / c)^{[k]} (b / c)^{[n-k]}}{(a / c + b / c)^{[n]}} \]

    Prueba

    De los dos resultados anteriores,\[ \P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n) = \frac{a^{(c,k)} b^{(c, n - k)}}{(a + b)^{(c,n)}} =\frac{[a^{(c,k)} / c^k] [b^{(c, n - k)} / c^{n-k}]}{(a + b)^{(c,n)} / c^n} = \frac{(a /c)^{[k]} (b / c)^{[n-k]}}{(a / c + b / c)^{[n]}} \] y esta es la distribución dimensional finita correspondiente de la distribución beta-Bernoulli con parámetros\( a / c \) y\( (b / c) \).

    Recordemos que el proceso beta-Bernoulli se obtiene, en la formulación habitual, aleatorizando el parámetro de éxito en una secuencia de ensayos de Bernoulli, dando al parámetro de éxito una distribución beta. Entonces específicamente, supongamos\( a, \, b, \, c \in \N_+ \) y esa variable aleatoria\( P \) tiene la distribución beta con parámetros\( a / c \) y\( b / c \). Supongamos también que dado\( P = p \in (0, 1) \), el proceso aleatorio\( \bs X = (X_1, X_2, \ldots) \) es una secuencia de ensayos de Bernoulli con parámetro de éxito\( p \). Entonces\( \bs X \) es el proceso Pólya con parámetros\( a, \, b, \, c \). Se trata de una conexión fascinante entre dos procesos que al principio, parecen tener poco en común. De hecho, sin embargo, cada secuencia intercambiable de variables aleatorias indicadoras se puede obtener aleatorizando el parámetro de éxito en una secuencia de ensayos de Bernoulli. Este es el teorema de Finetti, llamado así por Bruno de Finetti, que se estudia en la sección sobre martingales al revés. Cuando\( c \in \N_+ \), todos los resultados de esta sección son casos especiales de los resultados correspondientes para el proceso beta-Bernoulli, pero sigue siendo interesante interpretar los resultados en términos del modelo de urna.

    Para cada\(i \in \N_+\)

    1. \(\E(X_i) = \frac{a}{a + b}\)
    2. \(\var(X_i) = \frac{a}{a + b} \frac{b}{a + b}\)
    Prueba

    Dado que la secuencia es intercambiable,\(X_i\) tiene la misma distribución que\(X_1\), entonces\(\P(X_i = 1) = \frac{a}{a + b}\). La media y varianza se derivan ahora de los resultados estándar para las variables indicadoras.

    Así\(\bs{X}\) es una secuencia de variables distribuidas idénticamente, bastante sorprendente al principio pero por supuesto inevitable para cualquier secuencia intercambiable. Comparar las distribuciones conjuntas y marginales. Tenga en cuenta que\(\bs{X}\) es una secuencia independiente si y solo si\(c = 0\), cuando tenemos muestreo simple con reemplazo. La urna de Pólya es uno de los ejemplos más famosos de un proceso aleatorio en el que las variables de resultado son intercambiables, pero dependientes (en general).

    A continuación, calculemos la covarianza y correlación de un par de variables de resultado.

    Supongamos que\(i, \, j \in \N_+\) son distintos. Entonces

    1. \(\cov\left(X_i, X_j\right) = \frac{a b c}{(a + b)^2 (a + b + c)}\)
    2. \(\cor\left(X_i, X_j\right) = \frac{c}{a + b + c}\)
    Prueba

    Dado que las variables son intercambiables,\(\P(X_i = 1, X_j = 1) = \P(X_1 = 1, X_2 = 1) = \frac{a}{a + b} \frac{a + c}{a + b + c}\). Los resultados se derivan ahora de fórmulas estándar para covarianza y correlación.

    Así, las variables se correlacionan positivamente si\(c \gt 0\), negativamente correlacionadas si\(c \lt 0\), y no correlacionadas (de hecho, independientes), si\(c = 0\). Estos resultados ciertamente tienen sentido cuando recordamos la dinámica de la urna de Pólya. Resulta que en cualquier secuencia infinita de variables intercambiables, las variables deben estar correlacionadas no negativamente. Aquí hay otro resultado que explora cómo se relacionan las variables.

    Supongamos que\( n \in \N_+ \) y\( (x_1, x_2, \ldots, x_n) \in \{0, 1\}^n \). Vamos\( k = \sum_{i=1}^n x_i \). Entonces\[ \P(X_{n+1} = 1 \mid X_1 = x_1, X_2 = x_2, \ldots X_n = x_n) = \frac{a + k c}{a + b + n c} \]

    Prueba

    Usando la distribución conjunta,\ begin {align*}\ P (X_ {n+1} = 1\ mid X_1 = x_1, X_2 = x_2,\ ldots x_n = x_n) & =\ frac {\ P (X_1 = x_1, X_2 = x_2,\ ldots x_n = x_n, X_ {n+1} = 1)}\ P (X_1 = x_1, X_2 = x_2,\ ldots x_n = x_n)}\\ & =\ frac {a^ {(c, k+1)} b^ {(c, n-k)}} {(a + b) ^ {(c, n + 1)}}\ frac {(a + b) ^ {(c, n)}} a^ { (c, k)} b^ {(c, n-k)}} =\ frac {a + c k} {a + b + c n}\ end {alinear*}

    La urna de Pólya se describe mediante una secuencia de variables indicadoras. Podemos estudiar los mismos procesos aleatorios derivados que estudiamos con los ensayos de Bernoulli: el número de bolas rojas en los primeros\(n\) ensayos, el número de prueba de\(k\) la bola roja, y así sucesivamente.

    El número de bolas rojas

    Para\( n \in \N \), el número de bolas rojas seleccionadas en las primeras\(n\) pruebas es\[ Y_n = \sum_{i=1}^n X_i \] así que\( \bs{Y} = (Y_0, Y_1, \ldots) \) es el proceso de suma parcial asociado con\( \bs{X} = (X_1, X_2, \ldots) \).

    Tenga en cuenta que

    1. El número de bolas verdes seleccionadas en las primeras\(n\) pruebas es\(n - Y_n\).
    2. El número de bolas rojas en la urna después de los primeros\(n\) juicios es\(a + c \, Y_n\).
    3. El número de bolas verdes en la urna después de los primeros\(n\) juicios es\(b + c (n - Y_n)\).
    4. El número de bolas en la urna después de las primeras\(n\) pruebas es\(a + b + c \, n\).

    El análisis básico de\(\bs{Y}\) sigue fácilmente de nuestro trabajo con\(\bs{X}\).

    La función de densidad de probabilidad de\(Y_n\) viene dada por\[ \P(Y_n = k) = \binom{n}{k} \frac{a^{(c,k)} b^{(c, n-k)}}{(a + b)^{(c,n)}}, \quad k \in \{0, 1, \ldots, n\} \]

    Prueba

    \(\P(Y_n = y)\)es la suma de\(\P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n)\) sobre todo\((x_1, x_2, \ldots, x_n) \in \{0, 1\}^n\) con\(\sum_{i=1}^n x_i = k\). Existen\(\binom{n}{k}\) tales secuencias, y cada una tiene la probabilidad dada anteriormente.

    La distribución definida por esta función de densidad de probabilidad es conocida, adecuadamente, como la distribución de Pólya con parámetros\( n \),\( a \),\( b \), y\( c \). Por supuesto, la distribución se reduce a la distribución binomial con parámetros\( n \) y\( a / (a + b) \) en el caso del muestreo con reemplazo (\(c = 0\)) y a la distribución hipergeométrica con parámetros\( n \)\( a \), y\( b \) en el caso del muestreo sin reemplazo ( \(c = - 1\)), aunque de nuevo en este caso necesitamos\(n \le a + b\). Cuando\( c \gt 0 \), la distribución de Póyla es un caso especial de la distribución beta-binomial.

    Si\( a, \, b, \, c \in \N_+ \) entonces la distribución de Pólya con parámetros\( a, \, b, \, c \) es la distribución beta-binomial con parámetros\( a / c \) y\( b / c \). Es decir,\[P(Y_n = k) = \binom{n}{k} \frac{(a / c)^{[k]} (b/c)^{[n - k]}}{(a/c + b/c)^{[n]}}, \quad k \in \{0, 1, \ldots, n\}\]

    Prueba

    Esto se deduce inmediatamente del resultado anterior que\( \bs X = (X_1, X_2, \ldots) \) es el proceso beta-Bernoulli con parámetros\( a / c \) y\( b / c \). Entonces, por definición,\( Y_n = \sum_{i=1}^n X_i \) tiene la distribución beta-binomial con parámetros\( n \),\( a / c \), y\( b / c \). Una prueba directa también es simple usando la fórmula de permutación anterior:\[ \P(Y_n = k) = \binom{n}{k} \frac{a^{(c,k)} b^{(c, n-k)}}{(a + b)^{(c,n)}} = \binom{n}{k} \frac{[a^{(c,k)} / c^k] [b^{(c, n-k)} / c^{n-k}]}{(a + b)^{(c,n)} / c^n} = \binom{n}{k} \frac{(a / c)^{[k]} (b/c)^{[n - k]}}{(a/c + b/c)^{[n]}}, \quad k \in \{0, 1, \ldots, n\} \]

    El caso en el que los tres parámetros son iguales es particularmente interesante.

    Si\(a = b = c\) entonces\(Y_n\) se distribuye uniformemente en\(\{0, 1, \ldots, n\}\).

    Prueba

    Esto se desprende del resultado anterior, ya que la distribución beta-binomial con parámetros\( n \), 1 y 1 se reduce a la distribución uniforme. Específicamente, tenga en cuenta que\( 1^{[k]} = k! \),\( 1^{[n-k]} = (n - k)! \) y\( 2^{[n]} = (n + 1)! \). Así que la sustitución da\[ \P(Y_n = k) = \frac{n!}{k!(n - k)!} \frac{k! (n - k)!}{(n + 1)!} = \frac{1}{n + 1}, \quad k \in \{0, 1, \ldots, n\} \]

    En general, la familia de distribuciones Pólya cuenta con una diversa colección de formas.

    Inicia la simulación del Experimento Urna Pólya. Varíe los parámetros y anote la forma de la función de densidad de probabilidad. En particular, tenga en cuenta cuando la función está sesgada, cuando la función es simétrica, cuando la función es unimodal, cuando la función es monótona y cuando la función tiene forma de U. Para diversos valores de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

    La función de densidad de probabilidad de Pólya es

    1. unimodal si\(a \gt b \gt c\) y\(n \gt \frac{a - c}{b - c}\)
    2. unimodal si\(b \gt a \gt c\) y\(n \gt \frac{b - c}{a - c}\)
    3. En forma de U si\(c \gt a \gt b\) y\(n \gt \frac{c - b}{c - a}\)
    4. En forma de U si\(c \gt b \gt a\) y\(n \gt \frac{c - a}{c - b}\)
    5. aumentando si\(b \lt c \lt a\)
    6. decreciente si\(a \lt c \lt b\)
    Prueba

    Estos resultados se derivan de la solución de la desigualdad\(\P(Y_n = k) \gt \P(Y_n = k - 1)\).

    A continuación, encontremos la media y la varianza. Curiosamente, la media no depende del parámetro\(c\).

    La media y varianza del número de bolas rojas seleccionadas son

    1. \(\E(Y_n) = n \frac{a}{a + b}\)
    2. \(\var(Y_n) = n \frac{a b}{(a + b)^2} \left[1 + (n - 1) \frac{c}{a + b + c}\right]\)
    Prueba

    Estos resultados se derivan de la media y covarianza de las variables indicadoras dadas anteriormente, y de las propiedades básicas de valor esperado y varianza.

    1. \( \E(Y_n) = \sum_{i=1}^n \E(X_i) \)
    2. \(\var(Y_n) = \sum_{i=1}^n \sum_{j=1}^n \cov\left(X_i, X_j\right)\)

    Inicia la simulación del Experimento Urna Pólya. Varíe los parámetros y anote la forma y ubicación de la barra de desviación\( \pm \) estándar media. Para diversos valores de los parámetros, ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

    Calcular explícitamente la función de densidad de probabilidad, media y varianza de\(Y_5\) cuándo\(a = 6\)\(b = 4\),, y para los valores de\(c \in \{-1, 0, 1, 2, 3, 10\}\). Esboce la gráfica de la función de densidad en cada caso.

    Arreglar\(a\)\(b\),, y\(n\), y dejar\(c \to \infty\). Entonces

    1. \(\P(Y_n = 0) \to \frac{b}{a + b}\)
    2. \(\P(Y_n = n) \to \frac{a}{a + b}\)
    3. \(\P\left(Y_n \in \{1, 2, \ldots, n - 1\}\right) \to 0\)
    Prueba

    Tenga en cuenta que\(\P(Y_n = 0) = \frac{b^{(c, n)}}{(a + b)^{(c, n)}}\). El numerador y el denominador tienen\( n \) factores cada uno. Si estos factores se agrupan en un producto de\(n\) fracciones, entonces el primero es\(\frac{b}{a + b}\). El resto tienen la forma\(\frac{a + j \, c}{a + b + j \, c}\) donde\(j \in \{1, 2, \ldots n - 1\}\) Cada uno de estos converge a 1 como\(c \to \infty\). La parte b) sigue de un argumento similar. La parte c) se desprende de los apartados a) y b) y la regla del complemento.

    Así, la distribución limitante de\(Y_n\) as\( c \to \infty \) se concentra en 0 y\(n\). Las probabilidades limitantes son solo la proporción inicial de bolas verdes y rojas, respectivamente. Interpretar este resultado en términos de la dinámica del esquema de urnas de Pólya.

    Nuestro siguiente resultado da la distribución condicional de\( X_{n+1} \) dado\( Y_n \).

    Supongamos que\(n \in \N\) y\(k \in \{0, 1, \ldots, n\}\). Entonces\[ \P(X_{n+1} = 1 \mid Y_n = k) = \frac{a + c k}{a + b + c n } \]

    Prueba

    Dejar\( S = \left\{(x_1, x_2, \ldots, x_n) \in \{0, 1\}^n: \sum_{i=1}^n x_i = k\right\} \) y dejar\( \bs{X}_n = (X_1, X_2, \ldots, X_n) \). Tenga en cuenta que los eventos\( \{\bs{X}_n = \bs{x}\} \) sobre la\( \bs{x} \in S \) partición del evento\( \{Y_n = k\} \). Acondicionamiento encendido\( \bs{X}_n \),\ comenzar {alinear*}\ P (X_ {n+1} = 1\ mid Y_n = k) & =\ sum_ {\ bs x\ en S}\ P (X_ {n+1} = 1\ mid Y_n = k,\ bs {X} _n =\ bs {x})\ P (\ bs {X} _n =\ bs {x}\ mid Y_n = k)\\ & =\ sum_ {\ bs x\ en S}\ P (X_ {n+1} = 1\ mediados\ bs {X} _n =\ bs x)\ P (\ bs {X} _n =\ bs x\ mid Y_n = k)\ end {align*} Pero de nuestro resultado anterior,\( \P(X_{n+1} = 1 \mid \bs{X}_n = \bs x) = (a + c k) / (a + b + cn) \) para cada\( \bs{x} \in S \). De ahí\[ \P(X_{n+1} = 1 \mid Y_n = k) = \frac{a + c k}{a + b + c n} \sum_{\bs x \in S} \P(\bs{X}_n = x \mid Y_n = k) \] que la última suma sea 1.

    En particular, si\(a = b = c\) entonces\(\P(X_{n+1} = 1 \mid Y_n = n) = \frac{n + 1}{n + 2}\). Esta es la regla de sucesión de Laplace, otra conexión interesante. La regla lleva el nombre de Pierre Simon Laplace, y se estudia desde un punto de vista diferente en la sección sobre Independencia.

    La Proporción de Bolas Rojas

    Supongamos que\(c \in \N\), para que el proceso continúe indefinidamente. Para\( n \in \N_+ \), la proporción de bolas rojas seleccionadas en los primeros\(n\) ensayos es\[ M_n = \frac{Y_n}{n} = \frac{1}{n} \sum_{i=1}^n X_i \] Esta es una variable interesante, ya que un poco de reflexión sugiere que puede tener un límite como\(n \to \infty\). En efecto, si\(c = 0\), entonces\(M_n\) es solo la media muestral correspondiente a los ensayos de\(n\) Bernoulli. Así, por la ley de los grandes números,\(M_n\) converge al parámetro de éxito\(\frac{a}{a + b}\) como\(n \to \infty\) con la probabilidad 1. Por otro lado, la proporción de bolas rojas en la urna después de\(n\) los juicios es\[ Z_n = \frac{a + c Y_n}{a + b + c n} \] Cuando\(c = 0\), por supuesto,\(Z_n = \frac{a}{a + b}\) para que en este caso,\(Z_n\) y\(M_n\) tengan el mismo comportamiento limitante. Obsérvese que\[Z_n = \frac{a}{a + b + c n} + \frac{c n}{a + b + c n} M_n\] Dado que el término constante converge a 0 as\(n \to \infty\) y el coeficiente de\(M_n\) converge a 1 as\(n \to \infty\), se deduce que los límites de\( M_n \) y\( Z_n \) como\( n \to \infty \) serán los mismos, si el límite existe, para cualquier modo de convergencia: con probabilidad 1, en media o en distribución. Aquí está el resultado general cuando\( c \gt 0 \).

    Supongamos que\( a, \, b, \, c \in \N_+ \). Existe una variable aleatoria\( P \) que tiene la distribución beta con parámetros\( a / c \) y\( b / c \) tal que\(M_n \to P\) y\(Z_n \to P\) como\( n \to \infty \) con probabilidad 1 y en cuadrado medio, y por lo tanto también en distribución.

    Prueba

    Como se señaló anteriormente, el proceso de urna es equivalente al proceso beta-Bernoulli con parámetros\( a / c \) y\( b / c \). Mostramos en esa sección que al\( M_n \to P \) igual que\( n \to \infty \) con la probabilidad 1 y en el cuadrado medio, donde\( P \) se encuentra la variable beta aleatoria utilizada en la construcción.

    En resulta que el proceso aleatorio\( \bs Z = \{Z_n = (a + c Y_n) / (a + b + c n): n \in \N\} \) es una martingala. La teoría de las martingales proporciona poderosas herramientas para estudiar la convergencia en el proceso de urna de Pólya. Como caso especial interesante, tenga en cuenta que si\( a = b = c \) entonces la distribución limitante es la distribución uniforme en\( (0, 1) \).

    El Número de Juicio\(k\) de la Bola Roja

    Supongamos de nuevo eso\(c \in \N\), para que el proceso continúe indefinidamente. Para\(k \in \N_+\) dejar\( V_k \) denotar el número de prueba de la bola roja\( k \) th seleccionada. Por lo tanto\[ V_k = \min\{n \in \N_+: Y_n = k\} \] Tenga en cuenta que\(V_k\) toma valores en\(\{k, k + 1, \ldots\}\). Los procesos aleatorios\(\bs{V} = (V_1, V_2, \ldots)\) y\(\bs{Y} = (Y_1, Y_2, \ldots)\) son inversos el uno del otro en cierto sentido.

    Para\(k, \, n \in \N_+\) con\(k \le n\),

    1. \(V_k \le n\)si y solo si\(Y_n \ge k\)
    2. \(V_k = n\)si y solo si\(Y_{n-1} = k - 1\) y\(X_n = 1\)

    La función de denisty de probabilidad\(V_k\) está dada por\[ \P(V_k = n) = \binom{n - 1}{k - 1} \frac{a^{(c,k)} b^{(c,n-k)}}{(a + b)^{(c,n)}}, \quad n \in \{k, k + 1, \ldots\} \]

    Prueba

    Acondicionamiento\( Y_{n-1} \). Usando el PDF de\( Y_{n-1} \) y el resultado anterior,\ begin {align*}\ P (V_k = n) & =\ P (Y_ {n-1} = k - 1, x_n = 1) =\ P (Y_ {n-1} = k - 1)\ P (x_n = 1\ mid Y_ {n-1} = k - 1)\\ & =\ binom {n - 1} {k - 1}\ frac {a^ {(c, k - 1)} b^ {(c, (n - 1) - (k - 1))}} {(a + b) ^ {(c, n-1)}}\ frac {a + c (k - 1)} {a + b + c (n - 1)} =\ binom {n - 1} {k - 1}\ frac {a^ {(c, k)} b^ {(c, n-k)}} {(a + b) ^ {(c, n)}}\ end {alinear*}

    Por supuesto, esta función de densidad de probabilidad se reduce a la función de densidad binomial negativa con parámetro de ensayo\(k\) y parámetro de éxito\(p = \frac{a}{a+b}\) cuando\(c = 0\) (muestreo con reemplazo). Cuando\( c \gt 0 \), la distribución es un caso especial de la distribución binomial beta-negativa.

    Si\( a, \, b, \, c \in \N_+ \) entonces\( V_k \) tiene la distribución binomial beta-negativa con parámetros\( k \),\( a / c \), y\( b / c \). Es decir,\[ \P(V_k = n) = \binom{n - 1}{k - 1} \frac{(a/c)^{[k]} (b/c)^{[n-k]}}{(a / c + b / c)^{[n]}}, \quad n \in \{k, k + 1, \ldots\} \]

    Prueba

    Al igual que con pruebas anteriores, este resultado sigue ya que el proceso subyacente\( \bs X = (X_1, X_2, \ldots) \) es el proceso beta-Bernoulli con parámetros\( a / c \) y\( b / c \). La forma del PDF también se desprende fácilmente del resultado anterior dividiendo el numerador y el denominador\( c^n \).

    Si\(a = b = c\) entonces\[ \P(V_k = n) = \frac{k}{n (n + 1)}, \quad n \in \{k, k + 1, k + 2, \ldots\} \]

    Prueba

    Al igual que en la prueba correspondiente para el número de bolas rojas, la fracción en el PDF de\(V_k\) en el resultado anterior se reduce a\(\frac{k! (n - k)!}{(n + 1)!}\), mientras que el coeficiente binomial es\(\frac{(n - 1)!}{(k - 1)! (n - k)!}\).

    Arreglar\(a\)\(b\),, y\(k\), y dejar\(c \to \infty\). Entonces

    1. \(\P(V_k = k) \to \frac{a}{a + b}\)
    2. \(\P(V_k \in \{k + 1, k + 2, \ldots\}) \to 0\)

    Así, la distribución limitante de\(V_k\) se concentra en\(k\) y\(\infty\). Las probabilidades limitantes en estos dos puntos son solo la proporción inicial de bolas rojas y verdes, respectivamente. Interpretar este resultado en términos de la dinámica del esquema de urnas de Pólya.


    This page titled 12.8: Proceso de Urna de Pólya is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.