Saltar al contenido principal
LibreTexts Español

12.2: Ruina del jugador

  • Page ID
    150207
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En la última sección, se estudió el tipo más simple de caminata aleatoria simétrica.\({\mathbf R}^1\) En esta sección, eliminamos la suposición de que la caminata aleatoria es simétrica. En cambio, asumimos que\(p\) y\(q\) son números reales no negativos con\(p+q = 1\), y que la función de distribución común de los saltos de la caminata aleatoria es

    \[f_X(x) = \left \{ \begin{array}{ll} p, & \mbox{if $x = 1$},\\ q, & \mbox{if $x = -1$}. \end{array} \right.\]

    Uno puede imaginar la caminata aleatoria como una secuencia de tiradas de una moneda ponderada, con una cabeza apareciendo con probabilidad\(p\) y una cola apareciendo con probabilidad\(q\). Una formulación alternativa de esta situación es la de un jugador jugando una secuencia de juegos contra un adversario (a veces pensado como otra persona, a veces llamada “la casa”) donde, en cada juego, el jugador tiene probabilidad\(p\) de ganar.

    El problema de la ruina del jugador

    La formulación anterior de este tipo de caminata aleatoria conduce a un problema conocido como el problema de la ruina del jugador. Este problema se introdujo en el Ejercicio [exer 11.2.22], pero volveremos a dar la descripción del problema. Un jugador comienza con una “apuesta” de tamaño\(s\). Ella juega hasta que su capital alcanza el valor\(M\) o el valor 0. En el lenguaje de las cadenas de Markov, estos dos valores corresponden a estados absorbentes. Nos interesa estudiar la probabilidad de ocurrencia de cada uno de estos dos resultados.

    También se puede suponer que el jugador está jugando contra un adversario “infinitamente rico”. En este caso, diríamos que solo hay un estado absorbente, es decir, cuando la apuesta del jugador es 0. Bajo esta suposición, se puede pedir la probabilidad de que el jugador finalmente se arruine.

    Comenzamos definiendo\(q_k\) que es la probabilidad de que la apuesta del jugador llegue a 0, es decir, se arruine, antes de que llegue\(M\), dado que la apuesta inicial es\(k\). Tomamos nota de que\(q_0 = 1\) y\(q_M = 0\). La relación fundamental entre los\(q_k\)'s es la siguiente:

    \[q_k = pq_{k+1} + qq_{k-1}\ ,\]

    donde\(1 \le k \le M-1\). Esto se sostiene porque si su apuesta es igual\(k\), y juega un juego, entonces su apuesta se vuelve\(k+1\) con probabilidad\(p\) y\(k-1\) con probabilidad\(q\). En el primer caso, la probabilidad de eventual ruina es\(q_{k+1}\) y en el segundo caso, lo es\(q_{k-1}\). Observamos que ya que\(p + q = 1\), podemos escribir la ecuación anterior como

    \[p(q_{k+1} - q_k) = q(q_k - q_{k-1})\ ,\]

    o

    \[q_{k+1} - q_k = {q\over p}(q_k - q_{k-1})\ .\]

    A partir de esta ecuación, es fácil ver que

    \[q_{k+1} - q_k = \biggl({q\over p}\biggr)^k(q_1 - q_0)\ . \label{eq 12.2.2}\]

    Ahora utilizamos sumas telescópicas para obtener una ecuación en la que lo único desconocido es\(q_1\):

    \[\begin{aligned} -1 &=& q_M - q_0 \\ &=& \sum_{k = 0}^{M-1} (q_{k+1} - q_k)\ ,\end{aligned}\]

    por lo

    \[\begin{aligned} -1 &=& \sum_{k = 0}^{M-1} \biggl({q\over p}\biggr)^k(q_1 - q_0)\\ &=& (q_1 - q_0) \sum_{k = 0}^{M-1} \biggl({q\over p}\biggr)^k\ .\end{aligned}\]

    Si\(p \ne q\), entonces la expresión anterior es igual

    \[(q_1 - q_0) {(q/p)^M - 1}\over{(q/p) - 1}\ ,\]

    mientras que si\(p = q = 1/2\), entonces obtenemos la ecuación

    \[-1 = (q_1 - q_0) M\ .\]

    Por el momento vamos a asumir eso\(p \ne q\). Entonces tenemos

    \[q_1 - q_0 = -{(q/p) - 1}\over{(q/p)^M - 1}\ .\]

    Ahora, para cualquiera\(z\) con\(1 \le z \le M\), tenemos

    \[\begin{aligned} q_z - q_0 &=& \sum_{k = 0}^{z-1} (q_{k+1} - q_k)\\ &=& (q_1 - q_0)\sum_{k = 0}^{z-1} \biggl({q\over p}\biggr)^k\\ &=& -(q_1 - q_0){(q/p)^z - 1}\over{(q/p) - 1}\\ &=& -{(q/p)^z - 1}\over{(q/p)^M - 1}\ .\end{aligned}\]

    Por lo tanto,

    \[\begin{aligned} q_z &=& 1 - {(q/p)^z - 1}\over{(q/p)^M - 1}\\ &=& {(q/p)^M - (q/p)^z}\over{(q/p)^M - 1}\ . \label{eq 12.2.3}\end{aligned}\]

    Por último\(p = q = 1/2\), si, es fácil demostrarlo (ver Ejercicio [exer 12.2.11])

    \[q_z = {M - z}\over M\ .\]

    Observamos que ambas fórmulas sostienen si\(z = 0\).

    Definimos, para\(0 \le z \le M\), que la cantidad\(p_z\) sea la probabilidad de que alcance la apuesta del jugador\(M\) sin haber alcanzado nunca 0. Dado que el juego podría continuar indefinidamente, no es obvio que\(p_z + q_z = 1\) para todos\(z\). Sin embargo, uno puede usar el mismo método que el anterior para mostrar que si\(p \ne q\), entonces

    \[q_z = {(q/p)^z - 1}\over{(q/p)^M - 1}\ ,\]

    y si\(p = q = 1/2\), entonces

    \[q_z = {z\over M}\ .\]

    Así, para todos\(z\), es el caso que\(p_z + q_z = 1\), así el juego termina con probabilidad 1.

    Adversarios infinitamente ricos

    Pasamos ahora al problema de encontrar la probabilidad de una eventual ruina si el jugador está jugando contra un adversario infinitamente rico. Esta probabilidad se puede obtener dejando\(M\) ir a\(\infty\) en la expresión para\(q_z\) calculado anteriormente. Si\(q < p\), entonces la expresión se acerca\((q/p)^z\), y si\(q > p\), la expresión se acerca a 1. En el caso\(p = q = 1/2\), lo recordamos\(q_z = 1 - z/M\). Así, si\(M \rightarrow \infty\), vemos que la probabilidad de eventual ruina tiende a 1.

    Observaciones Históricas

    En 1711, De Moivre, en su libro, dio una ingeniosa derivación de la probabilidad de ruina. La siguiente descripción de su argumento está tomada de David. 6 La notación utilizada es la siguiente: Imaginamos que hay dos jugadores, A y B, y las probabilidades de que ganen un juego son\(p\) y\(q\), respectivamente. Los jugadores comienzan con\(a\) y\(b\) contrarresta, respectivamente.

    Imagínese que cada jugador comienza con sus contadores ante él en una pila, y que los valores nominales se asignan a los contadores de la siguiente manera. Al contador inferior de A se le da el valor nominal\(q/p\); al siguiente se le da el valor nominal\((q/p)^2\), y así sucesivamente hasta su contador superior que tiene el valor nominal\((q/p)^a\). El mostrador superior de B se valora\((q/p)^{a+1}\), y así sucesivamente hacia abajo hasta su contador inferior que se valora\((q/p)^{a+b}\). Después de cada juego, el contador superior del perdedor se transfiere a la parte superior de la pila del ganador, y siempre es el mostrador superior el que se estaca para el siguiente juego. Entonces la apuesta de B siempre es\(q/p\) veces A, de manera que en cada juego la expectativa nominal de cada jugador es nula. Esto sigue siendo cierto a lo largo de la jugada; por lo tanto, la probabilidad de A de ganar todos los contadores de B, multiplicada por su ganancia nominal si lo hace, debe igualar la probabilidad de B multiplicada por la ganancia nominal de B. Por lo tanto,

    \[P_a\biggl(\Bigl({q\over p}\Bigr)^{a+1} + \cdots + \Bigl({q\over p}\Bigr)^{a+b}\biggr) = P_b\biggl(\Bigl({q\over p}\Bigr) + \cdots + \Bigl({q\over p}\Bigr)^a\biggr)\ . \label{eq 12.2.1}\]

     

    Usando esta ecuación, junto con el hecho de que

    \[P_a + P_b = 1\ ,\]

    se puede demostrar fácilmente que

    \[P_a = {(q/p)^a - 1}\over{(q/p)^{a+b} - 1}\ ,\]

    si\(p \ne q\), y

    \[P_a = {a\over{a+b}}\ ,\]

    si\(p = q = 1/2\).

    En términos de la teoría moderna de la probabilidad, de Moivre está cambiando los valores de los contadores para convertir un juego injusto en un juego limpio, que se llama martingala. Con los nuevos valores, la fortuna esperada del jugador A (es decir, la suma de los valores nominales de sus contadores) después de cada jugada iguala a su fortuna antes de la jugada (y de manera similar para el jugador B). (Para un argumento martingala más simple, véase Ejercicio [exer 12.2.10].) De Moivre utiliza entonces el hecho de que cuando termina el juego, sigue siendo justo, por lo tanto, la Ecuación [eq 12.2.1] debe ser cierta. Este hecho requiere de pruebas, y es uno de los teoremas centrales en el área de la teoría martingala.

    Ejercicio\(\PageIndex{2}\)

    En el problema de la ruina del jugador, asumir que la apuesta inicial del jugador es de 1 dólar, y asumir que su probabilidad de éxito en cualquier juego lo es\(p\). Dejar\(T\) ser el número de juegos hasta que se alcance 0 (el jugador está arruinado). Demostrar que la función generadora para\(T\) es

    \[h(z) = \frac{1 - \sqrt{1 - 4pqz^2}}{2pz}\ ,\]

    y que

    \[h(1) = \left \{ \begin{array}{ll} q/p, & \mbox{if $q \leq p$}, \\ 1, & \mbox{if $q \geq p,$} \end{array} \right.\]

    y

    \[h'(1) = \left \{ \begin{array}{ll} 1/(q - p), & \mbox{if $q > p$}, \\ \infty, & \mbox{if $q = p.$} \end{array} \right.\]

    Interpreta tus resultados en términos del tiempo\(T\) para llegar a 0. (Ver también Ejemplo [examen 10.1.7].)

    Ejercicio\(\PageIndex{3}\)

    Demuestre que la expansión de la serie Taylor para\(\sqrt{1 - x}\)

    \[\sqrt{1 - x} = \sum_{n = 0}^\infty {{1/2} \choose n} x^n\ ,\]

    donde el coeficiente binomial\({1/2} \choose n\) es

    \[{{1/2} \choose n} = \frac{(1/2)(1/2 - 1) \cdots (1/2 - n + 1)}{n!}\ .\]

    Usando esto y el resultado del Ejercicio [exer 12.2.2], muestran que la probabilidad de que el jugador se arruine en el paso\(n\) th es

    \[p_T(n) = \left \{ \begin{array}{ll} \frac{(-1)^{k - 1}}{2p} {{1/2} \choose k} (4pq)^k, & \mbox{if $n = 2k - 1$,} \\ 0, & \mbox{if $n = 2k$.} \end{array} \right.\]

    Ejercicio\(\PageIndex{4}\)

    Para el problema de la ruina del jugador, supongamos que el jugador empieza con\(k\) dólares. \(T_k\)Sea el momento de llegar a 0 por primera vez.

    1. Demostrar que la función generadora\(h_k(t)\) para\(T_k\) es la potencia\(k\) th de la función generadora para que el tiempo se arruine\(T\) a partir de 1.: Vamos\(T_k = U_1 + U_2 +\cdots+ U_k\), donde\(U_j\) es el tiempo para que la caminata\(j\) a partir de llegar\(j - 1\) por primera vez.
    2. Encuentra\(h_k(1)\)\(h_k'(1)\) e interpreta tus resultados.

    Los siguientes tres problemas provienen de Feller. 7

    Ejercicio\(\PageIndex{5}\)

    Al igual que en el texto, supongamos que\(M\) es un entero positivo fijo.

    1. Demuestre que si un jugador comienza con una apuesta de 0 (y se le permite tener una cantidad negativa de dinero), entonces la probabilidad de que su apuesta alcance el valor de\(M\) antes de que vuelva a 0 es igual\(p(1 - q_1)\).
    2. Demuestre que si el jugador comienza con una apuesta de\(M\) entonces la probabilidad de que su apuesta llegue a 0 antes de que vuelva a\(M\) iguales\(qq_{M-1}\).
    Ejercicio\(\PageIndex{6}\)

    Supongamos que un jugador empieza con una apuesta de 0 dólares.

    1. Demostrar que la probabilidad de que su apuesta nunca llegue\(M\) antes de volver a 0 es igual\(1 - p(1 - q_1)\).
    2. Mostrar que la probabilidad de que su apuesta alcance el valor\(M\) exactamente\(k\) veces antes de volver a 0 es igual\(p(1-q_1)(1 - qq_{M-1})^{k-1}(qq_{M-1})\).: Usar Ejercicio [exer 12.2.5].
    Ejercicio\(\PageIndex{7}\)

    En el texto, se demostró que si\(q < p\), hay una probabilidad positiva de que un jugador, comenzando con una apuesta de 0 dólares, nunca regrese al origen. Así, ahora vamos a asumir eso\(q \ge p\). Usando Ejercicio [exer 12.2.6], mostrar que si un jugador comienza con una apuesta de 0 dólares, entonces el número esperado de veces que su apuesta es igual\(M\) antes de volver a 0 es igual\((p/q)^M\), si\(q > p\) y 1, si\(q = p\). (Citamos de Feller: “Las implicaciones verdaderamente sorprendentes de este resultado aparecen mejor en el lenguaje de los juegos justos. Se lanza una moneda perfecta hasta la primera igualación de los números acumulados de cabezas y colas. El jugador recibe un centavo por cada vez que el número acumulado de cabezas supere al número acumulado de colas por\(m\). “)

    Ejercicio\(\PageIndex{8}\)

    En el juego en Ejercicio [exer 12.2.7], vamos\(p = q = 1/2\) y\(M = 10\). ¿Cuál es la probabilidad de que la apuesta del jugador sea igual al\(M\) menos 20 veces antes de que vuelva a 0?

    Ejercicio\(\PageIndex{9}\)

    Escribir un programa de computadora que simule el juego en Ejercicio [exer 12.2.7] para el caso\(p = q = 1/2\), y\(M = 10\).

    Ejercicio\(\PageIndex{19}\)

    En la descripción del juego que hace de de Moivre, podemos modificar la definición de la fortuna del jugador A de tal manera que el juego sigue siendo una martingala (y los cálculos son más sencillos). Esto lo hacemos asignando valores nominales a los contadores de la misma manera que de Moivre, pero la fortuna actual de cada jugador se define como solo el valor del contador que se está apostando en el próximo juego. Entonces, si el jugador A tiene\(a\) contadores, entonces su fortuna actual es\((q/p)^a\) (estipulamos que esto es cierto aunque\(a = 0\)). Demuestre que bajo esta definición, la fortuna esperada del jugador A después de una jugada iguala a su fortuna antes de la jugada, si\(p \ne q\). Entonces, como hace de Moivre, escribe una ecuación que exprese el hecho de que la fortuna final esperada del jugador A es igual a su fortuna inicial. Usa esta ecuación para encontrar la probabilidad de ruina del jugador A.

    Ejercicio\(\PageIndex{11}\)

    Asumir en el problema de la ruina del jugador que\(p = q = 1/2\).

    1. Usando la ecuación [eq 12.2.2], junto con los hechos que\(q_0 = 1\) y\(q_M = 0\), muestran que para\(0 \le z \le M\),\[q_z = {{M - z}\over M}\ .\]
    2. En la Ecuación [eq 12.2.3], let\(p \rightarrow 1/2\) (y since\(q = 1 - p\),\(q \rightarrow 1/2\) también). Demostrar que en el límite,

      \[q_z = {{M - z}\over M}\ .\]: Reemplazar\(q\) por\(1-p\), y usar la regla de L'Hopital.

    Ejercicio\(\PageIndex{12}\)

    En los casinos americanos, las ruedas de ruleta tienen los enteros entre 1 y 36, junto con 0 y 00. La mitad de los números distintos de cero son rojos, la otra mitad son negros, y 0 y 00 son verdes. Una apuesta común en este juego es apostar un dólar al rojo. Si aparece un número rojo, el apostante recupera su dólar, y también recibe otro dólar. Si aparece un número negro o verde, pierde su dólar.

    1. Supongamos que alguien empieza con 40 dólares, y sigue apostando por el rojo hasta que o bien su fortuna llegue a 50 o 0. Encuentra la probabilidad de que su fortuna alcance los 50 dólares.
    2. ¿Con cuánto dinero tendría que empezar, para que tenga un 95% de posibilidades de ganar 10 dólares antes de ir a la quiebra?
    3. Una vez se escuchó a un dueño de un casino comentar que “Si sacáramos 0 y 00 de la rueda de la ruleta, seguiríamos ganando mucho dinero, porque la gente seguiría entrando y jugando hasta que perdieran todo su dinero”. ¿Crees que un casino así se quedaría en el negocio?

    This page titled 12.2: Ruina del jugador is shared under a GNU Free Documentation License 1.3 license and was authored, remixed, and/or curated by Charles M. Grinstead & J. Laurie Snell (American Mathematical Society) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.