Saltar al contenido principal
Library homepage
 
LibreTexts Español

13.8: El juego rojo y negro

  • Page ID
    152115
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \(\newcommand{\P}{\mathbb{P}}\)\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\R}{\mathbb{R}}\)\(\newcommand{\N}{\mathbb{N}}\)\(\newcommand{\bs}{\boldsymbol}\)\(\newcommand{\var}{\text{var}}\)\(\newcommand{\sd}{\text{sd}}\)

    En esta sección y en las tres secciones siguientes, estudiaremos estrategias de juego para uno de los modelos de juego más simples. Sin embargo, a pesar de la simplicidad del modelo, el análisis matemático conduce a algunos resultados hermosos y a veces sorprendentes que tienen importancia y aplicación mucho más allá del juego. Nuestra exposición se basa principalmente en el libro clásico de Dubbins y Savage, Desigualdades para procesos estocásticos (How to Gamble if You Must) de Lester E Dubbins y Leonard J Savage (1965).

    Teoría Básica

    Supuestos

    Aquí está la situación básica: El jugador comienza con una suma inicial de dinero. Ella apuesta por juegos independientes, probabilísticamente idénticos, cada uno con dos resultados: ganar o perder. Si gana un juego, recibe el monto de la apuesta en ese juego; si pierde un juego, debe pagar el monto de la apuesta. Así, el jugador juega en apuestas pares. Esta situación particular (juegos IID e incluso apuestas) se conoce como rojo y negro, y lleva el nombre de las apuestas de color en la ruleta del juego de casino. Otros ejemplos son el pase y no pases apuestas en dados.

    Tratemos de formular matemáticamente el experimento del juego. Primero, vamos a\(I_n\) denotar el resultado del\(n\) th juego para\(n \in \N_+\), donde 1 denota una victoria y 0 denota una pérdida. Estas son variables aleatorias indicadoras independientes con la misma distribución:\[ \P\left(I_j = 1\right) = p_j, \quad \P\left(I_j = 0\right) = q = 1 - p_j \] donde\(p \in [0, 1]\) está la probabilidad de ganar un juego individual. Así,\(\bs{I} = (I_1, I_2, \ldots)\) es una secuencia de ensayos de Bernoulli.

    Si\(p = 0\), entonces el jugador siempre pierde y si\(p = 1\) entonces el jugador siempre gana. Estos casos triviales no son interesantes, por lo que normalmente asumiremos eso\(0 \lt p \lt 1\). En casas de juego reales, claro,\(p \lt \frac{1}{2}\) (es decir, los juegos son injustos para el jugador), por lo que nos interesará particularmente este caso.

    Procesos Aleatorios

    La fortuna del jugador a lo largo del tiempo es el proceso básico aleatorio de interés: Vamos a\(X_0\) denotar la fortuna inicial del jugador y\(X_i\) la fortuna del jugador después de\(i\) los juegos. La estrategia del jugador consiste en las decisiones de cuánto apostar en los distintos juegos y cuándo dejar de fumar. Dejar\(Y_i\) denotar la cantidad de la apuesta\(i\) th, y dejar\(N\) denotar el número de juegos jugados por el jugador. Si queremos, siempre podemos suponer que los juegos continúan para siempre, pero con la suposición de que el jugador apuesta 0 en todos los juegos posteriores\(N\). Con esta comprensión, el resultado del juego, la fortuna y los procesos de apuesta se definen para todo momento\(i \in \N_+\).

    El proceso de la fortuna está relacionado con el proceso de apuesta de la siguiente manera:\[ X_j = X_{j-1} + \left(2 I_j - 1\right) Y_j, \quad j \in \N_+ \]

    Estrategias

    La estrategia del jugador puede ser muy complicada. Por ejemplo, la variable aleatoria\(Y_n\), la apuesta del jugador en el juego\(n\), o el evento\(N = n - 1\), su decisión de detenerse después de\(n - 1\) los juegos, podría basarse en toda la historia pasada del juego, hasta el tiempo\(n\). Técnicamente, esta historia forma un\( \sigma \) álgebra:\[ \mathscr{H}_n = \sigma\left\{X_0, Y_1, I_1, Y_2, I_2, \ldots, Y_{n-1}, I_{n-1}\right\} \] Además, podrían tener fuentes adicionales de aleatoriedad. Por ejemplo, un jugador que juega a la ruleta podría basar en parte sus apuestas en el rollo de un dado afortunado que guarda en su bolsillo. No obstante, la jugadora no puede ver el futuro (desafortunadamente desde su punto de vista), por lo que al menos podemos asumir eso\(Y_n\) y\(\{N = n - 1\}\) somos independientes de\(\left(I_1, I_2, \ldots, I_{n-1}\right)\).

    Al menos en términos de valor esperado, cualquier estrategia de juego es inútil si los juegos son injustos.

    \(\E\left(X_i\right) = \E\left(X_{i-1}\right) + (2 p - 1) \E\left(Y_i\right)\)para\(i \in \N_+\)

    Prueba

    Esto se desprende del resultado anterior y del supuesto de no presciencia.

    Supongamos que el jugador tiene una probabilidad positiva de hacer una apuesta real en el juego\(i\), así que eso\(\E(Y_i) \gt 0\). Entonces

    1. \(\E(X_i) \lt \E(X_{i-1})\)si\(p \lt \frac{1}{2}\)
    2. \(\E(X_i) \gt \E(X_{i-1})\)si\(p \gt \frac{1}{2}\)
    3. \(\E(X_i) = \E(X_{i-1})\)si\(p = \frac{1}{2}\)
    Prueba

    Esto se desprende del resultado anterior sobre el valor esperado de\( X_i \).

    Así, en cualquier juego en el que el jugador haga una apuesta positiva, su fortuna esperada disminuye estrictamente si los juegos son injustos, sigue siendo el mismo si los juegos son justos, y aumenta estrictamente si los juegos son favorables.

    Como señalamos anteriormente, una estrategia general puede depender de la historia pasada y puede ser aleatorizada. No obstante, dado que los juegos subyacentes de Bernoulli son independientes, se podría adivinar que estas complicadas estrategias no son mejores que simples estrategias en las que el monto de la apuesta y la decisión de parar se basan únicamente en la fortuna actual del jugador. Estas estrategias simples realmente juegan un papel fundamental y se las conoce como estrategias estacionarias, deterministas. Tal estrategia puede ser descrita por una función\(S\) de apuestas desde el espacio de las fortunas hasta el espacio de las apuestas permisibles, de modo que esa\(S(x)\) es la cantidad que apuesta el jugador cuando su fortuna actual es\(x\).

    La regla de detención

    A partir de ahora, asumiremos que la regla de parada del jugador es muy simple y estándar: apostará por los juegos hasta que pierda toda su fortuna y se arruine o alcance una fortuna objetivo fijo\(a\):\[ N = \min\{n \in \N: X_n = 0 \text{ or } X_n = a\} \] Así, cualquier estrategia (función de apuestas)\(S\) debe satisfacer\(s(x) \le \min\{x, a - x\}\) para\(0 \le x \le a\): la jugadora no puede apostar lo que no tiene, y no apostará más de lo necesario para alcanzar el objetivo\(a\).

    Si queremos, podemos pensar en la diferencia entre la fortuna objetivo y la fortuna inicial como toda la fortuna de la casa. Con esta interpretación, el jugador y la casa juegan papeles simétricos, pero con probabilidades de ganar complementarias: el juego continúa hasta que o el jugador se arruina o la casa se arruina. Nuestro principal interés está en la fortuna final\(X_N\) del jugador. Tenga en cuenta que esta variable aleatoria toma solo dos valores; 0 y\(a\).

    La media y varianza de la fortuna final están dadas por

    1. \(\E(X_N) = a \P(X_N = a)\)
    2. \(\var(X_N) = a^2 \P(X_N = a) \left[1 - \P(X_N = a)\right]\)

    Presumiblemente, al jugador le gustaría maximizar la probabilidad de alcanzar la fortuna objetivo. ¿Es mejor apostar pequeñas cantidades o grandes cantidades, o no importa? ¿Cómo depende la estrategia óptima, si la hay, de la fortuna inicial, la fortuna objetivo y la probabilidad de ganar el juego?

    También nos interesa\(\E(N)\), el esperado número de partidos jugados. Quizás un objetivo secundario de la jugadora es maximizar el número esperado de juegos que llega a jugar. ¿Los dos objetivos son compatibles o incompatibles? Es decir, ¿puede el jugador maximizar tanto su probabilidad de alcanzar el objetivo como el número esperado de juegos jugados, o maximizar una cantidad significa necesariamente minimizar la otra?

    En las dos secciones siguientes, analizaremos y compararemos dos estrategias que en cierto sentido son opuestas:

    • Juego tímido: En cada juego, hasta que se detiene, la jugadora hace una pequeña apuesta constante, digamos $1.
    • Juego en negrita: En cada juego, hasta que se detiene, la jugadora apuesta ya sea toda su fortuna o la cantidad necesaria para alcanzar la fortuna objetivo, la que sea más pequeña.

    En la sección final del capítulo, volveremos a la cuestión de las estrategias óptimas.


    This page titled 13.8: El juego rojo y negro is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.