Saltar al contenido principal
LibreTexts Español

3.1: Introducción a los juegos repetidos

  • Page ID
    107906
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Ahora que somos expertos en encontrar pares de equilibrio, ¿qué sucede cuando un juego no tiene pares de equilibrio? ¿Qué deben hacer nuestros jugadores?

    Ejemplo 3.1.1 : A\(2 \times 2\) Repeated Game

    Considera el siguiente juego de suma cero

    \(\begin{bmatrix}1 & 0 \\-1 & 2 \end{bmatrix}\)

    ¿Este juego tiene par de equilibrio? Juega a este juego con un oponente\(10\) veces. Cuenta tus victorias y derrotas. Describe cómo elegiste qué estrategia jugar. Describe cómo tu oponente eligió qué estrategia jugar.

    Al jugar el juego varias veces, ¿tiene sentido que alguno de los jugadores juegue la misma estrategia todo el tiempo? ¿Por qué o por qué no?

    Aunque usamos el término “estrategia” para significar qué fila (o columna) elige jugar un jugador, también nos referiremos a cómo un jugador juega un juego repetido como estrategia del jugador. Para evitar confusiones, en juegos repetidos definiremos algunas estrategias específicas.

    Definición: Pure Strategy

    En un juego repetido, si un jugador siempre juega la misma fila (o columna), decimos que está jugando una estrategia pura.

    Por ejemplo, si el Jugador 1 siempre juega la Fila A, decimos que está jugando pura estrategia A.

    Definición: Estrategia Mixta

    Si un jugador varía en qué fila (o columna) juega, entonces decimos que está jugando una estrategia mixta.

    Por ejemplo, si un jugador juega la Fila A\(40 \%\) de la época y la Fila B\(60 \%\) de la época, diremos que está jugando una\((.4, .6)\) estrategia, ya que generalmente usamos la probabilidad más que el porcentaje. Las probabilidades de cada estrategia se enumerarán en el mismo orden que las estrategias en la matriz.

    No basta con determinar con qué frecuencia jugar una estrategia. Supongamos que el Jugador 1 solo alterna filas en Ejemplo\(3.1.1\). ¿Puede el Jugador 2 “superar a adivinar” al Jugador 1? ¿Cuál podría ser una mejor manera para que el jugador 1 juegue?

    Realmente nos gustaría encontrar la manera de determinar la mejor estrategia mixta para cada jugador en juegos repetidos. Empecemos con lo que ya sabemos: juegos con puntos de equilibrio. Si un juego tiene un par de equilibrio, ¿un jugador querría jugar una estrategia mixta? Recordemos que un par de estrategia es un par de equilibrio si ninguno de los jugadores gana cambiando de estrategia.

    Ejemplo 3.1.2 : Repetir un juego con un equilibrio

    Considera el siguiente juego de suma cero

    \(\begin{bmatrix} -1 & 1 \\ 0 & 2 \end{bmatrix}\)

    Este juego tiene un par de equilibrio. Convénzate de que si este juego se juega repetidamente, cada jugador debe optar por jugar una estrategia pura.

    Así, si el juego tiene un equilibrio sabemos que los jugadores jugarán las estrategias puras determinadas por las parejas de equilibrio. Entonces volvamos a pensar en juegos sin pares de equilibrio. Si jugamos un juego así una vez, ¿podemos predecir el resultado? ¿Y si repetimos el juego varias veces— ¿podemos predecir el resultado? Piensa en lanzar una moneda. Si lo arrojas una vez, ¿puedes predecir el resultado? ¿Y si lo arrojas\(100\) veces— ¿puedes predecir el resultado? No exactamente, pero podemos decir lo que esperamos: si lanzamos una moneda\(100\) veces esperamos que la mitad de las monedas suban la cabeza y la mitad vuelvan colas. Este puede no ser el resultado real, pero es una predicción razonable. Ahora es un buen momento para recordarte sobre encontrar el valor esperado!!

    Recordemos el familiar juego Rock-Paper-Scissors: ROCK late TIJERAS, TIJERAS bate PAPEL, y PAPEL Utilizando la matriz de pago y la experimentación, intentaremos determinar la mejor estrategia para este juego.

    Ejercicio 3.1.1 : Matriz de pago de RPS

    Construye una matriz de juego para Roca-Papel-Tijeras.

    Ejercicio 3.1.2 : RPS y puntos de equilibrio

    ¿Es Rock-Pap-Scissors un juego de suma cero? ¿Tiene un punto de equilibrio? Explique.

    Ejercicio 3.1.3 : Reproducir RPS

    Queremos ver qué pasa si repetimos Rock-Papel-Tijeras. Juega el juego diez veces con un oponente. Registre los resultados (enumere los pares de estrategia y los beneficios para cada jugador).

    Ejercicio 3.1.4 : Conjetura una estrategia

    Describe cualquier estrategia que hayas utilizado en Ejercicio\(3.1.3\).

    Ejercicio 3.1.5 : Fortalezas y Debilidades de Tu Estrategia

    Reflexiona sobre tu estrategia elegida. ¿Te garantiza un “triunfo”? ¿Qué debería significar “ganar” en un juego repetido? ¿Cuáles son las fortalezas y debilidades de tu estrategia?

    Ejercicio 3.1.6 : Comparte tu estrategia

    Discuta tu estrategia con alguien más de la clase (puede ser tu oponente). Después de compartir tus ideas para una estrategia, ¿puedes mejorar tu estrategia anterior?

    Aunque es posible que hayas ideado una buena estrategia, veamos si no podemos decidir cuál debería ser la “mejor” estrategia para Roca-Papel-Tijeras. Supongamos que estamos jugando Rock-Paper-Scissors contra el jugador más inteligente que jamás haya vivido. Llamaremos a tal oponente el jugador “perfecto”.

    Ejercicio 3.1.7 : La debilidad de una estrategia pura

    Explica por qué no es buena idea jugar una estrategia pura; es decir, jugar solo ROCA, solo PAPEL, o solo TIJERAS.

    Ejercicio 3.1.8 : Una estrategia desigual

    ¿Tiene sentido jugar una opción con más frecuencia que otra (por ejemplo, ROCK más a menudo que PAPEL)? Explique.

    Ejercicio 3.1.9 : Frecuencia de\(\text{R}\), \(\text{P}\), \(\text{S}\)

    ¿Con qué frecuencia deberías jugar cada opción?

    Ejercicio 3.1.10 : Reproducción de un patrón

    ¿Quieres jugar en un patrón predecible o al azar? ¿Cuáles son algunas ventajas y desventajas de un patrón? ¿Cuáles son algunas ventajas y desventajas de una estrategia aleatoria?

    Ojalá concluyeras que la mejor estrategia contra nuestro jugador perfecto sería jugar ROCK, PAPEL, TIJERAS\(\dfrac{1}{3}\) de la época cada una, y jugar al azar. Podemos decir que nuestra estrategia es jugar cada opción al azar con una probabilidad de\(\dfrac{1}{3}\), y llamar a esto la\(\left(\dfrac{1}{3}, \dfrac{1}{3}, \dfrac{1}{3}\right)\) estrategia Aleatoria.

    Ejercicio 3.1.11 : pago a largo plazo

    Usando esta “mejor” estrategia, ¿cuál predice que será el pago a largo plazo para el Jugador 1? ¿Para el Jugador 2?

    Ejercicio 3.1.12 : Probando el Aleatorio\(\left(\dfrac{1}{3}, \dfrac{1}{3}, \dfrac{1}{3}\right)\) Strategy

    Comprobemos nuestra predicción. Usando un dado, dejar\(1\) y\(2\) representar ROCA,\(3\) y\(4\) representar PAPEL,\(5\) y\(6\) representar TIJERAS. Juega los\(20\) tiempos de juego con alguien en clase donde cada jugador rueda para determinar la elección de ROCA, PAPEL o TIJERA. Lleve un registro de los pares de estrategias y los beneficios. ¿Cuál fue el pago total para cada jugador? (En este punto, si aún sientes que tienes una mejor estrategia, prueba tu estrategia contra la aleatoria— ¡mira qué pasa!)

    Ejercicio 3.1.13 : Compare con su predicción

    ¿Cómo se comparó el resultado real con su resultado predicho? ¿Qué esperas que pasaría si juegas los\(100\) tiempos de juego? (¿O más?)

    Usando ideas sobre probabilidad y valor esperado podemos responder con mayor precisión Ejercicio\(3.1.13\).

    Ejercicio 3.1.14 : Probabilidades cuando ambos jugadores juegan la estrategia aleatoria

    Supongamos que ambos jugadores están usando la\(\left(\dfrac{1}{3}, \dfrac{1}{3}, \dfrac{1}{3}\right)\) estrategia Aleatoria. Enumere todos los resultados posibles para un solo juego (recuerde que el resultado es el par de estrategia y el pago, por ejemplo\([R, P]\),\((-1, 1)\)). ¿Cuál es la probabilidad de que se juegue algún par de estrategias en particular? ¿Los pares de estrategia son igualmente probables?

    Ejercicio 3.1.15 : Valor esperado

    Utilizando las probabilidades y los beneficios de Ejercicio\(3.1.14\) calcular el valor esperado del juego para cada jugador.

    Ejercicio 3.1.16 : Estrategia para los repetidos\(2 \times 2\) Game

    Ahora considere la matriz del Ejemplo\(3.1.1\) anterior:

    \(\begin{bmatrix}1 & 0 \\-1 & 2 \end{bmatrix}\)

    Ve si puedes determinar con qué frecuencia el Jugador 1 debe jugar cada fila y con qué frecuencia el Jugador 2 debe jugar cada columna. Intenta probar tu estrategia propuesta (es posible que puedas usar una variación en los dados como vimos en Ejercicio\(3.1.12\)). Escribe cualquier estrategia conjeturada y los resultados de jugar el juego con tu estrategia. ¿Crees que has ideado la mejor estrategia? Explique.

    Es posible que hayas tenido una idea sobre la mejor manera de jugar a Rock-Paper-Scissors antes de trabajar en esta sección, pero ¿cómo podemos encontrar soluciones a otros juegos, como el de Ejercicio\(3.1.16\)? No queremos simplemente usar un método de “adivinar y verificar”. ¡Sobre todo porque hay infinitamente muchas estrategias mixtas posibles para probar! El resto del capítulo desarrollará métodos matemáticos para resolver juegos repetidos sin punto de equilibrio.


    This page titled 3.1: Introducción a los juegos repetidos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Jennifer A. Firkins Nordstrom via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.