Saltar al contenido principal
LibreTexts Español

4.2: Dilema del prisionero y pollo

  • Page ID
    107896
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Antes de profundizar en los juegos que no son de suma cero, recordemos algunas ideas clave sobre los juegos de suma cero.

    • Si un juego de suma cero tiene un punto de equilibrio, entonces repetir el juego no afecta cómo jugarán los jugadores.
    • Si un juego de suma cero tiene más de un punto de equilibrio entonces los valores de los puntos de equilibrio son los mismos.
    • En un juego de suma cero, podemos encontrar puntos de equilibrio de estrategia mixta utilizando el método gráfico o el método del valor esperado.
    • En un juego de suma cero, un jugador nunca se beneficia de comunicar su estrategia a su oponente.

    ¡Ojalá, en la última sección, hayas visto que los juegos que no sean de suma cero pueden diferir en todo lo anterior!

    Ejemplo 4.2.1 : A\(2\times 2\) Non-Zero Sum Game

    Consideremos el juego dado por Table\(4.2.1\).

    Tabla\(4.2.1\): Un ejemplo de suma distinta de cero
    \ (4.2.1\): Un ejemplo de suma distinta de cero"> \(C\) \(D\)
    \ (4.2.1\): Un ejemplo de suma distinta de cero">\(A\) \((0, 0)\) \((10, 5)\)
    \ (4.2.1\): Un ejemplo de suma distinta de cero">\(B\) \((5, 10)\) \((0, 0)\)
    Ejercicio 4.2.1 : Suma no cero

    Comprueba que este NO es un juego de suma cero.

    Incluso con juegos que no sean de suma cero, es útil comenzar por encontrar cualquier punto de equilibrio.

    Ejercicio 4.2.2 : Puntos de equilibrio

    Usando el método de “adivinar y verificar” para encontrar equilibrios, deberías poder determinar que Table\(4.2.1\) tiene dos puntos de equilibrio. ¿Qué son?

    Ejercicio 4.2.3 : Preferencia entre Equilibrios

    Como vimos en la Sección 4.1, los puntos de equilibrio en los juegos de suma distinta a cero no necesitan tener los mismos valores. ¿El Jugador 1 prefiere uno de los equilibrios de Ejercicio\(4.2.2\) sobre el otro?

    Dado que ahora es posible que AMBOS jugadores se beneficien al mismo tiempo, podría ser una buena idea que los jugadores se comuniquen entre sí. Por ejemplo, si el Jugador 1 dice que elegirá A pase lo que pase, entonces lo mejor para el Jugador 2 es elegir D. Si se permite la comunicación en el juego, entonces decimos que el juego de suma distinta a cero es cooperativo. Si no se permite la comunicación, decimos que es no cooperativa.

    Vimos en la Sección 4.1, que nuestros métodos para analizar juegos de suma cero no funcionan muy bien en juegos que no sean de suma cero. Veamos un poco más de cerca esto.

    Si aplicamos el método gráfico para el Jugador 1 al juego anterior, obtenemos que el Jugador 1 debe jugar una estrategia\(\left(\dfrac{1}{3}, \dfrac{2}{3}\right)\) mixta para obtener una recompensa esperada de\(\dfrac{10}{3}\). De igual manera podemos determinar que el Jugador 2 debe jugar una estrategia\(\left(\dfrac{2}{3}, \dfrac{1}{3}\right)\) mixta para obtener una recompensa esperada de\(\dfrac{10}{3}\). Recordemos que desarrollamos esta estrategia como una estrategia “súper defensiva”. Pero, ¿nuestros jugadores están motivados para jugar tan defensivamente en un juego que no sea de suma cero? ¡No necesariamente! ¡Ya no es cierto que el Jugador 2 necesite evitar que el Jugador 1 gane!

    Ahora supongamos, el Jugador 1 juega la\(\left(\dfrac{1}{3}, \dfrac{2}{3}\right)\) estrategia. Entonces el pago esperado al Jugador 2 por jugar estrategia pura C,\(E_2(C)\text{,}\) es\(\dfrac{20}{3}\); y el pago esperado al Jugador 2 por jugar estrategia pura D,\(E_2(D)\text{,}\) es\(\dfrac{5}{3}\). Así, el Jugador 2 prefiere C sobre D. Pero si el Jugador 2 juega solo C, entonces el Jugador 1 debería abandonar su\(\left(\dfrac{1}{3}, \dfrac{2}{3}\right)\) estrategia y ¡simplemente jugar B! Esto da como resultado el vector de pago\((5, 10)\). Observe, que ahora el valor esperado para el Jugador 1 es\(5\), ¡que es mejor que\(\dfrac{10}{3}\)! Nuevamente, dado que el Jugador 2 no está tratando de evitar que el Jugador 1 gane, no hay razón para aplicar la estrategia maximin a juegos que no sean de suma cero. Del mismo modo, no queremos aplicar la solución de valor esperado ya que al Jugador 1 no le importa si los valores esperados del Jugador 2 son iguales. A cada jugador solo le importa su propia recompensa, no la recompensa del otro jugador.

    Bien, entonces ahora, ¿cómo analizamos estos juegos?

    Ejercicio 4.2.4 : Conjetura una estrategia

    ¿Cuáles son algunas estrategias posibles para cada jugador? ¿Podrían depender algunas estrategias de lo que un jugador sepa de su oponente?

    ¿Ves que parte del análisis podría entenderse mejor con la psicología que con las matemáticas?

    Para entender mejor los juegos que no son de suma cero nos fijamos en dos juegos clásicos.

    Ejemplo 4.2.2 : El dilema del prisionero

    Dos compañeros en el delito son detenidos por robo y enviados a habitaciones separadas. A cada uno se les ofrece un trato: si confiesan y delatan a su pareja, recibirán una sentencia reducida. Entonces, si uno confiesa y el otro no, el confesor sólo recibe\(3\) meses de prisión, mientras que la pareja cumple\(10\) años. Si ambos confiesan, entonces cada uno obtiene\(8\) años. No obstante, si ninguno confiesa, no hay pruebas suficientes, y cada uno recibe apenas un año. Podemos representar la situación con la matriz en la Tabla\(4.2.2\).

    Cuadro\(4.2.2\): El dilema del preso (años de prisión).
    \ (4.2.2\): El dilema del prisionero (años de prisión) . “> Prisionero 2
    \ (4.2.2\): El dilema del prisionero (años de prisión) . “> Confiesa No confiesas
    \ (4.2.2\): El dilema del prisionero (años de prisión).” rowspan="2">Prisionero 1 Confiesa
    No confiesas

    Dado que este juego, tal y como se presenta, probablemente solo se juega una vez, podemos comenzar por buscar estrategias dominadas y puntos de equilibrio.

    Ejercicio 4.2.5 : Estrategias Dominadas

    ¿La matriz en Tabla\(4.2.2\) tiene alguna estrategia dominada para el Jugador 1? ¿Tiene alguna estrategia dominada para el Jugador 2? Hay que tener en cuenta que un preso prefiere números menores ya que el tiempo en prisión es malo.

    Si fueras uno de los presos, ¿qué harías? ¿Crees que todos harían eso también? ¿Qué haría nuestro jugador perfectamente racional? ¿Cambiaría tu estrategia si te permiten comunicarte? Examinamos algunas de estas preguntas en los próximos ejercicios.

    Ejercicio 4.2.6 : La estrategia de un preso

    Supongamos que eres Prisionero 1. ¿Qué debes hacer? ¿Por qué? Supongamos que eres Prisionero 2. ¿Qué debes hacer? ¿Por qué? ¿Su elección de estrategias resulta en un par de equilibrio?

    Ejercicio 4.2.7 : El mejor resultado

    Al mirar el juego como un forastero, qué par de estrategias es la mejor opción para ambos presos.

    Ejercicio 4.2.8 : Dos prisioneros racionales

    Ahora supongamos que ambos presos son perfectamente racionales, de manera que cualquier decisión que tome el Prisionero 1 también sería la decisión que toma el Prisionero 2. Además, supongamos que ambos presos saben que su oponente es perfectamente racional. ¿Qué debe hacer cada prisionero?

    Ejercicio 4.2.9 : Un prisionero loco

    Supongamos que Prisionero 2 está loco y es probable que confiese con\(50/50\) casualidad. ¿Qué debe hacer el Prisionero 1? ¿Cambia si confiesa con\(75\%\) oportunidad? Y si confiesa con\(25\%\) oportunidad.

    Ejercicio 4.2.10 : Comunicación entre presos

    Supongamos que los presos son capaces de comunicarse sobre su estrategia. ¿Cómo podría afectar esto a lo que eligen hacer?

    Ejercicio 4.2.11 : El dilema

    Explique por qué esto es un “dilema” para los presos. ¿Es probable que elijan una estrategia que conduzca al mejor resultado para ambos? Es posible que desee considerar si hay estrategias dominadas.

    Ahora deberías tener alguna idea de por qué llamamos a este juego un dilema, ya que los jugadores de hecho pueden tener dificultades para decidir si confesar o no. Incluso dos jugadores perfectamente racionales tal vez no puedan obtener la mejor recompensa.

    Pasamos ahora a otro ejemplo clásico. Podemos preguntar qeustions similares sobre Pollo que preguntamos sobre El dilema del prisionero.

    Ejemplo 4.2.3 : Pollo

    Dos conductores conducen uno hacia el otro. Si un conductor se desvía, se le considera un “pollo”. Si un conductor no se desvía (conduce recto), se le considera el ganador. Por supuesto que si ninguno se desvía, chocan y ninguno gana. Una posible matriz de pago para este juego se da en la Tabla\(4.2.3\).

    Mesa\(4.2.3\): El juego del pollo
    \ (4.2.3\): El juego del pollo"> Conductor 2
    \ (4.2.3\): El juego del pollo"> Desviarse Recta
    \ (4.2.3\): El juego del pollo” rowspan="2">Conductor 1 Desviarse \((0, 0)\) \((-1, 10)\)
    Recta \((10, -1)\) \((-100, -100)\)

    Nuevamente, dado que este juego tal y como se presenta probablemente solo se juega una vez, podemos comenzar por buscar estrategias dominadas y puntos de equilibrio.

    Ejercicio 4.2.12 : Estrategias Dominadas

    ¿El juego de Pollo en Mesa\(4.2.3\) tiene alguna estrategia dominada?

    Ejercicio 4.2.13 : El mejor resultado

    ¿Qué estrategia da como resultado el mejor resultado para el Piloto 1? ¿Qué estrategia da como resultado el mejor resultado para el Conductor 2? ¿Qué pasa si ambos eligen esa estrategia?

    Ejercicio 4.2.14 : Puntos de equilibrio

    Considera el par de estrategia con resultado\((-1, 10)\text{.}\) ¿El piloto 1 se arrepiente de su elección? ¿Qué pasa con Driver 2? ¿Es este un punto de equilibrio? ¿Hay algún otro punto en el que ninguno de los conductores se arrepienta de su elección?

    Si fueras uno de los conductores, ¿qué harías? ¿Crees que todos harían eso también? ¿Qué haría nuestro jugador perfectamente racional? ¿Cambiaría tu estrategia si te permiten comunicarte? Examinamos algunas de estas preguntas en los próximos ejercicios.

    Ejercicio 4.2.15 : La estrategia de un conductor

    ¿Se puede determinar qué debe hacer cada chofer en Chicken? Si es así, ¿esto resulta en un par de equilibrio?

    Ejercicio 4.2.16 : Dos Conductores Racionales

    Ahora supongamos que ambos pilotos en el juego de Chicken son perfectamente racionales, por lo que cualquier decisión que tome el Conductor 1 también sería la decisión que tome el Conductor 2. Además, supongamos que ambos pilotos saben que su oponente es perfectamente racional. ¿Qué debe hacer cada conductor?

    Ejercicio 4.2.17 : Un controlador de control remoto

    Supongamos que Driver 2 es un maniquí de control remoto y se desviará o conducirá recto con una\(50/50\) oportunidad. ¿Qué debe hacer el Conductor 1? ¿Cambia si el maniquí de control remoto se desvía con\(75\%\) casualidad?

    Ejercicio 4.2.18 : Comunicación entre conductores

    ¿Puede beneficiar a los conductores en el juego de Chicken comunicarse sobre su estrategia? Explicar.

    Ejercicio 4.2.19 : Comparar juegos

    Compara El dilema del prisionero y el pollo. ¿Hay estrategias dominadas en ambos juegos? ¿Hay pares de equilibrio? ¿Es probable que los jugadores alcancen la recompensa óptima para un jugador, ambos jugadores o ninguno de los jugadores? ¿La elección de un jugador depende de lo que sepa de su oponente (perfectamente racional o perfectamente aleatorio)?

    Tanto Prisioner's Dilemma como Chicken son modelos de juegos donde describimos la elección de estrategia como “Cooperar” y “Defecto”. En El dilema del prisionero, pensamos en “cooperar” como cooperar con el otro jugador, y “desertar” como volverse contra el otro jugador. Entonces, si ambos jugadores cooperan (entre sí, no con la policía), obtendrán la mayor recompensa de sólo un año de prisión. Ellos desertan al ratarse el uno al otro. En Chicken, los jugadores cooperan descarriando y desertando conduciendo recto. Usando los ejemplos de Prisioner's Dilemma y Chicken, piensa en cómo estos juegos pueden modelar otras interacciones cotidianas donde podrías describir tus elecciones como cooperantes y desertores. El resto del capítulo mira más de cerca las situaciones en las que los jugadores pueden cooperar o desertar.


    This page titled 4.2: Dilema del prisionero y pollo is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Jennifer A. Firkins Nordstrom via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.