3.5: Póker del mentiroso
- Page ID
- 107898
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En esta sección, continuaremos explorando las ideas de un equilibrio de estrategia mixta. Hemos visto varios ejemplos de encontrar un equilibrio. Comenzamos con juegos que tenían un equilibrio de estrategia puro y luego pasamos a juegos con equilibrio de estrategia mixta. Vimos dos métodos diferentes para encontrar un equilibrio. Los primeros emplearon gráficas para comprender y encontrar las estrategias de maximin y minimax, y de ahí la estrategia mixta de equilibrio. El segundo método empleó las ideas de valor esperado para encontrar la estrategia de equilibrio. Seguiremos solidificando estas ideas con otro juego, una variación simplificada del poker.
Comenzamos con una baraja de cartas que tiene\(50 \%\) ases (A) y\(50 \%\) reyes (K). Los ases tienen un rango superior a los reyes. Al jugador 1 se le reparte una carta, boca abajo. El jugador 1 puede mirar la carta, pero no la muestra al Jugador 2. El jugador 1 luego dice “as” o “rey” dependiendo de cuál sea su carta. El jugador 1 puede decir la verdad y decir cuál es la carta (T), o puede farolear y decir que tiene una carta de mayor rango (B). Tenga en cuenta que si el Jugador 1 tiene un as, debe decir la verdad ya que no hay cartas de mayor rango. No obstante, si se le reparte un rey, puede farolear, diciendo que tiene un as. Si el Jugador 1 dice “rey” el juego termina y ambos jugadores se ponen de par. Si el Jugador 1 dice “as” entonces el Jugador 2 puede llamar (C) o doblar (F). Si el Jugador 2 se pliega, entonces el Jugador 1 gana\($0.50\). Si el Jugador 2 llama y el Jugador 1 no tiene un as, entonces el Jugador 2 gana\($1\). Si el Jugador 2 llama y el Jugador 1 tiene un as, entonces el Jugador 1 gana\($1\).
Elige un oponente y juega Liar's Poker varias veces. Asegúrate de jugar el juego como Jugador 1 y como Jugador 2. Esto es importante para entender el juego. Lleve un registro de los resultados.
Apenas de jugar Liar's Poker varias veces, ¿puedes sugerir una estrategia para el Jugador 1? ¿Y para el Jugador 2? ¿Este juego parece justo, o uno de los jugadores parece tener ventaja? Explique sus respuestas.
Para analizar formalmente Liar's Poker, deberíamos encontrar la matriz de pago. Haz tu mejor esfuerzo para encontrar la matriz de pago. En una sola mano de Liar's Poker, ¿cuáles son las estrategias posibles para el Jugador 1? ¿Cuáles son las estrategias posibles para el Jugador 2? Determina cualquier pago que puedas.
Encontrar la matriz de pago en Ejercicio\(3.5.3\) es probablemente más desafiante de lo que parece. Finalmente, queremos emplear el mismo método para encontrar la matriz de pago que usamos en One-Card Stud Poker del Ejemplo\(2.4.1\) en el Capítulo 2, pero primero necesitamos entender las estrategias de cada jugador y los beneficios resultantes. Comenzamos con el hecho de que al Jugador 1 se le puede repartir un as o un rey.
Supongamos que el jugador 1 recibe un as. ¿Qué puede hacer el Jugador 1? ¿Qué puede hacer el jugador 2? ¿Cuál es la retribución para cada situación?
Supongamos que el jugador 1 recibe un rey. ¿Qué puede hacer el Jugador 1? ¿Qué puede hacer el jugador 2? ¿Cuál es la retribución para cada situación?
Dado que el Jugador 1 debe decir “as” cuando se le reparte un as, solo tiene opción de estrategia cuando se le reparte a un rey. Para que podamos definir su estrategia independientemente del trato. Una estrategia es decir “as” cuando se le reparte un as y decir “as” cuando se le reparte a un rey; llamar a esto la estrategia de farol (B). La otra estrategia es decir “as” cuando se le reparte un as y decir “rey” cuando se trata de un rey; llamar a esto la estrategia de la verdad (T). Recordemos que la única vez que el Jugador 2 tiene una opción es cuando el Jugador 1 dice “as”. En este caso, el Jugador 2 puede llamar (C) o doblar (F). Dado que necesitamos determinar la matriz de pago, primero necesitamos determinar los beneficios para estrategias puras. Esto es similar a lo que hicimos para el juego One-Card Stud.
Considera la estrategia pura del Jugador 1 de siempre farol cuando se le reparte un rey (B) y la estrategia pura del Jugador 2 de llamar siempre (C). Determina el valor esperado para el Jugador 1. ¿Cuál es el valor esperado del Jugador 2?
- Sugerencia
-
Es necesario considerar cada trato posible.
De igual manera, determinar el valor esperado para el Jugador 1 para el par de estrategia pura [B, F]. ¿Cuál es el valor esperado del Jugador 2?
Determinar el valor esperado para el Jugador 1 para el par de estrategia pura [T, C]. ¿Cuál es el valor esperado del Jugador 2?
Determinar el valor esperado para el Jugador 1 para el par de estrategia pura [T, F]. ¿Cuál es el valor esperado del Jugador 2?
Usando los valores esperados que calculaste en Ejercicio\(3.5.6\)\(3.5.7\), Ejercicio\(3.5.8\), Ejercicio y Ejercicio\(3.5.9\), configura\(2 \times 2\) la matriz de pago para Liar's Poker.
Una vez que hayas determinado la matriz de pago para Liar's Poker, puedes usar el método gráfico o el método de valor esperado para resolver el juego. Pero antes de usar cualquiera de estos métodos, ¡siempre verifique un equilibrio de estrategia puro!
Usando la matriz de pago que encontraste en Ejercicio\(3.5.10\), ¿Liar's Poker tiene un equilibrio de estrategia puro? Explique.
Usa cualquier método que hayas aprendido para encontrar un equilibrio de estrategia mixta para Liar's Poker. Da la estrategia mixta para el Jugador 1 y la estrategia mixta para el Jugador 2.
Compara tu solución de Ejercicio\(3.5.12\) a tu estrategia conjeturada de Ejercicio\(3.5.2\).
¿Cuál es el valor esperado del juego para cada jugador? ¿Cuánto esperaría ganar la jugadora 1 si jugaba\(15\) juegos usando la estrategia mixta de equilibrio?
¿Este juego es justo? Explique. Nuevamente, compara tu respuesta con tu conjetura en Ejercicio\(3.5.2\).
¡Felicidades! Ahora puedes configurar matrices para juegos simples de azar y resolver para un equilibrio de estrategia mixta. Antes de resolver un juego más complicado, consigamos la ayuda de la tecnología para resolver juegos de matriz más grandes.