3.4: Estrategias Mixtas: Solución de Valor Esperado
- Page ID
- 107914
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En esta sección, utilizaremos la idea de valor esperado para encontrar las estrategias mixtas de equilibrio para juegos repetidos de suma cero de dos personas.
Uno de los inconvenientes significativos de la solución gráfica de las secciones anteriores es que sólo puede resolver juegos\(2 \times 2\) matriciales. Si cada jugador tiene\(3\) opciones, necesitaríamos graficar en tres dimensiones. Técnicamente esto es posible, pero bastante complicado. Si cada jugador tiene más que\(3\) opciones, ya que no podemos graficar en cuatro o más dimensiones, estamos en una pérdida completa. Entonces necesitamos pensar en una forma alternativa de resolver para las estrategias mixtas. Aunque comenzaremos con\(2 \times 2\) los juegos, este método se generalizará fácilmente a juegos más grandes.
Considera el juego en el que cada jugador puede elegir HEADS (H) o TAILS (T); si los dos jugadores coinciden, el Jugador 1 gana; si los dos jugadores difieren, el Jugador 2 gana. ¿Qué estrategia debe jugar cada jugador?
Determina la matriz de pago para el juego Matching Pennies.
Explica por qué el juego Matching Pennies no tiene un punto de equilibrio de estrategia pura.
Como sabemos que no existe un punto de equilibrio de estrategia pura, necesitamos buscar un punto de equilibrio de estrategia mixta. Con sólo mirar la matriz de pago para Matching Pennies, ¿cuál crees que sería una estrategia ideal para cada jugador? Explica tu elección.
Supongamos que ambos jugadores juegan tu estrategia ideal en el juego Matching Pennies, ¿cuál debería ser el valor esperado del juego?
Podríamos usar nuestro método gráfico anterior para determinar el valor esperado del juego (podrías probar esto rápidamente solo para verificar tu predicción). Sin embargo, como hemos señalado, un inconveniente importante de la solución gráfica es que si nuestros jugadores tienen\(3\) (o más) opciones, entonces necesitaríamos graficar una ecuación en\(3\) (¡o más!) variables; que, espero que estén de acuerdo, no queremos hacer. Si bien seguiremos centrándonos en\(2 \times 2\) los juegos, desarrollaremos un nuevo método que se pueda utilizar más fácilmente para resolver juegos más grandes.
Vamos a necesitar un poco de notación. Let
Además, dejaremos\(E_1(H)\) ser el valor esperado para el Jugador 1 jugando la estrategia pura H contra una estrategia dada para el Jugador 2. De igual manera,\(E_2(H)\) será el valor esperado del Jugador 2 por jugar estrategia pura H.
Supongamos que el jugador 2 juega H\(60 \%\) del tiempo y T\(40 \%\) del tiempo.
- Qué son\(P_2(H)\) y\(P_2(T)\text{?}\)
- ¿Qué crees que debería hacer el Jugador 1? ¿Esto difiere de tu estrategia mixta ideal en Ejercicio\(3.4.3\)? Explique.
- Podemos usar el valor esperado para calcular lo que el Jugador 1 debe hacer en respuesta a la\(60/40\) estrategia del Jugador 2. Primero, considera una estrategia pura para el Jugador 1. Calcule el valor esperado para el Jugador 1 si solo juega H mientras que el Jugador 2 juega H con probabilidad\(.6\) y T con probabilidad\(.4\). Este valor esperado está\(E_1(H)\text{,}\) por encima.
- De igual manera, computa el valor esperado para el Jugador 1 si juega solo T (llámalo\(E_1(T)\)).
- ¿Cuál estrategia pura tiene un mayor valor esperado para el Jugador 1? Si el Jugador 1 juega esta estrategia pura, ¿le irá mejor que tu valor predicho del juego?
Ojalá concluyeras que en Ejercicio\(3.4.5\) una estrategia pura es buena para el Jugador 1. Explica por qué esto significa que la\(60/40\) estrategia es mala para el Jugador 2.
Para cualquier estrategia mixta (o pura) particular del Jugador 2, podríamos encontrar\(E_1(T)\) y\(E_1(H)\text{.}\) explicar por qué si el\(E_1(H) > E_1(T)\text{,}\) Jugador 1 siempre debe jugar H.
De igual manera, explica por qué si el\(E_1(H) \lt E_1(T)\text{,}\) Jugador 1 siempre debe jugar T.
Explica por qué las situaciones en Ejercicio\(3.4.7\) y Ejercicio\(3.4.8\) son malas para el Jugador 2.
Usa tus respuestas de Ejercicio\(3.4.7\)\(3.4.8\), Ejercicio y Ejercicio\(3.4.9\) para explicar por qué la situación en la que\(E_1(H)=E_1(T)\) es la mejor para el Jugador 2.
Desde Ejercicio ahora\(3.4.10\) sabemos que el Jugador 2 quiere\(E_1(H)=E_1(T)\text{,}\) podemos usar un poco de álgebra para calcular la mejor estrategia defensiva para el Jugador 2. Recuerda, queremos asumir que el Jugador 1 siempre podrá elegir la estrategia que sea mejor para ella, y así el Jugador 2 quiere protegerse. Encontremos las probabilidades con las que el Jugador 2 debe jugar H y T.
Dejar\(P_2(H)\) y\(P_2(T)\) ser las probabilidades de que el Jugador 2 juegue H y T respectivamente. Encuentra ecuaciones para\(E_1(H)\) y\(E_1(T)\) en términos de\(P_2(H)\) y\(P_2(T)\) para el juego de Matching Pennies. Ya que queremos\(E_1(H)=E_1(T)\text{,}\) establecer sus dos ecuaciones iguales entre sí. Esto le da una ecuación en términos de\(P_2(H)\) y\(P_2(T)\text{.}\)
Explicar por qué también debemos tener\(P_2(H)+P_2(T)=1\text{.}\)
Entonces, en general, para resolver la estrategia del Jugador 2, queremos escribir una ecuación para cada uno de los valores esperados de estrategia pura del Jugador 1 en términos de probabilidades del Jugador 2. Por ejemplo,\(E_1(H)\) y\(E_1(T)\) en términos de variables\(P_2(H)\) y luego\(P_2(T)\text{.}\) establecemos los valores esperados iguales entre sí. Ahora tenemos una ecuación solo en términos de las probabilidades del Jugador 2.
Para resolver las probabilidades, también necesitamos usar el hecho de que las probabilidades del Jugador 2 suman a\(1\). Por ejemplo,\(P_2(H)+P_2(T)=1\text{.}\) Para un\(2 \times 2\) juego, ahora tienes\(2\) ecuaciones con\(2\) incógnitas (\(P_2(H)\)y\(P_2(T)\)). Utilizar un método algebraico como la sustitución o eliminación para resolver el sistema de ecuaciones.
Usando las ecuaciones de Ejercicio\(3.4.11\) y Ejercicio\(3.4.12\), resuelve para\(P_2(H)\) y Ahora\(P_2(T)\text{.}\) tienes la estrategia mixta de equilibrio para el Jugador 2. ¿Coincide esto con la estrategia mixta que determinaste en Ejercicio\(3.4.3\)?
Ahora, ¿puedes usar un proceso similar para encontrar la estrategia del Jugador 1? ¿Cuyos valores esperados debes usar? ¿Cuyas probabilidades?
Configura y resuelve las ecuaciones análogas de Ejercicio\(3.4.11\) y Ejercicio\(3.4.12\) para el Jugador 1. ¿Coincide esto con la estrategia mixta de Ejercicio\(3.4.3\)?
- Pista
-
Deberíamos tener una ecuación para\(E_2(H)\) y otra para\(E_2(T)\text{.}\) Ya que estamos buscando las probabilidades de cada una de las opciones del Jugador 1, las ecuaciones deben involucrar\(P_1(H)\) y\(P_1(T)\text{.}\)
Ahora tenemos un nuevo método para encontrar las mejores estrategias mixtas para los Jugadores 1 y 2, asumiendo que cada jugador está jugando a la defensiva contra un jugador ideal. Pero, ¿cómo podemos encontrar el valor del juego? Para el Jugador 2, asumimos\(E_1(H)=E_1(T)\text{.}\) En otras palabras, encontramos la situación en la que el valor esperado del Jugador 1 es el mismo sin importar qué estrategia pura juegue. Así, el Jugador 1 es indiferente a qué estrategia pura juega. Si no fuera indiferente, entonces jugaría la estrategia con un mayor valor esperado. Pero, como vimos, esto sería malo para el Jugador 2. Por lo que el Jugador 1 puede asumir que el Jugador 2 jugará la estrategia mixta de equilibrio. Así, mientras el Jugador 1 juegue una estrategia mixta, no importa si en un momento dado, juega H o T (esta es la idea de que les es indiferente). De ahí que el valor esperado del juego para el Jugador 1 sea el mismo\(E_1(H)\text{,}\) que el que es el mismo que\(E_1(T)\text{.}\) Similarmente, encontramos que el valor esperado del juego para el Jugador 2 es\(E_2(H)\) (o\(E_2(T)\)). Esta es una idea bastante complicada. Es posible que tengas que pensarlo por un tiempo. Mientras tanto, usa las probabilidades que encontraste para cada jugador y las ecuaciones para\(E_1(H)\) y\(E_2(H)\) para encontrar el valor del juego para cada jugador.
Usa las probabilidades que calculaste en Ejercicio\(3.4.13\) para encontrar\(E_1(H)\text{,}\) y de ahí el valor esperado del juego para el Jugador 1. ¿Cómo se compara esto con tu predicción del valor del juego que diste en Ejercicio\(3.4.4\)?
Usa las probabilidades que calculaste en Ejercicio\(3.4.14\) para encontrar\(E_2(H)\text{,}\) y de ahí el valor esperado del juego para el Jugador 2. ¿Cómo se compara esto con tu predicción del valor del juego que diste en Ejercicio\(3.4.4\)?
¡Sigue practicando con el método del valor esperado en algunos otros juegos!
Aplicar este método de usar el valor esperado al Ejemplo\(3.1.1\) (que resolvimos usando el método gráfico en la sección anterior) para encontrar las estrategias mixtas de equilibrio para cada jugador y el valor del juego para cada jugador:
\(\begin{bmatrix}1 & 0 \\-1 & 2 \end{bmatrix}\)
Como señalamos en esta sección, este método puede ser utilizado para resolver juegos más grandes. Sólo tenemos más ecuaciones. Utilice el método del valor esperado para encontrar la estrategia mixta de equilibrio para Roca-Papel-Tijeras para el Jugador 2.
- Pista
-
Tendrás que establecer\(E_1(R)=E_1(P)\) y\(E_1(P)=E_1(S)\text{;}\) resolver para\(P_2(R), P_2(P), P_2(S)\text{;}\) etc. Debe ser muy similar a lo que hiciste para Matching Pennies, pero habrá tres ecuaciones y tres incógnitas.
Si encontraste que este último ejercicio es álgebraicamente arduo, no te preocupes, eventualmente usaremos la tecnología para ayudarnos a resolver problemas con varias variables.