Saltar al contenido principal
LibreTexts Español

3.2: Estrategias Mixtas: Solución Gráfica

  • Page ID
    107899
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En esta sección aprenderemos un método para encontrar la solución maximin para un juego repetido usando una gráfica.

    Sigamos considerando el juego dado en Ejemplo\(3.1.1\) por

    \(\begin{bmatrix}1 & 0 \\-1 & 2 \end{bmatrix}\)

    Para facilitar nuestro análisis, nombremos las estrategias de fila y columna como en Tabla\(3.2.1\).

    Tabla\(3.2.1\): Ejemplo\(3.1.1\) con Estrategias Nombradas
    \ (3.2.1\): Ejemplo\(3.1.1\) con Estrategias Nombradas"> C D
    \ (3.2.1\): Ejemplo\(3.1.1\) con estrategias con nombre">A \(1\) \(0\)
    \ (3.2.1\): Ejemplo\(3.1.1\) con estrategias con nombre">B \(-1\) \(2\)

    Queremos determinar con qué frecuencia el Jugador 1 debe jugar A y con qué frecuencia debe jugar B.

    Ejercicio 3.2.1 : Conjetura una estrategia

    Primero, es bueno poner a prueba tu instinto. ¿Crees que debería jugar una de las estrategias con más frecuencia que la otra? Si es así, ¿qué estrategia debería jugar más?

    Lo que realmente estamos tratando de encontrar es la probabilidad con la que el Jugador 1 juega A (o B). Ya que sabemos que las probabilidades suman a una, si podemos encontrar una probabilidad, entonces conocemos la otra.

    Aquí hay una manera de hacer esto. Deja\(p\) ser la probabilidad de que el Jugador 1 juegue B. Let\(m\) Ser el pago al Jugador 1. Como estamos tratando de encontrar una estrategia mixta para el Jugador 1, elegiremos una estrategia para el Jugador 2 y trataremos de determinar los posibles beneficios para el Jugador 1.

    Determinemos algunos pares\((p, m)\text{.}\)

    Paso 1: Supongamos que el jugador 2 juega estrategia pura C.

    Paso 1a: Encuentra la probabilidad (\(p\)) y el pago (\(m\)) si el Jugador 1 siempre juega A. Si el Jugador 1 juega estrategia pura A, entonces ella nunca juega B. Así, la probabilidad de que juegue B es 0. De ahí que,\(p=0\text{.}\) en el caso en que el Jugador 1 juegue A y el Jugador 2 juegue C, ¿cuál es la retribución para el Jugador 1? Esto es\(m\text{,}\) así\(m=1\text{.}\) Así, para el par de estrategia que\([A, C]\) obtenemos\((0, 1)\) para\((p, m)\text{.}\) Es importante señalar que no\((0, 1)\) es un vector de pago. Esta es una notación común para cualquier par ordenado. Con vectores de pago, el par ordenado representa el pago a cada jugador. Aquí el par ordenado representa una probabilidad de jugar B y el pago al Jugador 1.

    Paso 1b: Encuentra la probabilidad (\(p\)) y el pago (\(m\)) si el Jugador 1 siempre juega B. Si el Jugador 1 juega pura estrategia B, entonces ¿cuál es la probabilidad de que juegue B? Ya que ella siempre juega B,\(p=1\text{.}\) En el caso donde el Jugador 1 juega B y el Jugador 2 juega C, ¿cuál es la retribución para el Jugador 1? \(m=-1\text{.}\)Así, para el par de estrategia\([B, C]\) obtenemos\((1, -1)\) para\((p, m)\text{.}\)

    Paso 1c: Ahora queremos saber cuál será la retribución del Jugador 1 ya que varía la probabilidad,\(p\text{,}\) con la que juega B. Podemos dibujar una gráfica donde el\(x\) eje -representa a la probabilidad con la que juega B (\(p\)) y el\(y\) eje -representa la ganancia esperada (\(m\)). Ver Figura\(3.2.1\).

    image-1.svg
    Figura 3.2.1 : Ejes etiquetados. (Copyright; autor vía fuente)

    Así, cuando el Jugador 1 juega solo A, está jugando B con probabilidad 0; cuando el Jugador 1 juega solo B, está jugando B con probabilidad 1. Podría ser más fácil de recordar si etiquetas tu gráfica como en la Figura\(3.2.1\).

    Paso 1d: Ahora podemos trazar los puntos que determinamos en el Paso 1a y el Paso 1b. Los conectaremos con una línea que representa la estrategia pura C del Jugador 2. Ver Figura\(3.2.2\).

    image-8.svg
    Figura 3.2.2 : La estrategia del jugador 2 C. (Copyright; autor vía fuente)

    Antes de seguir adelante, asegurémonos de entender lo que representa esta línea. Cualquier punto en él representa el beneficio esperado para el Jugador 1 ya que varía su estrategia, asumiendo que el Jugador 2 solo juega C. En este caso, podemos ver que a medida que juega B con más frecuencia, su pago esperado baja.

    Ahora hagamos lo mismo, suponiendo que el Jugador 2 juegue solo D.

    Paso 2: Supongamos que el jugador 2 juega estrategia pura D.

    Paso 2a: Encuentra la probabilidad (\(p\)) y el pago (\(m\)) si el Jugador 1 siempre juega A. Si el Jugador 1 juega estrategia pura A, entonces, ¿cuál es la probabilidad de que juegue B? \(p=0\text{.}\)¿Cuál es la retribución para el Jugador 1? \(m=0\text{.}\)Así, para el par de estrategia\([A, D]\) obtenemos\((0, 0)\) para\((p, m)\text{.}\)

    Paso 2b: Encuentra la probabilidad (\(p\)) y el pago (\(m\)) si el Jugador 1 siempre juega B. Si el Jugador 1 juega pura estrategia B, entonces ¿cuál es la probabilidad de que juegue B? \(p=1\text{.}\)¿Cuál es la retribución para el Jugador 1? \(m=2\text{.}\)Así, para el par de estrategia\([B, D]\) obtenemos\((1, 2)\) para\((p, m)\text{.}\)

    Paso 2c: Ahora, en nuestra misma gráfica del Paso 1, podemos trazar los puntos que determinamos en el Paso 2a y el Paso 2b. Los conectaremos con una línea que represente la estrategia pura del Jugador 2 D. Ver Figura\(3.2.3\).

    image-9.svg
    Figura 3.2.3 : La estrategia D del jugador 2. (Copyright; autor vía fuente)

    Ahora podemos ver que si el Jugador 2 juega solo D, entonces el Jugador 1 lo hace mejor jugando solo B.

    Entonces tenemos esta linda gráfica, pero ¿qué nos dice realmente? Aunque trazamos líneas que representan cada una de las estrategias puras del Jugador 2, el Jugador 1 no sabe lo que hará el Jugador 2. Supongamos que el Jugador 1 solo jugó A, mientras que el Jugador 2 juega una estrategia mixta desconocida. Entonces los posibles beneficios para el Jugador 1 son\(1\) o\(0\). Cuanto más a menudo el Jugador 2 juega C, más a menudo recibe el Jugador 1\(1\). Por lo que el pago esperado por juego para un juego repetido varía entre\(0\) y\(1\). Podemos ver los posibles valores esperados como la línea roja en la gráfica de la Figura\(3.2.4\).

    image-10.svg
    Figura 3.2.4 : Figura\(3.2.4\) de los beneficios esperados para el Jugador 1 jugando solo A. (Copyright; autor vía fuente)

    Ya que queremos entender estrategias mixtas para el Jugador 1, ¿qué pasaría si el Jugador 1 jugara A la mitad del tiempo y B la mitad del tiempo? En otras palabras, qué pasa si\(p= \dfrac{1}{2}\text{?}\) Aunque es posible que no podamos ver fácilmente los valores exactos, podemos representar los posibles valores esperados en la gráfica de la Figura\(3.2.5\).

    image-11.svg
    Figura 3.2.5 : Los beneficios esperados para el Jugador 1 jugando B la mitad del tiempo. (Copyright; autor vía fuente)

    Ojalá hayas comenzado a ver que por cada elección de\(p\text{,}\) la línea superior representa el valor más alto esperado para el Jugador 1; la línea de fondo representa el valor esperado más bajo para el Jugador 1; el área entre las líneas representa los posibles valores esperados para el Jugador 1. Como hicimos con juegos no repetidos, veamos el “peor de los casos” para el Jugador 1. En otras palabras, supongamos que el Jugador 2 puede entender la estrategia del Jugador 1. Entonces el Jugador 1 querría maximizar el valor mínimo esperado. ¡Ajá! ¡Esto es solo buscar la estrategia maximin!

    Ahora el valor mínimo esperado para cada elección de\(p\) viene dado por las líneas de fondo de la gráfica, que se muestran en rojo en la Figura\(3.2.6\).

    image-12.svg
    Figura 3.2.6 : Los beneficios mínimos esperados para el Jugador 1. (Copyright; autor vía fuente)

    Debería ser fácil ver que el máximo de los beneficios mínimos esperados ocurre en la intersección de las dos líneas.

    Paso 3: Encuentra la intersección de las dos líneas.

    Paso 3a: Encuentra la ecuación para la Línea C. Esta es la línea que pasa por los puntos\((0, 1)\) y\((1, -1)\text{.}\) tiene pendiente\(-2\) e\(y\) -intercepta 1. Por lo tanto, tiene ecuación\(y=-2x+1\text{.}\) [Aunque el\(x\) eje -representa la probabilidad\(p\) y el\(y\) eje -representa el beneficio esperado, probablemente se\(m\text{,}\) sienta más cómodo resolviendo ecuaciones, al menos por el momento, en\(x\) y\(y\text{.}\)]

    Paso 3b: Encuentra la ecuación para la Línea D. Esta es la línea que pasa por los puntos\((0, 0)\) y\((1, 2)\text{.}\) tiene pendiente\(2\) e\(y\) -intercepta 0. Por lo tanto, tiene ecuación\(y=2x\text{.}\)

    Paso 3c: Usa la sustitución para encontrar el punto de intersección.

    \(\begin{array} s 2x &= -2x+1 \\ 4x &= 1 \\ x &= \dfrac{1}{4} \end{array}\)

    Sustituir de\(x=\dfrac{1}{4}\) nuevo a cualquiera de las ecuaciones originales, digamos nos\(y=2x\text{,}\) da\(y=\dfrac{1}{2}\text{.}\) Así, el punto de intersección es\(\left(\dfrac{1}{4}, \dfrac{1}{2} \right)\text{.}\)

    Paso 4: Determina la estrategia mixta máxima del jugador 1. Recordando que la primera coordenada es\(p\text{,}\) la probabilidad de que el Jugador 1 juegue B, sabemos que el Jugador 1 jugará B con probabilidad\(\dfrac{1}{4}\), y así, jugará A con probabilidad\(\dfrac{3}{4}\) [\(1-\dfrac{1}{4}=\dfrac{3}{4}\)]. El pago esperado para el Jugador 1 es\(\dfrac{1}{2}\). Es importante volver a consultar tu intuición original sobre el juego de Ejercicio\(3.2.2\). ¿Parecía que el Jugador 1 debía jugar A con más frecuencia que B?

    Hagamos algunas observaciones importantes. Primero, debe quedar claro a partir de la gráfica que el Jugador 1 espera un pago de\(\dfrac{1}{2}\) NO IMPORTA LO QUE HACE EL JUGADOR 2. Además, dado que se trata de un juego de suma cero, sabemos que el pago esperado del Jugador 2 es\(-\dfrac{1}{2}\text{.}\) Es importante señalar que esta gráfica no nos da ninguna información sobre una estrategia óptima para el Jugador 2. Veremos cómo encontrar una estrategia para el Jugador 2 en los siguientes ejercicios. ¿Se te ocurre cómo podrías hacer esto?

    Podemos usar el método gráfico para encontrar las estrategias mixtas maximin y minimax para juegos repetidos de suma cero de dos personas.

    Usando la misma matriz de juego que la anterior:

    \(\begin{bmatrix}1 & 0 \\-1 & 2 \end{bmatrix}\)

    continuaremos etiquetando las estrategias del Jugador 1 por\(A\) y\(B\text{,}\) y las estrategias del Jugador 2 por\(C\) y Ahora\(D\text{.}\) queremos determinar la estrategia de minimax para el Jugador 2. Ten en cuenta que los beneficios siguen siendo los beneficios para el Jugador 1, por lo que el Jugador 2 quiere que el pago sea lo más pequeño posible.

    Ejercicio 3.2.2 : Esbozar el gráfico

    Dibuja la gráfica para el Jugador 1 que dibujamos arriba. Asegúrese de etiquetar los puntos finales de cada línea. También etiquetar cada línea de acuerdo a qué estrategia representan.

    Ejercicio 3.2.3 : Indicar la estrategia Minimax

    Describir la estrategia minimax y mostrarla en la gráfica. (No es necesario encontrar la estrategia mixta real para el Jugador 2.)

    Ejercicio 3.2.4 : Vectores de pago

    ¿Los vectores de pago para las estrategias maximin y minimax son los mismos?

    Para juegos no repetidos hemos visto que si el valor maximin es el mismo que el valor minimax, entonces el juego tiene un equilibrio de estrategia puro. La misma idea se aplica a los juegos de estrategia mixta. Si el valor de la estrategia maximin es el mismo que el valor de la estrategia minimax, entonces las estrategias mixtas correspondientes serán un punto de equilibrio. Así, tu respuesta a Ejercicio\(3.2.4\) debería decirte que este juego tiene un punto de equilibrio de estrategia mixta que consiste en la estrategia máximo/ minimax.

    Ahora sabemos que el Jugador 2 quiere jugar la estrategia minimax en respuesta a la estrategia maximin del Jugador 1, por lo que necesitamos encontrar la estrategia mixta real para que el Jugador 2 la emplee. Como estamos minimizando el pago máximo esperado del Jugador 1, continuaremos usando la matriz que representa el pago del Jugador 1. Repetiremos el proceso que usamos para el Jugador 1, excepto que el\(x\) eje -ahora representa la probabilidad de que el Jugador 2 juegue\(D\text{,}\) y las líneas representarán las estrategias del Jugador 1\(A\) y\(B\text{.}\) El\(y\) eje -continúa representando el pago del Jugador 1.

    Ejercicio 3.2.5 : Dibuja los ejes para la estrategia del jugador 2.

    Primero bosquejar los ejes. (Recordemos, el\(x\) eje -solo va de\(0\) a\(1\).)

    Ejercicio 3.2.6 : Jugador 1 Juega\(A\)

    Supongamos que el jugador 1 solo juega\(A\text{.}\)

    1. Si el Jugador 2 solo juega\(C\text{,}\) ¿cuál es la retribución para el Jugador 1? Recordemos a esto\(m\text{.}\) lo llamamos Cuál es la probabilidad de que Player 2 juegue\(D\text{?}\) Recall lo llamamos a esto\(p\text{.}\) En tu gráfica, traza el punto (\(p\text{,}\)\(m\)).
    2. Si el Jugador 2 juega solo\(D\text{,}\) encuentra\(m\) y\(p\text{.}\)\((p, m)\) Traza en la gráfica.
    3. Ahora dibuja la línea a través de tus dos puntos. Esta línea representa la estrategia pura del Jugador 1\(A\) y el beneficio esperado (al Jugador 1) para las estrategias mixtas del Jugador 2. Etiquetarlo\(A\text{.}\)
    Ejercicio 3.2.7 : Jugador 1 Reproduce\(B\)

    Ahora supongamos que el Jugador 1 juega solo\(B\text{.}\) Repita los pasos en el Ejercicio\(3.2.6\), usando en\(B\) lugar de\(A\text{,}\) para encontrar la línea que representa la estrategia pura del Jugador 1\(B\text{.}\) (¡Llámala!)

    Ejercicio 3.2.8 : La gráfica para el jugador 2

    Es importante tener en cuenta que aunque el\(x\) eje -se refiere a la frecuencia con la que jugará\(D\text{,}\) el Jugador 2\(C\) y el\(y\) eje -representa el pago al Jugador 1.

    1. Explica por qué estamos buscando la estrategia minimax para el Jugador 2.
    2. Muestra en la gráfica el beneficio máximo que el Jugador 1 puede esperar por cada una de las posibles estrategias mixtas del Jugador 2.
    3. Mostrar el punto en la gráfica que representa la estrategia minimax.
    Ejercicio 3.2.9 : Ecuaciones para las líneas

    Encuentra las ecuaciones de las líneas que dibujaste en Ejercicio\(3.2.6\) y Ejercicio\(3.2.7\).

    Ejercicio 3.2.10 : El punto de intersección

    Usando las ecuaciones de Ejercicio\(3.2.9\), encuentra el punto de intersección de las dos líneas.

    Ejercicio 3.2.11 : Estrategia mixta del jugador 2

    ¿Con qué frecuencia debe jugar el Jugador 2 Con\(C\text{?}\) qué frecuencia debería jugar\(D\text{?}\) ¿Cuál es el beneficio esperado del Jugador 1? Y de ahí, ¿cuál es el pago esperado del Jugador 2?

    Ejercicio 3.2.12 : Estrategias de equilibrio

    Explica por qué cada jugador debe jugar la estrategia mixta máximo/ minimax. Es decir, explicar por qué ninguno de los jugadores se beneficia al cambiar su estrategia.

    Pista

    Piensa en jugar a la defensiva y asumiendo que el otro jugador es el jugador “perfecto”.

    Ahora se te puede haber ocurrido que dado que este es un juego de suma cero, podríamos haber convertido nuestra matriz a la matriz de pago para el Jugador 2, y encontrar la estrategia maximin del Jugador 2. Pero es importante entender la relación entre las estrategias maximin y minimax. Entonces, por el bien de la práctica y un poco más de perspicacia, encuentra la estrategia maximin del Jugador 2 escribiendo la matriz de pago para el Jugador 2 y repitiendo el proceso que hicimos para el Jugador 1. Ten en cuenta que el Jugador 2 está encontrando la probabilidad de jugar\(C\) y\(D\) en lugar de\(A\) y\(B\text{.}\)

    Ejercicio 3.2.13 : Encontrar el Maximin usando los beneficios del jugador 2.

    Convierte la matriz de pago anterior en la matriz de pago para el Jugador 2. Encuentra la estrategia maximin para Player 2 usando el método gráfico. Asegúrese de incluir un boceto de la gráfica (etiquetada!!) , las ecuaciones para las líneas, la probabilidad de que juegue el Jugador 2\(C\)\(D\text{,}\) y y el beneficio esperado para el Jugador 2.

    Ejercicio 3.2.14 : Comparar las soluciones

    Compara tu respuesta en Ejercicio\(3.2.13\) con tu respuesta en Ejercicio\(3.2.11\).

    Ejercicio 3.2.15 : Equidad

    ¿Este juego es justo? Explicar.

    Ejercicio 3.2.16 : pago esperado

    Vimos arriba que el pago esperado para el Jugador 1 era\(\dfrac{1}{2}\). Explica lo que esto significa para un juego repetido.

    Responder

    ¿Es realmente posible que un jugador gane\(\dfrac{1}{2}\) en un juego determinado?

    ¡Ahora ya estás listo para intentar analizar algunos juegos más!

    Ejercicio 3.2.17 : Práctica para encontrar estrategias mixtas

    Considera el juego de suma cero\(\begin{bmatrix}-4 & 4 \\2 & -2 \end{bmatrix}\).

    1. ¿Este juego tiene un equilibrio de estrategia puro?
    2. Con sólo mirar la matriz, ¿crees que este juego será justo? (¿Prefieres ser Jugador 1 o Jugador 2?)
    3. Sketch (¡y etiqueta!) la gráfica apropiada para este juego.
    4. Usa tu gráfica para determinar si hay un punto de equilibrio de estrategia mixta. Si la hay, ¿con qué frecuencia debe jugar el Jugador 1 en cada estrategia? ¿Cuál es el pago esperado para cada jugador?
    5. ¿Este juego es justo? Explicar. Compara tu respuesta con (b).
    Ejercicio 3.2.18 : Más práctica para encontrar estrategias mixtas

    Considera el juego de suma cero\(\begin{bmatrix}0 & 1 \\1 & -10 \end{bmatrix}\).

    1. ¿Este juego tiene un equilibrio de estrategia puro?
    2. Con sólo mirar la matriz, ¿crees que este juego será justo? (¿Prefieres ser Jugador 1 o Jugador 2?)
    3. Sketch (¡y etiqueta!) la gráfica apropiada para este juego.
    4. Usa tu gráfica para determinar si hay un punto de equilibrio de estrategia mixta. Si la hay, ¿con qué frecuencia debe jugar el Jugador 1 en cada estrategia? ¿Cuál es el pago esperado para cada jugador?
    5. ¿Este juego es justo? Explicar. Compara tu respuesta con (b).

    Si bien vale la pena trabajar a través de ejemplos a mano para entender el proceso algebraico, en la siguiente sección veremos cómo la tecnología puede ayudarnos a resolver sistemas de ecuaciones.


    This page titled 3.2: Estrategias Mixtas: Solución Gráfica is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Jennifer A. Firkins Nordstrom via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.