Saltar al contenido principal
LibreTexts Español

17.1: Razonamiento probabilístico por agentes racionales

  • Page ID
    151339
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Desde una perspectiva bayesiana, la inferencia estadística tiene que ver con la revisión de creencias. Empiezo con un conjunto de hipótesis candidatas h sobre el mundo. No sé cuál de estas hipótesis es verdad, pero ¿tengo algunas creencias sobre qué hipótesis son plausibles y cuáles no? Cuando observo los datos d, tengo que revisar esas creencias. Si los datos son consistentes con una hipótesis, mi creencia en esa hipótesis se fortalece. Si los datos son inconsistentes con la hipótesis, mi creencia en esa hipótesis se debilita. ¡Eso es! Al final de esta sección voy a dar una descripción precisa de cómo funciona el razonamiento bayesiano, pero primero quiero trabajar a través de un ejemplo sencillo para introducir las ideas clave. Considere el siguiente problema de razonamiento:

    Llevo un paraguas. ¿Crees que va a llover?

    En este problema, te he presentado un solo dato (d= llevo el paraguas), y te estoy pidiendo que me digas tus creencias sobre si está lloviendo. Tienes dos hipótesis posibles, h: o llueve hoy o no. ¿Cómo se debe resolver este problema?

    Priores: lo que creías antes

    Lo primero que debes hacer ignora lo que te dije sobre el paraguas, y anota tus creencias preexistentes sobre la lluvia. Esto es importante: si quieres ser honesto acerca de cómo se han revisado tus creencias a la luz de nuevas pruebas, ¡entonces debes decir algo sobre lo que creías antes de que aparecieran esos datos! Entonces, ¿qué podrías creer sobre si va a llover hoy? Probablemente sepas que vivo en Australia, y que gran parte de Australia es caliente y seca. Y de hecho tienes razón: la ciudad de Adelaida donde vivo tiene un clima mediterráneo, muy similar al sur de California, sur de Europa o norte de África. Estoy escribiendo esto en enero, y así puedes asumir que es la mitad del verano. De hecho, es posible que hayas decidido echar un vistazo rápido a Wikipedia 254 y haber descubierto que Adelaida recibe un promedio de 4.4 días de lluvia a lo largo de los 31 días de enero. Sin saber nada más, se podría concluir que la probabilidad de lluvia de enero en Adelaida es de aproximadamente 15%, y la probabilidad de un día seco es de 85%. Si esto es realmente lo que crees de las lluvias de Adelaida (y ahora que te lo he dicho, apuesto a que esto realmente es lo que crees) entonces lo que he escrito aquí es tu distribución previa, escrita P (h):

    Hipótesis Grado de Creencia
    Día lluvioso 0.15
    Día seco 0.85

    Probabilidades: teorías sobre los datos

    Para resolver el problema del razonamiento, necesitas una teoría sobre mi comportamiento. ¿Cuándo lleva Dan un paraguas? Podrías adivinar que no soy un completo idiota, 255 y trato de llevar sombrillas solo en días lluviosos. Por otro lado, también sabes que tengo niños pequeños, y no te sorprendería tanto saber que soy bastante olvidadizo por este tipo de cosas. Supongamos que en los días lluviosos recuerdo mi paraguas alrededor del 30% del tiempo (realmente soy horrible en esto). Pero digamos que en los días secos sólo tengo alrededor del 5% de probabilidades de llevar un paraguas. Así que podrías escribir una mesita como esta:

    Hipótesis Paraguas Sin paraguas
    Día lluvioso 0.30 0.70
    Día seco 0.05 0.95

    Es importante recordar que cada celda de esta tabla describe tus creencias sobre qué datos d se observarán, dada la verdad de una hipótesis particular h. Esta “probabilidad condicional” está escrita P (d|h), que puedes leer como “la probabilidad de d dada h”. En la estadística bayesiana, esto se conoce como probabilidad de datos d dada la hipótesis h. 256

    probabilidad conjunta de datos e hipótesis

    En este punto, todos los elementos están en su lugar. Habiendo anotado los antecedentes y la probabilidad, tienes toda la información que necesitas para hacer razonamiento bayesiano. La pregunta ahora es, ¿cómo usamos esta información? Resulta que hay una ecuación muy simple que podemos usar aquí, pero es importante que entiendas por qué la usamos, así que voy a intentar construirla a partir de ideas más básicas.

    Empecemos con una de las reglas de la teoría de la probabilidad. Lo enumeré muy atrás en la Tabla 9.1, pero en ese momento no hice un gran problema y probablemente lo ignoraste. La regla en cuestión es la que habla de la probabilidad de que dos cosas sean ciertas. En nuestro ejemplo, es posible que desee calcular la probabilidad de que hoy sea lluvioso (es decir, la hipótesis h es cierta) y estoy llevando un paraguas (es decir, se observan los datos d). La probabilidad conjunta de la hipótesis y los datos se escribe P (d, h), y se puede calcular multiplicando la P (h) anterior por la probabilidad P (d|h). Matemáticamente, decimos que:

    P (d, h) =P (d|h) P (h)

    Entonces, ¿cuál es la probabilidad de que hoy sea un día lluvioso y recuerde llevar un paraguas? Como comentamos anteriormente, el previo nos dice que la probabilidad de un día lluvioso es del 15%, y la probabilidad nos dice que la probabilidad de que recuerde mi paraguas en un día lluvioso es del 30%. Entonces la probabilidad de que ambas cosas sean verdaderas se calcula multiplicando las dos:

    \(\begin{aligned} \text { (rainy, umbrella) } &=P(\text { umbrella } | \text {rainy}) \times P(\text { rainy }) \\ &=0.30 \times 0.15 \\ &=0.045 \end{aligned}\)

    Es decir, antes de que le digan algo sobre lo que realmente sucedió, piensa que hay un 4.5% de probabilidad de que hoy sea un día lluvioso y que recordaré un paraguas. No obstante, por supuesto hay cuatro cosas posibles que podrían pasar, ¿verdad? Así que vamos a repetir el ejercicio para los cuatro. Si hacemos eso, terminamos con la siguiente tabla:

    Paraguas Sin paraguas
    Lluvioso 0.045 0.105
    Seco 0.0425 0.8075

    Esta tabla captura toda la información sobre cuáles de las cuatro posibilidades son probables. Sin embargo, para obtener realmente la imagen completa, ayuda agregar los totales de fila y los totales de columna. Eso nos da esta tabla:

    Paraguas Sin paraguas Total
    Lluvioso 0.0450 0.1050 0.15
    Seco 0.0425 0.8075 0.85
    Total 0.0875 0.9125 1

    Esta es una tabla muy útil, por lo que vale la pena tomarse un momento para pensar en lo que todos estos números nos están diciendo. Primero, fíjate que las sumas de fila no nos están diciendo nada nuevo en absoluto. Por ejemplo, la primera fila nos dice que si ignoramos todo este negocio paraguas, la posibilidad de que hoy sea un día lluvioso es del 15%. Eso no es sorprendente, claro: ese es nuestro previo. Lo importante no es el número en sí: más bien, lo importante es que nos da cierta confianza de que nuestros cálculos son sensatos! Ahora echa un vistazo a las sumas de columna, y fíjate que nos dicen algo que aún no hemos dicho explícitamente. De la misma manera que las sumas de fila nos dicen la probabilidad de lluvia, las sumas de columna nos dicen la probabilidad de que lleve un paraguas. Específicamente, la primera columna nos dice que en promedio (es decir, ignorando si es un día lluvioso o no), la probabilidad de que lleve un paraguas es de 8.75%. Por último, observe que cuando sumamos los cuatro eventos lógicamente posibles, todo suma a 1. En otras palabras, lo que hemos escrito es una distribución de probabilidad adecuada definida sobre todas las combinaciones posibles de datos e hipótesis.

    Ahora bien, debido a que esta tabla es muy útil, quiero asegurarme de que entiendas a qué corresponden todos los elementos, y cómo escribieron:

    Paraguas Sin paraguas
    Lluvioso P (Paraguas, Lluvioso) P (Sin paraguas, lluvioso) P (Lluvioso)
    Seco P (Paraguas, Seco) P (Sin paraguas, Seco) P (Seco)
      P (Paraguas) P (Sin paraguas)

    Por último, usemos la notación estadística “apropiada”. En el problema de los días lluviosos, los datos corresponden a la observación de que tengo o no tengo paraguas. Entonces dejaremos que d 1 se refiera a la posibilidad de que me observes cargando un paraguas, y d 2 se refiere a que me observas no cargando uno. De igual manera, h 1 es su hipótesis de que hoy es lluvioso, y h 2 es la hipótesis de que no lo es. Usando esta notación, la tabla se ve así:

    Actualizando creencias usando la regla de Bayes

    El cuadro que presentamos en la última sección es una herramienta muy poderosa para resolver el problema de los días lluviosos, ya que considera las cuatro posibilidades lógicas y establece exactamente qué tan seguro estás en cada una de ellas antes de que te den algún dato. Ahora es el momento de considerar qué sucede con nuestras creencias cuando en realidad se nos dan los datos. En el problema de los días lluviosos, te dicen que realmente llevo un paraguas. Esto es algo así como un suceso sorprendente: según nuestra tabla, la probabilidad de que lleve un paraguas es de sólo 8.75%. Pero eso tiene sentido, ¿verdad? Un tipo que lleva una sombrilla en un día de verano en una ciudad calurosa y seca es bastante inusual, así que realmente no te lo esperabas. No obstante, el problema te dice que es cierto. No importa lo poco probable que pensaras que era, ahora debes ajustar tus creencias para acomodar el hecho de que ahora sabes que tengo un paraguas. 257 Para reflejar este nuevo conocimiento, nuestra tabla revisada debe tener los siguientes números:

    Paraguas Sin paraguas
    Lluvioso   0
    Seco   0
    Total 1 0

    Es decir, los hechos han eliminado cualquier posibilidad de “no paraguas”, así que tenemos que poner ceros en cualquier celda de la mesa que implique que no llevo paraguas. Además, sabes a ciencia cierta que llevo un paraguas, por lo que la suma de columna de la izquierda debe ser 1 para describir correctamente el hecho de que P (paraguas) =1.

    ¿Qué dos números debemos poner en las celdas vacías? Nuevamente, no nos preocupemos por las matemáticas, y en cambio pensemos en nuestras intuiciones. Cuando escribimos nuestra mesa la primera vez, resultó que esas dos celdas tenían números casi idénticos, ¿verdad? Se determinó que la probabilidad conjunta de “lluvia y paraguas” fue de 4.5%, y la probabilidad conjunta de “seco y paraguas” fue de 4.25%. Es decir, antes de que te dijera que de hecho llevo un paraguas, habrías dicho que estos dos eventos eran casi idénticos en probabilidad, ¿sí? Pero fíjense que ambas posibilidades son consistentes con el hecho de que en realidad llevo un paraguas. Desde la perspectiva de estas dos posibilidades, muy poco ha cambiado. Espero que esté de acuerdo en que sigue siendo cierto que estas dos posibilidades son igualmente plausibles. Entonces, lo que esperamos ver en nuestra mesa final son algunos números que preservan el hecho de que “lluvia y paraguas” es un poco más plausible que “seco y paraguas”, al tiempo que aseguran que los números en la tabla sumen. Algo como esto, ¿quizás?

    Paraguas Sin paraguas
    Lluvioso 0.514 0
    Seco 0.486 0
    Total 1 0

    Lo que esta tabla te está diciendo es que, después de que me hayan dicho que llevo un paraguas, crees que hay un 51.4% de posibilidades de que hoy sea un día lluvioso, y un 48.6% de posibilidades de que no lo haga ¡Esa es la respuesta a nuestro problema! La probabilidad posterior de lluvia P (h|d) dado que llevo un paraguas es 51.4%

    ¿Cómo calculé estos números? Probablemente puedas adivinar. Para calcular que había una probabilidad de 0.514 de “lluvia”, todo lo que hice fue tomar la probabilidad 0.045 de “lluvia y paraguas” y dividirla por la probabilidad 0.0875 de “paraguas”. Esto produce una tabla que satisface nuestra necesidad de tener todo suma a 1, y nuestra necesidad de no interferir con la verosimilitud relativa de los dos eventos que en realidad son consistentes con los datos. Para decir lo mismo usando la jerga estadística de fantasía, lo que he hecho aquí es dividir la probabilidad conjunta de la hipótesis y los datos P (d, h) por la probabilidad marginal de los datos P (d), y esto es lo que nos da la probabilidad posterior de la hipótesis dado que sabemos que se han observado los datos. Para escribir esto como una ecuación: 258

    \(P(h | d)=\dfrac{P(d, h)}{P(d)}\)

    No obstante, recuerden lo que dije al inicio de la última sección, es decir, que la probabilidad conjunta P (d, h) se calcula multiplicando la P (h) anterior por la probabilidad P (d|h). En la vida real, las cosas que realmente sabemos escribir son los antecedentes y la probabilidad, así que volvamos a sustituirlos en la ecuación. Esto nos da la siguiente fórmula para la probabilidad posterior:

    \(\ P(h | d)=\dfrac{P(d | h)P(h)}{P(d)}\)

    Y esta fórmula, amigos, se conoce como regla de Bayes. Describe cómo un alumno comienza con creencias previas sobre la plausibilidad de diferentes hipótesis, y te dice cómo esas creencias deben revisarse ante los datos. En el paradigma bayesiano, toda inferencia estadística fluye a partir de esta regla simple.


    This page titled 17.1: Razonamiento probabilístico por agentes racionales is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform.