17.2: Pruebas Bayesianas de Hipótesis
- Page ID
- 151332
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En el capítulo 11 describí el enfoque ortodoxo de las pruebas de hipótesis. Se necesitó un capítulo entero para describirlo, porque la prueba de hipótesis nula es un artilugio muy elaborado que a la gente le resulta muy difícil darle sentido. En contraste, el enfoque bayesiano para las pruebas de hipótesis es increíblemente simple. Escojamos un escenario que sea muy análogo al escenario ortodoxo. Hay dos hipótesis que queremos comparar, una hipótesis nula h 0 y una hipótesis alternativa h 1. Antes de ejecutar el experimento tenemos algunas creencias P (h) sobre qué hipótesis son ciertas. Realizamos un experimento y obtenemos datos d. a diferencia de las estadísticas frecuentistas La estadística bayesiana permite hablar sobre la probabilidad de que la hipótesis nula sea cierta. Mejor aún, nos permite calcular la probabilidad posterior de la hipótesis nula, utilizando la regla de Bayes:
\(\ P(h_0 | d) = \dfrac{P(d | h_0)P(h_0)}{P(d)}\)
Esta fórmula nos dice exactamente cuánta creencia debemos tener en la hipótesis nula después de haber observado los datos d. Del mismo modo, podemos calcular cuánta creencia colocar en la hipótesis alternativa usando esencialmente la misma ecuación. Todo lo que hacemos es cambiar el subíndice:
\(\ P(h_1 | d) = \dfrac{P(d | h_1)P(h_1)}{P(d)}\)
Todo es tan sencillo que me siento como un idiota incluso molestándose en escribir estas ecuaciones, ya que lo único que estoy haciendo es copiar la regla de Bayes de la sección anterior. 259
Factor Bayes
En la práctica, la mayoría de los analistas de datos bayesianos tienden a no hablar en términos de las probabilidades posteriores crudas P (h 0 |d) y P (h 1 |d). En cambio, tendemos a hablar en términos del odds ratio posterior. Piénsalo como apostar. Supongamos, por ejemplo, que la probabilidad posterior de la hipótesis nula es del 25%, y la probabilidad posterior de la alternativa es del 75%. La hipótesis alternativa es tres veces más probable que la nula, por lo que decimos que las probabilidades son 3:1 a favor de la alternativa. Matemáticamente, todo lo que tenemos que hacer para calcular las probabilidades posteriores es dividir una probabilidad posterior por la otra:
\(\ \dfrac{P(h_1 | d)}{P(h_0 | d)}=\dfrac{0.75}{0.25}=3\)
O bien, para escribir lo mismo en términos de las ecuaciones anteriores:
\(\ \dfrac{P(h_1 | d)}{P(h_0 | d)} = \dfrac{P(d | h_1)}{P(d | h_0)} \times \dfrac{P(h_1)}{P(h_0)}\)
En realidad, vale la pena ampliar esta ecuación. Aquí hay tres términos diferentes que debes conocer. En el lado izquierdo, tenemos las probabilidades posteriores, que te dice lo que crees sobre la plausibildad relativa de la hipótesis nula y la hipótesis alternativa después de ver los datos. En el lado derecho, tenemos las cuotas previas, lo que indica lo que pensaste antes de ver los datos. En el medio, tenemos el factor Bayes, que describe la cantidad de evidencias aportadas por los datos:
El factor Bayes (a veces abreviado como BF) ocupa un lugar especial en las pruebas de hipótesis bayesianas, porque cumple un papel similar al valor p en las pruebas de hipótesis ortodoxas: cuantifica la fuerza de evidencia proporcionada por los datos, y como tal es el Bayes factor que la gente tiende a reportar cuando se ejecuta una prueba de hipótesis bayesiana. La razón para reportar los factores Bayes en lugar de las probabilidades posteriores es que diferentes investigadores tendrán diferentes antecedentes. Algunas personas podrían tener un fuerte sesgo para creer que la hipótesis nula es cierta, otras podrían tener un sesgo fuerte para creer que es falsa. Debido a esto, lo educado que debe hacer un investigador aplicado es reportar el factor Bayes. De esa manera, cualquiera que lea el artículo puede multiplicar el factor Bayes por sus propias probabilidades previas personales, y pueden averiguar por sí mismos cuáles serían las probabilidades posteriores. En cualquier caso, por convención nos gusta pretender que damos igual consideración tanto a la hipótesis nula como a la alternativa, en cuyo caso las probabilidades anteriores equivalen a 1, y las probabilidades posteriores se convierten en las mismas que el factor Bayes.
Interpretación de los factores Bayes
Una de las cosas realmente buenas del factor Bayes es que los números son intrínsecamente significativos. Si ejecutas un experimento y calculas un factor Bayes de 4, significa que la evidencia proporcionada por tus datos corresponde a cuotas de apuestas de 4:1 a favor de la alternativa. Sin embargo, ha habido algunos intentos de cuantificar los estándares de evidencia que se considerarían significativos en un contexto científico. Los dos más utilizados son de Jeffreys (1961) y Kass y Raftery (1995). De los dos, tiendo a preferir la mesa de Kass y Raftery (1995) porque es un poco más conservadora. Entonces aquí está:
Factor Bayes | Interpretación |
---|---|
1 - 3 | Evidencia despreciable |
3 - 20 | Evidencia positiva |
20 - 150 | Evidencia fuerte |
$>$150 | Evidencia muy fuerte |
Y para ser perfectamente honesto, creo que hasta los estándares de Kass y Raftery están siendo un poco caritativos. Si fuera por mí, habría llamado a la categoría de “evidencia positiva” “evidencia débil”. Para mí, cualquier cosa en el rango 3:1 a 20:1 es evidencia “débil” o “modesta” en el mejor de los casos. Pero aquí no hay reglas duras y rápidas: lo que cuenta como evidencia fuerte o débil depende completamente de lo conservador que seas, y de los estándares en los que tu comunidad insiste antes de que esté dispuesta a etiquetar un hallazgo como “verdadero”.
En cualquier caso, tenga en cuenta que todos los números enumerados anteriormente tienen sentido si el factor Bayes es mayor que 1 (es decir, la evidencia favorece la hipótesis alternativa). Sin embargo, una gran ventaja práctica del enfoque bayesiano en relación con el enfoque ortodoxo es que también permite cuantificar evidencia para el nulo. Cuando eso suceda, el factor Bayes será menor a 1. Se puede optar por reportar un factor Bayes menor a 1, pero para ser honesto me parece confuso. Por ejemplo, supongamos que la probabilidad de los datos bajo la hipótesis nula P (d|h 0) es igual a 0.2, y la probabilidad correspondiente P (d|h 0) bajo la hipótesis alternativa es 0.1. Usando las ecuaciones dadas anteriormente, el factor Bayes aquí sería:
\(\ BF=\dfrac{P(d | h_1)}{P(d | h_0}=\dfrac{0.1}{0.2}=0.5\)
Leído literalmente, este resultado dice es que la evidencia a favor de la alternativa es de 0.5 a 1. Esto me resulta difícil de entender. Para mí, tiene mucho más sentido dar la vuelta a la ecuación “boca abajo”, y reportar la cantidad op evidencia a favor del nulo. En otras palabras, lo que calculamos es esto:
\(\ BF^{\prime} = \dfrac{P(d | h_0)}{P(d | h_1)}=\dfrac{0.2}{0.1}=2\)
Y lo que reportaríamos es un factor Bayes de 2:1 a favor del nulo. Mucho más fácil de entender, y puedes interpretar esto usando la tabla anterior.