17.10: Resumen
- Page ID
- 151351
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)La primera mitad de este capítulo se centró principalmente en los fundamentos teóricos de la estadística bayesiana. Introduje las matemáticas sobre cómo funciona la inferencia bayesiana (Sección 17.1), y di una visión muy básica de cómo se realiza típicamente la prueba de hipótesis bayesiana (Sección 17.2). Por último, dediqué algo de espacio a hablar sobre por qué creo que vale la pena usar los métodos bayesianos (Sección 17.3.
La segunda mitad del capítulo fue mucho más práctica, y se centró en las herramientas proporcionadas por el paquete BayesFactor
. Específicamente, hablé sobre el uso de la función ContingencyTableBF ()
para hacer análogos bayesianos de pruebas de chi-cuadrado (Sección 17.6, la función ttestBF ()
para hacer pruebas t bayesianas, (Sección 17.7), la función regressionBF ()
para hacer regresiones bayesianas, y finalmente la Función AnovaBF ()
para ANOVA bayesiano.
Si estás interesado en aprender más sobre el enfoque bayesiano, hay muchos libros buenos que podrías investigar. El libro de John Kruschke Doing Bayesian Data Analysis es un buen lugar para comenzar (Kruschke 2011), y es una buena mezcla de teoría y práctica. Su enfoque es un poco diferente al enfoque del “factor Bayes” que he discutido aquí, así que no estarás cubriendo el mismo terreno. Si eres psicólogo cognitivo, quizás quieras revisar el libro de Michael Lee y E.J. Wagenmakers “Bayesian Cognitive Modeling (Lee and Wagenmakers 2014). Elegí estos dos porque creo que son especialmente útiles para la gente de mi disciplina, pero hay muchos libros buenos por ahí, ¡así que mira a tu alrededor!
Referencias
Jeffreys, Harold. 1961. La Teoría de la Probabilidad. 3ª ed. Oxford.
Kass, Robert E., y Adrian E. Raftery. 1995. “Factores Bayes”. Revista de la Asociación Americana de Estadística 90:773—95.
Fisher, R. 1925. Métodos Estadísticos para Investigadores. Edimburgo, Reino Unido: Oliver; Boyd.
Johnson, Valen E. 2013. “Estándares revisados para la evidencia estadística”. Actas de la Academia Nacional de Ciencias, núm. 48:19313—7.
Morey, Richard D., y Jeffrey N. Rouder. 2015. BayesFactor: Computación de Factores Bayes para Diseños Comunes. http://CRAN.R-project.org/package=BayesFactor.
Gunel, Erdogan, y James Dickey. 1974. “Factores Bayes para la Independencia en las Tablas de Contingencia”. Biometrika, 545—57.
Kruschke, J. K. 2011. Haciendo Análisis Bayesiano de Datos: Un Tutorial con R y BUGS. Burlington, MA: Prensa Académica.
Lee, Michael D, y Erica-Jan Wagenmakers. 2014. Modelado Cognitivo Bayesiano: Un Curso Práctico. Prensa de la Universidad de Cambridge.
- http://en.wikiquote.org/wiki/David_Hume
- http://en.Wikipedia.org/wiki/Climate_of_Adelaide
- Es un salto de fe, lo sé, pero vamos a correr con él ¿bien?
- Um. Odio mencionar esto, pero algunos estadísticos se opondrían a que usara la palabra “verosimilitud” aquí. El problema es que la palabra “verosimilitud” tiene un significado muy específico en la estadística frecuentista, y no es exactamente lo mismo que lo que significa en la estadística bayesiana. Por lo que puedo decir, los bayesianos originalmente no tenían ningún nombre acordado para la probabilidad, por lo que se convirtió en una práctica común que las personas usaran la terminología frecuencista. Esto no habría sido un problema, salvo por el hecho de que la forma en que los bayesianos usan la palabra resulta ser bastante diferente a la forma en que lo hacen los frecuentistas. Este no es el lugar para otra larga lección de historia, sino para decirlo crudamente: cuando un bayesiano dice “una función de verosimilitud” suelen referirse a una de las filas de la tabla. Cuando un frecuentista dice lo mismo, se refiere a la misma tabla, pero a ellos “una función de verosimilitud” casi siempre se refiere a una de las columnas. Esta distinción importa en algunos contextos, pero no es importante para nuestros propósitos.
- Si estuviéramos siendo un poco más sofisticados, podríamos extender el ejemplo para dar cabida a la posibilidad de que esté mintiendo sobre el paraguas. Pero mantengamos las cosas simples, ¿de acuerdo?
- Podría notar que esta ecuación es en realidad una reformulación de la misma regla básica que enumeré al inicio de la última sección. Si multiplicas ambos lados de la ecuación por P (d), entonces obtienes P (d) P (h|d) =P (d, h), que es la regla de cómo se calculan las probabilidades conjuntas. Así que en realidad no estoy introduciendo ninguna regla “nueva” aquí, solo estoy usando la misma regla de una manera diferente.
- Obviamente, esta es una historia muy simplificada. Toda la complejidad de las pruebas de hipótesis bayesianas de la vida real se reduce a cómo se calcula la probabilidad P (d|h) cuando la hipótesis h es algo complejo y vago. No voy a hablar de esas complejidades en este libro, pero sí quiero destacar que aunque esta sencilla historia es cierta hasta donde va, la vida real es más desmesurada de lo que puedo cubrir en un libro de texto introductorio de estadísticas.
- http://www.imdb.com/title/tt0093779/quotes. Debo señalar de pasada que no soy la primera persona en usar esta cita para quejarse de los métodos frecuentistas. Rich Morey y sus colegas tuvieron la idea primero. Lo estoy robando descaradamente porque es una cita de extracción increíble para usar en este contexto y me niego a perder ninguna oportunidad de citar a La princesa novia.
- http://about.abc.net.au/reports-publications/appreciation-survey-summary-report-2013/
- http://knowyourmeme.com/memes/the-cake-is-a-lie
- En aras de ser completamente honesto, debo reconocer que no todas las pruebas estadísticas ortodoxas que se basan en esta tonta suposición. Hay una serie de herramientas de análisis secuenciales que a veces se utilizan en ensayos clínicos y similares. Estos métodos se basan en el supuesto de que los datos se analizan a medida que llegan, y estas pruebas no se rompen horriblemente en la forma de la que me quejo aquí. Sin embargo, los métodos de análisis secuencial se construyen de una manera muy diferente a la versión “estándar” de las pruebas de hipótesis nulas. No lo convierten en ningún libro de texto introductorio, y no son muy utilizados en la literatura psicológica. La preocupación que estoy planteando aquí es válida para cada prueba ortodoxa que he presentado hasta ahora, y para casi todas las pruebas que he visto reportadas en los periódicos que leí.
- Un problema relacionado: http://xkcd.com/1478/
- Algunos lectores podrían preguntarse por qué elegí 3:1 en lugar de 5:1, dado que Johnson (2013) sugiere que p=.05 se encuentra en algún lugar de ese rango. Lo hice con el fin de ser caritativo al valor p. Si hubiera elegido un factor Bayes 5:1 en su lugar, los resultados se verían aún mejor para el enfoque bayesiano.
- http://www.quotationspage.com/quotes/Ambrosius_Macrobius/
- Bien, solo sé que algunos frecuentistas conocedores leerán esto y comenzarán a quejarse de esta sección. Mira, no soy tonto. Sé absolutamente que si adoptas una perspectiva de análisis secuencial puedes evitar estos errores dentro del marco ortodoxo. También sé que se pueden diseñar estudios explicativamente con análisis intermedios en mente. Entonces sí, en un sentido estoy atacando a una versión de “hombre de paja” de los métodos ortodoxos. No obstante, el hombre de paja al que estoy atacando es el que utilizan casi todos los practicantes. Si alguna vez llega al punto en que los métodos secuenciales se convierten en la norma entre los psicólogos experimentales y ya no me veo obligado a leer 20 ANOVA extremadamente dudosas al día, prometo que reescribiré esta sección y marcaré el vitriolo. Pero hasta que llegue ese día, mantengo mi afirmación de que los métodos del factor Bayes por defecto son mucho más robustos ante las prácticas de análisis de datos tal como existen en el mundo real. Los métodos ortodoxos por defecto apestan, y todos lo sabemos.
- Si estás desesperado por saberlo, puedes encontrar todos los detalles cruentos en Gunel y Dickey (1974). Sin embargo, ese es un trabajo bastante técnico. La documentación de ayuda al
ContingencyTableBF ()
da esta explicación: “el argumentoPriorConcentration
indexa la desviación esperada de la hipótesis nula bajo la alternativa, y corresponde a Gunel y Dickey (1974) un parámetro”. Mientras escribo esto estoy a la mitad del papel de Gunel y Dickey, y estoy de acuerdo en que establecer a=1 es una opción por defecto bastante sensata, ya que corresponde a una suposición de que tienes muy poco conocimiento a priori sobre la tabla de contingencias. - En algunos de los ejemplos posteriores, verás que este número no siempre es del 0%. Esto se debe a que el paquete
BayesFactor
a menudo tiene que ejecutar algunas simulaciones para calcular los factores Bayes aproximados. Así que las respuestas que obtengas no siempre serán idénticas cuando ejecutes el comando por segunda vez. Por eso la salida de estas funciones te dice cuál es el margen de error. - Al parecer esta omisión es deliberada. Tengo este vago recuerdo de que hablé con Jeff Rouder sobre esto una vez, y su opinión era que cuando se viola la homogeneidad de la varianza los resultados de una prueba t son ininterpretables. Puedo ver el argumento a favor de esto, pero nunca he tenido realmente una opinión fuerte yo mismo. (Jeff, si nunca dijiste eso, lo siento)
- Por si acaso te interesa: la parte “JZS” de la salida se relaciona con cómo la prueba bayesiana expresa la incertidumbre previa sobre la varianza σ2, y es la abreviatura de los nombres de tres personas: “Jeffreys Zellner Siow”. Ver Rouder et al. (2009) para más detalles.
- Nuevamente, por si te importa... la hipótesis nula aquí especifica un tamaño de efecto de 0, ya que las dos medias son idénticas. La hipótesis alternativa establece que hay un efecto, pero no especifica exactamente qué tan grande será el efecto. El valor r aquí se relaciona con qué tan grande se espera que sea el efecto de acuerdo con la alternativa. ¿Se puede escribir
? TTestBF
para obtener más detalles. - Otra vez, chicos, perdón si los he malinterpretado.
- Ni siquiera estoy en desacuerdo con ellos: no es del todo obvio por qué un ANOVA bayesiano debería reproducir (digamos) el mismo conjunto de comparaciones de modelos que utiliza la estrategia de prueba Tipo II. Es precisamente por el hecho de que realmente no he llegado a ninguna conclusión sólida que no he agregado nada al paquete
lsr
para que las pruebas bayesianas Tipo II sean más fáciles de producir.