12.7: La prueba exacta de Fisher

Última actualización
Guardar como PDF

Page ID: 151277

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

¿Qué debes hacer si tus recuentos de celdas son demasiado pequeños, pero aún así quieres probar la hipótesis nula de que las dos variables son independientes? Una respuesta sería “recopilar más datos”, pero eso es demasiado sencillo: hay muchas situaciones en las que sería inviable o poco ético hacer eso. Si es así, los estadísticos tienen una especie de obligación moral de proporcionar a los científicos mejores pruebas. En esta instancia, Fisher (1922) amablemente proporcionó la respuesta correcta a la pregunta. Para ilustrar la idea básica, supongamos que estamos analizando datos de un experimento de campo, observando el estado emocional de las personas que han sido acusadas de brujería; algunas de las cuales actualmente están siendo quemadas en la hoguera. ¹⁸¹ Desafortunadamente para el científico (pero más bien afortunadamente para la población en general), en realidad es bastante difícil encontrar personas en proceso de ser incendiadas, por lo que los recuentos de células son muy pequeños en algunos casos. El archivo Salem.rdata ilustra el punto:

load("./rbook-master/data/salem.Rdata")

salem.tabs <- table( trial )
print( salem.tabs )

##        on.fire
## happy   FALSE TRUE
##   FALSE     3    3
##   TRUE     10    0

Al observar estos datos, sería difícil no sospechar que las personas que no están en llamas tienen más probabilidades de ser felices que las personas en llamas. Sin embargo, la prueba de chi-cuadrado hace que esto sea muy difícil de probar debido al pequeño tamaño de la muestra. Si trato de hacerlo, R me da un mensaje de advertencia:

chisq.test( salem.tabs )

## Warning in chisq.test(salem.tabs): Chi-squared approximation may be
## incorrect

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  salem.tabs
## X-squared = 3.3094, df = 1, p-value = 0.06888

Hablando como alguien que no quiere que le prendan fuego, realmente me gustaría poder obtener una mejor respuesta que esta. Aquí es donde la prueba exacta de Fisher viene muy útil.

La prueba exacta de Fisher funciona de manera algo diferente a la prueba de chi-cuadrado (o de hecho cualquiera de las otras pruebas de hipótesis de las que hablo en este libro) en la medida en que no tiene una estadística de prueba; calcula el valor p “directamente”. Explicaré los conceptos básicos de cómo funciona la prueba para una tabla de contingencia 2×2, aunque la prueba funciona bien para mesas más grandes. Como antes, vamos a tener alguna notación:

	Feliz	Triste	Total
Prenden fuego	O ₁₁	O ₁₂	R ₁
No prendido fuego	O ₂₁	O ₂₂	R ₂
Total	C ₁	C ₂	N

_{Para construir la prueba Fisher trata tanto los totales de fila como de columna (R ₁, R2, C ₁ y C ₂) son conocidos, cantidades fijas; y luego calcula la probabilidad de que hubiéramos obtenido las frecuencias observadas que hicimos (O ₁₁, O} 12, O ₂₁ y O ₂₂) dados esos totales. En la notación que desarrollamos en el Capítulo 9 esto está escrito:

P (O ₁₁, O ₁₂, O ₂₁, O ₂₂ | R ₁, R ₂, C ₁, C ₂)

y como te imaginas, es un ejercicio un poco complicado averiguar cuál es esta probabilidad, pero resulta que esta probabilidad es descrita por una distribución conocida como la distribución hipergeométrica. ¹⁸² Ahora que sabemos esto, lo que tenemos que hacer para calcular nuestro valor p es calcular la probabilidad de observar esta tabla en particular o una tabla que sea “más extrema”. ¹⁸³ Ya en la década de 1920, calcular esta suma era desalentador incluso en las situaciones más simples, pero en estos días es bastante fácil siempre que las tablas no sean demasiado grandes y el tamaño de la muestra no sea demasiado grande. El tema conceptualmente complicado es averiguar qué significa decir que una tabla de contingencia es más “extrema” que otra. La solución más sencilla es decir que la tabla con menor probabilidad es la más extrema. Esto nos da entonces el valor p.

La implementación de la prueba en R es a través de la función fisher.test (). Así es como se usa:

fisher.test( salem.tabs )

## 
##  Fisher's Exact Test for Count Data
## 
## data:  salem.tabs
## p-value = 0.03571
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.000000 1.202913
## sample estimates:
## odds ratio 
##          0

Esto es un poco más de salida de lo que obtuvimos de algunas de nuestras pruebas anteriores. Lo principal que nos interesa aquí es el valor p, que en este caso es lo suficientemente pequeño (p=.036) como para justificar rechazar la hipótesis nula de que las personas en llamas son tan felices como las personas que no están ardiendo.