14.12: Sobre la relación entre ANOVA y la prueba t de Student
- Page ID
- 151287
Hay una última cosa que quiero señalar antes de terminar. Es algo que mucha gente encuentra algo sorprendente, pero vale la pena conocerlo: un ANOVA con dos grupos es idéntico a la prueba t de Student. No, en serio. No es sólo que sean similares, sino que en realidad son equivalentes en todas las formas significativas. No voy a tratar de demostrar que esto siempre es cierto, pero les mostraré una sola demostración concreta. Supongamos que, en lugar de ejecutar un ANOVA en nuestro modelo de drogas de mood.gain ~
, hagámoslo usando la terapia
como predictor. Si ejecutamos este ANOVA, esto es lo que obtenemos:
summary( aov( mood.gain ~ therapy, data = clin.trial ))
## Df Sum Sq Mean Sq F value Pr(>F)
## therapy 1 0.467 0.4672 1.708 0.21
## Residuals 16 4.378 0.2736
En general, parece que aquí no hay ningún efecto significativo pero, como veremos en el Capítulo @ref (¡anova2 esta es en realidad una respuesta engañosa! En cualquier caso, es irrelevante para nuestros objetivos actuales: nuestro interés aquí está en el estadístico F, que es F (1,16) =1.71, y el valor p, que es .21. Como solo tenemos dos grupos, en realidad no necesitaba recurrir a un ANOVA, podría haber decidido simplemente hacer una prueba t de Student. Entonces veamos qué pasa cuando hago eso:
t.test( mood.gain ~ therapy, data = clin.trial, var.equal = TRUE )
##
## Two Sample t-test
##
## data: mood.gain by therapy
## t = -1.3068, df = 16, p-value = 0.2098
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.8449518 0.2005073
## sample estimates:
## mean in group no.therapy mean in group CBT
## 0.7222222 1.0444444
Curiosamente, los valores p son idénticos: una vez más obtenemos un valor de p=.21. Pero, ¿qué pasa con el estadístico de prueba? Habiendo realizado una prueba t en lugar de un ANOVA, obtenemos una respuesta algo diferente, es decir, t (16) =−1.3068. Sin embargo, aquí hay una relación bastante sencilla. Si cuadramos la estadística t
1.3068 ^ 2
## [1] 1.707726
obtenemos el estadístico F de antes.