16.3: Tamaño del efecto, medias estimadas e intervalos de confianza

Última actualización
Guardar como PDF

Page ID: 151307

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

En esta sección voy a discutir algunas cantidades adicionales que quizás te encuentres queriendo calcular para un ANOVA factorial. Lo principal que probablemente querrás calcular es el tamaño del efecto para cada término en tu modelo, pero es posible que también quieras que R te dé algunas estimaciones para las medias grupales y los intervalos de confianza asociados.

Tamaños de efecto

Los cálculos del tamaño del efecto para un ANOVA factorial son bastante similares a los utilizados en ANOVA de una manera (ver Sección 14.4). Específicamente, podemos usar η ² (eta-cuadrado) como forma sencilla de medir qué tan grande es el efecto general para cualquier término en particular. Como antes, η ² se define dividiendo la suma de cuadrados asociados a ese término por la suma total de cuadrados. Por ejemplo, para determinar el tamaño del efecto principal del Factor A, usaríamos la siguiente fórmula

\(\eta_{A}^{2}=\dfrac{\mathrm{SS}_{A}}{\mathrm{SS}_{T}}\)

Como antes, esto se puede interpretar de la misma manera que ^R2 en regresión. ²³⁴ Te indica la proporción de varianza en la variable de resultado que puede ser contabilizada por el efecto principal del Factor A. Por lo tanto, es un número que va desde 0 (ningún efecto en absoluto) hasta 1 (da cuenta de toda la variabilidad en el resultado). Además, la suma de todos los valores η ², tomados en todos los términos del modelo, sumará al R ² total para el modelo ANOVA. Si, por ejemplo, el modelo ANOVA encaja perfectamente (es decir, ¡no hay ninguna variabilidad dentro de los grupos!) , los valores η ² sumarán a 1. Por supuesto, eso rara vez si alguna vez sucede en la vida real.

No obstante, al hacer un ANOVA factorial, hay una segunda medida del tamaño del efecto que a la gente le gusta reportar, conocida como η parcial ². La idea detrás de η ² parcial (que a veces se denota\(\ {p^\eta}^2\) o\(\ \eta_p^2\)) es que, al medir el tamaño del efecto para un término en particular (digamos, el efecto principal del Factor A), se quiere ignorar deliberadamente los otros efectos en el modelo (por ejemplo, el efecto principal del Factor B). Es decir, fingirías que el efecto de todos estos otros términos es cero, para luego calcular cuál habría sido el valor η ². Esto en realidad es bastante fácil de calcular. Todo lo que tienes que hacer es eliminar del denominador la suma de cuadrados asociados a los otros términos. En otras palabras, si quieres el η parcial ² para el efecto principal del Factor A, el denominador es solo la suma de los valores SS para el Factor A y los residuales:

parcial\(\eta_{A}^{2}=\dfrac{\mathrm{SS}_{A}}{\mathrm{SS}_{A}+\mathrm{SS}_{R}}\)

Esto siempre te dará un número mayor que η ², lo que el cínico en mí sospecha da cuenta de la popularidad del η parcial ². Y una vez más se obtiene un número entre 0 y 1, donde 0 representa ningún efecto. Sin embargo, es un poco más complicado interpretar lo que significa un gran valor parcial η ². En particular, ¡en realidad no se pueden comparar los valores parciales de η ² entre términos! Supongamos, por ejemplo, que no hay ninguna variabilidad dentro de los grupos: si es así, SS _R =0. Lo que eso significa es que cada término tiene un valor parcial η ² de 1. Pero eso no quiere decir que todos los términos en su modelo sean igualmente importantes, o de hecho que sean igualmente grandes. Todo lo que significa es que todos los términos en su modelo tienen tamaños de efecto que son grandes en relación con la variación residual. No es comparable entre términos.

Para ver a lo que me refiero con esto, es útil ver un ejemplo concreto. Una vez más, usaremos la función etaSquared () del paquete lsr. Como antes, se ingresa el objeto aov para el que queremos que se realicen los cálculos η ², y R genera una matriz que muestra los tamaños de efecto para cada término en el modelo. Primero, echemos un vistazo a los tamaños de efecto para el ANOVA original sin el término de interacción:

etaSquared( model.2 )

##            eta.sq eta.sq.part
## drug    0.7127623   0.7888325
## therapy 0.0964339   0.3357285

Al observar primero los valores de η ², vemos que el fármaco representa 71.3% de la varianza (es decir, η ² =0.713) en el estado de ánimo.ganancia, mientras que la terapia solo representa 9.6%. Esto deja un total de 19.1% de la variación descontabilizada (es decir, los residuos constituyen 19.1% de la variación en el resultado). En general, esto implica que tenemos un efecto muy grande ²³⁵ de fármaco y un efecto modesto de la terapia.

Ahora veamos los valores parciales de η ². Debido a que el efecto de la terapia no es tan grande, controlar por ella no hace mucha diferencia, por lo que el η ² parcial para fármaco no aumenta mucho, y obtenemos un valor de\(\ {p^\eta}^2\) =0.789). En contraste, debido a que el efecto del fármaco fue muy grande, controlar por ello hace una gran diferencia, y así cuando calculamos el η2 parcial para la terapia se puede ver que sube a\(\ {p^\eta}^2\) =0.336. La pregunta que tenemos que hacernos es, ¿qué significan realmente estos valores parciales de η ²? La forma en que generalmente interpreto el η ² parcial para el efecto principal del Factor A es interpretarlo como una afirmación sobre un experimento hipotético en el que solo se variaba el Factor A. Entonces, aunque en este experimento variamos tanto A como B, podemos imaginar fácilmente un experimento en el que solo se varió el Factor A: el estadístico parcial η ² te dice cuánto de la varianza en la variable de resultado esperarías ver contabilizada en ese experimento. No obstante, cabe señalar que esta interpretación —como muchas cosas asociadas a los efectos principales— no tiene mucho sentido cuando hay un efecto de interacción grande y significativo.

Hablando de efectos de interacción, esto es lo que obtenemos cuando calculamos los tamaños de efecto para el modelo que incluye el término de interacción. Como puede ver, los valores η ² para los efectos principales no cambian, pero los valores parciales de η ² sí:

 etaSquared( model.3 )

##                  eta.sq eta.sq.part
## drug         0.71276230   0.8409091
## therapy      0.09643390   0.4169559
## drug:therapy 0.05595689   0.2932692

Promedio estimado del grupo

En muchas situaciones te encontrarás queriendo reportar estimaciones de todas las medias grupales con base en los resultados de tu ANOVA, así como intervalos de confianza asociados a ellos. Puedes usar la función effect () en el paquete de efectos para hacer esto (¡no olvides instalar el paquete si aún no lo tienes!). Si el ANOVA que ha realizado es un modelo saturado (es decir, contiene todos los posibles efectos principales y todos los posibles efectos de interacción) entonces las estimaciones de las medias de grupo son realmente idénticas a las medias de la muestra, aunque los intervalos de confianza utilizarán una estimación agrupada de los errores estándar, en lugar de usar uno separado para cada grupo. Para ilustrar esto, apliquemos la función effect () a nuestro modelo saturado (es decir, modelo.3) para los datos del ensayo clínico. La función effect () contiene dos argumentos que nos importan: el argumento término especifica para qué términos del modelo queremos que se calculen las medias, y el argumento mod especifica el modelo:

library(effects)
 eff <- effect( term = "drug*therapy", mod = model.3 )
 eff

## 
##  drug*therapy effect
##           therapy
## drug       no.therapy      CBT
##   placebo    0.300000 0.600000
##   anxifree   0.400000 1.033333
##   joyzepam   1.466667 1.500000

Observe que estos son en realidad los mismos números que obtuvimos al calcular las medias de muestra antes (es decir, la variable group.means que calculamos usando aggregate ()). Una cosa útil que podemos hacer usando la variable de efecto eff, sin embargo, es extraer los intervalos de confianza usando la función summary ():

 summary(eff)

## 
##  drug*therapy effect
##           therapy
## drug       no.therapy      CBT
##   placebo    0.300000 0.600000
##   anxifree   0.400000 1.033333
##   joyzepam   1.466667 1.500000
## 
##  Lower 95 Percent Confidence Limits
##           therapy
## drug        no.therapy       CBT
##   placebo  0.006481093 0.3064811
##   anxifree 0.106481093 0.7398144
##   joyzepam 1.173147759 1.2064811
## 
##  Upper 95 Percent Confidence Limits
##           therapy
## drug       no.therapy       CBT
##   placebo   0.5935189 0.8935189
##   anxifree  0.6935189 1.3268522
##   joyzepam  1.7601856 1.7935189

En este resultado, vemos que la ganancia media estimada del estado de ánimo para el grupo placebo sin terapia fue de 0.300, con un intervalo de confianza del 95% de 0.006 a 0.594. Tenga en cuenta que estos no son los mismos intervalos de confianza que obtendría si los calculara por separado para cada grupo, debido a que el modelo ANOVA asume homogeneidad de varianza y por lo tanto utiliza una estimación agrupada de la desviación estándar.

Cuando el modelo no contiene el término de interacción, entonces las medias de grupo estimadas serán diferentes de las medias de la muestra. En lugar de reportar la media muestral, la función effect () calculará el valor de las medias grupales que se esperarían sobre la base de las medias marginales (es decir, suponiendo que no haya interacción). Usando la notación que desarrollamos anteriormente, la estimación reportada para μ _rc, la media para el nivel r en la (fila) Factor A y nivel c en la (columna) Factor B sería μ_..+α _r +β _c. Si realmente no hay interacciones entre los dos factores, esta es en realidad una mejor estimación de la media poblacional que la media de la muestra cruda. El comando para obtener estas estimaciones es en realidad idéntico al último, excepto que usamos modelo.2. Cuando hagas esto, R te dará un mensaje de advertencia:

eff <- effect( "drug*therapy", model.2 )

## NOTE: drug:therapy does not appear in the model

pero esto no es nada de qué preocuparse. Esto es R siendo cortés, y haciéndole saber que las estimaciones que está construyendo se basan en la suposición de que no existen interacciones. Tiene sentido que haga esto: cuando usamos “droga*terapia” como nuestro insumo, le estamos diciendo a R que queremos que emita las medias estimadas del grupo (en lugar de las medias marginales), pero la entrada real “droga*terapia” podría significar que quieres que se incluyan interacciones o quizás no. Aquí no hay ambigüedad real, porque el modelo en sí tiene o no interacciones, pero los autores de la función pensaron que era sensato incluir una advertencia solo para asegurarse de que has especificado el modelo real que te importa. Pero, asumiendo que realmente no creemos que haya interacciones, model.2 es el modelo adecuado para usar, por lo que podemos ignorar esta advertencia. ²³⁶ En cualquier caso, cuando inspeccionamos la salida, obtenemos la siguiente tabla de medias de grupo estimadas:

eff

## 
##  drug*therapy effect
##           therapy
## drug       no.therapy       CBT
##   placebo   0.2888889 0.6111111
##   anxifree  0.5555556 0.8777778
##   joyzepam  1.3222222 1.6444444

Como antes, podemos obtener intervalos de confianza usando el siguiente comando:

 summary( eff )

## 
##  drug*therapy effect
##           therapy
## drug       no.therapy       CBT
##   placebo   0.2888889 0.6111111
##   anxifree  0.5555556 0.8777778
##   joyzepam  1.3222222 1.6444444
## 
##  Lower 95 Percent Confidence Limits
##           therapy
## drug       no.therapy       CBT
##   placebo  0.02907986 0.3513021
##   anxifree 0.29574653 0.6179687
##   joyzepam 1.06241319 1.3846354
## 
##  Upper 95 Percent Confidence Limits
##           therapy
## drug       no.therapy       CBT
##   placebo   0.5486979 0.8709201
##   anxifree  0.8153646 1.1375868
##   joyzepam  1.5820313 1.9042535

pero la salida se ve prácticamente igual que la última vez, y este libro ya es demasiado largo, así que no lo voy a incluir aquí.