15.8: Dentro de los sujetos
- Page ID
- 152316
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
- Explicar por qué se puede esperar que un diseño dentro de los sujetos tenga más poder que un diseño entre sujetos
- Explicar el error en términos de interacción
- Ser capaz de crear las columnas Fuente y df de una tabla de resumen ANOVA para un diseño con una variable entre sujetos y una dentro de los sujetos
- Describir las consecuencias de violar el supuesto de esfericidad
- Discutir los cursos de acción que se pueden tomar si se viola la esfericidad
Los factores dentro de los sujetos implican comparaciones de los mismos sujetos bajo diferentes condiciones. Por ejemplo, en el estudio “Tratamiento del TDAH”, el desempeño de cada niño se midió cuatro veces, una vez después de estar en cada una de las cuatro dosis de fármaco durante una semana.Por lo tanto, el desempeño de cada sujeto se midió en cada uno de los cuatro niveles del factor “Dosis”. Obsérvese la diferencia con los factores entre sujetos para los cuales el desempeño de cada sujeto se mide solo una vez y las comparaciones son entre diferentes grupos de sujetos. Un factor dentro de los sujetos a veces se denomina factor de medidas repetidas ya que se toman mediciones repetidas en cada sujeto. Un diseño experimental en el que la variable independiente es un factor dentro de sujetos se denomina diseño dentro de sujetos.
Ventaja de los diseños dentro de los sujetos
Diseños de un factor
Consideremos cómo analizar los datos del estudio de caso “Tratamiento del TDAH”. Estos datos consisten en las puntuaciones de\(24\) niños con TDAH en una tarea de retraso de gratificación (DOG). Cada niño fue probado bajo cuatro niveles de dosificación. Por ahora, solo nos ocuparemos de probar la diferencia entre la media en la condición de placebo (la dosis más baja\(D0\)) y la media en la condición de dosis más alta (\(D60\)). Los detalles de los cálculos son relativamente poco importantes ya que son realizados casi universalmente por computadoras. Por lo tanto saltamos directamente a la tabla Resumen de ANOVA que se muestra en Tabla\(\PageIndex{1}\).
Fuente | df | SSQ | MS | F | p |
---|---|---|---|---|---|
Sujetos | 23 | 5781.98 | 251.39 | ||
Dosificación | 1 | 295.02 | 295.02 | 10.38 | 0.004 |
Error | 23 | 653.48 | 28.41 | ||
Total | 47 | 6730.48 |
La primera fuente de variación, “Sujetos”, se refiere a las diferencias entre sujetos. Si todos los sujetos tuvieran exactamente la misma media (a través de las dos dosis), entonces la suma de cuadrados para los sujetos sería cero; cuantos más sujetos difieran entre sí, mayor será la suma de los sujetos cuadrados.
Dosificación se refiere a las diferencias entre los dos niveles de dosificación. Si las medias para los dos niveles de dosificación fueran iguales, la suma de cuadrados sería cero. Cuanto mayor sea la diferencia entre medias, mayor será la suma de cuadrados.
El error refleja el grado en que el efecto de la dosis es diferente para diferentes sujetos. Si todos los sujetos respondieran de manera muy similar al medicamento, entonces el error sería muy bajo. Por ejemplo, si todos los sujetos se desempeñaron moderadamente mejor con la dosis alta que con el placebo, entonces el error sería bajo. Por otro lado, si a algunos sujetos les fue mejor con el placebo mientras que a otros les fue mejor con la dosis alta, entonces el error sería alto. Debe tener sentido intuitivo que cuanto menos consistente sea el efecto de la dosis, mayor tendría que ser el efecto de la dosis para ser significativo. El grado en que el efecto de la dosis difiere dependiendo del sujeto es la\(Subjects \times Dosage\) interacción. Recordemos que una interacción ocurre cuando el efecto de una variable difiere dependiendo del nivel de otra variable. En este caso, el tamaño del término de error es la medida en que el efecto de la variable “Dosis” difiere dependiendo del nivel de la variable “Sujetos”. Obsérvese que cada asignatura es un nivel diferente de la variable “Sujetos”.
Otras porciones de la tabla resumida tienen el mismo significado que en ANOVA entre sujetos. El\(F\) para la dosis es el cuadrado medio para la dosis dividido por el error cuadrático medio. Para estos datos, el\(F\) es significativo con\(p = 0.004\). Observe que esta\(F\) prueba es equivalente a la prueba t para pares correlacionados, con\(F = t^2\).
El cuadro\(\PageIndex{2}\) muestra el Cuadro Resumen de ANOVA cuando se incluyen las cuatro dosis en el análisis. Dado que ahora hay cuatro niveles de dosificación en lugar de dos, la dosis\(df\) para es tres en lugar de uno. Dado que el error es la\(Subjects \times Dosage\) interacción, el error\(df\) for es el\(df\) para “Sujetos” (\(23\)) veces el\(df\) para Dosis (\(3\)) y es igual a\(69\).
Fuente | df | SSQ | MS | F | p |
---|---|---|---|---|---|
Sujetos | 23 | 9065.49 | 394.15 | ||
Dosificación | 3 | 557.61 | 185.87 | 5.18 | 0.003 |
Error | 69 | 2476.64 | 35.89 | ||
Total | 95 | 12099.74 |
Efectos de arrastre
A menudo, el desempeño en una condición afecta el desempeño en una condición posterior de tal manera que hace que un diseño dentro de los sujetos sea poco práctico. Por ejemplo, considere un experimento con dos condiciones. En ambas condiciones los sujetos se presentan con pares de palabras. En\(\text{Condition A}\), se pide a los sujetos que juzguen si las palabras tienen un significado similar mientras que en\(\text{Condition B}\), se pide a los sujetos que juzguen si suenan similares. En ambas condiciones, los sujetos reciben una prueba sorpresa de memoria al final de la presentación. Si\(\text{Condition}\) fuera una variable dentro de los sujetos, entonces no habría sorpresa después de la segunda presentación y es probable que los sujetos hubieran estado tratando de memorizar las palabras.
No todos los efectos de arrastre causan problemas tan graves. Por ejemplo, si los sujetos se fatigan al realizar una tarea, entonces se esperaría que empeoraran en la segunda condición en la que se encontraban. No obstante, siempre y cuando el orden de presentación esté contrapesado para que la mitad de los sujetos estén en\(\text{Condition A}\) primera y\(\text{Condition B}\) segunda, el efecto de fatiga en sí no invalidaría los resultados, aunque agregaría ruido y reduciría la potencia. El efecto de arrastre es simétrico en que tener\(\text{Condition A}\) primero afecta el rendimiento en\(\text{Condition B}\) el mismo grado que tener\(\text{Condition B}\) primero afecta el rendimiento en\(\text{Condition A}\).
Los efectos asimétricos de arrastre causan problemas más graves. Por ejemplo, supongamos que el desempeño en\(\text{ConditionB }\) fue mucho mejor si fue precedido por\(\text{Condition A}\), mientras que el desempeño en\(\text{Condition A}\) fue aproximadamente el mismo independientemente de si fue precedido por\(\text{Condition B}\). Con este tipo de efecto de arrastre, probablemente sea mejor usar un diseño entre sujetos.
Un factor entre y uno dentro de los sujetos
En el estudio de caso “Stroop Interference”, los sujetos realizaron tres tareas: nombrar colores, leer palabras de color y nombrar el color de tinta de las palabras de color. Algunos de los sujetos fueron varones y otros mujeres. Por lo tanto, este diseño tuvo dos factores: género y tarea. El Cuadro Resumen de ANOVA para este diseño se muestra en la Tabla\(\PageIndex{3}\).
Fuente | df | SSQ | MS | F | p |
---|---|---|---|---|---|
Género | 1 | 83.32 | 83.32 | 1.99 | 0.165 |
Error | 45 | 1880.56 | 41.79 | ||
Tarea | 2 | 9525.97 | 4762.99 | 228.06 | <0.001 |
Género x Tarea | 2 | 55.85 | 27.92 | 1.34 | 0.268 |
Error | 90 | 1879.67 | 20.89 |
Los cómputos para las sumas de cuadrados no serán cubiertos ya que los cálculos se realizan normalmente por software. No obstante, hay algunas cosas importantes que aprender de la tabla de resumen. Primero, observe que existen dos términos de error: uno para la variable entresujetos Género y otro para la variable dentro de sujetos Tarea y la interacción de la variable entresujetos y la variable dentro de sujetos. Por lo general, el error cuadrático medio para la variable entre sujetos será mayor que el otro error cuadrático medio. En este ejemplo, el error cuadrático medio para Género es aproximadamente el doble que el otro error cuadrático medio.
Los grados de libertad para la variable entre sujetos es igual al número de niveles de la variable entre sujetos menos uno. En este ejemplo, es uno ya que hay dos niveles de género. De igual manera, los grados de libertad para la variable dentro de sujetos es igual al número de niveles de la variable menos uno. En este ejemplo, son dos ya que hay tres tareas. Los grados de libertad para la interacción son producto de los grados de libertad para las dos variables. Para la\(Gender \times Task\) interacción, los grados de libertad son producto de grados de libertad Género (que es\(1\)) y los grados de libertad Tarea (que es\(2\)) y es igual a\(2\).
Asunción de Esfericidad
El ANOVA dentro de los sujetos hace una suposición restrictiva sobre las varianzas y las correlaciones entre las variables dependientes. Si bien los detalles del supuesto están fuera del alcance de este libro, es aproximadamente correcto decir que se supone que todas las correlaciones son iguales y todas las varianzas son iguales. En el cuadro se\(\PageIndex{4}\) muestran las correlaciones entre las tres variables dependientes en el estudio de caso “Interferencia Stroop”.
lectura de palabras | denominación de color | interferencia | |
---|---|---|---|
lectura de palabras | 1 | 0.7013 | 0.1583 |
denominación de color | 0.7013 | 1 | 0.2382 |
interferencia | 0.1583 | 0.2382 | 1 |
Tenga en cuenta que la correlación entre la lectura de palabras y las variables de denominación de color de\(0.7013\) es mucho mayor que la correlación entre cualquiera de estas variables con la variable de interferencia. Además, como se muestra en la Tabla\(\PageIndex{5}\), las varianzas entre las variables difieren mucho.
Variable | Varianza |
---|---|
lectura de palabras | 15.77 |
denominación de color | 13.92 |
interferencia | 55.07 |
Naturalmente el supuesto de esfericidad, como todos los supuestos, se refiere a poblaciones no a muestras. No obstante, a partir de estos datos muestrales se desprende que el supuesto no se cumple en la población.
Consecuencias de Violar la Asunción de Esfericidad
Aunque el ANOVA es robusto a la mayoría de las violaciones de sus supuestos, el supuesto de esfericidad es una excepción: Violar la suposición de esfericidad conduce a un aumento sustancial en la tasa de error Tipo I. Además, esta suposición rara vez se cumple en la práctica. Si bien las violaciones a este supuesto en algún momento habían recibido poca atención, el consenso actual de los analistas de datos es que ya no se considera aceptable ignorarlos.
Enfoques para hacer frente a las violaciones de la esfericidad
Si un efecto es altamente significativo, existe una prueba conservadora que puede usarse para proteger contra una tasa de error tipo I inflada. Esta prueba consiste en ajustar los grados de libertad para todas las variables dentro de los sujetos de la siguiente manera: Los grados de libertad numerador y denominador se dividen por el número de puntajes por sujeto menos uno. Considera el efecto de Tarea que se muestra en la Tabla\(\PageIndex{3}\). Hay tres puntuaciones por materia y por lo tanto los grados de libertad deben dividirse por dos. Los grados de libertad ajustados son:
\((2)(1/2) = 1\)para el numerador y
\((90)(1/2) = 45\)para el denominador
El valor de probabilidad se obtiene usando la calculadora de\(F\) probabilidad con los nuevos parámetros de grados de libertad. La probabilidad de un\(F\) de\(228.06\) o mayor con\(1\) y\(45\) grados de libertad es menor que\(0.001\). Por lo tanto, no hay necesidad de preocuparse por la presunción de violación en este caso.
Posible violación de esfericidad sí hace diferencia en la interpretación del análisis mostrado en la Tabla\(\PageIndex{2}\). El valor de probabilidad de un\(F\) de\(5.18\) con\(1\) y\(23\) grados de libertad es\(0.032\), un valor que conduciría a una conclusión más cautelosa que el\(p\) valor de\(0.003\) mostrado en la Tabla\(\PageIndex{2}\).
La corrección descrita anteriormente es muy conservadora y sólo debe utilizarse cuando, como en la Tabla\(\PageIndex{3}\), el valor de probabilidad es muy bajo. Una mejor corrección, pero muy complicada de calcular, es multiplicar los grados de libertad por una cantidad llamada\(\varepsilon\) (la letra griega épsilon). Existen dos métodos de cálculo\(\varepsilon\). La corrección llamada Huynh-Feldt (o\(H-F\)) es ligeramente preferida a la llamada Greenhouse-Geisser (o\(G-G\)), aunque ambas funcionan bien. La\(G-G\) corrección generalmente se considera un poco demasiado conservadora.
Un método final para tratar las violaciones de esfericidad es utilizar un enfoque multivariado para las variables dentro de los sujetos. Este método tiene mucho que recomendarlo, pero está más allá del alcance de este texto.