Saltar al contenido principal
LibreTexts Español

8.2: Partición de las Sumas de Cuadrados

  • Page ID
    150451
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Es hora de introducir un nuevo nombre para una idea que aprendiste del último capítulo, se llama particionar las sumas de cuadrados. A veces, un nuevo nombre oscuro puede ser útil para tu comprensión de lo que está pasando. Los ANOVA se tratan de particionar las sumas de cuadrados. Ya hicimos algunas particiones en el último capítulo. ¿A qué nos referimos con particionamiento?

    Imagina que tenías una gran casa vacía sin habitaciones en ella. ¿Qué pasaría si repartieras la casa? ¿Qué estarías haciendo? Una forma de dividir la casa es dividirla en diferentes habitaciones. Puedes hacer esto agregando nuevas paredes y haciendo pequeñas habitaciones por todas partes. Eso es lo que significa particionar, dividir.

    El acto de particionar, o dividir, es la idea central del ANOVA. Para usar la analogía de la casa. Nuestras sumas totales de cuadrados (SS Total) es nuestra gran casa vacía. Queremos dividirlo en cuartos pequeños. Antes particionamos SS Total usando esta fórmula:

    \[SS_\text{TOTAL} = SS_\text{Effect} + SS_\text{Error} \nonumber \]

    Recuerde, la\(SS_\text{Effect}\) era la varianza que podíamos atribuir a las medias de los diferentes grupos, y\(SS_\text{Error}\) fue la varianza sobrante que no pudimos explicar. \(SS_\text{Effect}\)y\(SS_\text{Error}\) son los tabiques de\(SS_\text{TOTAL}\), son los cuartos pequeños.

    En el caso entre sujetos anterior, llegamos a\(SS_\text{TOTAL}\) dividirnos en dos partes. Lo más interesante del diseño de medidas repetidas, es que llegamos a\(SS_\text{TOTAL}\) dividirnos en tres partes, hay una partición más. ¿Puedes adivinar cuál es la nueva partición? Pista: siempre que tengamos una nueva forma de calcular medios en nuestro diseño, siempre podemos crear una partición para esos nuevos medios. ¿Cuáles son los nuevos medios en el diseño de medidas repetidas?

    Aquí está la nueva idea para particionar\(SS_\text{TOTAL}\) en un diseño de medidas repetidas:

    \[SS_\text{TOTAL} = SS_\text{Effect} + SS_\text{Subjects} +SS_\text{Error} \nonumber \]

    Hemos agregado\(SS_\text{Subjects}\) como la nueva idea en la fórmula. ¿Cuál es la idea aquí? Bueno, debido a que cada sujeto se midió en cada condición, tenemos un nuevo conjunto de medias. Estos son los medios para cada sujeto, colapsado a través de las condiciones. Por ejemplo, el sujeto 1 tiene una media (media de sus puntuaciones en las condiciones A, B y C); el sujeto 2 tiene una media (media de sus puntuaciones en las condiciones A, B y C); y el sujeto 3 tiene una media (media de sus puntuaciones en las condiciones A, B y C). Hay tres medias de sujeto, una por cada sujeto, colapsadas a través de las condiciones. Y, ahora podemos estimar la porción de la varianza total que se explica por estos medios sujetos.

    Acabamos de mostrarte una “fórmula” para\(SS_\text{TOTAL}\) dividirte en tres partes, pero llamamos a la fórmula una idea. Lo hicimos porque la forma en que escribimos la fórmula es un poco engañosa, y necesitamos aclarar algo. Antes de aclarar la cosa, te vamos a confundir sólo un poco. Prepárate para confundirte un poco.

    Primero, necesitamos presentarte algunos términos más. Resulta que diferentes autores utilizan diferentes palabras para describir partes del ANOVA. Esto puede ser realmente confuso. Por ejemplo, describimos la fórmula SS para un diseño entre sujetos así:

    \[SS_\text{TOTAL} = SS_\text{Effect} + SS_\text{Error} \nonumber \]

    Sin embargo, la misma fórmula a menudo se escribe de manera diferente, usando las palabras entre y dentro en lugar de efecto y error, se ve así:

    \[SS_\text{TOTAL} = SS_\text{Between} + SS_\text{Within} \nonumber \]

    Guau, espera un minuto. ¿No hemos vuelto a hablar de un ANOVA entre sujetos? ¡SÍ! Entonces, ¿por qué estamos usando la palabra dentro, qué significa eso? ¡SÍ! Creemos que esto es muy confuso para la gente. Aquí la palabra dentro tiene un significado especial. No se refiere a un diseño dentro de las asignaturas. Vamos a explicar. Primero,\(SS_\text{Between}\) (que hemos venido llamando\(SS_\text{Effect}\)) se refiere a la variación entre los medios grupales, por eso se le llama\(SS_\text{Between}\). Segundo, y lo más importante,\(SS_\text{Within}\) (que hemos venido llamando\(SS_\text{Error}\)), se refiere a la variación sobrante dentro de cada media de grupo. Específicamente, es la variación entre la media de cada grupo y cada puntaje en el grupo. “¡AAGGH, acabas de usar la palabra entre para describir dentro de grupo la variación!”. ¡Sí! Sentimos tu dolor. Recuerde, para cada media de grupo, cada puntaje probablemente esté un poco fuera de la media. Entonces, las puntuaciones dentro de cada grupo tienen alguna variación. Esta es la variación dentro del grupo, y es por eso que a menudo se llama el error sobrante que no podemos explicar\(SS_\text{Within}\).

    OK. Entonces, ¿por qué presentamos esta nueva manera confusa de hablar de las cosas? ¿Por qué no podemos usar simplemente\(SS_\text{Error}\) para hablar de esto en lugar de\(SS_\text{Within}\), lo que podría (nosotros) encontrar confuso? Estamos llegando, pero tal vez una imagen ayude a aclarar las cosas.

    Ilustración que muestra cómo las sumas totales de cuadrados se dividen de manera diferente para un diseño entre y medidas repetidas.
    Figura\(\PageIndex{1}\): Ilustración que muestra cómo las sumas totales de cuadrados se dividen de manera diferente para un diseño entre y medidas repetidas.

    La figura articula la partición de las Sumas de Cuadrados tanto para diseños entre sujetos como de medidas repetidas. En ambos diseños, primero\(SS_\text{Total}\) se divide en dos piezas\(SS_\text{Effect (between-groups)}\) y\(SS_\text{Error (within-groups)}\). En este punto, ambas ANOVA son iguales. En el caso de medidas repetidas dividimos la\(SS_\text{Error (within-groups)}\) en dos partes más pequeñas, a las que llamamos\(SS_\text{Subjects (error variation about the subject mean)}\) y\(SS_\text{Error (left-over variation we can't explain)}\).

    Entonces, cuando antes escribimos la fórmula para dividir SS en el diseño de medidas repetidas, fuimos un poco descuidados al definir lo que realmente queríamos decir con\(SS_\text{Error}\), esto era un poco vago:

    \[SS_\text{TOTAL} = SS_\text{Effect} + SS_\text{Subjects} +SS_\text{Error} \nonumber \]

    La característica crítica del ANOVA de medidas repetidas, es que el\(SS_\text{Error}\) que posteriormente utilizaremos para calcular el MSE en el denominador para el\(F\) -valor, es menor en un diseño de medidas repetidas, en comparación con un diseño entre sujetos. Esto se debe a que el\(SS_\text{Error (within-groups)}\) se divide en dos partes,\(SS_\text{Subjects (error variation about the subject mean)}\) y\(SS_\text{Error (left-over variation we can't explain)}\).

    Para que esto sea más claro, hicimos otra figura:

    Primer plano que muestra que el término Error se divide en dos partes en el diseño de medidas repetidas.
    Figura\(\PageIndex{2}\): Primer plano que muestra que el término Error se divide en dos partes en el diseño de medidas repetidas.

    Como señalamos, el\(SS_\text{Error (left-over)}\) en el círculo verde será un número menor que el\(SS_\text{Error (within-group)}\). Eso es porque somos capaces de restar la\(SS_\text{Subjects}\) parte de la\(SS_\text{Error (within-group)}\). Como veremos en breve, esto puede tener el efecto de producir valores F mayores cuando se usa un diseño de medidas repetidas en comparación con un diseño entre sujetos.


    This page titled 8.2: Partición de las Sumas de Cuadrados is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.