Saltar al contenido principal
Library homepage
 
LibreTexts Español

14.7: Supuestos de ANOVA unidireccional

  • Page ID
    151288
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Como cualquier prueba estadística, el análisis de varianza se basa en algunas suposiciones sobre los datos. Hay tres supuestos clave que hay que tener en cuenta: normalidad, homogeneidad de varianza e independencia. Si recuerdas volver a la Sección 14.2.4 —que espero que al menos hayas desnatado aunque no lo hayas leído en su totalidad—, describí los modelos estadísticos que sustentan el ANOVA, que escribí así:

    H 0:Y ik =μ+ik

    H 1:Y ik k +ik

    En estas ecuaciones μ se refiere a una media de población única y grandiosa que es la misma para todos los grupos, y μ k es la media poblacional para el k-ésimo grupo. Hasta este punto nos ha interesado principalmente si nuestros datos se describen mejor en términos de una sola gran media (la hipótesis nula) o en términos de diferentes medias específicas de grupo (la hipótesis alternativa). Esto tiene sentido, por supuesto: ¡esa es en realidad la pregunta de investigación importante! Sin embargo, todos nuestros procedimientos de prueba se han basado —implícitamente— en una suposición específica sobre los residuos, ik, a saber, que

    ik ∼Normal (0, σ 2)

    Ninguna de las matemáticas funciona correctamente sin este bit. O, para ser precisos, todavía puedes hacer todos los cálculos, y terminarás con un estadístico F, pero no tienes ninguna garantía de que este estadístico F realmente mida lo que crees que está midiendo, por lo que cualquier conclusión que puedas sacar sobre la base de la prueba F podría estar equivocada.

    Entonces, ¿cómo verificamos si esta suposición sobre los residuos es exacta? Bueno, como señalé anteriormente, hay tres reclamos distintos enterrados en esta única declaración, y los consideraremos por separado.

    • Normalidad. Se supone que los residuos están distribuidos normalmente. Como vimos en la Sección 13.9, podemos evaluar esto observando parcelas QQ o ejecutando una prueba Shapiro-Wilk. Hablaré de esto en un contexto ANOVA en la Sección 14.9.
    • Homogeneidad de varianza. Observe que solo tenemos el valor único para la desviación estándar de la población (es decir, σ), en lugar de permitir que cada grupo tenga su propio valor (es decir, σ k). Esto se conoce como la hipótesis de homogeneidad de varianza (a veces llamada homocedasticidad). ANOVA asume que la desviación estándar de la población es la misma para todos los grupos. Hablaremos de esto extensamente en la Sección 14.7.
    • Independencia. El supuesto de independencia es un poco más complicado. Lo que básicamente significa es que, conocer un residuo no te dice nada sobre ningún otro residual. Se supone que todos los valores de ik se han generado sin ninguna “consideración” o “relación con” ninguno de los otros. No hay una manera obvia o sencilla de probar esto, pero hay algunas situaciones que son claras violaciones de esto: por ejemplo, si tienes un diseño de medidas repetidas, donde cada participante de tu estudio aparece en más de una condición, entonces la independencia no se sostiene; hay una relación especial entre algunas observaciones... es decir, las que corresponden a una misma persona! Cuando eso sucede, es necesario usar algo así como ANOVA de medidas repetidas. Actualmente no hablo de ANOVA de medidas repetidas en este libro, pero se incluirá en versiones posteriores.

    robusto es ANOVA?

    Una pregunta a la que la gente suele querer saber la respuesta es hasta qué punto se puede confiar en los resultados de un ANOVA si se violan los supuestos. O, para usar el lenguaje técnico, qué tan robusto es el ANOVA ante violaciones de los supuestos. Debido a limitaciones de plazo no tengo tiempo para discutir este tema. Este es un tema que cubriré con cierto detalle en una versión posterior del libro.


    This page titled 14.7: Supuestos de ANOVA unidireccional is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.