Saltar al contenido principal

# 13.2: ANOVA de una vía

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

El propósito de una prueba ANOVA unidireccional es determinar la existencia de una diferencia estadísticamente significativa entre varias medias grupales. La prueba en realidad utiliza varianzas para ayudar a determinar si las medias son iguales o no. Para realizar una prueba ANOVA unidireccional, hay varios supuestos básicos a cumplir:

Cinco supuestos básicos de ANOVA unidireccional a cumplir

1. Se supone que cada población de la que se toma una muestra es normal.
2. Todas las muestras son seleccionadas al azar e independientes.
3. Se supone que las poblaciones tienen desviaciones estándar iguales (o varianzas).
4. El factor es una variable categórica.
5. La respuesta es una variable numérica.

## Las hipótesis nulas y alternativas

La hipótesis nula es simplemente que todas las medias poblacionales grupales son iguales. La hipótesis alternativa es que al menos un par de medias es diferente. Por ejemplo, si hay$$k$$ grupos:

• $$H_{0}: \mu_{1} = \mu_{2} = \mu_{3} = \dotsc = \mu_{k}$$
• $$H_{a}: \text{At least two of the group means} \mu_{2} = \mu_{3} = \dotsc = \mu_{k} \text{are not equal}$$

Las gráficas, un conjunto de gráficas de caja que representan la distribución de valores con las medias de grupo indicadas por una línea horizontal a través de la caja, ayudan en la comprensión de la prueba de hipótesis. En la primera gráfica (parcelas de caja roja),$$H_{0}: \mu_{1} = \mu_{2} = \mu_{3}$$ y las tres poblaciones tienen la misma distribución si la hipótesis nula es verdadera. La varianza de los datos combinados es aproximadamente la misma que la varianza de cada una de las poblaciones.

Si la hipótesis nula es falsa, entonces la varianza de los datos combinados es mayor que es causada por las diferentes medias como se muestra en la segunda gráfica (gráficas de caja verde).

## Revisar

El análisis de varianza extiende la comparación de dos grupos a varios, cada uno un nivel de una variable categórica (factor). Las muestras de cada grupo son independientes y deben seleccionarse aleatoriamente de poblaciones normales con varianzas iguales. Probamos la hipótesis nula de medias iguales de la respuesta en cada grupo versus la hipótesis alternativa de que una o más medias grupales sean diferentes de las otras. Una prueba de hipótesis ANOVA unidireccional determina si varias medias poblacionales son iguales. La distribución para la prueba es la$$F$$ distribución con dos grados de libertad diferentes.

Supuestos:

1. Se supone que cada población de la que se toma una muestra es normal.
2. Todas las muestras son seleccionadas al azar e independientes.
3. Se supone que las poblaciones tienen desviaciones estándar iguales (o varianzas).

## Glosario

Análisis de varianza
también denominado ANOVA, es un método para probar si las medias de tres o más poblaciones son iguales o no. El método es aplicable si:
• todas las poblaciones de interés se distribuyen normalmente.
• las poblaciones tienen desviaciones estándar iguales.
• muestras (no necesariamente del mismo tamaño) se seleccionan al azar e independientemente de cada población.

El estadístico de prueba para el análisis de varianza es el$$F$$ -ratio.

Uno-wayanova
un método para comprobar si las medias de tres o más poblaciones son iguales o no; el método es aplicable si:
• todas las poblaciones de interés se distribuyen normalmente.
• las poblaciones tienen desviaciones estándar iguales.
• muestras (no necesariamente del mismo tamaño) se seleccionan al azar e independientemente de cada población.

El estadístico de prueba para el análisis de varianza es el$$F$$ -ratio.

Varianza
media de las desviaciones cuadradas de la media; el cuadrado de la desviación estándar. Para un conjunto de datos, una desviación se puede representar como$$x - \bar{x}$$ donde$$x$$ es un valor de los datos y$$\bar{x}$$ es la media de la muestra. La varianza muestral es igual a la suma de los cuadrados de las desviaciones dividida por la diferencia del tamaño de la muestra y uno.