4.5: Prueba F para comparar dos varianzas de población
- Page ID
- 149516
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
Prueba F para comparar dos varianzas de población
Una aplicación importante de una prueba para la igualdad de dos varianzas poblacionales es para verificar la validez del supuesto de igual varianza\((\sigma_1^2=\sigma_2^2)\) para una prueba t de dos muestras. Primero planteamos la hipótesis de dos poblaciones de mediciones que normalmente están distribuidas. Se etiquetan estas poblaciones como 1 y 2, respectivamente. Nos interesa comparar la varianza de la población 1\((\sigma_1^2)\) con la varianza de la población 2\((\sigma_2^2)\).
Cuando se han extraído muestras aleatorias independientes de las poblaciones respectivas, la proporción
$$\ frac {S^2_1/S_2^2} {\ sigma_1^2/\ sigma ^2_2}\]
posee una distribución de probabilidad en muestreo repetido que se denomina distribución F y sus propiedades son:
- A diferencia de Z y t, pero como\(\chi^2\), F puede asumir solo valores positivos.
- La distribución F, a diferencia de las distribuciones Z y t, pero al igual que la distribución (\ chi^2\), es no simétrica.
- Hay muchas distribuciones F, y cada una tiene una forma diferente. Especificamos uno particular designando los grados de libertad asociados con\(S_1^2\) y\(S_2^2\). Denotamos estas cantidades por\(df_1\) y\(df_2\), respectivamente.
Figura 5. La distribución F.
Nota: Una prueba estadística de la hipótesis nula\(\sigma_1^2 = \sigma_2^2\) utiliza el estadístico de prueba\(S_1^2/S_2^2\). Puede requerir región de rechazo de cola superior o inferior, dependiendo de qué varianza de la muestra sea mayor. Para paliar esta situación, tenemos la libertad de designar a la población con mayor varianza muestral como población 1 (es decir, utilizada como numerador de la razón\(S_1^2/S_2^2\)). Por esta convención, la región de rechazo sólo se localiza en la cola superior de la distribución F.
Hipótesis nula:\(H_0:\sigma_1^2 = \sigma_2^2\)
Hipótesis alternativa:
- \(H_a: \sigma_1^2 > \sigma_2^2\)(de una cola), rechazar\(H_0\) si el F observado > Fα
- \(H_a: \sigma_1^2 \ne \sigma_2^2\)(de dos colas), rechazar\(H_0\) si el F observado > Fα/2.
Estadística de prueba:\(F = \frac {S_1^2}{S^2_2}\) asumiendo\(S_1^2>S_2^2\),
donde el valor crítico F en la región de rechazo se basa en 2 grados de libertad\(df_1 = n_1 – 1\) (asociados con numerador\(S_1^2\)) y\(df_2 = n_2 – 1\) (asociados con denominador\(S_2^2\)).
Ejemplo\(\PageIndex{1}\):
Un silvicultor quiere comparar dos soplantes de niebla diferentes para una aplicación consistente. Ella quiere usar el soplador de niebla con la varianza más pequeña, lo que significa una aplicación más consistente. Ella quiere probar que la varianza de Tipo A (0.087 gal.2) es significativamente mayor que la varianza del Tipo B (0.073 gal.2) usando α = 0.05.
Tipo A | Tipo B |
\(S_1^2\)= 0.087 | \(S^2_2\)=0.073 |
\(n_1\)= 16 | \(n_2\)= 21 |
Solución
\(H_0: \sigma_1^2 = \sigma_2^2\)
\(H_1:\sigma_1^2 > \sigma_2^2\)
El valor crítico\((df_1 = 15\) y\(df_2 = 20)\) es 2.20.
El estadístico de prueba es:
$$F =\ frac {S_1^2} {S_2^2} =\ frac {0.087} {0.073} =1.192\]
El estadístico de prueba no es mayor que el valor crítico (no cae en la zona de rechazo) por lo que fallamos en rechazar la hipótesis nula. Si bien la varianza del Tipo B es matemáticamente menor que la varianza del Tipo A, no es estadísticamente menor. No hay evidencia estadística suficiente para apoyar la afirmación de que la varianza del Tipo A es significativamente mayor que la varianza del Tipo B. Ambos sopladores de niebla entregarán el químico con igual consistencia.
Soluciones de Software
Minitab
Prueba y CI para dos varianzas
Método |
|||||
Hipótesis nula |
Varianza (1)/Varianza (2) = 1 |
||||
Hipótesis alternativa |
Varianza (1)/Varianza (2) > 1 |
||||
Nivel de significancia |
Alfa = 0.05 |
||||
Estadísticas |
|||||
Muestra |
N |
StDev |
Varianza |
||
1 |
16 |
0.295 |
0.087 |
||
2 |
21 |
0.270 |
0.073 |
||
Relación de desviaciones estándar = 1.092 |
|||||
Relación de varianzas = 1.192 |
|||||
Pruebas |
|||||
Test |
|||||
Método |
DF1 |
DF2 |
Estadística |
valor p |
|
Prueba F (normal) |
15 |
20 |
1.19 |
0.351 |
Excel
Prueba F de dos muestras para varianzas
Tipo A |
Tipo B |
|
Media |
11.07188 |
11.10595 |
Varianza |
0.08699 |
0.073379 |
Observaciones |
16 |
21 |
df |
15 |
20 |
F |
1.185483 |
|
\(P(F\le f)\)una cola |
0.355098 |
|
F Critical de una cola |
2.203274 |