4.2: Prueba t de dos muestras agrupadas (Suponiendo varianzas iguales)
- Page ID
- 149507
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
Prueba t de dos muestras agrupadas (Suponiendo varianzas iguales)
En el apartado anterior, hicimos el supuesto de varianzas desiguales entre nuestras dos poblaciones. El estadístico de la prueba t de Welch no asume que las varianzas poblacionales son iguales y se puede utilizar independientemente de que las varianzas poblacionales sean iguales o no. La prueba que asume varianzas iguales de población se conoce como la prueba t agrupada. El agrupamiento se refiere a encontrar un promedio ponderado de las dos varianzas de muestra independientes.
El estadístico de prueba agrupado utiliza un promedio ponderado de las dos varianzas de la muestra.
\[S_p^2 = \frac {(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} = (\frac {n_1-1}{n_1+n_2-2})S_1^2 + (\frac {n_2-1}{n_1+n_2-2})S_2^2\]
Si\(n_1= n_2\), entonces\(S^2_p = (\frac {1}{2}s^2_1 + (1/2)s^2_2\), el promedio de las dos varianzas muestrales. Pero siempre que n1≠ n2, el\(s^2\) basado en el tamaño de muestra más grande recibirá más peso que el otro\(s^2\).
La ventaja de este estadístico de prueba es que sigue exactamente la distribución t del estudiante con n1+ n2— 2 grados de libertad.
\[t=\frac {\bar {X_1} - \bar {X_2}}{\sqrt {S_p^2(\frac {1}{n_1}+\frac {1}{n_2})}}=\frac {\bar {X_1}- \bar {X_2}}{S_p\sqrt {\frac {1}{n_1} +\frac {1}{n_2}}}\]
El procedimiento de prueba de hipótesis seguirá los mismos pasos que el apartado anterior.
Puede ser difícil verificar que dos varianzas poblacionales puedan ser iguales con base en los datos de la muestra. La prueba F se usa comúnmente para probar varianzas pero no es robusta. Las pequeñas desviaciones de la normalidad impactan en gran medida el resultado haciendo que los resultados de la prueba F sean poco confiables. Puede ser difícil decidir si un resultado significativo de una prueba F se debe a las diferencias en las varianzas o no normalidad. Debido a esto, muchos investigadores confían en la t de Welch al comparar dos medias.
Ejemplo\(\PageIndex{1}\):
Se midió el crecimiento de plántulas de pino en dos sustratos diferentes. Queremos saber si el crecimiento fue mejor en el sustrato 2. Se midió el crecimiento (en cm/año) y se incluyó en la siguiente tabla. α = 0.05
Sustrato 1 |
Sustrato 2 |
3.2 |
4.5 |
4.5 |
6.2 |
3.8 |
5.8 |
4.0 |
6.0 |
3.7 |
7.1 |
3.2 |
6.8 |
4.1 |
7.2 |
Solución
\(H_0: \mu_1 = \mu_2\)
\(H_1: \mu_1 < \mu_2\)
\[S^2_p=\frac {(7-1)0.474^2 +(7-1)0.936^2}{7+7-2} = 0.55\]
\[t=\frac {3.79-6.23}{\sqrt{0.55(\frac {1}{7}+ \frac {1}{7})}}=\frac {-2.44}{0.396}=-6.16\]
Esta es una prueba unilateral con\(n_1 + n_2 – 2 = 12\) grados de libertad. El valor crítico es -1.782. El estadístico de prueba es menor que el valor crítico por lo que rechazaremos la hipótesis nula.
Existe evidencia suficiente para sustentar la afirmación de que el crecimiento medio es menor en el sustrato 1. El crecimiento en el sustrato 2 es mayor.
El enfoque del intervalo de confianza también utiliza la varianza agrupada y toma la forma:
\[(\bar {x_1}-\bar {x_2}) \pm t_{\frac {\alpha}{2}}\sqrt {s^2_p(\frac {1}{n_1}+\frac {1}{n_2})}\]
usando\(n_1 + n_2 – 2\) grados de libertad. Entonces respondamos la misma pregunta con un intervalo de confianza del 90%.
\[(3.79-6.23)\pm 1.782 \sqrt{0.55(\frac {1}{7}+\frac {1}{7})} = (-2.44 \pm 0.7064)=(-3.146,-1.734)\]
Todos los valores negativos indican que existe una diferencia significativa entre el crecimiento medio para los dos sustratos y que el crecimiento en el sustrato 1 es significativamente menor que el crecimiento en el sustrato 2 con reducción en el crecimiento que va de 1.734 a 3.146 cm/año.
Soluciones de Software
Minitab
Prueba T de dos muestras e CI: Sustrato1, Sustrato2
T de dos muestras para el sustrato1 frente al sustrato2 |
||||
N |
Media |
StDev |
SE Media |
|
Sustrato1 |
7 |
3.786 |
0.474 |
0.18 |
Sustrato2 |
7 |
6.229 |
0.936 |
0.35 |
Diferencia = mu (Sustrato1) — mu (Sustrato2) |
||||
Diferencia estimada: -2.443 |
||||
95% límite superior para diferencia: -1.736 |
||||
Prueba T de diferencia = 0 (vs <): Valor T = -6.16 valor p = 0.000 DF = 12 |
||||
Ambos usan StDev agrupado = 0.7418 |
El valor p (0.000) es menor que el nivel de significancia (0.05). Rechazaremos la hipótesis nula.
Excel
Prueba T: Dos Muestras Suponiendo Varianzas Iguales |
||
Variable 1 |
Variable 2 |
|
Media |
3.785714 |
6.228571 |
Varianza |
0.224762 |
0.875714 |
Observaciones |
7 |
7 |
Varianza agrupada |
0.550238 |
|
Diferencia de medias hipotética |
0 |
|
df |
12 |
|
t Stat |
-6.16108 |
|
P\((T \le t)\) de una cola |
2.43E-05 |
|
t Crítico de una cola |
1.782288 |
|
P\((T \le t)\) de dos colas |
4.86E-05 |
|
t Crítico de dos colas |
2.178813 |
Esta es una prueba unilateral (mayor que) así que usa el valor P de\((T \le t)\) una cola 2.43E-05. El valor p (0.0000243) es menor que el nivel de significancia (0.05). Rechazaremos la hipótesis nula.