4.2: Prueba t de dos muestras agrupadas (Suponiendo varianzas iguales)

Última actualización
Guardar como PDF

Page ID: 149507

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

Prueba t de dos muestras agrupadas (Suponiendo varianzas iguales)

En el apartado anterior, hicimos el supuesto de varianzas desiguales entre nuestras dos poblaciones. El estadístico de la prueba t de Welch no asume que las varianzas poblacionales son iguales y se puede utilizar independientemente de que las varianzas poblacionales sean iguales o no. La prueba que asume varianzas iguales de población se conoce como la prueba t agrupada. El agrupamiento se refiere a encontrar un promedio ponderado de las dos varianzas de muestra independientes.

El estadístico de prueba agrupado utiliza un promedio ponderado de las dos varianzas de la muestra.

\[S_p^2 = \frac {(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} = (\frac {n_1-1}{n_1+n_2-2})S_1^2 + (\frac {n_2-1}{n_1+n_2-2})S_2^2\]

Si\(n_1= n_2\), entonces\(S^2_p = (\frac {1}{2}s^2_1 + (1/2)s^2_2\), el promedio de las dos varianzas muestrales. Pero siempre que n1≠ n2, el\(s^2\) basado en el tamaño de muestra más grande recibirá más peso que el otro\(s^2\).

La ventaja de este estadístico de prueba es que sigue exactamente la distribución t del estudiante con n1+ n2— 2 grados de libertad.

\[t=\frac {\bar {X_1} - \bar {X_2}}{\sqrt {S_p^2(\frac {1}{n_1}+\frac {1}{n_2})}}=\frac {\bar {X_1}- \bar {X_2}}{S_p\sqrt {\frac {1}{n_1} +\frac {1}{n_2}}}\]

El procedimiento de prueba de hipótesis seguirá los mismos pasos que el apartado anterior.

Puede ser difícil verificar que dos varianzas poblacionales puedan ser iguales con base en los datos de la muestra. La prueba F se usa comúnmente para probar varianzas pero no es robusta. Las pequeñas desviaciones de la normalidad impactan en gran medida el resultado haciendo que los resultados de la prueba F sean poco confiables. Puede ser difícil decidir si un resultado significativo de una prueba F se debe a las diferencias en las varianzas o no normalidad. Debido a esto, muchos investigadores confían en la t de Welch al comparar dos medias.

Ejemplo\(\PageIndex{1}\):

Se midió el crecimiento de plántulas de pino en dos sustratos diferentes. Queremos saber si el crecimiento fue mejor en el sustrato 2. Se midió el crecimiento (en cm/año) y se incluyó en la siguiente tabla. α = 0.05

Sustrato 1	Sustrato 2
3.2	4.5
4.5	6.2
3.8	5.8
4.0	6.0
3.7	7.1
3.2	6.8
4.1	7.2

Solución

\(H_0: \mu_1 = \mu_2\)

\(H_1: \mu_1 < \mu_2\)

\[S^2_p=\frac {(7-1)0.474^2 +(7-1)0.936^2}{7+7-2} = 0.55\]

\[t=\frac {3.79-6.23}{\sqrt{0.55(\frac {1}{7}+ \frac {1}{7})}}=\frac {-2.44}{0.396}=-6.16\]

Esta es una prueba unilateral con\(n_1 + n_2 – 2 = 12\) grados de libertad. El valor crítico es -1.782. El estadístico de prueba es menor que el valor crítico por lo que rechazaremos la hipótesis nula.

Existe evidencia suficiente para sustentar la afirmación de que el crecimiento medio es menor en el sustrato 1. El crecimiento en el sustrato 2 es mayor.

El enfoque del intervalo de confianza también utiliza la varianza agrupada y toma la forma:

\[(\bar {x_1}-\bar {x_2}) \pm t_{\frac {\alpha}{2}}\sqrt {s^2_p(\frac {1}{n_1}+\frac {1}{n_2})}\]

usando\(n_1 + n_2 – 2\) grados de libertad. Entonces respondamos la misma pregunta con un intervalo de confianza del 90%.

\[(3.79-6.23)\pm 1.782 \sqrt{0.55(\frac {1}{7}+\frac {1}{7})} = (-2.44 \pm 0.7064)=(-3.146,-1.734)\]

Todos los valores negativos indican que existe una diferencia significativa entre el crecimiento medio para los dos sustratos y que el crecimiento en el sustrato 1 es significativamente menor que el crecimiento en el sustrato 2 con reducción en el crecimiento que va de 1.734 a 3.146 cm/año.

Soluciones de Software

Minitab

075_1.tif

075_2.tif

Prueba T de dos muestras e CI: Sustrato1, Sustrato2

T de dos muestras para el sustrato1 frente al sustrato2
	N	Media	StDev	SE Media
Sustrato1	7	3.786	0.474	0.18
Sustrato2	7	6.229	0.936	0.35
Diferencia = mu (Sustrato1) — mu (Sustrato2)
Diferencia estimada: -2.443
95% límite superior para diferencia: -1.736
Prueba T de diferencia = 0 (vs <): Valor T = -6.16 valor p = 0.000 DF = 12
Ambos usan StDev agrupado = 0.7418

El valor p (0.000) es menor que el nivel de significancia (0.05). Rechazaremos la hipótesis nula.

Excel

074_1.tif

074_2.tif

Prueba T: Dos Muestras Suponiendo Varianzas Iguales
	Variable 1	Variable 2
Media	3.785714	6.228571
Varianza	0.224762	0.875714
Observaciones	7	7
Varianza agrupada	0.550238
Diferencia de medias hipotética	0
df	12
t Stat	-6.16108
P\((T \le t)\) de una cola	2.43E-05
t Crítico de una cola	1.782288
P\((T \le t)\) de dos colas	4.86E-05
t Crítico de dos colas	2.178813

Esta es una prueba unilateral (mayor que) así que usa el valor P de\((T \le t)\) una cola 2.43E-05. El valor p (0.0000243) es menor que el nivel de significancia (0.05). Rechazaremos la hipótesis nula.

Search

Text Color

Text Size

Margin Size

Font Type

Prueba T de dos muestras e CI: Sustrato1, Sustrato2