Saltar al contenido principal
LibreTexts Español

10.1: Comparación de dos medias poblacionales independientes

  • Page ID
    150836
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    La comparación de dos medias poblacionales independientes es muy común y proporciona una manera de probar la hipótesis de que los dos grupos difieren entre sí. ¿El turno de noche es menos productivo que el turno diurno? ¿Las tasas de rendimiento de las inversiones en activos fijos son diferentes a las de las inversiones en acciones ordinarias, y así sucesivamente? La diferencia observada entre dos medias de muestra depende tanto de las medias como de las desviaciones estándar de la muestra. Medios muy diferentes pueden ocurrir por casualidad si hay una gran variación entre las muestras individuales. El estadístico de prueba tendrá que dar cuenta de este hecho. La prueba que compara dos medias poblacionales independientes con desviaciones estándar de población desconocidas y posiblemente desiguales se denomina\(t\) prueba de Aspin-Welch. La fórmula de grados de libertad que veremos más adelante fue desarrollada por Aspin-Welch.

    Cuando desarrollamos la prueba de hipótesis para la media y las proporciones comenzamos con el Teorema del Límite Central. Reconocimos que una media muestral provino de una distribución de medias muestrales, y las proporciones muestrales provinieron de la distribución muestral de proporciones muestrales. Esto convirtió nuestros parámetros muestrales, las medias y proporciones de la muestra, en variables aleatorias. Para nosotros era importante conocer la distribución de la que provinieron estas variables aleatorias. El Teorema del Límite Central nos dio la respuesta: la distribución normal. Nuestro\(Z\) y\(t\) las estadísticas vinieron de este teorema. Esto nos proporcionó la solución a nuestra pregunta de cómo medir la probabilidad de que una media muestral provenga de una distribución con un valor hipotético particular de la media o proporción. En ambos casos esa fue la pregunta: ¿cuál es la probabilidad de que la media (o proporción) de nuestros datos de muestra provenga de una distribución poblacional con el valor hipotético que nos interesa?

    Ahora nos interesa si dos muestras tienen o no la misma media. Nuestra pregunta no ha cambiado: ¿Estas dos muestras provienen de la misma distribución poblacional? Para abordar este problema creamos una nueva variable aleatoria. Reconocemos que tenemos dos medias de muestra, una de cada conjunto de datos, y así tenemos dos variables aleatorias provenientes de dos distribuciones desconocidas. Para resolver el problema creamos una nueva variable aleatoria, la diferencia entre las medias de la muestra. Esta nueva variable aleatoria también tiene una distribución y, nuevamente, el Teorema del Límite Central nos dice que esta nueva distribución se distribuye normalmente, independientemente de las distribuciones subyacentes de los datos originales. Un gráfico puede ayudar a entender este concepto.

    Figura\(\PageIndex{2}\)

    En la foto se muestran dos distribuciones de datos,\(X_1\) y\(X_2\), con medias desconocidas y desviaciones estándar. El segundo panel muestra la distribución de muestreo de la variable aleatoria recién creada (\(\overline{X}_{1}-\overline{X}_{2}\)). Esta distribución es la distribución teórica de muchas medias muestrales de la población 1 menos las medias muestrales de la población 2. El Teorema del Límite Central nos dice que esta distribución teórica de muestreo de las diferencias en las medias muestrales se distribuye normalmente, independientemente de la distribución de los datos poblacionales reales que se muestran en el panel superior. Debido a que la distribución de muestreo se distribuye normalmente, podemos desarrollar una fórmula estandarizadora y calcular probabilidades a partir de la distribución normal estándar en el panel inferior, la\(Z\) distribución. Hemos visto este mismo análisis antes en la Figura del Capítulo 7\(\PageIndex{2}\).

    El Teorema del Límite Central, como antes, nos proporciona la desviación estándar de la distribución muestral, y además, que el valor esperado de la media de la distribución de las diferencias en las medias muestrales es igual a las diferencias en las medias poblacionales. Matemáticamente esto se puede afirmar:

    \[E\left(\mu_{\overline{x}_{1}}-\mu_{\overline{x}_{2}}\right)=\mu_{1}-\mu_{2}\nonumber\]

    Debido a que no conocemos las desviaciones estándar de la población, las estimamos utilizando las dos desviaciones estándar de la muestra de nuestras muestras independientes. Para la prueba de hipótesis, se calcula la desviación estándar estimada, o error estándar, de la diferencia en las medias de la muestra,\(\overline{X}_{1}-\overline{X}_{2}\).

    \[\textbf{The standard error is:}\nonumber\]

    \[\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}\nonumber\]

    Recordamos que sustituir la varianza de la muestra por la varianza poblacional cuando no se tuvo la varianza poblacional fue la técnica que utilizamos al construir el intervalo de confianza y el estadístico de prueba para la prueba de hipótesis para una sola media de vuelta en Intervalos de Confianza y Prueba de Hipótesis con Una Muestra. El estadístico de prueba (t- score) se calcula de la siguiente manera:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}}}\nonumber\]

    donde:

    • \(s_1\)y\(s_2\), las desviaciones estándar de la muestra, son estimaciones de\(\sigma_1\) y\(\sigma_2\), respectivamente y
    • \(\sigma_1\)y\(\sigma_2\) son las desviaciones estándar poblacionales desconocidas.
    • \(\overline{x}_{1}\)y\(\overline{x}_{2}\) son las medias de la muestra. \(\mu_1\)y\(\mu_2\) son las medias poblacionales desconocidas.

    El número de grados de libertad (df) requiere de un cálculo algo complicado. \(df\)Los no siempre son un número entero. El estadístico de prueba anterior se aproxima por la\(t\) distribución de Student con\(df\) lo siguiente:

    Grados de libertad

    \[df=\frac{\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}+\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}{\left(\frac{1}{n_{1}-1}\right)\left(\frac{\left(s_{1}\right)^{2}}{n_{1}}\right)^{2}+\left(\frac{1}{n_{2}-1}\right)\left(\frac{\left(s_{2}\right)^{2}}{n_{2}}\right)^{2}}\nonumber\]

    Cuando ambos tamaños de muestra\(n_1\) y\(n_2\) son 30 o mayores, la t aproximación de Student es muy buena. Si cada muestra tiene más de 30 observaciones entonces los grados de libertad se pueden calcular como\(n_1 + n_2 - 2\).

    El formato de la distribución muestral, diferencias en las medias muestrales, especifica que el formato de la hipótesis nula y alternativa es:

    \[H_{0} : \mu_{1}-\mu_{2}=\delta_{0}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1}-\mu_{2} \neq \delta_{0}\nonumber\]

    donde\(\delta_{0}\) está la diferencia hipotética entre las dos medias. Si la pregunta es simplemente “¿hay alguna diferencia entre los medios?” entonces\(\delta_{0} = 0\) y las hipótesis nulas y alternativas se convierten en:

    \[H_{0} : \mu_{1}=\mu_{2}\nonumber\]

    \[H_{\mathrm{a}} : \mu_{1} \neq \mu_{2}\nonumber\]

    Un ejemplo de cuándo\(\delta_{0}\) podría no ser cero es cuando la comparación de los dos grupos requiere una diferencia específica para que la decisión sea significativa. Imagina que estás haciendo una inversión de capital. Está considerando cambiar de su máquina modelo actual a otra. Usted mide la productividad de sus máquinas por la velocidad que producen el producto. Puede ser que un contendiente para reemplazar el viejo modelo sea más rápido en términos de rendimiento del producto, pero también sea más caro. La segunda máquina también puede tener más costos de mantenimiento, costos de configuración, etc. La hipótesis nula se configuraría para que la nueva máquina tuviera que ser mejor que la anterior por lo suficiente para cubrir estos costos adicionales en términos de velocidad y costo de producción. Esta forma de la hipótesis nula y alternativa muestra cuán valiosa puede ser esta prueba de hipótesis particular. Durante la mayor parte de nuestro trabajo estaremos probando hipótesis simples preguntando si hay alguna diferencia entre los dos medios de distribución.

    Ejemplo\(\PageIndex{1}\) INDEPENDENT GROUPS

    La Corporación Kona Iki produce leche de coco. Toman cocos y extraen la leche en su interior perforando un agujero y vertiendo la leche en una tina para su procesamiento. Tienen tanto un turno diurno (llamado turno B) como un turno nocturno (llamado turno G) para hacer esta parte del proceso. A ellos les gustaría saber si el turno de día y el turno de noche son igualmente eficientes en el procesamiento de los cocos. Se realiza un estudio muestreando 9 turnos del turno G y 16 turnos del turno B. Los resultados del número de horas requeridas para procesar 100 libras de cocos se presentan en la Tabla\(\PageIndex{1}\). Se realiza un estudio y se recogen los datos, dando como resultado los datos en la Tabla\(\PageIndex{1}\).

    \ (\ PageIndex {1}\) “>
    Tamaño de la muestra Promedio de Horas para Procesar 100 Libras de Cocos Desviación estándar de muestra
    Turno G 9 2 0.8660.866
    B Turno 16 3.2 1.00
    Mesa\(\PageIndex{1}\)

    ¿Hay alguna diferencia en la cantidad media de tiempo para que cada turno procese 100 libras de cocos? Prueba al nivel de significancia del 5%.

    Contestar

    Solución 10.1

    Se desconocen las desviaciones estándar de la población y no se puede suponer que se igualan entre sí. \(g\)Sea el subíndice para el Turno G y\(b\) sea el subíndice para el Turno B. Entonces,\(\mu_g\) es la media poblacional para el Turno G y\(\mu_b\) es la media poblacional para el Turno B. Esta es una prueba de dos grupos independientes, dos medias poblacionales.

    Variable aleatoria:\(\overline{X}_{g}-\overline{X}_{b}\) = diferencia en la cantidad de tiempo promedio de la muestra entre el Desplazamiento G y el Cambio B tarda en procesar los cocos.
    \(\H_{0}: \mu_g = \mu_b\)\(\H_{0}: \mu_g – \mu_b = 0\)
    \(H_a: \mu_g \neq \mu_b\)\(H_a: \mu_g – \mu_b \neq 0\)
    Las palabras “lo mismo” te dicen que\(\H_{0}\) tiene un “=”. Ya que no hay otras palabras para indicar\(H_a\), es o más rápido o más lento. Esta es una prueba de dos colas.

    Distribución para la prueba: Usar\(t_{df}\) donde\(df\) se calcula usando la\(df\) fórmula para grupos independientes, dos medias poblacionales arriba. El uso de una calculadora,\(df\) es aproximadamente 18.8462.

    Gráfica:

    Esta es una curva de distribución normal que representa la diferencia en la cantidad promedio de tiempo que niñas y niños practican deportes todo el día. La media es igual a cero, y los valores -1.2, 0 y 1.2 están etiquetados en el eje horizontal. Dos líneas verticales se extienden desde -1.2 y 1.2 hasta la curva. La región a la izquierda de x = -1.2 y la región a la derecha de x = 1.2 están sombreadas para representar el valor p. El área de cada región es 0.0028.

    Figura\(\PageIndex{3}\)

    \[\mathrm{t}_{\mathrm{c}}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=-3.01\nonumber\]

    A continuación encontramos el valor crítico en la\(t\) mesa utilizando los grados de libertad desde arriba. El valor crítico, 2.093, se encuentra en la columna .025, esto es\(\alpha/2\), a 19 grados de libertad. (La convención consiste en redondear los grados de libertad para que la conclusión sea más conservadora). A continuación calculamos el estadístico de prueba y lo marcamos en la gráfica\(t\) -distribución.

    Tomar una decisión: Como el\(t\) valor calculado está en la cola no podemos aceptar la hipótesis nula de que no hay diferencia entre los dos grupos. Los medios son diferentes.

    La gráfica ha incluido la distribución muestral de las diferencias en las medias muestrales para mostrar cómo la distribución t se alinea con los datos de distribución de muestreo. Vemos en el panel superior que la diferencia calculada en las dos medias es de -1.2 y el panel inferior muestra que se trata de 3.01 desviaciones estándar de la media. Normalmente no necesitamos mostrar la gráfica de distribución muestral y podemos confiar en la gráfica del estadístico de prueba, la distribución t en este caso, para llegar a nuestra conclusión.

    Conclusión: Al nivel de significancia del 5%, los datos de la muestra muestran que hay evidencia suficiente para concluir que el número medio de horas que el Turno G tarda en procesar 100 libras de cocos es diferente del Turno B (el número medio de horas para el Turno B es mayor que el número medio de horas para el Turno G).

    NOTA

    Cuando la suma de los tamaños de muestra es mayor de\(30\left(n_{1}+n_{2}>30\right)\) lo que puedes usar la distribución normal para aproximar la del estudiante\(t\).

    Ejemplo\(\PageIndex{2}\)

    Se realiza un estudio para determinar si la Compañía A retiene a sus trabajadores por más tiempo que la Compañía B. Se cree que la Compañía A tiene una retención mayor que la Compañía B. El estudio encuentra que en una muestra de 11 trabajadores de la Compañía A su tiempo promedio con la empresa es de cuatro años con una desviación estándar de 1.5 años. Una muestra de 9 trabajadores de la Compañía B encuentra que el tiempo promedio con la empresa fue de 3.5 años con una desviación estándar de 1 año. Pruebe esta proposición en el nivel de significancia del 1%.

    a. ¿Es ésta una prueba de dos medias o dos proporciones?

    Contestar

    Solución 10.2

    a. dos medias porque el tiempo es una variable aleatoria continua.

    b. ¿Se conocen o desconocen las desviaciones estándar de las poblaciones?

    Contestar

    Solución 10.2

    b. desconocido

    c. ¿Qué distribución utilizas para realizar la prueba?

    Contestar

    Solución 10.2

    c. Alumnos\(t\)

    d. ¿Cuál es la variable aleatoria?

    Contestar

    Solución 10.2

    d.\(\overline{X}_{A}-\overline{X}_{B}\)

    e. ¿Cuáles son las hipótesis nulas y alternativas?

    Contestar

    Solución 10.2

    e.

    • \(H_{0} : \mu_{A} \leq \mu_{B}\)
    • \(H_{a} : \mu_{A}>\mu_{B}\)

    f. ¿Esta prueba es derecha, izquierda o de dos colas?

    Contestar

    Solución 10.2

    f. prueba de una cola derecha

    Esta es una curva de distribución normal con media igual a 0. Una línea vertical cerca de la cola de la curva a la derecha de cero se extiende desde el eje hasta la curva. La región bajo la curva a la derecha de la línea está sombreada.

    Figura\(\PageIndex{4}\)

    g. ¿Cuál es el valor del estadístico de prueba?

    Contestar

    Solución 10.2

    g.

    \(t_{c}=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\delta_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=0.89\)

    h. ¿Se puede aceptar/rechazar la hipótesis nula?

    Contestar

    Solución 10.2

    h. No se puede rechazar la hipótesis nula de que no hay diferencia entre los dos grupos. El estadístico de prueba no está en la cola. El valor crítico de la distribución t es 2.764 con 10 grados de libertad. Este ejemplo muestra lo difícil que es rechazar una hipótesis nula con una muestra muy pequeña. Los valores críticos requieren estadísticas de prueba muy grandes para llegar a la cola.

    i. Conclusión:

    Contestar

    Solución 10.2

    i. Al nivel de significancia del 1%, a partir de los datos de la muestra, no hay evidencia suficiente para concluir que la retención de trabajadores en la Compañía A es mayor que la Compañía B, en promedio.

    Ejemplo\(\PageIndex{3}\)

    Una pregunta interesante de investigación es el efecto, en su caso, que los diferentes tipos de formatos de enseñanza tienen en los resultados de las calificaciones de los estudiantes. Para investigar este tema se tomó una muestra de calificaciones de los estudiantes de una clase híbrida y otra de una clase de formato estándar de clase. Ambas clases fueron para la misma asignatura. La nota media del curso en porcentaje para los 35 estudiantes híbridos es de 74 con una desviación estándar de 16. Las calificaciones medias de los 40 alumnos que forman la clase estándar de clase magistral fue de 76 por ciento con una desviación estándar de 9. Prueba al 5% para ver si hay alguna diferencia significativa en las calificaciones medias de la población entre el curso de clase estándar y la clase híbrida.

    Contestar

    Solución 10.3

    Comenzamos por señalar que tenemos dos grupos, estudiantes de una clase híbrida y estudiantes de una clase de formato de conferencia estándar. También observamos que la variable aleatoria, lo que nos interesa, son las calificaciones de los estudiantes, una variable aleatoria continua. Podríamos haber hecho la pregunta de investigación de una manera diferente y tener una variable aleatoria binaria. Por ejemplo, podríamos haber estudiado el porcentaje de alumnos con una calificación reprobatoria, o con una calificación A. Ambos serían binarios y así una prueba de proporciones y no una prueba de medias como es el caso aquí. Por último, no existe la presunción de qué formato podría conducir a calificaciones superiores por lo que la hipótesis se plantea como una prueba de dos colas.

    \(H_{0}: \mu_1 = \mu_2 \)
    \(H_a: \mu_1 \neq \mu_2\)

    Como prácticamente siempre sería el caso, desconocemos las varianzas poblacionales de las dos distribuciones y así nuestro estadístico de prueba es:

    \[t_{c}=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\delta_{0}}{\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}}=\frac{(74-76)-0}{\sqrt{\frac{16^{2}}{35}+\frac{9^{2}}{40}}}=-0.65\nonumber\]

    Para determinar el valor crítico de la t del Estudiante necesitamos los grados de libertad. Para este caso utilizamos:\(df = n_1 + n_2 - 2 = 35 + 40 -2 = 73\). Esto es lo suficientemente grande como para considerarlo la distribución normal así\(t_{\alpha /2} = 1.96\). Nuevamente como siempre determinamos si el valor calculado está en la cola determinado por el valor crítico. En este caso ni siquiera necesitamos buscar el valor crítico: el valor calculado de la diferencia en estas dos calificaciones promedio no es ni siquiera una desviación estándar de diferencia. Desde luego no en la cola.

    Conclusión: No se puede rechazar el nulo at\(\bf{\alpha = 5\%}\). Por lo tanto, no existe evidencia que demuestre que las calificaciones en las clases híbridas y estándar difieran.


    This page titled 10.1: Comparación de dos medias poblacionales independientes is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.