11.5: Prueba de homogeneidad
- Page ID
- 153182
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)La prueba de bondad de ajuste puede utilizarse para decidir si una población se ajusta a una distribución determinada, pero no bastará con decidir si dos poblaciones siguen la misma distribución desconocida. Una prueba diferente, llamada prueba de homogeneidad, se puede utilizar para sacar una conclusión sobre si dos poblaciones tienen la misma distribución. Para calcular el estadístico de prueba para una prueba de homogeneidad, siga el mismo procedimiento que con la prueba de independencia.
El valor esperado para cada celda debe ser de al menos cinco para que puedas usar esta prueba.
Hipótesis
- \(H_{0}\): Las distribuciones de las dos poblaciones son las mismas.
- \(H_{a}\): Las distribuciones de las dos poblaciones no son las mismas.
Estadística de prueba
- Utilice un estadístico de\(\chi^{2}\) prueba. Se calcula de la misma manera que la prueba de independencia.
Grados de Libertad (\(df\))
- \(df = \text{number of columns} - 1\)
Requerimientos
- Todos los valores de la tabla deben ser mayores o iguales a cinco.
Usos Comunes
Comparando dos poblaciones. Por ejemplo: hombres vs. mujeres, antes vs después, oriente vs oeste. La variable es categórica con más de dos posibles valores de respuesta.
Ejemplo\(\PageIndex{1}\)
¿Los estudiantes universitarios masculinos y femeninos tienen la misma distribución de arreglos de vivienda? Utilizar un nivel de significancia de 0.05. Supongamos que a 250 estudiantes universitarios varones seleccionados al azar y a 300 estudiantes universitarias elegidas al azar se les preguntó sobre sus arreglos de vivienda: dormitorio, departamento, con padres, otros. Los resultados se muestran en la Tabla\(\PageIndex{1}\). ¿Los estudiantes universitarios masculinos y femeninos tienen la misma distribución de arreglos de vivienda?
Dormitorio | Departamento | Con los padres | Otros | |
Machos | 72 | 84 | 49 | 45 |
Hembras | 91 | 86 | 88 | 35 |
Responder
- \(H_{0}\): La distribución de los arreglos de vivienda para los estudiantes universitarios varones es la misma que la distribución de los arreglos de vivienda para las estudiantes universitarias femeninas.
- \(H_{a}\): La distribución de los arreglos de vivienda para los estudiantes universitarios masculinos no es lo mismo que la distribución de los arreglos de vivienda para las estudiantes universitarias femeninas.
Grados de Libertad (\(df\)):
\(df = \text{number of columns} - 1 = 4 - 1 = 3\)
Distribución para la prueba:\(\chi^{2}_{3}\)
Calcular el estadístico de prueba:\(\chi^{2} = 10.1287\) (calculadora o computadora)
Declaración de probabilidad:\(p\text{-value} = P(\chi^{2} > 10.1287) = 0.0175\)
Presione el botón
MATRX
tecla y flecha sobre para
EDIT
. Prensa
1:[A]
. Prensa
2 ENTER 4 ENTER
. Introduzca los valores de la tabla por fila. Prensa
ENTER
después de cada uno. Prensa
2nd QUIT
. Prensa
STAT
y flecha sobre
TESTS
. Flecha hacia abajo para
C:χ2-TEST
. Prensa
ENTER
. Deberías ver
Observed:[A] and Expected:[B]
. Flecha hacia abajo para
Calculate
. Prensa
ENTER
. El estadístico de prueba es 10.1287 y el\(p\text{-value} = 0.0175\). Haz el procedimiento por segunda vez pero flecha hacia abajo para
Draw
en lugar de
calculate
.
Comparar α y el valor p: Dado que no\(\alpha\) se da, asuma\(\alpha = 0.05\). \(p\text{-value} = 0.0175\). \(\alpha > p\text{-value}\).
Tomar una decisión: Desde\(\alpha > p\text{-value}\), rechazar\(H_{0}\). Esto quiere decir que las distribuciones no son las mismas.
Conclusión: A un nivel de significancia del 5%, a partir de los datos, hay evidencia suficiente para concluir que las distribuciones de los arreglos de vivienda para estudiantes universitarios masculinos y femeninos no son las mismas.
Observe que la conclusión es sólo que las distribuciones no son las mismas. No podemos usar la prueba de homogeneidad para sacar conclusiones sobre cómo difieren.
Ejercicio\(\PageIndex{1}\)
¿Las familias y los solteros tienen la misma distribución de autos? Utilizar un nivel de significancia de 0.05. Supongamos que a 100 familias seleccionadas al azar y a 200 singles seleccionados al azar se les preguntó qué tipo de automóvil conducían: sport, sedán, hatchback, camioneta, furgoneta/SUV. Los resultados se muestran en la Tabla\(\PageIndex{2}\). ¿Las familias y los solteros tienen la misma distribución de autos? Prueba a un nivel de significancia de 0.05.
Deporte | Sedán | Hatchback | Camión | Van/SUV | |
---|---|---|---|---|---|
Familia | 5 | 15 | 35 | 17 | 28 |
Individual | 45 | 65 | 37 | 46 | 7 |
Responder
Con un\(p\text{-value}\) de casi cero, rechazamos la hipótesis nula. Los datos muestran que la distribución de autos no es la misma para familias y solteros.
Ejemplo 11.5.2
Tanto antes como después de un terremoto reciente, se realizaron encuestas en las que se preguntaba a los votantes cuál de los tres candidatos planeaban votar en la próxima elección del ayuntamiento. ¿Ha habido un cambio desde el sismo? Utilizar un nivel de significancia de 0.05. En la tabla se muestran los resultados de la encuesta. ¿Ha habido un cambio en la distribución de las preferencias de los votantes desde el sismo?
Pérez | Chung | Stevens | |
Antes | 167 | 128 | 135 |
Después | 214 | 197 | 225 |
Responder
\(H_{0}\): La distribución de las preferencias de los votantes fue la misma antes y después del sismo.
\(H_{a}\): La distribución de las preferencias de los votantes no fue la misma antes y después del sismo.
Grados de Libertad (df):
\(df = \text{number of columns} - 1 = 3 - 1 = 2\)
Distribución para la prueba:\(\chi^{2}_{2}\)
Calcular el estadístico de prueba:\(\chi^{2} = 3.2603\) (calculadora o computadora)
Declaración de probabilidad:\(p\text{-value} = P(\chi^{2} > 3.2603) = 0.1959\)
Presiona la tecla MATRX
y flecha hacia arriba para EDITAR
. Presione 1: [A]
. Presione 2 ENTRAR 3 ENTER
. Introduzca los valores de la tabla por fila. Presione ENTRAR
después de cada uno. Presiona 2º QUITAR
. Presiona STAT
y flecha hacia PRUEBAS
. Flecha hacia abajo a C:χ2-test
. Presione ENTER
. Debería ver Observado: [A] y Esperado: [B]
. Flecha hacia abajo para Calcular
. Presione ENTER
. El estadístico de prueba es 3.2603 y el valor p = 0.1959. Haz el procedimiento por segunda vez pero flecha hacia abajo para Dibujar
en lugar de calcular
.
Comparar\(\alpha\) y el\(p\text{-value}\):\(\alpha = 0.05\) y el\(p\text{-value} = 0.1959\). \(\alpha < p\text{-value}\).
Tomar una decisión: Ya que\(\alpha < p\text{-value}\), no rechace\(H_{0}\).
Conclusión: A un nivel de significancia del 5%, a partir de los datos, no hay evidencia suficiente para concluir que la distribución de las preferencias electorales no fue la misma antes y después del sismo.
Ejercicio\(\PageIndex{2}\)
Las escuelas de la Ivy League reciben muchas solicitudes, pero solo algunas pueden ser aceptadas. En las escuelas listadas en la Tabla, se aceptan dos tipos de solicitudes: decisión regular y temprana.
Tipo de Aplicación Aceptada | Marrón | Columbia | Cornell | Dartmouth | Penn | Yale |
---|---|---|---|---|---|---|
Regular | 2,115 | 1,792 | 5,306 | 1,734 | 2,685 | 1,245 |
Decisión Anticipada | 577 | 627 | 1,228 | 444 | 1,195 | 761 |
Queremos saber si el número de solicitudes regulares aceptadas sigue la misma distribución que el número de solicitudes anticipadas aceptadas. Indicar las hipótesis nulas y alternativas, los grados de libertad y el estadístico de prueba, esbozar la gráfica del valor p y sacar una conclusión sobre la prueba de homogeneidad.
Responder
\(H_{0}\): La distribución de las solicitudes regulares aceptadas es la misma que la distribución de las solicitudes anticipadas aceptadas.
\(H_{a}\): La distribución de las solicitudes regulares aceptadas no es lo mismo que la distribución de las solicitudes anticipadas aceptadas.
\(df = 5\)
\(\chi^{2} \text{test statistic} = 430.06\)
Presiona la tecla MATRX
y flecha hacia arriba para EDITAR
. Presione 1: [A]
. Presione 3 ENTRAR 3 ENTER
. Introduzca los valores de la tabla por fila. Presione ENTRAR
después de cada uno. Presiona 2º QUITAR
. Presiona STAT
y flecha hacia PRUEBAS
. Flecha hacia abajo a C:χ2-test
.
Presione ENTER
. Debería ver Observado: [A] y Esperado: [B]
. Flecha hacia abajo para Calcular
. Presione ENTER
. El estadístico de prueba es 430.06 y el\(p\text{-value} = 9.80E-91\). Haz el procedimiento por segunda vez pero flecha hacia abajo para Dibujar
en lugar de calcular
.
Referencias
- Datos del Instituto de Seguros para la Seguridad Vial, 2013. Disponible en línea en www.iihs.org/iihs/ratings (consultado el 24 de mayo de 2013).
- “Uso de energía (kg de equivalente de petróleo per cápita).” El Banco Mundial, 2013. Disponible en línea en http://data.worldbank.org/indicator/...G.OE/countries (consultado el 24 de mayo de 2013).
- “Encuesta de participación de padres y familias del Programa Nacional de Encuestas de Educación de los Hogares 2007 (NHES)”, Departamento de Educación de Estados Unidos, Centro Nacional de Estadísticas de Educación. Disponible en línea en http://nces.ed.gov/pubsearch/pubsinf...? pubid=2009030 (consultado el 24 de mayo de 2013).
- “Encuesta de participación de padres y familias del Programa Nacional de Encuestas de Educación de los Hogares 2007 (NHES)”, Departamento de Educación de Estados Unidos, Centro Nacional de Estadísticas de Educación. Disponible en línea en http://nces.ed.gov/pubs2009/2009030_sup.pdf (consultado el 24 de mayo de 2013).
Revisar
Para evaluar si dos conjuntos de datos se derivan de la misma distribución, lo que no necesita conocerse, puede aplicar la prueba de homogeneidad que usa la distribución chi-cuadrada. La hipótesis nula para esta prueba establece que las poblaciones de los dos conjuntos de datos provienen de la misma distribución. La prueba compara los valores observados con los valores esperados si las dos poblaciones siguieron la misma distribución. La prueba es de cola derecha. Cada observación o categoría de celda debe tener un valor esperado de al menos cinco.
Revisión de Fórmula
\(\sum_{i \cdot j} \frac{(O-E)^{2}}{E}\)Estadística de prueba de homogeneidad donde: valores\(O =\) observados
\(E =\)valores esperados
\(i =\)número de filas en la tabla de contingencia de datos
\(j =\)número de columnas en la tabla de contingencia de datos
\(df = (i −1)(j −1)\)Grados de libertad
Ejercicio\(\PageIndex{3}\)
Una profesora de matemáticas quiere ver si dos de sus clases tienen la misma distribución de los puntajes de los exámenes. ¿Qué prueba debe usar?
Responder
prueba de homogeneidad
Ejercicio\(\PageIndex{4}\)
¿Cuáles son las hipótesis nulas y alternativas para el ejercicio?
Ejercicio\(\PageIndex{5}\)
Un investigador de mercado quiere ver si dos tiendas diferentes tienen la misma distribución de ventas a lo largo del año. ¿Qué tipo de prueba debe usar?
Responder
prueba de homogeneidad
Ejercicio\(\PageIndex{6}\)
Un meteorólogo quiere saber si Australia Oriental y Oeste tienen la misma distribución de tormentas. ¿Qué tipo de prueba debe usar?
Ejercicio\(\PageIndex{7}\)
¿Qué condición se debe cumplir para utilizar la prueba de homogeneidad?
Responder
Todos los valores de la tabla deben ser mayores o iguales a cinco.
Utilice la siguiente información para responder a los siguientes cinco ejercicios: ¿Los médicos de práctica privada y los médicos de los hospitales tienen la misma distribución de horas de trabajo? Supongamos que una muestra de 100 médicos de práctica privada y 150 médicos del hospital son seleccionados al azar y se les pregunta sobre el número de horas a la semana que trabajan. Los resultados se muestran en la Tabla.
20—30 | 30—40 | 40—50 | 50—60 | |
---|---|---|---|---|
Práctica Privada | 16 | 40 | 38 | 6 |
Hospital | 8 | 44 | 59 | 39 |
Ejercicio\(\PageIndex{8}\)
Indicar las hipótesis nulas y alternativas.
Ejercicio\(\PageIndex{9}\)
\(df =\)_______
Responder
3
Ejercicio\(\PageIndex{10}\)
¿Cuál es el estadístico de prueba?
Ejercicio\(\PageIndex{11}\)
¿Cuál es el\(p\text{-value}\)?
Responder
0.00005
Ejercicio\(\PageIndex{12}\)
¿Qué se puede concluir en el nivel de significancia del 5%?