11.1: Prueba de Chi-Cuadrado para la Independencia
- Page ID
- 149671
Recuerda, los datos cualitativos es donde recolectas datos sobre individuos que son categorías o nombres. Entonces contarías cuántos de los individuos tenían cualidades particulares. Un ejemplo es que existe una teoría de que existe una relación entre la lactancia materna y el autismo. Para determinar si existe una relación, los investigadores podrían recopilar el periodo de tiempo que una madre amamantó a su hijo y si ese niño fue diagnosticado con autismo. Entonces tendrías una tabla que contenga esta información. Ahora quieres saber si cada celda es independiente la una de la otra celda. Recuerde, la independencia dice que un evento no afecta a otro evento. Aquí significa que tener autismo es independiente de ser amamantado. Lo que realmente quieres es ver si no son independientes. En otras palabras, ¿uno afecta al otro? Si tuvieras que hacer una prueba de hipótesis, esta es tu hipótesis alternativa y la hipótesis nula es que son independientes. Existe una prueba de hipótesis para esto y se llama Prueba de Chi-Cuadrado para la Independencia. Técnicamente debería llamarse la Prueba de Chi-Cuadrado para la Dependencia, pero por razones históricas se le conoce como la prueba para la independencia. Al igual que con las pruebas de hipótesis anteriores, todos los pasos son iguales excepto los supuestos y el estadístico de prueba.
Prueba de hipótesis para la prueba de Chi-cuadrado
- Afirma las hipótesis nulas y alternativas y el nivel de significancia
\(H_{o}\): las dos variables son independientes (esto significa que una variable no se ve afectada por la otra)
\(H_{A}\): las dos variables son dependientes (esto significa que una variable se ve afectada por el otro)
También, indica tu\(\alpha\) nivel aquí. - Indicar y verificar los supuestos para la prueba de hipótesis
- Se toma una muestra aleatoria.
- Las frecuencias esperadas para cada celda son mayores o iguales a 5 (Las frecuencias esperadas, E, se calcularán posteriormente, y esta suposición significa\(E \geq 5\)).
- Encontrar el estadístico de prueba y el valor p
Encontrar el estadístico de prueba implica varios pasos. Primero se recopilan y cuentan los datos, y luego se organizan en una tabla (en una tabla cada entrada se llama celda). Estos valores se conocen como las frecuencias observadas, cuyo símbolo para una frecuencia observada es O. Cada tabla se compone de filas y columnas. Entonces cada fila se suma para dar un total de fila y cada columna se suma para dar un total de columna.
La hipótesis nula es que las variables son independientes. Usando la regla de multiplicación para eventos independientes se puede calcular la probabilidad de ser un valor de la primera variable, A, y un valor de la segunda variable, B (la probabilidad de una celda en particular\(P(A \text { and } B) )\). Recuerda en una prueba de hipótesis,\(H_{o}\) asumes que eso es cierto, se supone que las dos variables son independientes.
\[ \begin{align*} P(A \text { and } B) &=P(A) \cdot P(B) \text { if } A \text { and } B are independent \\[4pt] &=\dfrac{\text { number of ways } A \text { can happen }}{\text { total number of individuals }} \cdot \dfrac{\text { number of ways } B \text { can happen }}{\text { total number of individuals }} \\[4pt] &= \dfrac{\text { row total }}{n} * \dfrac{\text { column total }}{n} \end{align*}\]
Ahora quieres saber cuántos individuos esperas estar en una determinada celda. Para encontrar las frecuencias esperadas, solo necesitas multiplicar la probabilidad de esa celda por el número total de individuos. No redondear las frecuencias esperadas.
Frecuencia esperada\((\operatorname{cell} A \text { and } B)=E(A \text { and } B)\)
\(\begin{array}{l}{=n\left(\dfrac{\text { row total }}{n} \cdot \dfrac{\text { column total }}{n}\right)} \\ {=\dfrac{\text { row total -column total }}{n}}\end{array}\)
Si las variables son independientes las frecuencias esperadas y las frecuencias observadas deben ser las mismas. El estadístico de prueba aquí implicará observar la diferencia entre la frecuencia esperada y la frecuencia observada para cada celda. Entonces quieres encontrar la “diferencia total” de todas estas diferencias. Cuanto mayor sea el total, menores serán las posibilidades de que puedas encontrar ese estadístico de prueba dado que el supuesto de independencia es cierto. Eso quiere decir que el supuesto de independencia no es cierto. ¿Cómo encuentra el estadístico de prueba? Primero encuentra las diferencias entre las frecuencias observadas y esperadas. Debido a que algunas de estas diferencias serán positivas y otras serán negativas, es necesario cuadrar estas diferencias. Estos cuadrados podrían ser grandes solo porque las frecuencias son grandes, hay que dividirlas por las frecuencias esperadas para escalarlas. Entonces finalmente sumar todos estos valores fraccionarios. Este es el estadístico de prueba.
Estadística de prueba:
El símbolo de Chi-cuadrado es\(\chi^{2}\)
\(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\)
donde O es la frecuencia observada y E es la frecuencia esperada
Distribución de Chi-Cuadrado
\(\chi^{2}\)tiene diferentes curvas dependiendo de los grados de libertad. Se inclina hacia la derecha por pequeños grados de libertad y se vuelve más simétrica a medida que aumentan los grados de libertad (ver Figura\(\PageIndex{1}\)). Dado que el estadístico de prueba implica cuadrar las diferencias, los estadísticos de prueba son todos positivos. Una prueba de chi-cuadrado para la independencia siempre tiene la cola correcta.
valor p:
Usando el TI-83/84:\(\chi \text { cdf (lower limit, } 1 \mathrm{E} 99, d f )\)
Usando R:\(1-\text { pchisq }\left(x^{2}, d f\right)\)
Donde se encuentran los grados de libertad\(d f=(\# \text { of rows }-1) *(\# \text { of columns }-1)\)
4. Conclusión
Aquí es donde escribes rechazar\(H_{o}\) o no rechazas\(H_{o}\). La regla es: si el valor p <\(\alpha\), entonces rechazar\(H_{o}\). Si el valor p\(\geq \alpha\), entonces no puede rechazar\(H_{o}\).
5. Interpretación
Aquí es donde interpretas en términos del mundo real la conclusión a la prueba. La conclusión para una prueba de hipótesis es que o bien tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad, o no tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad.
Ejemplo\(\PageIndex{1}\) hypothesis test with chi-square test using formula
¿Existe una relación entre el autismo y la lactancia materna? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran en qué periodo de tiempo amamantaron a sus hijos. Los datos se encuentran en la tabla #11 .1.1 (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que la lactancia materna y el autismo son independientes? Prueba al nivel 1%.
Autis261m | Cronogramas de Lactancia Materna | Total de fila | |||
Ninguno | Menos de 2 meses | 2 a 6 meses | Más de 6 meses | ||
Sí | 241 | 198 | 164 | 215 | 818 |
No | 20 | 25 | 27 | 44 | 116 |
Total de Columna | 261 | 223 | 191 | 259 | 934 |
Solución
1. Indicar las hipótesis nulas y alternativas y el nivel de significación
\(H_{o}\): La lactancia materna y el autismo son independientes
\(H_{A}\): La lactancia materna y el autismo son dependientes
\(\alpha\)= 0.01
2. Indicar y verificar los supuestos para la prueba de hipótesis
- Se tomó una muestra aleatoria de plazos de lactancia materna e incidencia de autismo.
- Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. Todas las frecuencias esperadas son más de 5.
3. Encuentra el estadístico de prueba y el valor p
Estadística de prueba:
Primero encuentra las frecuencias esperadas para cada celda
\(E(\text { Autism and no breastfeeding })=\dfrac{818^{*} 261}{934} \approx 228.585\)
\(E(\text { Autism and }<2 \text { months })=\dfrac{818^{*} 223}{934} \approx 195.304\)
\(E(\text { Autism and } 2 \text { to } 6 \text { months })=\dfrac{818^{*} 191}{934} \approx 167.278\)
\(E(\text { Autism and more than } 6 \text { months })=\dfrac{818 * 259}{934} \approx 226.833\)
Otros se hacen de manera similar. Es más fácil hacer los cálculos para el estadístico de prueba con una tabla, los demás están en la tabla #11 .1.2 junto con el cálculo para el estadístico de prueba. (Nota: la columna de O-E debe agregar a 0 o cerca de 0.)
O | E | O-E | \((O-E)^{2}\) | \((O-E)^{2} / E\) |
---|---|---|---|---|
241 | 228.585 | 12.415 | \ ((O-E) ^ {2}\) ">154.132225 | \ ((O-E) ^ {2}/E\) ">0.674288448 |
198 | 195.304 | 2.696 | \ ((O-E) ^ {2}\) ">7.268416 | \ ((O-E) ^ {2}/E\) ">0.03721591 |
164 | 167.278 | -3.278 | \ ((O-E) ^ {2}\) ">10.745284 | \ ((O-E) ^ {2}/E\) ">0.064236086 |
215 | 226.833 | -11.833 | \ ((O-E) ^ {2}\) ">140.019889 | \ ((O-E) ^ {2}/E\) ">0.617281828 |
20 | 32.4154 | -12.4154 | \ ((O-E) ^ {2}\) ">154.1421572 | \ ((O-E) ^ {2}/E\) ">4.755213792 |
25 | 27.6959 | -2.6959 | \ ((O-E) ^ {2}\) ">7.26787681 | \ ((O-E) ^ {2}/E\) ">0.262417066 |
27 | 23.7216 | 3.2784 | \ ((O-E) ^ {2}\) ">10.74790656 | \ ((O-E) ^ {2}/E\) ">0.453085229 |
44 | 32.167 | 11.833 | \ ((O-E) ^ {2}\) ">140.019889 | \ ((O-E) ^ {2}/E\) ">4.352904809 |
Total | 0.0001 | \ ((O-E) ^ {2}\) "> | \ ((O-E) ^ {2}/E\) ">11.2166432 =\(\chi^{2}\) |
La fórmula estadística de prueba es\(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\), que es el total de la última columna en Ejemplo\(\PageIndex{2}\).
valor p:
\(d f=(2-1)^{*}(4-1)=3\)
Usando TI-83/84:\(\chi \operatorname{cdf}(11.2166432,1 \mathrm{E} 99,3) \approx 0.01061\)
Usando R:\(1-\text{pchisq}(11.2166432,3) \approx 0.01061566\)
4. Conclusión
No se puede rechazar\(H_{o}\) ya que el valor p es superior a 0.01.
5. Interpretación
No hay evidencia suficiente para demostrar que la lactancia materna y el autismo son dependientes. Esto significa que no se puede decir que el si un niño es amamantado o no indicará si ese niño será diagnosticado con autismo.
Ejemplo\(\PageIndex{2}\) hypothesis test with chi-square test using technology
¿Existe una relación entre el autismo y la lactancia materna? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran en qué periodo de tiempo amamantaron a sus hijos. Los datos están en Example\(\PageIndex{1}\) (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que la lactancia materna y el autismo son independientes? Prueba al nivel 1%.
Solución
1. Indicar las hipótesis nulas y alternativas y el nivel de significación
\(H_{o}\): La lactancia materna y el autismo son independientes
\(H_{A}\): La lactancia materna y el autismo son dependientes
\(\alpha\)= 0.01
2. Indicar y verificar los supuestos para la prueba de hipótesis
- Se tomó una muestra aleatoria de plazos de lactancia materna e incidencia de autismo.
- Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. Todas las frecuencias esperadas son más de 5.
3. Encuentra el estadístico de prueba y el valor p
Estadística de prueba:
Para utilizar la calculadora TI-83/84 para calcular el estadístico de prueba, primero debes poner los datos en la calculadora. Sin embargo, este proceso es diferente al de otras pruebas de hipótesis. Es necesario poner los datos como una matriz en lugar de en la lista. Entra en el menú MATRX luego pasa a EDITAR y elige 1: [A]. Esto le permitirá escribir la tabla en la calculadora. La figura\(\PageIndex{2}\) muestra lo que verás en tu calculadora cuando elijas 1: [A] en el menú EDITAR.
La tabla tiene 2 filas y 4 columnas (no incluya la columna total de fila y la fila total de columna en su conteo). Necesitas decirle a la calculadora que tienes un 2 por 4. El 1 X1 (podrías tener otro tamaño en tu matriz, pero no importa porque lo cambiarás) en la calculadora es el tamaño de la matriz. Entonces escriba 2 ENTRAR y 4 ENTRAR y la calculadora hará una matriz del tamaño correcto. Ver Figura\(\PageIndex{3}\).
Ahora escriba la tabla presionando ENTRAR después de cada valor de celda. La figura\(\PageIndex{4}\) contiene la tabla completa escrita. Una vez que tenga los datos en, presione QUIT.
Para ejecutar la prueba en la calculadora, vaya a STAT, luego pase a PRUEBA y elija\(\chi^{2}\) -Prueba de la lista. La configuración para la prueba está en la Figura\(\PageIndex{5}\).
Una vez que presione ENTRAR en Calcular verá los resultados en la Figura\(\PageIndex{6}\).
El estadístico de prueba es\(\chi^{2} \approx 11.2167\) y el valor p es\(p \approx 0.01061\). Observe que la calculadora calcula los valores esperados por usted y los coloca en la matriz B. Para visualizar los valores esperados, vaya a MATRX y elija 2: [B]. La figura\(\PageIndex{7}\) muestra la salida. Presiona las flechas de la derecha para ver toda la matriz.
Para calcular el estadístico de prueba y el valor p con R,
fila1 = c (datos de la fila 1 separados por comas)
fila2 = c (datos de la fila 2 separados por comas)
continúa hasta que tengas todas tus filas ingresadas.
data.table = rbind (row1, row2,...) — convierte los datos en una tabla. Puedes llamarlo como siempre quieras. No tiene que ser data.table.
data.table — usa si quieres mirar la tabla
chisq.test (data.table) — calcula la prueba chi-cuadrada para la independencia
chisq.test (data.table) $esperado — vamos a ver los valores esperados
Para este ejemplo, los comandos serían
fila1 = c (241, 198, 164, 215)
fila2 = c (20, 25, 27, 44)
datos.table = rbind (row1, row2)
datos.table
Salida:
[,1] [,2] [,3] [,4]
fila1 241 198 164 215
fila2 20 25 27 44
chisq.test (data.table)
Salida: Prueba de Chi-cuadrado de
Pearson
datos: datos.tabla
X-cuadrado = 11.217, df = 3, valor p = 0.01061
chisq.test (data.table) $ esperado
Salida: [,1] [,2] [,3] [,4]
fila1 228.58458 195.30407 167.27837 226.83298
fila2 32.41542 27.69593 23.72163 32.16702
El estadístico de prueba es\(\chi^{2} \approx 11.217\) y el valor p es\(p \approx 0.01061\).
4. Conclusión
No se puede rechazar\(H_{o}\) ya que el valor p es superior a 0.01.
5. Interpretación
No hay evidencia suficiente para demostrar que la lactancia materna y el autismo son dependientes. Esto significa que no se puede decir que el si un niño es amamantado o no indicará si ese niño será diagnosticado con autismo.
Ejemplo\(\PageIndex{3}\) hypothesis test with chi-square test using formula
La Organización Mundial de la Salud (OMS) realiza un seguimiento de cuántos incidentes de lepra hay en el mundo. Utilizando las regiones de la OMS y los grupos de ingresos de los Bancos Mundiales, se puede preguntar si un nivel de ingresos y una región de la OMS dependen entre sí en términos de predecir dónde está la enfermedad. Se recolectaron datos sobre casos de lepra en diferentes países para el año 2011 y se presenta un resumen en la Tabla\(\PageIndex{3}\) (“Lepra: Número de”, 2013). ¿Hay evidencia que demuestre que el nivel de ingresos y la región de la OMS son independientes cuando se trata de la enfermedad de la lepra? Prueba al nivel del 5%.
Región OMS | Grupo de Ingresos del Banco Mundial | Total de fila | |||
Ingresos altos | Ingresos medios altos | Renta Media Baja | Bajos ingresos | ||
Américas | 174 | 36028 | 615 | 0 | 36817 |
Mediterránea Oriental | 54 | 6 | 1883 | 604 | 2547 |
Europa | 10 | 0 | 0 | 0 | 10 |
Pacífico Occidental | 26 | 216 | 3689 | 1155 | 5086 |
África | 0 | 39 | 1986 | 15928 | 17953 |
Sudeste Asiático | 0 | 0 | 149896 | 10236 | 160132 |
Total de Columna | 264 | 36289 | 158069 | 27923 | 222545 |
Solución
1. Indicar las hipótesis nulas y alternativas y el nivel de significación
\(H_{o}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son independientes
\(H_{A}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son dependientes
\(\alpha\)= 0.05
2. Indicar y verificar los supuestos para la prueba de hipótesis
- Se tomó una muestra aleatoria de incidencia de lepra de diferentes países y se tomó el nivel de ingresos y la región de la OMS.
- Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. En realidad hay 4 frecuencias esperadas que son menores a 5, y los resultados de la prueba pueden no ser válidos. Si miras las frecuencias esperadas notarás que todas están en Europa. Esto se debe a que Europa no tuvo muchos casos en 2011.
3. Encuentra el estadístico de prueba y el valor p
Estadística de prueba:
Primero encuentra las frecuencias esperadas para cada celda.
\(E(\text { Americas and High Income })=\dfrac{36817 * 264}{222545} \approx 43.675\)
\(E(\text { Americas and Upper Middle Income })=\dfrac{36817 * 36289}{222545} \approx 6003.514\)
\(E (\text { Americas and Lower Middle Income) }=\dfrac{36817 * 158069}{222545} \approx 26150.335\)
\(E(\text { Americas and Lower Income })=\dfrac{36817 * 27923}{222545} \approx 4619.475\)
Otros se hacen de manera similar. Es más fácil hacer los cálculos para el estadístico de prueba con una tabla, y los demás están en Ejemplo\(\PageIndex{4}\) junto con el cálculo para el estadístico de prueba.
O | E | O-E | \((O-E)^{2}\) | \((O-E)^{2} / E\) |
---|---|---|---|---|
174 | 43.675 | 130.325 | \ ((O-E) ^ {2}\) ">16984.564 | \ ((O-E) ^ {2}/E\) ">388.8838719 |
54 | 3.021 | 50.979 | \ ((O-E) ^ {2}\) ">2598.813 | \ ((O-E) ^ {2}/E\) ">860.1218328 |
10 | 0.012 | 9.988 | \ ((O-E) ^ {2}\) ">99.763 | \ ((O-E) ^ {2}/E\) ">8409.746711 |
26 | 6.033 | 19.967 | \ ((O-E) ^ {2}\) ">398.665 | \ ((O-E) ^ {2}/E\) ">66.07628214 |
0 | 21.297 | -21.297 | \ ((O-E) ^ {2}\) ">453.572 | \ ((O-E) ^ {2}/E\) ">21.29722977 |
0 | 189.961 | -189.961 | \ ((O-E) ^ {2}\) ">36085.143 | \ ((O-E) ^ {2}/E\) ">189.9608978 |
36028 | 6003.514 | 30024.486 | \ ((O-E) ^ {2}\) ">901469735.315 | \ ((O-E) ^ {2}/E\) ">150157.0038 |
6 | 415.323 | -409.323 | \ ((O-E) ^ {2}\) ">167545.414 | \ ((O-E) ^ {2}/E\) ">403.4097962 |
0 | 1.631 | -1.631 | \ ((O-E) ^ {2}\) ">2.659 | \ ((O-E) ^ {2}/E\) ">1.6306365 |
216 | 829.342 | -613.342 | \ ((O-E) ^ {2}\) ">376188.071 | \ ((O-E) ^ {2}/E\) ">453.5983897 |
39 | 2927.482 | -2888.482 | \ ((O-E) ^ {2}\) ">8343326.585 | \ ((O-E) ^ {2}/E\) ">2850.001268 |
0 | 26111.708 | -26111.708 | \ ((O-E) ^ {2}\) ">681821316.065 | \ ((O-E) ^ {2}/E\) ">26111.70841 |
615 | 26150.335 | -25535.335 | \ ((O-E) ^ {2}\) ">652053349.724 | \ ((O-E) ^ {2}/E\) ">24934.7988 |
1883 | 1809.080 | 73.290 | \ ((O-E) ^ {2}\) ">5464.144 | \ ((O-E) ^ {2}/E\) ">3.020398811 |
0 | 7.103 | -7.103 | \ ((O-E) ^ {2}\) ">50.450 | \ ((O-E) ^ {2}/E\) ">7.1027882 |
3689 | 3612.478 | 76.522 | \ ((O-E) ^ {2}\) ">5855.604 | \ ((O-E) ^ {2}/E\) ">1.620938405 |
1986 | 12751.636 | -10765.636 | \ ((O-E) ^ {2}\) ">115898911.071 | \ ((O-E) ^ {2}/E\) ">9088.944681 |
149896 | 113738.368 | 36157.632 | \ ((O-E) ^ {2}\) ">1307374351.380 | \ ((O-E) ^ {2}/E\) ">11494.57632 |
0 | 4619.475 | -4619.475 | \ ((O-E) ^ {2}\) ">21339550.402 | \ ((O-E) ^ {2}/E\) ">4619.475122 |
604 | 319.575 | 284.425 | \ ((O-E) ^ {2}\) ">80897.421 | \ ((O-E) ^ {2}/E\) ">253.1404187 |
0 | 1.255 | -1.255 | \ ((O-E) ^ {2}\) ">1.574 | \ ((O-E) ^ {2}/E\) ">1.25471253 |
1155 | 638.147 | 516.853 | \ ((O-E) ^ {2}\) ">267137.238 | \ ((O-E) ^ {2}/E\) ">418.6140882 |
15928 | 2252.585 | 13675.415 | \ ((O-E) ^ {2}\) ">187016964.340 | \ ((O-E) ^ {2}/E\) ">83023.25138 |
10236 | 20091.963 | -9855.963 | \ ((O-E) ^ {2}\) ">97140000.472 | \ ((O-E) ^ {2}/E\) ">4834.769106 |
Total | 0.000 | \ ((O-E) ^ {2}\) "> | \ ((O-E) ^ {2}/E\) ">328594.008 =\(\chi^{2}\) |
La fórmula estadística de prueba es\(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\), que es el total de la última columna en Ejemplo\(\PageIndex{2}\).
valor p:
\(d f=(6-1) *(4-1)=15\)
Usando el TI-83/84:\(\chi \operatorname{cdf}(328594.008,1 \mathrm{E} 99,15) \approx 0\)
Usando R:\(1-\text { pchisq }(328594.008,15) \approx 0\)
4. Conclusión
Rechazar\(H_{o}\) ya que el valor p es menor a 0.05.
5. Interpretación
Existe evidencia suficiente para demostrar que la región de la OMS y el nivel de ingresos son dependientes cuando se trata de la enfermedad de la lepra. La OMS puede decidir cómo enfocar sus esfuerzos en función de la región y el nivel de ingresos. Sin embargo, recuerde que los resultados pueden no ser válidos debido a que las frecuencias esperadas no son todas superiores a 5.
Ejemplo\(\PageIndex{4}\) hypothesis test with chi-square test using technology
La Organización Mundial de la Salud (OMS) realiza un seguimiento de cuántos incidentes de lepra hay en el mundo. Utilizando las regiones de la OMS y los grupos de ingresos de los Bancos Mundiales, se puede preguntar si un nivel de ingresos y una región de la OMS dependen entre sí en términos de predecir dónde está la enfermedad. Se recolectaron datos sobre casos de lepra en diferentes países para el año 2011 y se presenta un resumen en la Tabla\(\PageIndex{3}\) (“Lepra: Número de”, 2013). ¿Hay evidencia que demuestre que el nivel de ingresos y la región de la OMS son independientes cuando se trata de la enfermedad de la lepra? Prueba al nivel del 5%.
Solución
1. Indicar las hipótesis nulas y alternativas y el nivel de significación
\(H_{o}\): la región de la OMS y el Nivel de Ingresos al tratar la enfermedad de la lepra son independientes
\(H_{A}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son dependientes
\(\alpha\)= 0.05
2. Indicar y verificar los supuestos para la prueba de hipótesis
- Se tomó una muestra aleatoria de incidencia de lepra de diferentes países y se tomó el nivel de ingresos y la región de la OMS.
- Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. En realidad hay 4 frecuencias esperadas que son menores a 5, y los resultados de la prueba pueden no ser válidos. Si miras las frecuencias esperadas notarás que todas están en Europa. Esto se debe a que Europa no tuvo muchos casos en 2011.
3. Encuentre el estadístico de prueba y el valor p Estadística de
prueba:
Usando el TI-83/84. Ver Ejemplo\(\PageIndex{2}\) para el proceso de hacer la prueba en la calculadora. Recuerda, necesitas poner los datos como una matriz en lugar de en la lista.
\(\chi^{2} \approx 328594.0079\)
Presiona la flecha derecha para ver las otras frecuencias esperadas.
valor p:
\(p-\text {value} \approx 0\)
Usando R:
fila1 = c (174, 36028, 615, 0)
fila2=c (54, 6, 1883, 604)
fila3=c (10, 0, 0, 0)
fila4=c (26, 216, 3689, 1155)
fila5=c (0, 39, 1986, 15928)
fila6=c (0, 0, 149896, 10236)
chisq.test (data.table)
Prueba de Chi-cuadrado de Pearson
datos: datos.tabla
X-cuadrado = 328590, df = 15, valor p < 2.2e-16
Mensaje de advertencia:
En chisq.test (data.table): La aproximación Chi-cuadrada puede ser incorrecta
chisq.test (data.table) $ esperado
\(\begin{array} {ccccc} {}&{[,1]}&{[,2]}&{[,3]}&{[,4]} \\ {\text{row1}}&{43.67515783}&{6003.514404}&{2.615034e+04}&{4619.475122}\\{\text{row2}}&{3.02144735}&{415.323117}&{1.809080e+03}&{319.575281}\\ {\text{row3}}&{0.01186277}&{1.630637}&{7.102788e+00}&{1.254713}\\{\text{row4}}&{6.03340448}&{829.341724}&{3.612478e+03}&{638.146793}\\{\text{row5}}&{21.29722977}&{2927.481709}&{1.275164e+04}&{2252.585405}\\{\text{row6}}&{189.96089780}&{26111.708410}&{1.137384e+05}&{20091.962686} \end{array}\)
Mensaje de advertencia:
En chisq.test (data.table): La aproximación Chi-cuadrada puede ser incorrecta
\(\chi^{2}=328590\)y valor p =\(2.2 \times 10^{-16}\)
4. Conclusión
Rechazar\(H_{o}\) ya que el valor p es menor a 0.05.
5. Interpretación
Existe evidencia suficiente para demostrar que la región de la OMS y el nivel de ingresos son dependientes cuando se trata de la enfermedad de la lepra. La OMS puede decidir cómo enfocar sus esfuerzos en función de la región y el nivel de ingresos. Sin embargo, recuerde que los resultados pueden no ser válidos debido a que las frecuencias esperadas no son todas superiores a 5.
Tareas
Ejercicio\(\PageIndex{1}\)
En cada problema se muestran todos los pasos de la prueba de hipótesis. Si no se cumplen algunos de los supuestos, tenga en cuenta que los resultados de la prueba pueden no ser correctos y luego continuar el proceso de la prueba de hipótesis.
- El número de personas que sobrevivieron al Titanic según la clase y el sexo está en Ejemplo\(\PageIndex{5}\) (“Enciclopedia Titánica”, 2013). ¿Hay pruebas suficientes para demostrar que la clase y el sexo de una persona que sobrevivió al Titanic son independientes? Prueba al nivel del 5%.
Clase Sexo Total Hembra Macho 1r 134 59 193 2do 94 25 119 3er 80 58 138 Total 308 142 450 Tabla\(\PageIndex{5}\): Sobreviviendo al Titanic - Los investigadores observaron grupos de delfines frente a la costa de Irlanda en 1998 para determinar en qué actividades participan los delfines en ciertos momentos del día (“Actividades del delfín”, 2013). Los números en Ejemplo\(\PageIndex{6}\) representan el número de grupos de delfines que estaban participando en una actividad en ciertos momentos de los días. ¿Hay pruebas suficientes para demostrar que la actividad y el periodo de tiempo son independientes para los delfines? Prueba al nivel del 1%.
Actividad Periodo Total de fila Mañana Mediodía Tarde Tarde Viajes 6 6 14 13 39 Feed 28 4 0 56 88 Social 38 5 9 10 62 Total de Columna 72 15 23 79 189 Tabla\(\PageIndex{6}\): Actividad de Delfines - ¿Existe una relación entre el autismo y lo que se alimenta a un infante? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran lo que alimentaban a su infante. Los datos están en Example\(\PageIndex{7}\) (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que lo que se alimenta a un infante y el autismo son independientes? Prueba al nivel del 1%.
Autismo Alimentación Total de fila Lactancia materna Fórmula con DHA/ARA Fórmula sin DRA/ARA Sí 12 39 65 116 No 6 22 10 38 Total de Columna 18 61 75 164 Tabla\(\PageIndex{7}\): Autismo versus lactancia - El nivel educativo y el grupo de edad de una persona fueron recolectados por la Oficina del Censo de Estados Unidos en 1984 para ver si el grupo de edad y el nivel educativo están relacionados. Los conteos en miles están en Ejemplo\(\PageIndex{8}\) (“Educación por edad”, 2013). ¿Los datos muestran que el logro educativo y la edad son independientes? Prueba al nivel del 5%.
Educación Grupo de edad Total de fila 25-34 35-44 45-54 55-64 >64 No completó HS 5416 5030 5777 7606 13746 37575 HS Finalizado 16431 1855 9435 8795 7558 44074 Colegio 1-3 años 8555 5576 3124 2524 2503 22282 Colegio 4 o más años 9771 7596 3904 3109 2483 26863 Total de Columna 40173 20057 22240 22034 26290 130794 Tabla\(\PageIndex{8}\): Logro Educativo y Grupo de Edad - A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importantes eran las buenas calificaciones para ellos (1 muy importante y 4 menos importantes). Los datos están en Ejemplo\(\PageIndex{9}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia de las calificaciones son independientes? Prueba al nivel del 5%.
Gol Calificación de importancia de calificaciones Total de fila 1 2 3 4 Grados 70 66 55 56 247 Popular 14 33 45 49 141 Deportes 10 24 33 23 90 Total de Columna 94 123 133 128 478 Tabla\(\PageIndex{9}\): Meta Personal e Importancia de los Grados - A los alumnos de escuelas de primaria múltiple se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era para ellos ser bueno en el deporte (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{10}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia del deporte son independientes? Prueba al nivel del 5%.
Gol Calificación de Importancia Deportiva Total de fila 1 2 3 4 Grados 83 81 55 28 247 Popular 32 49 43 17 141 Deportes 50 24 14 2 90 Total de Columna 165 154 112 47 478 Tabla\(\PageIndex{10}\): Meta Personal e Importancia del Deporte - A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era para ellos tener buena apariencia (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{11}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia de las miradas son independientes? Prueba al nivel del 5%.
Gol Looks Calificación de Importancia Total de fila 1 2 3 4 Grados 80 66 66 35 247 Popular 81 30 18 12 141 Deportes 24 30 17 19 90 Total de Columna 185 126 101 66 478 Tabla\(\PageIndex{11}\): Meta personal e importancia de las miradas - A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era tener dinero para ellos (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{12}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia del dinero son independientes? Prueba al nivel del 5%.
Gol Calificación de Importancia de Dinero Total de fila 1 2 3 4 Grados 14 34 71 128 247 Popular 14 29 35 63 141 Deportes 6 12 26 46 90 Total de Columna 34 75 132 237 478 Tabla\(\PageIndex{12}\): Meta personal e importancia del dinero
- Contestar
-
Para todas las pruebas de hipótesis, solo se da la conclusión. Ver soluciones para toda la respuesta.
1. Rechazar Ho
3. Rechazar Ho
5. Rechazar Ho
7. Rechazar Ho