Saltar al contenido principal
LibreTexts Español

11.1: Prueba de Chi-Cuadrado para la Independencia

  • Page ID
    149671
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Recuerda, los datos cualitativos es donde recolectas datos sobre individuos que son categorías o nombres. Entonces contarías cuántos de los individuos tenían cualidades particulares. Un ejemplo es que existe una teoría de que existe una relación entre la lactancia materna y el autismo. Para determinar si existe una relación, los investigadores podrían recopilar el periodo de tiempo que una madre amamantó a su hijo y si ese niño fue diagnosticado con autismo. Entonces tendrías una tabla que contenga esta información. Ahora quieres saber si cada celda es independiente la una de la otra celda. Recuerde, la independencia dice que un evento no afecta a otro evento. Aquí significa que tener autismo es independiente de ser amamantado. Lo que realmente quieres es ver si no son independientes. En otras palabras, ¿uno afecta al otro? Si tuvieras que hacer una prueba de hipótesis, esta es tu hipótesis alternativa y la hipótesis nula es que son independientes. Existe una prueba de hipótesis para esto y se llama Prueba de Chi-Cuadrado para la Independencia. Técnicamente debería llamarse la Prueba de Chi-Cuadrado para la Dependencia, pero por razones históricas se le conoce como la prueba para la independencia. Al igual que con las pruebas de hipótesis anteriores, todos los pasos son iguales excepto los supuestos y el estadístico de prueba.

    Prueba de hipótesis para la prueba de Chi-cuadrado

    1. Afirma las hipótesis nulas y alternativas y el nivel de significancia
      \(H_{o}\): las dos variables son independientes (esto significa que una variable no se ve afectada por la otra)
      \(H_{A}\): las dos variables son dependientes (esto significa que una variable se ve afectada por el otro)
      También, indica tu\(\alpha\) nivel aquí.
    2. Indicar y verificar los supuestos para la prueba de hipótesis
      1. Se toma una muestra aleatoria.
      2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (Las frecuencias esperadas, E, se calcularán posteriormente, y esta suposición significa\(E \geq 5\)).
    3. Encontrar el estadístico de prueba y el valor p
      Encontrar el estadístico de prueba implica varios pasos. Primero se recopilan y cuentan los datos, y luego se organizan en una tabla (en una tabla cada entrada se llama celda). Estos valores se conocen como las frecuencias observadas, cuyo símbolo para una frecuencia observada es O. Cada tabla se compone de filas y columnas. Entonces cada fila se suma para dar un total de fila y cada columna se suma para dar un total de columna.
      La hipótesis nula es que las variables son independientes. Usando la regla de multiplicación para eventos independientes se puede calcular la probabilidad de ser un valor de la primera variable, A, y un valor de la segunda variable, B (la probabilidad de una celda en particular\(P(A \text { and } B) )\). Recuerda en una prueba de hipótesis,\(H_{o}\) asumes que eso es cierto, se supone que las dos variables son independientes.

    \[ \begin{align*} P(A \text { and } B) &=P(A) \cdot P(B) \text { if } A \text { and } B are independent \\[4pt] &=\dfrac{\text { number of ways } A \text { can happen }}{\text { total number of individuals }} \cdot \dfrac{\text { number of ways } B \text { can happen }}{\text { total number of individuals }} \\[4pt] &= \dfrac{\text { row total }}{n} * \dfrac{\text { column total }}{n} \end{align*}\]

    Ahora quieres saber cuántos individuos esperas estar en una determinada celda. Para encontrar las frecuencias esperadas, solo necesitas multiplicar la probabilidad de esa celda por el número total de individuos. No redondear las frecuencias esperadas.

    Frecuencia esperada\((\operatorname{cell} A \text { and } B)=E(A \text { and } B)\)

    \(\begin{array}{l}{=n\left(\dfrac{\text { row total }}{n} \cdot \dfrac{\text { column total }}{n}\right)} \\ {=\dfrac{\text { row total -column total }}{n}}\end{array}\)

    Si las variables son independientes las frecuencias esperadas y las frecuencias observadas deben ser las mismas. El estadístico de prueba aquí implicará observar la diferencia entre la frecuencia esperada y la frecuencia observada para cada celda. Entonces quieres encontrar la “diferencia total” de todas estas diferencias. Cuanto mayor sea el total, menores serán las posibilidades de que puedas encontrar ese estadístico de prueba dado que el supuesto de independencia es cierto. Eso quiere decir que el supuesto de independencia no es cierto. ¿Cómo encuentra el estadístico de prueba? Primero encuentra las diferencias entre las frecuencias observadas y esperadas. Debido a que algunas de estas diferencias serán positivas y otras serán negativas, es necesario cuadrar estas diferencias. Estos cuadrados podrían ser grandes solo porque las frecuencias son grandes, hay que dividirlas por las frecuencias esperadas para escalarlas. Entonces finalmente sumar todos estos valores fraccionarios. Este es el estadístico de prueba.

    Estadística de prueba:

    El símbolo de Chi-cuadrado es\(\chi^{2}\)

    \(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\)

    donde O es la frecuencia observada y E es la frecuencia esperada

    Distribución de Chi-Cuadrado

    \(\chi^{2}\)tiene diferentes curvas dependiendo de los grados de libertad. Se inclina hacia la derecha por pequeños grados de libertad y se vuelve más simétrica a medida que aumentan los grados de libertad (ver Figura\(\PageIndex{1}\)). Dado que el estadístico de prueba implica cuadrar las diferencias, los estadísticos de prueba son todos positivos. Una prueba de chi-cuadrado para la independencia siempre tiene la cola correcta.

    Captura de pantalla (213) .png
    Figura\(\PageIndex{1}\): Distribución Chi-Cuadrada

    valor p:

    Usando el TI-83/84:\(\chi \text { cdf (lower limit, } 1 \mathrm{E} 99, d f )\)

    Usando R:\(1-\text { pchisq }\left(x^{2}, d f\right)\)

    Donde se encuentran los grados de libertad\(d f=(\# \text { of rows }-1) *(\# \text { of columns }-1)\)

    4. Conclusión

    Aquí es donde escribes rechazar\(H_{o}\) o no rechazas\(H_{o}\). La regla es: si el valor p <\(\alpha\), entonces rechazar\(H_{o}\). Si el valor p\(\geq \alpha\), entonces no puede rechazar\(H_{o}\).

    5. Interpretación

    Aquí es donde interpretas en términos del mundo real la conclusión a la prueba. La conclusión para una prueba de hipótesis es que o bien tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad, o no tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad.

    Ejemplo\(\PageIndex{1}\) hypothesis test with chi-square test using formula

    ¿Existe una relación entre el autismo y la lactancia materna? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran en qué periodo de tiempo amamantaron a sus hijos. Los datos se encuentran en la tabla #11 .1.1 (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que la lactancia materna y el autismo son independientes? Prueba al nivel 1%.

    Autis261m Cronogramas de Lactancia Materna Total de fila
    Ninguno Menos de 2 meses 2 a 6 meses Más de 6 meses
    241 198 164 215 818
    No 20 25 27 44 116
    Total de Columna 261 223 191 259 934
    Tabla\(\PageIndex{1}\): Autismo versus lactancia

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación

    \(H_{o}\): La lactancia materna y el autismo son independientes

    \(H_{A}\): La lactancia materna y el autismo son dependientes

    \(\alpha\)= 0.01

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se tomó una muestra aleatoria de plazos de lactancia materna e incidencia de autismo.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. Todas las frecuencias esperadas son más de 5.

    3. Encuentra el estadístico de prueba y el valor p

    Estadística de prueba:

    Primero encuentra las frecuencias esperadas para cada celda

    \(E(\text { Autism and no breastfeeding })=\dfrac{818^{*} 261}{934} \approx 228.585\)

    \(E(\text { Autism and }<2 \text { months })=\dfrac{818^{*} 223}{934} \approx 195.304\)

    \(E(\text { Autism and } 2 \text { to } 6 \text { months })=\dfrac{818^{*} 191}{934} \approx 167.278\)

    \(E(\text { Autism and more than } 6 \text { months })=\dfrac{818 * 259}{934} \approx 226.833\)

    Otros se hacen de manera similar. Es más fácil hacer los cálculos para el estadístico de prueba con una tabla, los demás están en la tabla #11 .1.2 junto con el cálculo para el estadístico de prueba. (Nota: la columna de O-E debe agregar a 0 o cerca de 0.)

    O E O-E \((O-E)^{2}\) \((O-E)^{2} / E\)
    241 228.585 12.415 \ ((O-E) ^ {2}\) ">154.132225 \ ((O-E) ^ {2}/E\) ">0.674288448
    198 195.304 2.696 \ ((O-E) ^ {2}\) ">7.268416 \ ((O-E) ^ {2}/E\) ">0.03721591
    164 167.278 -3.278 \ ((O-E) ^ {2}\) ">10.745284 \ ((O-E) ^ {2}/E\) ">0.064236086
    215 226.833 -11.833 \ ((O-E) ^ {2}\) ">140.019889 \ ((O-E) ^ {2}/E\) ">0.617281828
    20 32.4154 -12.4154 \ ((O-E) ^ {2}\) ">154.1421572 \ ((O-E) ^ {2}/E\) ">4.755213792
    25 27.6959 -2.6959 \ ((O-E) ^ {2}\) ">7.26787681 \ ((O-E) ^ {2}/E\) ">0.262417066
    27 23.7216 3.2784 \ ((O-E) ^ {2}\) ">10.74790656 \ ((O-E) ^ {2}/E\) ">0.453085229
    44 32.167 11.833 \ ((O-E) ^ {2}\) ">140.019889 \ ((O-E) ^ {2}/E\) ">4.352904809
    Total 0.0001 \ ((O-E) ^ {2}\) "> \ ((O-E) ^ {2}/E\) ">11.2166432 =\(\chi^{2}\)
    Tabla\(\PageIndex{2}\): Cálculos para el estadístico de prueba de Chi-cuadrado

    La fórmula estadística de prueba es\(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\), que es el total de la última columna en Ejemplo\(\PageIndex{2}\).

    valor p:

    \(d f=(2-1)^{*}(4-1)=3\)

    Usando TI-83/84:\(\chi \operatorname{cdf}(11.2166432,1 \mathrm{E} 99,3) \approx 0.01061\)

    Usando R:\(1-\text{pchisq}(11.2166432,3) \approx 0.01061566\)

    4. Conclusión

    No se puede rechazar\(H_{o}\) ya que el valor p es superior a 0.01.

    5. Interpretación

    No hay evidencia suficiente para demostrar que la lactancia materna y el autismo son dependientes. Esto significa que no se puede decir que el si un niño es amamantado o no indicará si ese niño será diagnosticado con autismo.

    Ejemplo\(\PageIndex{2}\) hypothesis test with chi-square test using technology

    ¿Existe una relación entre el autismo y la lactancia materna? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran en qué periodo de tiempo amamantaron a sus hijos. Los datos están en Example\(\PageIndex{1}\) (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que la lactancia materna y el autismo son independientes? Prueba al nivel 1%.

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación

    \(H_{o}\): La lactancia materna y el autismo son independientes

    \(H_{A}\): La lactancia materna y el autismo son dependientes

    \(\alpha\)= 0.01

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se tomó una muestra aleatoria de plazos de lactancia materna e incidencia de autismo.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. Todas las frecuencias esperadas son más de 5.

    3. Encuentra el estadístico de prueba y el valor p

    Estadística de prueba:

    Para utilizar la calculadora TI-83/84 para calcular el estadístico de prueba, primero debes poner los datos en la calculadora. Sin embargo, este proceso es diferente al de otras pruebas de hipótesis. Es necesario poner los datos como una matriz en lugar de en la lista. Entra en el menú MATRX luego pasa a EDITAR y elige 1: [A]. Esto le permitirá escribir la tabla en la calculadora. La figura\(\PageIndex{2}\) muestra lo que verás en tu calculadora cuando elijas 1: [A] en el menú EDITAR.

    Captura de pantalla (214) .png
    Figura\(\PageIndex{2}\): Menú de edición de matriz en TI-83/84

    La tabla tiene 2 filas y 4 columnas (no incluya la columna total de fila y la fila total de columna en su conteo). Necesitas decirle a la calculadora que tienes un 2 por 4. El 1 X1 (podrías tener otro tamaño en tu matriz, pero no importa porque lo cambiarás) en la calculadora es el tamaño de la matriz. Entonces escriba 2 ENTRAR y 4 ENTRAR y la calculadora hará una matriz del tamaño correcto. Ver Figura\(\PageIndex{3}\).

    Captura de pantalla (215) .png
    Figura\(\PageIndex{3}\): Configuración de matriz para mesa

    Ahora escriba la tabla presionando ENTRAR después de cada valor de celda. La figura\(\PageIndex{4}\) contiene la tabla completa escrita. Una vez que tenga los datos en, presione QUIT.

    Captura de pantalla (216) .png
    Figura\(\PageIndex{4}\): Datos mecanografiados en Matrix

    Para ejecutar la prueba en la calculadora, vaya a STAT, luego pase a PRUEBA y elija\(\chi^{2}\) -Prueba de la lista. La configuración para la prueba está en la Figura\(\PageIndex{5}\).

    Captura de pantalla (217) .png
    Figura\(\PageIndex{5}\): Configuración para Prueba de Chi-Cuadrado en TI-83/84

    Una vez que presione ENTRAR en Calcular verá los resultados en la Figura\(\PageIndex{6}\).

    Captura de pantalla (218) .png
    Figura\(\PageIndex{6}\): Resultados para la prueba de Chi-cuadrado en TI-83/84

    El estadístico de prueba es\(\chi^{2} \approx 11.2167\) y el valor p es\(p \approx 0.01061\). Observe que la calculadora calcula los valores esperados por usted y los coloca en la matriz B. Para visualizar los valores esperados, vaya a MATRX y elija 2: [B]. La figura\(\PageIndex{7}\) muestra la salida. Presiona las flechas de la derecha para ver toda la matriz.

    Captura de pantalla (219) .png
    Figura\(\PageIndex{7}\): Frecuencia esperada para la prueba de Chi-cuadrado en TI-83/84

    Para calcular el estadístico de prueba y el valor p con R,
    fila1 = c (datos de la fila 1 separados por comas)
    fila2 = c (datos de la fila 2 separados por comas)
    continúa hasta que tengas todas tus filas ingresadas.
    data.table = rbind (row1, row2,...) — convierte los datos en una tabla. Puedes llamarlo como siempre quieras. No tiene que ser data.table.
    data.table — usa si quieres mirar la tabla
    chisq.test (data.table) — calcula la prueba chi-cuadrada para la independencia
    chisq.test (data.table) $esperado — vamos a ver los valores esperados

    Para este ejemplo, los comandos serían
    fila1 = c (241, 198, 164, 215)
    fila2 = c (20, 25, 27, 44)
    datos.table = rbind (row1, row2)
    datos.table

    Salida:
    [,1] [,2] [,3] [,4]
    fila1 241 198 164 215
    fila2 20 25 27 44

    chisq.test (data.table)

    Salida: Prueba de Chi-cuadrado de
    Pearson

    datos: datos.tabla
    X-cuadrado = 11.217, df = 3, valor p = 0.01061

    chisq.test (data.table) $ esperado

    Salida: [,1] [,2] [,3] [,4]
    fila1 228.58458 195.30407 167.27837 226.83298
    fila2 32.41542 27.69593 23.72163 32.16702

    El estadístico de prueba es\(\chi^{2} \approx 11.217\) y el valor p es\(p \approx 0.01061\).

    4. Conclusión

    No se puede rechazar\(H_{o}\) ya que el valor p es superior a 0.01.

    5. Interpretación

    No hay evidencia suficiente para demostrar que la lactancia materna y el autismo son dependientes. Esto significa que no se puede decir que el si un niño es amamantado o no indicará si ese niño será diagnosticado con autismo.

    Ejemplo\(\PageIndex{3}\) hypothesis test with chi-square test using formula

    La Organización Mundial de la Salud (OMS) realiza un seguimiento de cuántos incidentes de lepra hay en el mundo. Utilizando las regiones de la OMS y los grupos de ingresos de los Bancos Mundiales, se puede preguntar si un nivel de ingresos y una región de la OMS dependen entre sí en términos de predecir dónde está la enfermedad. Se recolectaron datos sobre casos de lepra en diferentes países para el año 2011 y se presenta un resumen en la Tabla\(\PageIndex{3}\) (“Lepra: Número de”, 2013). ¿Hay evidencia que demuestre que el nivel de ingresos y la región de la OMS son independientes cuando se trata de la enfermedad de la lepra? Prueba al nivel del 5%.

    Región OMS Grupo de Ingresos del Banco Mundial Total de fila
    Ingresos altos Ingresos medios altos Renta Media Baja Bajos ingresos
    Américas 174 36028 615 0 36817
    Mediterránea Oriental 54 6 1883 604 2547
    Europa 10 0 0 0 10
    Pacífico Occidental 26 216 3689 1155 5086
    África 0 39 1986 15928 17953
    Sudeste Asiático 0 0 149896 10236 160132
    Total de Columna 264 36289 158069 27923 222545
    Tabla\(\PageIndex{3}\): Número de casos de lepra

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación

    \(H_{o}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son independientes

    \(H_{A}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son dependientes

    \(\alpha\)= 0.05

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se tomó una muestra aleatoria de incidencia de lepra de diferentes países y se tomó el nivel de ingresos y la región de la OMS.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. En realidad hay 4 frecuencias esperadas que son menores a 5, y los resultados de la prueba pueden no ser válidos. Si miras las frecuencias esperadas notarás que todas están en Europa. Esto se debe a que Europa no tuvo muchos casos en 2011.

    3. Encuentra el estadístico de prueba y el valor p

    Estadística de prueba:

    Primero encuentra las frecuencias esperadas para cada celda.

    \(E(\text { Americas and High Income })=\dfrac{36817 * 264}{222545} \approx 43.675\)

    \(E(\text { Americas and Upper Middle Income })=\dfrac{36817 * 36289}{222545} \approx 6003.514\)

    \(E (\text { Americas and Lower Middle Income) }=\dfrac{36817 * 158069}{222545} \approx 26150.335\)

    \(E(\text { Americas and Lower Income })=\dfrac{36817 * 27923}{222545} \approx 4619.475\)

    Otros se hacen de manera similar. Es más fácil hacer los cálculos para el estadístico de prueba con una tabla, y los demás están en Ejemplo\(\PageIndex{4}\) junto con el cálculo para el estadístico de prueba.

    O E O-E \((O-E)^{2}\) \((O-E)^{2} / E\)
    174 43.675 130.325 \ ((O-E) ^ {2}\) ">16984.564 \ ((O-E) ^ {2}/E\) ">388.8838719
    54 3.021 50.979 \ ((O-E) ^ {2}\) ">2598.813 \ ((O-E) ^ {2}/E\) ">860.1218328
    10 0.012 9.988 \ ((O-E) ^ {2}\) ">99.763 \ ((O-E) ^ {2}/E\) ">8409.746711
    26 6.033 19.967 \ ((O-E) ^ {2}\) ">398.665 \ ((O-E) ^ {2}/E\) ">66.07628214
    0 21.297 -21.297 \ ((O-E) ^ {2}\) ">453.572 \ ((O-E) ^ {2}/E\) ">21.29722977
    0 189.961 -189.961 \ ((O-E) ^ {2}\) ">36085.143 \ ((O-E) ^ {2}/E\) ">189.9608978
    36028 6003.514 30024.486 \ ((O-E) ^ {2}\) ">901469735.315 \ ((O-E) ^ {2}/E\) ">150157.0038
    6 415.323 -409.323 \ ((O-E) ^ {2}\) ">167545.414 \ ((O-E) ^ {2}/E\) ">403.4097962
    0 1.631 -1.631 \ ((O-E) ^ {2}\) ">2.659 \ ((O-E) ^ {2}/E\) ">1.6306365
    216 829.342 -613.342 \ ((O-E) ^ {2}\) ">376188.071 \ ((O-E) ^ {2}/E\) ">453.5983897
    39 2927.482 -2888.482 \ ((O-E) ^ {2}\) ">8343326.585 \ ((O-E) ^ {2}/E\) ">2850.001268
    0 26111.708 -26111.708 \ ((O-E) ^ {2}\) ">681821316.065 \ ((O-E) ^ {2}/E\) ">26111.70841
    615 26150.335 -25535.335 \ ((O-E) ^ {2}\) ">652053349.724 \ ((O-E) ^ {2}/E\) ">24934.7988
    1883 1809.080 73.290 \ ((O-E) ^ {2}\) ">5464.144 \ ((O-E) ^ {2}/E\) ">3.020398811
    0 7.103 -7.103 \ ((O-E) ^ {2}\) ">50.450 \ ((O-E) ^ {2}/E\) ">7.1027882
    3689 3612.478 76.522 \ ((O-E) ^ {2}\) ">5855.604 \ ((O-E) ^ {2}/E\) ">1.620938405
    1986 12751.636 -10765.636 \ ((O-E) ^ {2}\) ">115898911.071 \ ((O-E) ^ {2}/E\) ">9088.944681
    149896 113738.368 36157.632 \ ((O-E) ^ {2}\) ">1307374351.380 \ ((O-E) ^ {2}/E\) ">11494.57632
    0 4619.475 -4619.475 \ ((O-E) ^ {2}\) ">21339550.402 \ ((O-E) ^ {2}/E\) ">4619.475122
    604 319.575 284.425 \ ((O-E) ^ {2}\) ">80897.421 \ ((O-E) ^ {2}/E\) ">253.1404187
    0 1.255 -1.255 \ ((O-E) ^ {2}\) ">1.574 \ ((O-E) ^ {2}/E\) ">1.25471253
    1155 638.147 516.853 \ ((O-E) ^ {2}\) ">267137.238 \ ((O-E) ^ {2}/E\) ">418.6140882
    15928 2252.585 13675.415 \ ((O-E) ^ {2}\) ">187016964.340 \ ((O-E) ^ {2}/E\) ">83023.25138
    10236 20091.963 -9855.963 \ ((O-E) ^ {2}\) ">97140000.472 \ ((O-E) ^ {2}/E\) ">4834.769106
    Total 0.000 \ ((O-E) ^ {2}\) "> \ ((O-E) ^ {2}/E\) ">328594.008 =\(\chi^{2}\)
    Tabla\(\PageIndex{4}\): Cálculos para el estadístico de prueba de Chi-cuadrado

    La fórmula estadística de prueba es\(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\), que es el total de la última columna en Ejemplo\(\PageIndex{2}\).

    valor p:

    \(d f=(6-1) *(4-1)=15\)

    Usando el TI-83/84:\(\chi \operatorname{cdf}(328594.008,1 \mathrm{E} 99,15) \approx 0\)

    Usando R:\(1-\text { pchisq }(328594.008,15) \approx 0\)

    4. Conclusión

    Rechazar\(H_{o}\) ya que el valor p es menor a 0.05.

    5. Interpretación

    Existe evidencia suficiente para demostrar que la región de la OMS y el nivel de ingresos son dependientes cuando se trata de la enfermedad de la lepra. La OMS puede decidir cómo enfocar sus esfuerzos en función de la región y el nivel de ingresos. Sin embargo, recuerde que los resultados pueden no ser válidos debido a que las frecuencias esperadas no son todas superiores a 5.

    Ejemplo\(\PageIndex{4}\) hypothesis test with chi-square test using technology

    La Organización Mundial de la Salud (OMS) realiza un seguimiento de cuántos incidentes de lepra hay en el mundo. Utilizando las regiones de la OMS y los grupos de ingresos de los Bancos Mundiales, se puede preguntar si un nivel de ingresos y una región de la OMS dependen entre sí en términos de predecir dónde está la enfermedad. Se recolectaron datos sobre casos de lepra en diferentes países para el año 2011 y se presenta un resumen en la Tabla\(\PageIndex{3}\) (“Lepra: Número de”, 2013). ¿Hay evidencia que demuestre que el nivel de ingresos y la región de la OMS son independientes cuando se trata de la enfermedad de la lepra? Prueba al nivel del 5%.

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación
    \(H_{o}\): la región de la OMS y el Nivel de Ingresos al tratar la enfermedad de la lepra son independientes

    \(H_{A}\): Región de la OMS y Nivel de Ingresos al tratar la enfermedad de la lepra son dependientes

    \(\alpha\)= 0.05

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se tomó una muestra aleatoria de incidencia de lepra de diferentes países y se tomó el nivel de ingresos y la región de la OMS.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (es decir. \(E \geq 5\)). Ver paso 3. En realidad hay 4 frecuencias esperadas que son menores a 5, y los resultados de la prueba pueden no ser válidos. Si miras las frecuencias esperadas notarás que todas están en Europa. Esto se debe a que Europa no tuvo muchos casos en 2011.

    3. Encuentre el estadístico de prueba y el valor p Estadística de
    prueba:
    Usando el TI-83/84. Ver Ejemplo\(\PageIndex{2}\) para el proceso de hacer la prueba en la calculadora. Recuerda, necesitas poner los datos como una matriz en lugar de en la lista.

    Captura de pantalla (220) .png
    Figura\(\PageIndex{8}\): Configuración para Matrix en TI-83/84
    Captura de pantalla (221) .png
    Figura\(\PageIndex{9}\): Resultados para la prueba de Chi-cuadrado en TI-83/84

    \(\chi^{2} \approx 328594.0079\)

    Captura de pantalla (222) .png
    Figura\(\PageIndex{10}\): Frecuencia esperada para la prueba de Chi-cuadrado en TI-83/84

    Presiona la flecha derecha para ver las otras frecuencias esperadas.

    valor p:

    \(p-\text {value} \approx 0\)

    Usando R:
    fila1 = c (174, 36028, 615, 0)
    fila2=c (54, 6, 1883, 604)
    fila3=c (10, 0, 0, 0)
    fila4=c (26, 216, 3689, 1155)
    fila5=c (0, 39, 1986, 15928)
    fila6=c (0, 0, 149896, 10236)
    chisq.test (data.table)

    Prueba de Chi-cuadrado de Pearson

    datos: datos.tabla
    X-cuadrado = 328590, df = 15, valor p < 2.2e-16

    Mensaje de advertencia:
    En chisq.test (data.table): La aproximación Chi-cuadrada puede ser incorrecta

    chisq.test (data.table) $ esperado

    \(\begin{array} {ccccc} {}&{[,1]}&{[,2]}&{[,3]}&{[,4]} \\ {\text{row1}}&{43.67515783}&{6003.514404}&{2.615034e+04}&{4619.475122}\\{\text{row2}}&{3.02144735}&{415.323117}&{1.809080e+03}&{319.575281}\\ {\text{row3}}&{0.01186277}&{1.630637}&{7.102788e+00}&{1.254713}\\{\text{row4}}&{6.03340448}&{829.341724}&{3.612478e+03}&{638.146793}\\{\text{row5}}&{21.29722977}&{2927.481709}&{1.275164e+04}&{2252.585405}\\{\text{row6}}&{189.96089780}&{26111.708410}&{1.137384e+05}&{20091.962686} \end{array}\)

    Mensaje de advertencia:
    En chisq.test (data.table): La aproximación Chi-cuadrada puede ser incorrecta

    \(\chi^{2}=328590\)y valor p =\(2.2 \times 10^{-16}\)

    4. Conclusión

    Rechazar\(H_{o}\) ya que el valor p es menor a 0.05.

    5. Interpretación

    Existe evidencia suficiente para demostrar que la región de la OMS y el nivel de ingresos son dependientes cuando se trata de la enfermedad de la lepra. La OMS puede decidir cómo enfocar sus esfuerzos en función de la región y el nivel de ingresos. Sin embargo, recuerde que los resultados pueden no ser válidos debido a que las frecuencias esperadas no son todas superiores a 5.

    Tareas

    Ejercicio\(\PageIndex{1}\)

    En cada problema se muestran todos los pasos de la prueba de hipótesis. Si no se cumplen algunos de los supuestos, tenga en cuenta que los resultados de la prueba pueden no ser correctos y luego continuar el proceso de la prueba de hipótesis.

    1. El número de personas que sobrevivieron al Titanic según la clase y el sexo está en Ejemplo\(\PageIndex{5}\) (“Enciclopedia Titánica”, 2013). ¿Hay pruebas suficientes para demostrar que la clase y el sexo de una persona que sobrevivió al Titanic son independientes? Prueba al nivel del 5%.
      Clase Sexo Total
      Hembra Macho
      1r 134 59 193
      2do 94 25 119
      3er 80 58 138
      Total 308 142 450
      Tabla\(\PageIndex{5}\): Sobreviviendo al Titanic
    2. Los investigadores observaron grupos de delfines frente a la costa de Irlanda en 1998 para determinar en qué actividades participan los delfines en ciertos momentos del día (“Actividades del delfín”, 2013). Los números en Ejemplo\(\PageIndex{6}\) representan el número de grupos de delfines que estaban participando en una actividad en ciertos momentos de los días. ¿Hay pruebas suficientes para demostrar que la actividad y el periodo de tiempo son independientes para los delfines? Prueba al nivel del 1%.

      Actividad Periodo Total de fila
      Mañana Mediodía Tarde Tarde
      Viajes 6 6 14 13 39
      Feed 28 4 0 56 88
      Social 38 5 9 10 62
      Total de Columna 72 15 23 79 189
      Tabla\(\PageIndex{6}\): Actividad de Delfines
    3. ¿Existe una relación entre el autismo y lo que se alimenta a un infante? Para determinar si la hay, un investigador pidió a madres de niños autistas y no autistas que dijeran lo que alimentaban a su infante. Los datos están en Example\(\PageIndex{7}\) (Schultz, Klonoff-Cohen, Wingard, Askhoomoff, Macera, Ji & Bacher, 2006). ¿Los datos proporcionan evidencia suficiente para demostrar que lo que se alimenta a un infante y el autismo son independientes? Prueba al nivel del 1%.

      Autismo Alimentación Total de fila
      Lactancia materna Fórmula con DHA/ARA Fórmula sin DRA/ARA
      12 39 65 116
      No 6 22 10 38
      Total de Columna 18 61 75 164
      Tabla\(\PageIndex{7}\): Autismo versus lactancia
    4. El nivel educativo y el grupo de edad de una persona fueron recolectados por la Oficina del Censo de Estados Unidos en 1984 para ver si el grupo de edad y el nivel educativo están relacionados. Los conteos en miles están en Ejemplo\(\PageIndex{8}\) (“Educación por edad”, 2013). ¿Los datos muestran que el logro educativo y la edad son independientes? Prueba al nivel del 5%.

      Educación Grupo de edad Total de fila
      25-34 35-44 45-54 55-64 >64
      No completó HS 5416 5030 5777 7606 13746 37575
      HS Finalizado 16431 1855 9435 8795 7558 44074
      Colegio 1-3 años 8555 5576 3124 2524 2503 22282
      Colegio 4 o más años 9771 7596 3904 3109 2483 26863
      Total de Columna 40173 20057 22240 22034 26290 130794
      Tabla\(\PageIndex{8}\): Logro Educativo y Grupo de Edad
    5. A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importantes eran las buenas calificaciones para ellos (1 muy importante y 4 menos importantes). Los datos están en Ejemplo\(\PageIndex{9}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia de las calificaciones son independientes? Prueba al nivel del 5%.

      Gol Calificación de importancia de calificaciones Total de fila
      1 2 3 4
      Grados 70 66 55 56 247
      Popular 14 33 45 49 141
      Deportes 10 24 33 23 90
      Total de Columna 94 123 133 128 478
      Tabla\(\PageIndex{9}\): Meta Personal e Importancia de los Grados
    6. A los alumnos de escuelas de primaria múltiple se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era para ellos ser bueno en el deporte (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{10}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia del deporte son independientes? Prueba al nivel del 5%.

      Gol Calificación de Importancia Deportiva Total de fila
      1 2 3 4
      Grados 83 81 55 28 247
      Popular 32 49 43 17 141
      Deportes 50 24 14 2 90
      Total de Columna 165 154 112 47 478
      Tabla\(\PageIndex{10}\): Meta Personal e Importancia del Deporte
    7. A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era para ellos tener buena apariencia (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{11}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia de las miradas son independientes? Prueba al nivel del 5%.

      Gol Looks Calificación de Importancia Total de fila
      1 2 3 4
      Grados 80 66 66 35 247
      Popular 81 30 18 12 141
      Deportes 24 30 17 19 90
      Total de Columna 185 126 101 66 478
      Tabla\(\PageIndex{11}\): Meta personal e importancia de las miradas
    8. A los alumnos de escuelas múltiples se les preguntó cuál era su objetivo personal (obtener buenas calificaciones, ser popular, ser bueno en los deportes) y qué tan importante era tener dinero para ellos (1 muy importante y 4 menos importante). Los datos están en Ejemplo\(\PageIndex{12}\) (“Archivo de datos para niños populares”, 2013). ¿Los datos proporcionan evidencia suficiente para demostrar que el logro de metas y la importancia del dinero son independientes? Prueba al nivel del 5%.

      Gol Calificación de Importancia de Dinero Total de fila
      1 2 3 4
      Grados 14 34 71 128 247
      Popular 14 29 35 63 141
      Deportes 6 12 26 46 90
      Total de Columna 34 75 132 237 478
      Tabla\(\PageIndex{12}\): Meta personal e importancia del dinero
    Contestar

    Para todas las pruebas de hipótesis, solo se da la conclusión. Ver soluciones para toda la respuesta.

    1. Rechazar Ho

    3. Rechazar Ho

    5. Rechazar Ho

    7. Rechazar Ho


    This page titled 11.1: Prueba de Chi-Cuadrado para la Independencia is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.