Saltar al contenido principal
LibreTexts Español

11.2: Chi-Cuadrado Bondad de Ajuste

  • Page ID
    149670
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En probabilidad, calculaste probabilidades utilizando métodos tanto experimentales como teóricos. Hay momentos en los que es importante determinar qué tan bien coinciden los valores experimentales con los valores teóricos. Un ejemplo de esto es si deseas verificar si un dado es justo. Para determinar si los valores observados se ajustan a los valores esperados, desea ver si la diferencia entre los valores observados y los valores esperados es lo suficientemente grande como para decir que es poco probable que ocurra el estadístico de prueba si asume que los valores observados se ajustan a los valores esperados. El estadístico de prueba en este caso también es el chi-cuadrado. El proceso es el mismo que para la prueba de chi-cuadrado para la independencia.

    Prueba de hipótesis para la prueba de bondad de ajuste

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación
      \(H_{o}\): Los datos son consistentes con una distribución específica
      \(H_{A}\): Los datos no son consistentes con una distribución específica
      También, indique su\(\alpha\) nivel aquí.
    2. Indicar y verificar los supuestos para la prueba de hipótesis
      1. Se toma una muestra aleatoria.
      2. Las frecuencias esperadas para cada celda son mayores o iguales a 5 (Las frecuencias esperadas, E, se calcularán posteriormente, y esta suposición significa\(E \geq 5\)).
    3. Encontrar el estadístico de prueba y el valor p
      Encontrar el estadístico de prueba implica varios pasos. Primero se recopilan y cuentan los datos, y luego se organizan en una tabla (en una tabla cada entrada se llama celda). Estos valores se conocen como las frecuencias observadas, cuyo símbolo para una frecuencia observada es O. El cuadro está conformado por k entradas. El número total de frecuencias observadas es n. Las frecuencias esperadas se calculan multiplicando la probabilidad de cada entrada, p, por n.

    \(\text{Expected frequency( entry }i )=E=n^{*} p\)

    Estadística de prueba:

    \(\chi^{2}=\sum \dfrac{(O-E)^{2}}{E}\)

    donde O es la frecuencia observada y E es la frecuencia esperada.

    Nuevamente, el estadístico de prueba implica cuadrar las diferencias, por lo que las estadísticas de prueba son todas positivas. Por lo tanto, una prueba de chi-cuadrado para la bondad de ajuste siempre tiene la cola correcta.

    valor p:

    Usando el TI-83/84:\(\chi \text { cdf }(\text { lower limit, } 1 \mathrm{E} 99, d f)\)

    Usando R:\(1-\text { pchisq }\left(\chi^{2}, d f\right)\)

    Donde los grados de libertad es df = k - 1

    4. Conclusión

    Aquí es donde escribes rechazar\(H_{o}\) o no rechazas\(H_{o}\). La regla es: si el valor p <\(\alpha\), entonces rechazar\(H_{o}\). Si el valor p\(\geq \alpha\), entonces no puede rechazar\(H_{o}\),

    5. Interpretación

    Aquí es donde interpretas en términos del mundo real la conclusión a la prueba. La conclusión para una prueba de hipótesis es que o bien tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad, o no tienes suficiente evidencia para demostrar que\(H_{A}\) es verdad.

    Ejemplo\(\PageIndex{1}\) goodness of fit test using the formula

    Supongamos que tienes un dado que tienes curiosidad si es justo o no. Si es justo entonces la proporción para cada valor debe ser la misma. Necesitas encontrar las frecuencias observadas y para lograrlo haces rodar el dado 500 veces y contar la frecuencia con la que sube cada lado. Los datos están en Ejemplo\(\PageIndex{1}\). ¿Los datos muestran que el dado es justo? Prueba al nivel del 5%.

    Valores de troqueles 1 2 3 4 5 6 Total
    Frecuencia Observada 78 87 87 76 85 87 100
    Tabla\(\PageIndex{1}\): Frecuencias observadas de troqueles

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación

    \(H_{o}\): Las frecuencias observadas son consistentes con la distribución para el dado justo (el dado es justo)

    \(H_{A}\): Las frecuencias observadas no son consistentes con la distribución para el dado justo (el dado no es justo)

    \(\alpha\)= 0.05

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se toma una muestra aleatoria ya que cada lanzamiento de un dado es un evento aleatorio.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5. Ver paso 3.

    3. Encuentra el estadístico de prueba y el valor p

    Primero necesitas encontrar la probabilidad de rodar cada lado del dado. El espacio de muestra para enrollar una matriz es {1, 2, 3, 4, 5, 6}. Ya que estás asumiendo que el dado es justo, entonces\(P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=\dfrac{1}{6}\).

    Ahora puedes encontrar la frecuencia esperada para cada lado del dado. Dado que todas las probabilidades son iguales, entonces cada frecuencia esperada es la misma.

    \(\text{Expected Frequency} =E=n^{*} p=500 * \dfrac{1}{6} \approx 83.33\)

    Estadística de prueba:

    Es más fácil calcular el estadístico de prueba usando una tabla.

    O E O-E \((O-E)^{2}\) \(\dfrac{(O-E)^{2}}{E}\)
    78 83.33 -5.22 \ ((O-E) ^ {2}\) ">28.4089 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.340920437
    87 83.33 3.67 \ ((O-E) ^ {2}\) ">13.4689 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.161633265
    87 83.33 3.67 \ ((O-E) ^ {2}\) ">13.4689 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.161633265
    76 83.33 -7.33 \ ((O-E) ^ {2}\) ">53.7289 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.644772591
    85 83.33 1.67 \ ((O-E) ^ {2}\) ">2.7889 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.033468139
    87 83.33 3.67 \ ((O-E) ^ {2}\) ">13.4689 \ (\ dfrac {(O-E) ^ {2}} {E}\) ">0.161633265
    Total 0.02 \ ((O-E) ^ {2}\) "> \ (\ dfrac {(O-E) ^ {2}} {E}\) ">\(\chi^{2} \approx 1.504060962\)
    Tabla\(\PageIndex{2}\): Cálculo del estadístico de prueba de Chi-cuadrado

    El estadístico de prueba es\(\chi^{2} \approx 1.504060962\)

    Los grados de libertad son df = k - 1 = 6 - 1 = 5

    Usando TI-83/84:\(p-\text {value}=\chi^{2} \operatorname{cdf}(1.50406096,1 E 99,5) \approx 0.913\)

    Usando R:\(p-\text {value}=1-\text { pchisq }(1.50406096,5) \approx 0.9126007\)

    4. Conclusión

    No se puede rechazar\(H_{o}\) ya que el valor p es mayor que 0.05.

    5. Interpretación

    No hay pruebas suficientes para demostrar que el dado no es consistente con la distribución para un dado justo. No hay pruebas suficientes para demostrar que el dado no es justo.

    Ejemplo\(\PageIndex{2}\) goodness of fit test using technology

    Supongamos que tienes un dado que tienes curiosidad si es justo o no. Si es justo entonces la proporción para cada valor debe ser la misma. Necesitas encontrar las frecuencias observadas y para lograrlo haces rodar el dado 500 veces y contar la frecuencia con la que sube cada lado. Los datos están en Ejemplo\(\PageIndex{1}\). ¿Los datos muestran que el dado es justo? Prueba al nivel del 5%.

    Solución

    1. Indicar las hipótesis nulas y alternativas y el nivel de significación

    \(H_{o}\): Las frecuencias observadas son consistentes con la distribución para el dado justo (el dado es justo)

    \(H_{A}\): Las frecuencias observadas no son consistentes con la distribución para el dado justo (el dado no es justo)

    \(\alpha\)= 0.05

    2. Indicar y verificar los supuestos para la prueba de hipótesis

    1. Se toma una muestra aleatoria ya que cada lanzamiento de un dado es un evento aleatorio.
    2. Las frecuencias esperadas para cada celda son mayores o iguales a 5. Ver paso 3.

    3. Encuentra el estadístico de prueba y el valor p

    Usando la calculadora TI-83/84:

    Usando el TI-83:

    Para utilizar la calculadora TI-83 para calcular el estadístico de prueba, primero debes poner los datos en la calculadora. Escriba las frecuencias observadas en L1 y las frecuencias esperadas en L2. Entonces tendrás que ir a L3, con la flecha hacia arriba sobre el nombre y escribir\((L 1-L 2)^{\wedge} 2 / L 2\). Ahora usa 1-Var Stats L3 para encontrar el total. Ver Figura\(\PageIndex{1}\) para la configuración inicial, Figura 11.2 .2 para los resultados de ese cálculo, y Figura\(\PageIndex{3}\) para el resultado de las Estadísticas 1-Var L3.

    Captura de pantalla (223) .png
    Figura\(\PageIndex{1}\): Entrada en TI-83
    Captura de pantalla (224) .png
    Figura\(\PageIndex{2}\): Resultado para L3 en TI-83
    Captura de pantalla (225) .png
    Figura\(\PageIndex{3}\): 1-Var Stats L3 Resultado en TI-83

    El total es el valor de chi-cuadrado,\(\chi^{2}=\sum x \approx 1.50406\).

    El valor p se encuentra usando\(p-\text {value}=\chi^{2} \operatorname{cdf}(1.50406096,1 E 99,5) \approx 0.913\), donde los grados de libertad son df = k - 1 = 6 - 1 = 5.

    Usando el TI-84:

    Para ejecutar la prueba en el TI-84, escriba las frecuencias observadas en L1 y las frecuencias esperadas en L2, luego vaya a STAT, pase a TEST y elija\(\chi^{2}\) GOF-test de la lista. La configuración para la prueba está en la Figura\(\PageIndex{4}\).

    Captura de pantalla (226) .png
    Figura\(\PageIndex{4}\): Configuración para la prueba de bondad de ajuste de Chi-cuadrado en TI-84

    Una vez que presione ENTRAR en Calcular verá los resultados en la Figura\(\PageIndex{5}\).

    Captura (227) .png
    Figura\(\PageIndex{5}\): Resultados para la prueba de Chi-cuadrado en TI-83/84

    El estadístico de prueba es\(\chi^{2} \approx 1.504060962\)

    El valor p\(\approx 0.913\)

    El CNTRB representa el valor\(\dfrac{(O-E)^{2}}{E}\) para cada dado. Puedes ver los valores pulsando la flecha derecha.

    Usando R:

    Escriba las frecuencias observadas. Llámalo algo así como observado.
    observado<- c (escriba datos con comas en el medio)
    Escriba las probabilidades que esté comparando con las frecuencias observadas.
    Llámalo algo así como null.probs.
    null.probs <- c (escriba en probabilidades con comas en el medio)
    chisq.test (observado, p=null.probs) — el comando para la prueba de hipótesis
    Para este ejemplo (Nota ya que estás buscando ver si el dado es justo, entonces la probabilidad de que cada lado de un dado justo suba es 1/6.)
    observado<-c (78, 87, 87, 76, 85, 87)
    nulo.probs<-c (1/6, 1/6, 1/6, 1/6, 1/6, 1/6, 1/6)
    chisq.test (observado, p=null.probs)

    Salida: Prueba de
    Chi-cuadrado para probabilidades dadas

    data:
    X al cuadrado observado = 1.504, df = 5, valor p = 0.9126

    El estadístico de prueba es\(\chi^{2}=1.504\) y el valor p = 0.9126.

    4. Conclusión

    No se puede rechazar\(H_{o}\) ya que el valor p es mayor que 0.05.

    5. Interpretación

    No hay pruebas suficientes para demostrar que el dado no es consistente con la distribución para un dado justo. No hay pruebas suficientes para demostrar que el dado no es justo.

    Testo

    Ejercicio\(\PageIndex{1}\)

    En cada problema se muestran todos los pasos de la prueba de hipótesis. Si no se cumplen algunos de los supuestos, tenga en cuenta que los resultados de la prueba pueden no ser correctos y luego continuar el proceso de la prueba de hipótesis.

    1. De acuerdo con la compañía de dulces M&M, la proporción esperada se puede encontrar en Ejemplo\(\PageIndex{3}\). Además, la tabla contiene el número de M&M's de cada color que se encontraron en una caja de dulces (Madison, 2013). Al nivel del 5%, ¿las frecuencias observadas apoyan la afirmación de M&M?
      Azul Marrón Verde Naranja Rojo Amarillo Total
      Frecuencias observadas 481 371 483 544 372 369 2620
      Proporción esperada 0.24 0.13 0.16 0.20 0.13 0.14
      Tabla\(\PageIndex{3}\): M&M Observado y Proporciones
    2. Eyeglassomatic fabrica anteojos para diferentes minoristas. Prueban para ver cuántas lentes defectuosas hicieron el periodo de tiempo del 1 de enero al 31 de marzo. Ejemplo\(\PageIndex{4}\) da el defecto y el número de defectos. ¿Los datos apoyan la noción de que cada tipo de defecto ocurre en la misma proporción? Prueba al nivel del 10%.
      Tipo de defecto Número de defectos
      Rasguño 5865
      Forma derecha - pequeña 4613
      Descamado 1992
      Eje incorrecto 1838
      Chaflán incorrecto 1596
      agrietamiento, grietas 1546
      Forma incorrecta 1485
      PD incorrecto 1398
      Manchas y burbujas 1371
      Altura incorrecta 1130
      Forma derecha - grande 1105
      Perdido en laboratorio 976
      Manchas/Burbuja - pasante 976
      Tabla\(\PageIndex{4}\): Número de lentes defectuosos
    3. En ocasiones, los estudios médicos necesitan modelar la proporción de la población que tiene una enfermedad y compararla con las frecuencias observadas de la enfermedad que realmente ocurre. Supongamos que la insuficiencia renal terminal en el suroeste de Gales fue recolectada para diferentes grupos etarios. ¿Los datos de Ejemplo\(\PageIndex{5}\) muestran que las frecuencias observadas están de acuerdo con la proporción de personas en cada grupo de edad (Boyle, Flowerdew & Williams, 1997)? Prueba al nivel 1%.
      Grupo de edad 16-29 30-44 45-59 60-75 75+ Total
      Frecuencia Observada 32 66 132 218 91 539
      Proporción esperada 0.23 0.25 0.22 0.21 0.09
      Tabla\(\PageIndex{5}\): Frecuencias de Insuficiencia Renal
    4. En África en 2011, el número de muertes de una mujer por enfermedad cardiovascular para diferentes grupos de edad se encuentra en Ejemplo\(\PageIndex{6}\) (“Observatorio de salud global”, 2013). Además, la proporción de muertes de mujeres por todas las causas para los mismos grupos de edad también están en Ejemplo\(\PageIndex{6}\). ¿Los datos muestran que las muertes por enfermedad cardiovascular están en la misma proporción que todas las muertes para los diferentes grupos de edad? Prueba al nivel del 5%.
      Edad 5-14 15-29 30-49 50-69 Total
      Frecuencia Cardiovascular 9 16 56 433 513
      Proporción de todas las causas 0.10 0.12 0.26 0.52
      Tabla\(\PageIndex{6}\): Fallecimientos de mujeres para diferentes grupos de edad
    5. En Australia en 1995, se planteaba la cuestión de si los indígenas tienen más probabilidades de morir en prisión que los no indígenas. Para averiguarlo, se\(\PageIndex{7}\) recolectaron los datos en Ejemplo. (“Muertes aborígenes en”, 2013). ¿Los datos muestran que los indígenas mueren en la misma proporción que los no indígenas? Prueba al nivel 1%.
      Muere preso Prisionero No Murió Total
      Frecuencia de Prisioneros Indígenas 17 2890 2907
      Frecuencia de Preso No Indígena 42 14459 14501
      Tabla\(\PageIndex{7}\): Muerte de presos
    6. Un proyecto realizado por la Oficina Federal Australiana de Seguridad Vial hizo muchas preguntas a la gente sobre sus autos. Una pregunta fue la razón por la que una persona elige un automóvil determinado, y que los datos están en Ejemplo\(\PageIndex{8}\) (“Preferencias de autos”, 2013).
      Seguridad Confiabilidad Costo Desempeño Comodidad Looks
      84 62 46 34 47 27
      Tabla\(\PageIndex{8}\): Motivo para elegir un auto
    Responder

    Para todas las pruebas de hipótesis, solo se da la conclusión. Ver soluciones para toda la respuesta.

    1. Rechazar Ho

    3. Rechazar Ho

    5. Rechazar Ho


    This page titled 11.2: Chi-Cuadrado Bondad de Ajuste is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.