Saltar al contenido principal
LibreTexts Español

11.3: Prueba de bondad de ajuste

  • Page ID
    150779
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En este tipo de prueba de hipótesis, se determina si los datos “se ajustan” a una distribución particular o no. Por ejemplo, puede sospechar que sus datos desconocidos se ajustan a una distribución binomial. Se utiliza una prueba de chi-cuadrado (es decir, la distribución para la prueba de hipótesis es chi-cuadrado) para determinar si hay un ajuste o no. El nulo y las hipótesis alternativas para esta prueba pueden escribirse en oraciones o pueden afirmarse como ecuaciones o desigualdades.

    El estadístico de prueba para una prueba de bondad de ajuste es:

    \[\sum_{k} \frac{(O-E)^{2}}{E}\nonumber\]

    donde:

    • \(O\)= valores observados (datos)
    • \(E\)= valores esperados (de la teoría)
    • \(k\)= el número de celdas o categorías de datos diferentes

    Los valores observados son los valores de datos y los valores esperados son los valores que esperarías obtener si la hipótesis nula fuera verdadera. Hay n términos de la forma\(\frac{(O-E)^{2}}{E}\).

    El número de grados de libertad es\(df\) = (número de categorías — 1).

    La prueba de bondad de ajuste casi siempre es de cola derecha. Si los valores observados y los valores esperados correspondientes no están cerca uno del otro, entonces el estadístico de prueba puede llegar a ser muy grande y estará muy lejos en la cola derecha de la curva de chi-cuadrado.

    NOTA

    El número de valores esperados dentro de cada celda necesita ser de al menos cinco para poder utilizar esta prueba.

    Ejemplo\(\PageIndex{4}\)

    El ausentismo de los estudiantes universitarios de las clases de matemáticas es una preocupación importante para los instructores de matemáticas porque la falta de clase parece aumentar la tasa de caída. Supongamos que se realizó un estudio para determinar si la tasa real de ausentismo estudiantil sigue la percepción de la facultad. El profesorado esperaba que un grupo de 100 alumnos faltara a clase según Table\(\PageIndex{1}\).

    \ (\ PageIndex {1}\) “>
    Número de ausencias por término Número esperado de alumnos
    0—2 50
    3—5 30
    6—8 12
    9—11 6
    12+ 2
    Mesa\(\PageIndex{1}\)

    Luego se realizó una encuesta aleatoria en todos los cursos de matemáticas para determinar el número real (observado) de ausencias en un curso. El gráfico de la Tabla\(\PageIndex{2}\) muestra los resultados de esa encuesta.

    \ (\ PageIndex {2}\) “>
    Número de ausencias por término Número real de alumnos
    0—2 35
    3—5 40
    6—8 20
    9—11 1
    12+ 4
    Mesa\(\PageIndex{2}\)

    Determinar las hipótesis nulas y alternativas necesarias para realizar una prueba de bondad de ajuste.

    \(\bf{H_a}\): El absentismo estudiantil se ajusta a la percepción de la facultad.

    La hipótesis alternativa es la opuesta a la hipótesis nula.

    \(\bf{H_a}\): El ausentismo estudiantil no se ajusta a la percepción de la facultad.

    a. ¿Se puede utilizar la información tal y como aparece en las tablas para realizar la prueba de bondad de ajuste?

    Responder

    Solución 11.4

    a. No. Observe que el número esperado de ausencias para la entrada “12+” es menor a cinco (es dos). Combine ese grupo con el grupo “9—11" para crear nuevas tablas donde el número de alumnos para cada entrada sea de al menos cinco. Los nuevos resultados se encuentran en Tabla\(\PageIndex{3}\) y Tabla\(\PageIndex{4}\).

    \ (\ PageIndex {3}\) “>
    Número de ausencias por término Número esperado de alumnos
    0—2 50
    3—5 30
    6—8 12
    9+ 8

    Cuadro 11.3

    \ (\ PageIndex {4}\) “>
    Número de ausencias por término Número real de alumnos
    0—2 35
    3—5 40
    6—8 20
    9+ 5
    Mesa\(\PageIndex{4}\)

    b. ¿Cuál es el número de grados de libertad (\(df\))?

    Responder

    Solución 11.4

    b. Hay cuatro “celdas” o categorías en cada una de las nuevas tablas.

    \(d f=\text { number of cells }-1=4-1=3\)

    Ejercicio\(\PageIndex{4}\)

    Un gerente de fábrica necesita entender cuántos productos están defectuosos frente a cuántos se producen. El número de defectos esperados se enumera en la Tabla\(\PageIndex{5}\).

    \ (\ PageIndex {5}\) “>
    Número producido Número defectuoso
    0—100 5
    101—200 6
    201—300 7
    301—400 8
    401—500 10
    Mesa\(\PageIndex{5}\)

    Se tomó una muestra aleatoria para determinar el número real de defectos. En la tabla se\(\PageIndex{6}\) muestran los resultados de la encuesta.

    \ (\ PageIndex {6}\) “>
    Número producido Número defectuoso
    0—100 5
    101—200 7
    201—300 8
    301—400 9
    401—500 11
    Mesa\(\PageIndex{6}\)

    Indicar las hipótesis nulas y alternativas necesarias para realizar una prueba de bondad de ajuste, y declarar los grados de libertad.

    Ejemplo\(\PageIndex{5}\)

    Los empleadores quieren saber qué días de la semana los empleados están ausentes en una semana laboral de cinco días. A la mayoría de los empleadores les gustaría creer que los empleados están ausentes por igual durante la semana. Supongamos que se le preguntó a una muestra aleatoria de 60 directivos en qué día de la semana tuvieron el mayor número de ausencias de empleados. Los resultados se distribuyeron como en la Tabla\(\PageIndex{7}\). Para la población de empleados, ¿los días para el mayor número de ausencias ocurren con frecuencias iguales durante una semana laboral de cinco días? Prueba a un nivel de significancia del 5%.

    \ (\ PageIndex {7}\) Día de la semana Los empleados estuvieron más ausentes “>
    Lunes martes Miércoles jueves Viernes
    Número de ausencias 15 12 9 9 15
    Mesa\(\PageIndex{7}\) Día de la Semana Los empleados estuvieron más ausentes
    Responder

    Solución 11.5

    Las hipótesis nulas y alternativas son:

    • \(H_0\): Los días ausentes ocurren con frecuencias iguales, es decir, se ajustan a una distribución uniforme.
    • \(H_a\): Los días ausentes ocurren con frecuencias desiguales, es decir, no se ajustan a una distribución uniforme.

    Si los días ausentes ocurren con frecuencias iguales, entonces, de 60 días ausentes (el total en la muestra:\(15 + 12 + 9 + 9 + 15 = 60\)), habría 12 ausencias el lunes, 12 el martes, 12 el miércoles, 12 el jueves y 12 el viernes. Estos números son los valores esperados (\(E\)). Los valores en la tabla son los valores observados (\(O\)) o datos.

    Esta vez, calcula el estadístico de prueba\ chi2 a mano. Haz un gráfico con los siguientes encabezamientos y rellena las columnas:

    • Valores esperados (\(E\))\((12, 12, 12, 12, 12)\)
    • Valores observados\(O\) ()\((15, 12, 9, 9, 15)\)
    • \((O – E)\)
    • \((O – E)^2\)
    • \(\frac{(O-E)^{2}}{E}\)

    Ahora agregue (sum) la última columna. La suma es de tres. Este es el estadístico de\(\chi^2\) prueba.

    El estadístico de prueba calculado es 3 y el valor crítico de la\(\chi^2\) distribución a 4 grados de libertad el nivel 0.05 de confianza es 9.48. Este valor se encuentra en la\(\chi^2\) tabla en la columna 0.05 en la fila de grados de libertad 4.

    \(\text{The degrees of freedom are the number of cells }– 1 = 5 – 1 = 4\)

    A continuación, complete una gráfica como la siguiente con el etiquetado y sombreado adecuados. (Debe sombrear la cola derecha).

    Esta es una curva chi-cuadrada asimétrica en blanco para el estadístico de prueba de los días de la semana ausentes.

    Figura\(\PageIndex{5}\)

    \[\bf{\chi}_{c}^{2}=\sum_{k} \frac{(O-E)^{2}}{E}=3\nonumber\]

    La decisión es no rechazar la hipótesis nula porque el valor calculado del estadístico de prueba no está en la cola de la distribución.

    Conclusión: A un nivel de significancia del 5%, a partir de los datos de la muestra, no hay evidencia suficiente para concluir que los días ausentes no ocurren con frecuencias iguales.

    Ejercicio\(\PageIndex{5}\)

    Los maestros quieren saber qué noche cada semana sus alumnos están haciendo la mayor parte de sus tareas. La mayoría de los profesores piensan que los alumnos hacen las tareas por igual durante toda la semana Supongamos que se les preguntó a una muestra aleatoria de 56 alumnos en qué noche de la semana hicieron más tareas. Los resultados se distribuyeron como en la Tabla\(\PageIndex{8}\).

    \ (\ PageIndex {8}\) “>
    domingo Lunes martes Miércoles jueves Viernes Sábado
    Número de alumnos 11 8 10 7 10 5 5
    Mesa\(\PageIndex{8}\)

    De la población de estudiantes, ¿las noches para el mayor número de alumnos que hacen la mayor parte de sus tareas ocurren con frecuencias iguales durante una semana? ¿Qué tipo de prueba de hipótesis deberías usar?

    Ejemplo\(\PageIndex{6}\)

    Un estudio indica que el número de televisores que tienen las familias estadounidenses se distribuye (esta es la distribución dada para la población estadounidense) como en Table\(\PageIndex{9}\).

    \ (\ PageIndex {9}\) “>
    Cantidad de televisores Por ciento
    0 10
    1 16
    2 55
    3 11
    4+ 8
    Mesa\(\PageIndex{9}\)

    El cuadro contiene porcentajes esperados (\(E\)).

    Una muestra aleatoria de 600 familias en el extremo oeste de Estados Unidos arrojó los datos en la Tabla\(\PageIndex{10}\).

    \ (\ PageIndex {10}\) “>
    Cantidad de televisores Frecuencia
    Total = 600
    0 66
    1 119
    2 340
    3 60
    4+ 15
    Mesa\(\PageIndex{10}\)

    La tabla contiene los valores de frecuencia observados (\(O\)).

    Al nivel de significancia del 1%, ¿parece que la distribución “número de televisores” de las familias del lejano oeste de Estados Unidos es diferente de la distribución para la población estadounidense en su conjunto?

    Responder

    Solución 11.6

    Este problema le pide probar si la distribución de familias del lejano oeste de Estados Unidos se ajusta a la distribución de las familias estadounidenses. Esta prueba siempre es de cola derecha.

    El primer cuadro contiene porcentajes esperados. Para obtener frecuencias esperadas (E) multiplicar el porcentaje por 600. Las frecuencias esperadas se muestran en la Tabla\(\PageIndex{11}\).

    \ (\ PageIndex {11}\) “>
    Número de televisores Por ciento Frecuencia esperada
    0 10 (0.10) (600) = 60
    1 16 (0.16) (600) = 96
    2 55 (0.55) (600) = 330
    3 11 (0.11) (600) = 66
    más de 3 8 (0.08) (600) = 48
    Mesa\(\PageIndex{11}\)

    Por lo tanto, las frecuencias esperadas son 60, 96, 330, 66 y 48.

    \(H_0\): La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es la misma que la distribución de “número de televisores” de la población estadounidense.

    \(H_a\): La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución de “número de televisores” de la población estadounidense.

    Distribución para la prueba:\(\chi_{4}^{2} \text { where } d f=(\text { the number of cells })-1=5-1=4\).

    Calcular el estadístico de prueba:\(\chi^2 = 29.65\)

    Gráfica:

    Se trata de una curva chi-cuadrada asimétrica con valores de 0, 4 y 29.65 etiquetados en el eje horizontal. El valor 4 coincide con el pico de la curva. Una línea vertical ascendente se extiende desde 29.65 hasta la curva, y la región a la derecha de esta línea está sombreada. El área sombreada es igual al valor p.
    Figura\(\PageIndex{6}\)

    La gráfica del Chi-cuadrado muestra la distribución y marca el valor crítico con cuatro grados de libertad a un nivel de confianza del 99%, α = .01, 13.277. La gráfica también marca el estadístico calculado de prueba de chi cuadrado de 29.65. Comparando el estadístico de prueba con el valor crítico, como lo hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.

    Tomar una decisión: Debido a que el estadístico de prueba está en la cola de la distribución no podemos aceptar la hipótesis nula.

    Esto significa que rechazas la creencia de que la distribución para los estados del lejano oeste es la misma que la de la población estadounidense en su conjunto.

    Conclusión: En el nivel de significancia del 1%, a partir de los datos, hay evidencia suficiente para concluir que la distribución del “número de televisores” para el extremo oeste de Estados Unidos es diferente de la distribución de “número de televisores” para la población estadounidense en su conjunto.

    Ejercicio\(\PageIndex{6}\)

    Se distribuye el porcentaje esperado del número de mascotas que los estudiantes tienen en sus hogares (esta es la distribución dada para la población estudiantil de Estados Unidos) como en Tabla\(\PageIndex{12}\).

    \ (\ PageIndex {12}\) “>
    Número de mascotas Por ciento
    0 18
    1 25
    2 30
    3 18
    4+ 9
    Mesa\(\PageIndex{12}\)

    Una muestra aleatoria de 1,000 estudiantes del este de Estados Unidos arrojó los datos en la Tabla\(\PageIndex{13}\).

    \ (\ PageIndex {13}\) “>
    Número de mascotas Frecuencia
    0 210
    1 240
    2 320
    3 140
    4+ 90
    Mesa\(\PageIndex{13}\)

    Al nivel de significancia del 1%, ¿parece que la distribución “número de mascotas” de los estudiantes en el este de Estados Unidos es diferente de la distribución para la población estudiantil de Estados Unidos en su conjunto?

    Ejemplo\(\PageIndex{7}\)

    Supongamos que volteas dos monedas 100 veces. Los resultados son\(20 HH, 27 HT, 30 TH\), y\(23 TT\). ¿Las monedas son justas? Prueba a un nivel de significancia del 5%.

    Responder

    Solución 11.7

    Este problema se puede configurar como un problema de bondad de ajuste. El espacio de muestra para voltear dos monedas justas es\(\{HH, HT, TH, TT\}\). De 100 volteretas, esperarías 25\(HH, 25 HT, 25 TH\), y\(25 TT\). Esta es la distribución esperada a partir de la distribución binomial de probabilidad. La pregunta: “¿Son justas las monedas?” es lo mismo que decir: “¿La distribución de las monedas se\((20 HH, 27 HT, 30 TH, 23 TT)\) ajusta a la distribución esperada?”

    Variable aleatoria: Let\(X\) = el número de cabezas en un tirón de las dos monedas. X toma los valores 0, 1, 2. (Hay 0, 1 o 2 cabezas en el flip de dos monedas). Por lo tanto, el número de celdas es de tres. Dado que\(X\) = el número de cabezas, las frecuencias observadas son 20 (para dos cabezas), 57 (para una cabeza) y 23 (para cero cabezas o ambas colas). Las frecuencias esperadas son 25 (para dos cabezas), 50 (para una cabeza) y 25 (para cero cabezas o ambas colas). Esta prueba es de cola derecha.

    \(\bf{H_0}\): Las monedas son justas.

    \(\bf{H_a}\): Las monedas no son justas.

    Distribución para la prueba:\(\chi_2^2\) dónde\(df = 3 – 1 = 2\).

    Calcular el estadístico de prueba:\(\chi^2 = 2.14\).

    Gráfica:

    Se trata de una curva chi-cuadrada asimétrica con valores de 0 y 2.14 etiquetados en el eje horizontal. Una línea vertical ascendente se extiende desde 2.14 hasta la curva y la región a la derecha de esta línea está sombreada. El área sombreada es igual al valor p.
    Figura\(\PageIndex{7}\)

    La gráfica del Chi-cuadrado muestra la distribución y marca el valor crítico con dos grados de libertad a un nivel de confianza del 95%,\(\alpha = 0.05\), 5.991. La gráfica también marca el estadístico\(\chi^2\) de prueba calculado de 2.14. Comparando el estadístico de prueba con el valor crítico, como lo hemos hecho con todas las demás pruebas de hipótesis, llegamos a la conclusión.

    Conclusión: No hay pruebas suficientes para concluir que las monedas no son justas: no podemos rechazar la hipótesis nula de que las monedas son justas.


    This page titled 11.3: Prueba de bondad de ajuste is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.