Saltar al contenido principal

# 11.3: Prueba de bondad de ajuste

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

En este tipo de prueba de hipótesis, se determina si los datos “se ajustan” a una distribución particular o no. Por ejemplo, puede sospechar que sus datos desconocidos se ajustan a una distribución binomial. Se utiliza una prueba de chi-cuadrado (es decir, la distribución para la prueba de hipótesis es chi-cuadrado) para determinar si hay un ajuste o no. El nulo y las hipótesis alternativas para esta prueba pueden escribirse en oraciones o pueden afirmarse como ecuaciones o desigualdades.

El estadístico de prueba para una prueba de bondad de ajuste es:

$\sum_k \frac{(O - E)^{2}}{E}$

donde:

• $$O =$$valores observados (datos)
• $$E =$$valores esperados (de la teoría)
• $$k =$$el número de celdas o categorías de datos diferentes

Los valores observados son los valores de datos y los valores esperados son los valores que esperarías obtener si la hipótesis nula fuera verdadera. Hay$$n$$ términos de la forma$$\frac{(O - E)^{2}}{E}$$.

El número de grados de libertad es$$df = (\text{number of categories} - 1)$$.

La prueba de bondad de ajuste casi siempre es de cola derecha. Si los valores observados y los valores esperados correspondientes no están cerca uno del otro, entonces el estadístico de prueba puede llegar a ser muy grande y estará muy lejos en la cola derecha de la curva de chi-cuadrado.

El valor esperado para cada celda debe ser de al menos cinco para que puedas usar esta prueba.

Ejemplo 11.3.1

El ausentismo de los estudiantes universitarios de las clases de matemáticas es una preocupación importante para los instructores de matemáticas porque la falta de clase parece aumentar la tasa de caída. Supongamos que se realizó un estudio para determinar si la tasa real de ausentismo estudiantil sigue la percepción de la facultad. El profesorado esperaba que un grupo de 100 alumnos faltara a clase de acuerdo con la siguiente tabla.

Número de ausencias por término Número esperado de alumnos
0—2 50
3—5 30
6—8 12
9—11 6
12+ 2

Luego se realizó una encuesta aleatoria en todos los cursos de matemáticas para determinar el número real (observado) de ausencias en un curso. El gráfico de la siguiente tabla muestra los resultados de esa encuesta.

Número de ausencias por término Número real de alumnos
0—2 35
3—5 40
6—8 20
9—11 1
12+ 4

Determinar las hipótesis nulas y alternativas necesarias para realizar una prueba de bondad de ajuste.

• $$H_{0}$$: El absentismo estudiantil se ajusta a la percepción de la facultad.
La hipótesis alternativa es la opuesta a la hipótesis nula.
• $$H_{a}$$: El ausentismo estudiantil no se ajusta a la percepción de la facultad.

Ejercicio$$\PageIndex{1}$$.1

a. ¿Se puede utilizar la información tal y como aparece en las tablas para realizar la prueba de bondad de ajuste?

Contestar

a. No. Observe que el número esperado de ausencias para la entrada “12+” es menor a cinco (es dos). Combine ese grupo con el grupo “9—11" para crear nuevas tablas donde el número de alumnos para cada entrada sea de al menos cinco. Los nuevos resultados se encuentran en la tabla siguiente.

Número de ausencias por término Número esperado de alumnos
0—2 50
3—5 30
6—8 12
9+ 8
Número de ausencias por término Número real de alumnos
0—2 35
3—5 40
6—8 20
9+ 5

Ejercicio$$\PageIndex{1}$$.2

b. ¿Cuál es el número de grados de libertad ($$df$$)?

Contestar

b. Hay cuatro “celdas” o categorías en cada una de las nuevas tablas.

$$df = \text{number of cells} - 1 = 4 - 1 = 3$$

Ejercicio$$\PageIndex{1}$$

Un gerente de fábrica necesita entender cuántos productos están defectuosos frente a cuántos se producen. El número de defectos esperados se indica en la siguiente tabla.

Número producido Número defectuoso
0—100 5
101—200 6
201—300 7
301—400 8
401—500 10

Se tomó una muestra aleatoria para determinar el número real de defectos. En la siguiente tabla se muestran los resultados de la encuesta.

Número producido Número defectuoso
0—100 5
101—200 7
201—300 8
301—400 9
401—500 11

Indicar las hipótesis nulas y alternativas necesarias para realizar una prueba de bondad de ajuste, y declarar los grados de libertad.

Contestar

$$H_{0}$$:El número de defectos se ajusta a las expectativas.

$$H_{a}$$:El número de defectos no se ajusta a las expectativas.

$$df = 4$$

Ejemplo 11.3.2

Los empleadores quieren saber qué días de la semana los empleados están ausentes en una semana laboral de cinco días. A la mayoría de los empleadores les gustaría creer que los empleados están ausentes por igual durante la semana. Supongamos que se le preguntó a una muestra aleatoria de 60 directivos en qué día de la semana tuvieron el mayor número de ausencias de empleados. Los resultados se distribuyeron como se muestra en la siguiente tabla. Para la población de empleados, ¿los días para el mayor número de ausencias ocurren con frecuencias iguales durante una semana laboral de cinco días? Prueba a un nivel de significancia del 5%.

Día de la semana Los empleados estuvieron más ausentes
Lunes martes Miércoles jueves Viernes
Número de ausencias 15 12 9 9 15

Contestar

Las hipótesis nulas y alternativas son:

• $$H_{0}$$: Los días ausentes ocurren con frecuencias iguales, es decir, se ajustan a una distribución uniforme.
• $$H_{a}$$: Los días ausentes ocurren con frecuencias desiguales, es decir, no se ajustan a una distribución uniforme.

Si los días ausentes ocurren con frecuencias iguales, entonces, de 60 días ausentes (el total en la muestra:$$15 + 12 + 9 + 9 + 15 = 60$$), habría 12 ausencias el lunes, 12 el martes, 12 el miércoles, 12 el jueves y 12 el viernes. Estos números son los valores esperados ($$E$$). Los valores en la tabla son los valores observados ($$O$$) o datos.

Esta vez, calcula el estadístico de$$\chi^{2}$$ prueba a mano. Haz un gráfico con los siguientes encabezamientos y rellena las columnas:

• Valores esperados ($$E$$)$$(12, 12, 12, 12, 12)$$
• Valores observados$$O$$ ()$$(15, 12, 9, 9, 15)$$
• $$(O – E)$$
• $$(O – E)^{2}$$
• $$\frac{(O - E)^{2}}{E}$$

Ahora agregue (sum) la última columna. La suma es de tres. Este es el estadístico de$$\chi^{2}$$ prueba.

Para encontrar el valor p, calcule$$P(\chi^{2} > 3)$$. Esta prueba es de cola derecha. (Use una computadora o calculadora para encontrar el valor p. Deberías conseguir$$p\text{-value} = 0.5578$$.)

Los$$dfs$$ son los$$\text{number of cells} - 1 = 5 - 1 = 4$$

Prensa 2ª DISTR.L. Flecha hacia abajo a$$\chi^{2}$$ cdf. Presione ENTER. Entrar (3,10^99,4). Redondeado a cuatro decimales, debería ver 0.5578, que es el$$p\text{-value}$$.

La decisión no es rechazar la hipótesis nula.

Conclusión: A un nivel de significancia del 5%, a partir de los datos de la muestra, no hay evidencia suficiente para concluir que los días ausentes no ocurren con frecuencias iguales.

TI-83+ y algunas calculadoras TI-84 no tienen un programa especial para el estadístico de prueba para la prueba de bondad de ajuste. El siguiente ejemplo Ejemplo tiene las instrucciones de la calculadora. Las calculadoras TI-84 más nuevas tienen en las PRUEBAS STAT la prueba Chi2 GOF. Para ejecutar la prueba, pon los valores observados (los datos) en una primera lista y los valores esperados (los valores que esperas si la hipótesis nula es verdadera) en una segunda lista. Presione STAT TEST y Chi2 GOF. Ingresa los nombres de lista para la lista Observada y la Lista Esperada. Ingresa los grados de libertad y presiona calcular o dibujar. Asegúrate de borrar cualquier lista antes de comenzar. Para Borrar Listas en las calculadoras: Vaya a EDITAR STAT y flecha hacia arriba al área de nombre de lista de la lista en particular. Presione CLEAR y luego flecha hacia abajo. Se borrará la lista. Alternativamente, puede presionar STAT y presionar 4 (para CLRList). Ingrese el nombre de la lista y presione ENTRAR.

Ejercicio$$\PageIndex{2}$$

Los maestros quieren saber qué noche cada semana sus alumnos están haciendo la mayor parte de sus tareas. La mayoría de los profesores piensan que los alumnos hacen las tareas por igual durante toda la semana Supongamos que se les preguntó a una muestra aleatoria de 49 alumnos en qué noche de la semana hicieron más tareas. Los resultados se distribuyeron como se muestra en la siguiente tabla.

domingo Lunes martes Miércoles jueves Viernes Sábado
Número de alumnos 11 8 10 7 10 5 5

De la población de estudiantes, ¿las noches para el mayor número de alumnos que hacen la mayor parte de sus tareas ocurren con frecuencias iguales durante una semana? ¿Qué tipo de prueba de hipótesis deberías usar?

Contestar

$$df = 6$$

$$p\text{-value} = 0.6093$$

Rechazamos rechazar la hipótesis nula. No hay pruebas suficientes que respalden que los estudiantes no hagan la mayor parte de sus tareas por igual a lo largo de la semana.

Ejemplo 11.3.3

Un estudio indica que se distribuye el número de televisores que tienen las familias estadounidenses (esta es la distribución dada para la población estadounidense) como en la siguiente tabla.

0 10
1 16
2 55
3 11
4+ 8

El cuadro contiene porcentajes esperados ($$E$$).

Una muestra aleatoria de 600 familias en el extremo oeste de Estados Unidos arrojó los datos de la siguiente tabla.

Total = 600
0 66
1 119
2 340
3 60
4+ 15

La tabla contiene los valores de frecuencia observados ($$O$$).

Ejercicio$$\PageIndex{3}$$.1

Al nivel de significancia del 1%, ¿parece que la distribución “número de televisores” de las familias del lejano oeste de Estados Unidos es diferente de la distribución para la población estadounidense en su conjunto?

Contestar

Este problema le pide probar si la distribución de familias del lejano oeste de Estados Unidos se ajusta a la distribución de las familias estadounidenses. Esta prueba siempre es de cola derecha.

El primer cuadro contiene porcentajes esperados. Para obtener frecuencias esperadas (E) multiplicar el porcentaje por 600. Las frecuencias esperadas se muestran en la siguiente tabla.

0 10 (0.10) (600) = 60
1 16 (0.16) (600) = 96
2 55 (0.55) (600) = 330
3 11 (0.11) (600) = 66
más de 3 8 (0.08) (600) = 48

Por lo tanto, las frecuencias esperadas son 60, 96, 330, 66 y 48. En las calculadoras TI, puedes dejar que la calculadora haga los cálculos. Por ejemplo, en lugar de 60, ingrese$$0.10*600$$.

$$H_{0}$$: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es la misma que la distribución de “número de televisores” de la población estadounidense.

$$H_{a}$$: La distribución del “número de televisores” de las familias del extremo oeste de Estados Unidos es diferente de la distribución de “número de televisores” de la población estadounidense.

Distribución para la prueba:$$\chi^{2}_{4}$$ dónde$$df = (\text{the number of cells}) - 1 = 5 - 1 = 4$$.

Nota 11.3.3.1

$$df \neq 600 - 1$$

Calcular el estadístico de prueba:$$\chi^{2} = 29.65$$

Gráfica:

Declaración de probabilidad:$$p\text{-value} = P(\chi^{2} > 29.65) = 0.000006$$

Compara α y el valor p:

$$\alpha = 0.01$$

$$p\text{-value} = 0.000006$$

Entonces,$$\alpha > p\text{-value}$$.

Tomar una decisión: Desde$$\alpha > p\text{-value}$$, rechazar$$H_{0}$$.

Esto significa que rechazas la creencia de que la distribución para los estados del lejano oeste es la misma que la de la población estadounidense en su conjunto.

Conclusión: En el nivel de significancia del 1%, a partir de los datos, hay evidencia suficiente para concluir que la distribución del “número de televisores” para el extremo oeste de Estados Unidos es diferente de la distribución de “número de televisores” para la población estadounidense en su conjunto.

Presione STAT e INTRO. Asegúrese de borrar las listas L1, L2 y L3 si tienen datos en ellas (vea la nota al final del Ejemplo). En L1, poner las frecuencias observadas 66, 119, 349, 60, 15. En L2, ponga las frecuencias esperadas .10*600, .16*600, .55*600, .11*600, .08*600. Flecha sobre la lista L3 y arriba hasta el área de nombre “L3". Ingrese (L1-L2) ^2/L2 e INTRO. Presiona 2º QUITAR. Presiona 2nd LIST y haz la flecha hacia MATH. Presione 5. Deberías ver “suma” (Ingresa L3). Redondeado a 2 decimales, debería ver 29.65. Prensa 2ª DISTR.L. Presione 7 o Flecha hacia abajo a 7:χ2cdf y presione ENTRAR. Entrar (29.65,1E99,4). Redondeado a cuatro lugares, debería ver 5.77E-6 = .000006 (redondeado a seis decimales), que es el valor p.

Las calculadoras TI-84 más nuevas tienen en las PRUEBAS STAT la prueba Chi2 GOF. Para ejecutar la prueba, pon los valores observados (los datos) en una primera lista y los valores esperados (los valores que esperas si la hipótesis nula es verdadera) en una segunda lista. Presione STAT TEST y Chi2 GOF. Ingresa los nombres de lista para la lista Observada y la Lista Esperada. Ingresa los grados de libertad y presiona calcular o dibujar. Asegúrate de borrar cualquier lista antes de comenzar.

Ejercicio$$\PageIndex{3}$$

Se distribuye el porcentaje esperado del número de mascotas que los estudiantes tienen en sus hogares (esta es la distribución dada para la población estudiantil de Estados Unidos) como en la siguiente tabla.

Número de mascotas Por ciento
0 18
1 25
2 30
3 18
4+ 9

Una muestra aleatoria de 1,000 estudiantes del este de Estados Unidos arrojó los datos de la siguiente tabla.

Número de mascotas Frecuencia
0 210
1 240
2 320
3 140
4+ 90

Al nivel de significancia del 1%, ¿parece que la distribución “número de mascotas” de los estudiantes en el este de Estados Unidos es diferente de la distribución para la población estudiantil de Estados Unidos en su conjunto? ¿Cuál es el$$p\text{-value}$$?

Contestar

$$p\text{-value} = 0.0036$$

Rechazamos la hipótesis nula de que las distribuciones son las mismas. Existe evidencia suficiente para concluir que la distribución “número de mascotas” de los estudiantes en el este de Estados Unidos es diferente de la distribución para la población estudiantil de Estados Unidos en su conjunto.

Ejemplo 11.3.4

Supongamos que volteas dos monedas 100 veces. Los resultados son 20 HH, 27 HT, 30 TH y 23 TT. ¿Las monedas son justas? Prueba a un nivel de significancia del 5%.

Contestar

Este problema se puede configurar como un problema de bondad de ajuste. El espacio de muestra para voltear dos monedas justas es$${HH, HT, TH, TT}$$. De 100 volteretas, esperarías 25 HH, 25 HT, 25 TH y 25 TT. Esta es la distribución esperada. La pregunta: “¿Son justas las monedas?” es lo mismo que decir: “¿La distribución de las monedas ($$20 HH, 27 HT, 30 TH, 23 TT$$) se ajusta a la distribución esperada?”

Variable aleatoria: Deje que$$X =$$ el número de cabezas en una vuelta de las dos monedas. $$X$$toma los valores 0, 1, 2. (Hay 0, 1 o 2 cabezas en el flip de dos monedas). Por lo tanto, el número de celdas es de tres. Desde$$X =$$ el número de cabezas, las frecuencias observadas son 20 (para dos cabezas), 57 (para una cabeza) y 23 (para cero cabezas o ambas colas). Las frecuencias esperadas son 25 (para dos cabezas), 50 (para una cabeza) y 25 (para cero cabezas o ambas colas). Esta prueba es de cola derecha.

$$H_{0}$$: Las monedas son justas.

$$H_{a}$$: Las monedas no son justas.

Distribución para la prueba:$$\chi^{2}_{2}$$ dónde$$df = 3 - 1 = 2$$.

Calcular el estadístico de prueba:$$\chi^{2} = 2.14$$

Gráfica:

Declaración de probabilidad:$$p\text{-value} = P(\chi^{2} > 2.14) = 0.3430$$

Compara α y el valor p:

$$\alpha = 0.05$$

$$p\text{-value} = 0.3430$$

$$\alpha < p\text{-value}$$.

Tomar una decisión: Ya que$$\alpha < p\text{-value}$$, no rechace$$H_{0}$$.

Conclusión: No hay pruebas suficientes para concluir que las monedas no son justas.

Presione STAT e INTRO. Asegúrese de borrar las listas L1, L2 y L3 si tienen datos en ellas. En L1, poner las frecuencias observadas 20, 57, 23. En L2, poner las frecuencias esperadas 25, 50, 25. Flecha sobre la lista L3 y arriba hasta el área de nombre “L3". Ingrese (L1-L2) ^2/L2 e INTRO. Presiona 2º QUITAR. Presiona 2nd LIST y haz la flecha hacia MATH. Presione 5. Deberías ver “suma”. Ingresa L3. Redondeado a dos decimales, deberías ver 2.14. Prensa 2ª DISTR.L. Flecha hacia abajo a 7:χ2cdf (o presiona 7). Presione ENTER. Ingresa 2.14,1E99,2). Redondeado a cuatro lugares, deberías ver .3430, que es el valor p.

Las calculadoras TI-84 más nuevas tienen en las PRUEBAS STAT la prueba Chi2 GOF. Para ejecutar la prueba, pon los valores observados (los datos) en una primera lista y los valores esperados (los valores que esperas si la hipótesis nula es verdadera) en una segunda lista. Presione STAT TEST y Chi2 GOF. Ingresa los nombres de lista para la lista Observada y la Lista Esperada. Ingresa los grados de libertad y presiona calcular o dibujar. Asegúrate de borrar cualquier lista antes de comenzar.

Ejercicio$$\PageIndex{4}$$

Los estudiantes en una clase de estudios sociales plantean la hipótesis de que las tasas de alfabetización en todo el mundo para cada región son del 82%. La siguiente tabla muestra las tasas reales de alfabetización en todo el mundo desglosadas por regiones. ¿Cuáles son los estadísticos de prueba y los grados de libertad?

Región de los ODM Tasa de Alfabetización de Adultos (%)
Norte de África 67.3
África Subsahariana 62.5
América Latina y el Caribe 91.0
Asia Oriental 93.8
Sur de Asia 61.9
Asia sudoriental 91.9
Asia Occidental 84.5
Oceanía 66.4

Contestar

$$df = 9$$

$$\chi^{2} \text{ test statistic} = 26.38$$

Presione STAT e INTRO. Asegúrese de borrar las listas L1, L2 y L3 si tienen datos en ellas. En L1, poner las frecuencias observadas 99, 99.5, 67.3, 62.5, 91, 93.8, 61.9, 91.9, 84.5, 66.4. En L2, poner las frecuencias esperadas 82, 82, 82, 82, 82, 82, 82, 82, 82, 82, 82. Flecha sobre la lista L3 y arriba hasta el área de nombre “L3". Ingrese (L1-L2) ^2/L2 e INTRO. Presiona 2º QUITAR. Presiona 2nd LIST y haz la flecha hacia MATH. Presione 5. Deberías ver “suma”. Ingresa L3. Redondeado a dos decimales, deberías ver 26.38. Prensa 2ª DISTR.L. Flecha hacia abajo a 7:χ2cdf (o presiona 7). Presione ENTER. Ingrese 26.38,1E99,9). Redondeado a cuatro lugares, deberías ver .0018, que es el valor p.

Las calculadoras TI-84 más nuevas tienen en las PRUEBAS STAT la prueba Chi2 GOF. Para ejecutar la prueba, pon los valores observados (los datos) en una primera lista y los valores esperados (los valores que esperas si la hipótesis nula es verdadera) en una segunda lista. Presione STAT TEST y Chi2 GOF. Ingresa los nombres de lista para la lista Observada y la Lista Esperada. Ingresa los grados de libertad y presiona calcular o dibujar. Asegúrate de borrar cualquier lista antes de comenzar.

## Referencias

1. Datos de la Oficina del Censo de Estados Unidos
2. Datos de la Junta Universitaria. Disponible en línea en http://www.collegeboard.com.
3. Datos de la Oficina del Censo de Estados Unidos, Informes de Población Actual.
4. Ma, Y., E.R. Bertone, E.J. Stanek III, G.W. Reed, J.R. Hebert, N.L. Cohen, P.A. Merriam, I.S. Ockene, “Asociación entre patrones alimentarios y obesidad en una población adulta estadounidense de vida libre”. American Journal of Epidemiology volumen 158, núm. 1, páginas 85-92.
5. Ogden, Cynthia L., Margaret D. Carroll, Brian K. Kit, Katherine M. Flegal, “Prevalencia de la obesidad en Estados Unidos, 2009—2010”. Resumen de Datos NCHS núm. 82, enero de 2012. Disponible en línea en http://www.cdc.gov/nchs/data/databriefs/db82.pdf (consultado el 24 de mayo de 2013).
6. Stevens, Barbara J., “Encuesta Multifamiliar y Comercial de Residuos Sólidos y Reciclaje”. Conteo de Arlington, VA. Disponible en línea en www.arlingtonva.us/departamento... /file84429.pdf (consultado el 24 de mayo de 2013).

## Revisar

Para evaluar si un conjunto de datos se ajusta a una distribución específica, puede aplicar la prueba de hipótesis de bondad de ajuste que utiliza la distribución de chi-cuadrado. La hipótesis nula para esta prueba establece que los datos provienen de la distribución asumida. La prueba compara los valores observados con los valores que esperaría tener si sus datos siguieran la distribución asumida. La prueba es casi siempre de cola derecha. Cada observación o categoría de celda debe tener un valor esperado de al menos cinco.

## Revisión de Fórmula

$$\sum_k \frac{(O - E)^{2}}{E}$$estadística de prueba de bondad de ajuste donde:

$$O$$: valores observados

$$E$$: valor esperado

$$k$$: número de celdas o categorías de datos diferentes

$$df = k - 1$$grados de libertad

Determinar la prueba apropiada que se utilizará en los siguientes tres ejercicios.

Ejercicio$$\PageIndex{5}$$

Una arqueóloga está calculando la distribución de la frecuencia del número de artefactos que encuentra en un sitio de excavación. Con base en excavaciones anteriores, el arqueólogo crea una distribución esperada desglosada por secciones de cuadrícula en el sitio de excavación. Una vez que el sitio ha sido completamente excavado, compara el número real de artefactos encontrados en cada sección de la cuadrícula para ver si su expectativa era exacta.

Ejercicio$$\PageIndex{6}$$

Un economista está derivando un modelo para predecir resultados en el mercado de valores. Crea una lista de puntos esperados en el índice bursátil para las próximas dos semanas. Al cierre de cada día de negociación, registra los puntos reales en el índice. Quiere ver qué tan bien su modelo coincidió con lo que realmente sucedió.

Contestar

una prueba de bondad de ajuste

Ejercicio$$\PageIndex{7}$$

Un entrenador personal está armando un programa de levantamiento de pesas para sus clientes. Para un programa de 90 días, espera que cada cliente levante un peso máximo específico cada semana. A medida que avanza, registra los pesos máximos reales que levantaron sus clientes. Ella quiere saber qué tan bien cumplieron sus expectativas con lo observado.

Utilice la siguiente información para responder a los siguientes cinco ejercicios: Un profesor predice que la distribución de las calificaciones en el examen final será y se registran en la siguiente tabla.

A 0.25
B 0.30
C 0.35
D 0.10

La distribución real para una clase de 20 se encuentra en la siguiente tabla.

A 7
B 7
C 5
D 1

Ejercicio$$\PageIndex{8}$$

$$df =$$______

Contestar

3

Ejercicio$$\PageIndex{9}$$

Indicar las hipótesis nulas y alternativas.

Ejercicio$$\PageIndex{10}$$

$$\chi^{2} \text{test statistic} =$$______

Contestar

2.04

Ejercicio$$\PageIndex{11}$$

$$p\text{-value} =$$______

Ejercicio$$\PageIndex{12}$$

Al nivel de significancia del 5%, ¿qué se puede concluir?

Contestar

Rechazamos rechazar la hipótesis nula. No hay evidencia suficiente para sugerir que los puntajes observados en las pruebas sean significativamente diferentes de los resultados esperados de las pruebas.

Utilice la siguiente información para responder a los siguientes nueve ejercicios: Los siguientes datos son reales. El número acumulado de casos de SIDA reportados para el condado de Santa Clara se desglosa por etnia como se muestra en la siguiente tabla.

Blanco 2,229
Hispano 1,157
Negro/Afroamericano 457
Asiático, Isleño del Pacífico 232
Total = 4,075

El porcentaje de cada grupo étnico en el condado de Santa Clara es como en la tabla siguiente.

Blanco 42.9% 1748.18
Hispano 26.7%
Negro/Afroamericano 2.6%
Asiático, Isleño del Pacífico 27.8%
Total = 100%

Ejercicio$$\PageIndex{13}$$

Si las etnias de las víctimas de SIDA siguieron las etnias de la población total del condado, llenar el número esperado de casos por grupo étnico.

Realizar una prueba de bondad de ajuste para determinar si la ocurrencia de casos de SIDA sigue las etnias de la población general del condado de Santa Clara.

Ejercicio$$\PageIndex{14}$$

$$H_{0}$$: _______

Contestar

$$H_{0}$$: la distribución de los casos de SIDA sigue las etnias de la población general del condado de Santa Clara.

Ejercicio$$\PageIndex{15}$$

$$H_{a}$$: _______

Ejercicio$$\PageIndex{16}$$

¿Es esta una prueba de cola derecha, cola izquierda o de dos colas?

Contestar

cola derecha

Ejercicio$$\PageIndex{17}$$

Ejercicio$$\PageIndex{18}$$

$$\chi^{2} \text{test statistic}$$= _______

Contestar

88,621

Ejercicio$$\PageIndex{19}$$

$$p\text{-value} =$$_______

Ejercicio$$\PageIndex{20}$$

Grafica la situación. Etiquetar y escalar el eje horizontal. Marcar la media y el estadístico de prueba. Sombra en la región correspondiente a la$$p\text{-value}$$.

Let$$\alpha = 0.05$$

Decisión: ________________

Motivo de la Decisión: ________________

Conclusión (escribir en oraciones completas): ________________

Contestar

Gráfica: Consulta la solución del alumno.

Decisión: Rechazar la hipótesis nula.

Motivo de la Decisión:$$p\text{-value} < \alpha$$

Conclusión (escribir en oraciones completas): La composición de los casos de SIDA no se ajusta a las etnias de la población general del condado de Santa Clara.

Ejercicio$$\PageIndex{21}$$

¿Parece que el patrón de casos de SIDA en el condado de Santa Clara corresponde a la distribución de grupos étnicos en este condado? ¿Por qué o por qué no?

This page titled 11.3: Prueba de bondad de ajuste is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform.