9.3: Distribución necesaria para las pruebas de hipótesis

Última actualización
Guardar como PDF

Page ID: 151082

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Anteriormente, discutimos las distribuciones de muestreo. Distribuciones particulares se asocian con pruebas de hipótesis. Realizaremos pruebas de hipótesis de una media poblacional usando una distribución normal o una\(t\) distribución de Student. (Recuerde, use una\(t\) distribución de Student cuando se desconozca la desviación estándar de la población y el tamaño de la muestra sea pequeño, donde pequeño se considera menor a 30 observaciones). Realizamos pruebas de una proporción poblacional utilizando una distribución normal cuando podemos suponer que la distribución se distribuye normalmente. Consideramos que esto es cierto si la proporción de muestra,\(p^{\prime}\), veces el tamaño de la muestra es mayor a 5 y\(1-p^{\prime}\) veces el tamaño de la muestra también es mayor que 5. Esta es la misma regla general que usamos al desarrollar la fórmula para el intervalo de confianza para una proporción poblacional.

Prueba de hipótesis para la media

Volviendo a la fórmula estandarizadora podemos derivar el estadístico de prueba para probar hipótesis sobre medias.

\[Z_{c}=\frac{\overline{x}-\mu_{0}}{\sigma / \sqrt{n}}\nonumber\]

La fórmula estandarizadora no se puede resolver como es porque no tenemos\(\mu\), la media poblacional. No obstante, si sustituimos en el valor hipotético de la media,\(\mu_0\) en la fórmula anterior, podemos calcular un\(Z\) valor. Este es el estadístico de prueba para una prueba de hipótesis para una media y se presenta en la Figura 9.3. Interpretamos este\(Z\) valor como la probabilidad asociada de que una muestra con una media muestral de\(\overline X\) podría provenir de una distribución con una media poblacional de\(H_0\) y llamamos a este\(Z\) valor\(Z_c\) para “calculado”. La Figura 9.3 y la Figura 9.4 muestran este proceso.

En la Figura 9.3 se presentan dos de los tres posibles resultados. \(\overline X_1\)y\(\overline X_3\) están en las colas de la distribución hipotética de\(H_0\). Observe que el eje horizontal en el panel superior está\(\overline X\) etiquetado's Esta es la misma distribución teórica de\(\overline X\)'s, la distribución de muestreo, que el Teorema del Límite Central nos dice que normalmente se distribuye. Es por ello que podemos dibujarlo con esta forma. El eje horizontal del panel inferior está etiquetado\(Z\) y es la distribución normal estándar. \(Z_{\frac{\alpha}{2}}\)y\(-Z_{\frac{\alpha}{2}}\), llamados los valores críticos, se marcan en el panel inferior como los\(Z\) valores asociados a la probabilidad que el analista ha establecido como el nivel de significancia en la prueba, (\(\alpha\)). Las probabilidades en las colas de ambos paneles son, por tanto, las mismas.

Observe que para cada uno\(\overline X\) hay un asociado\(Z_c\), llamado el calculado\(Z\), que viene de resolver la ecuación anterior. Esto calculado no\(Z\) es más que el número de desviaciones estándar que la media hipotética es de la media de la muestra. Si la media de la muestra cae “demasiadas” desviaciones estándar de la media hipotética concluimos que la media de la muestra no podría provenir de la distribución con la media hipotética, dado nuestro nivel de significancia requerido preestablecido. Podría haber venido de\(H_0\), pero se considera demasiado improbable. En la Figura 9.3 ambos\(\overline X_1\) y\(\overline X_3\) están en las colas de la distribución. Se consideran “demasiado lejos” del valor hipotético de la media dado el nivel elegido de alfa. Si de hecho esta muestra significa que sí vino de\(H_0\), pero de en la cola, hemos hecho un error Tipo I: hemos rechazado un buen nulo. Nuestro único consuelo real es que conocemos la probabilidad de cometer tal error,\ alfa, y podemos controlar el tamaño de\(\alpha\).

La Figura 9.4 muestra la tercera posibilidad para la localización de la media muestral,\(\overline x\). Aquí la media muestral está dentro de los dos valores críticos. Es decir, dentro de la probabilidad de\((1-\alpha)\) y no podemos rechazar la hipótesis nula.

Esto nos da la regla de decisión para probar una hipótesis para una prueba de dos colas:

Cuadro 9.3
Regla de decisión: prueba de dos colas
Si\(\left\|\mathrm{Z}_{c}\right\|<\mathrm{Z}_{\frac{\alpha}{2}}\): entonces no RECHAZAR\(H_0\)
Si\(\left\|\mathrm{Z}_{c}\right\|>\mathrm{Z}_{\frac{\alpha}{2}}\): entonces RECHAZAR\(H_0\)

Esta regla siempre será la misma sin importar qué hipótesis estemos probando o qué fórmulas estemos usando para hacer la prueba. El único cambio será cambiar el\(Z_c\) al símbolo apropiado para el estadístico de prueba para el parámetro que se está probando. Declarar la regla de decisión de otra manera: si es poco probable que la media de la muestra haya venido de la distribución con la media hipotética no podemos aceptar la hipótesis nula. Aquí definimos “improbable” como tener una probabilidad menor que alfa de ocurrir.

Enfoque de valor P

Se puede desarrollar una regla de decisión alternativa calculando la probabilidad de que se pueda encontrar una media de muestra que daría un estadístico de prueba mayor que el estadístico de prueba encontrado a partir de los datos actuales de la muestra asumiendo que la hipótesis nula es verdadera. Aquí la noción de “probable” e “improbable” se define por la probabilidad de extraer una muestra con una media de una población con la media hipotética que es mayor o menor que la encontrada en los datos de la muestra. En pocas palabras, el enfoque\(p\) -value compara el nivel de significancia deseado\(\alpha\),, con el\(p\) -valor que es la probabilidad de dibujar una media de muestra más lejos del valor hipotético que la media real de la muestra. Un gran\(p\) valor calculado a partir de los datos indica que no debemos rechazar la hipótesis nula. Cuanto menor es el\(p\) valor, más improbable es el resultado y más fuerte es la evidencia contra la hipótesis nula. Rechazaríamos la hipótesis nula si la evidencia está fuertemente en contra de ella. La relación entre la regla de decisión de comparar los estadísticos de prueba calculados\(Z_c\),, y el Valor Crítico\(Z_\alpha\), y usar el\(p\) -valor se puede ver en la Figura 9.5.

El valor calculado del estadístico de prueba se encuentra\(Z_c\) en este ejemplo y está marcado en la gráfica inferior de la distribución normal estándar porque es un\(Z\) valor. En este caso el valor calculado está en la cola y así no podemos aceptar la hipótesis nula, la asociada\(\overline X\) es simplemente demasiado inusualmente grande para creer que vino de la distribución con una media de\(\mu_0\) con un nivel de significancia de\ alfa.

Si usamos la regla de decisión\(p\) -value necesitamos un paso más. Necesitamos encontrar en la tabla normal estándar la probabilidad asociada con el estadístico de prueba calculado,\(Z_c\). Luego comparamos eso con el\ alfa asociado con nuestro nivel de confianza seleccionado. En la Figura 9.5 vemos que el\(p\) -valor es menor que\ alpha y por lo tanto no podemos aceptar el nulo. Sabemos que el\(p\) -valor es menor que\ alpha porque el área bajo el\(p\) -valor es menor que\(\alpha/ 2\). Es importante señalar que dos investigadores que extraen aleatoriamente de una misma población pueden encontrar dos\(p\) valores diferentes a partir de sus muestras. Esto ocurre porque el\(p\) -valor se calcula como la probabilidad en la cola más allá de la media de la muestra asumiendo que la hipótesis nula es correcta. Debido a que las medias de la muestra serán con toda probabilidad diferentes, esto creará dos\(p\) valores diferentes. Sin embargo, las conclusiones en cuanto a la hipótesis nula deben ser diferentes con solo el nivel de probabilidad de\(\alpha\).

Aquí hay una manera sistemática de tomar una decisión de si no se puede aceptar o no se puede rechazar una hipótesis nula si se usa el\(\bf{p}\) -valor y un preestablecido o preconcebido\ (\ bf {\ alpha}\) (el "nivel de significancia “). Un preset\(\alpha\) es la probabilidad de un error Tipo I (rechazando la hipótesis nula cuando la hipótesis nula es verdadera). Se le puede dar o no al inicio del problema. En todo caso, el valor de\(\alpha\) es la decisión del analista. Cuando tome una decisión de rechazar o no rechazar\(H_0\), haga lo siguiente:

Si\(\alpha > p\) -value, no se puede aceptar\(H_0\). Los resultados de los datos de la muestra son significativos. Hay pruebas suficientes para concluir que\(H_0\) es una creencia incorrecta y que la hipótesis alternativa, Ha, puede ser correcta.
Si\(\alpha \leq p\) -value, no se puede rechazar\(H_0\). Los resultados de los datos de la muestra no son significativos. No hay evidencia suficiente para concluir que la hipótesis alternativa, Ha, pueda ser correcta. En este caso se mantiene el status quo.
Cuando “no puedes rechazar\(H_0\) “, no significa que debas creer que eso\(H_0\) es cierto. Simplemente significa que los datos de la muestra no han aportado pruebas suficientes para arrojar serias dudas sobre la veracidad de\(H_0\). Recuerda que el nulo es el status quo y se necesita alta probabilidad para derrocar al status quo. Este sesgo a favor de la hipótesis nula es lo que da lugar a la afirmación “tiranía del status quo” al discutir las pruebas de hipótesis y el método científico.

Ambas reglas de decisión resultarán en la misma decisión y es cuestión de preferencia cuál se utiliza.

Pruebas de una y dos colas

La discusión de la Figura 9.3-Figura 9.5 se basó en la hipótesis nula y alternativa presentada en la Figura 9.3. Esto se denominó prueba de dos colas porque la hipótesis alternativa permitió que la media pudiera provenir de una población que era mayor o menor que la media hipotética en la hipótesis nula. Esto podría verse por la afirmación de la hipótesis alternativa como\(\mu \neq 100\), en este ejemplo.

Puede ser que al analista no le preocupe que el valor sea “demasiado” alto o “demasiado” bajo del valor hipotético. Si este es el caso, se convierte en una prueba de una cola y toda la probabilidad alfa se coloca en una sola cola y no se divide en\(\alpha /2\) como en el caso anterior de una prueba de dos colas. Cualquier prueba de un reclamo será una prueba de una cola. Por ejemplo, un fabricante de automóviles afirma que su Modelo 17B proporciona un kilometraje de gasolina de más de 25 millas por galón. La hipótesis nula y alternativa sería:

\(H_0: \mu \leq 25\)
\(H_a: \mu > 25\)

El reclamo estaría en la hipótesis alternativa. La carga de la prueba en las pruebas de hipótesis se lleva en la alternativa. Esto se debe a que de no rechazar lo nulo, el status quo, se debe lograr con un 90 o 95 por ciento de significación que no se puede mantener. Dicho de otra manera, queremos tener sólo un 5 o 10 por ciento de probabilidad de cometer un error Tipo I, rechazar un buen nulo; derrocar el status quo.

Esta es una prueba de una cola y toda la probabilidad alfa se coloca en una sola cola y no se divide en\(\alpha /2\) como en el caso anterior de una prueba de dos colas.

La Figura 9.6 muestra los dos casos posibles y la forma de la hipótesis nula y alternativa que los dan origen.

donde\(\mu_0\) está el valor hipotético de la media poblacional.

Cuadro 9.4 Estadísticas de prueba para prueba de medias, tamaño de muestra variable, desviación estándar de la población conocida o desconocida
Tamaño de la muestra	Estadística de prueba
< 30 (\(\sigma\)desconocido)	\(t_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
< 30 (\(\sigma\)conocido)	\(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)
> 30 (\(\sigma\)desconocido)	\(Z_{c}=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}\)
> 30 (\(\sigma\)conocido)	\(Z_{c}=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}\)

Efectos del tamaño de la muestra en el estadístico de prueba

Al desarrollar los intervalos de confianza para la media de una muestra, encontramos que la mayoría de las veces no tendríamos la desviación estándar poblacional,\(\sigma\). Si el tamaño de la muestra fuera inferior a 30, podríamos simplemente sustituir la estimación puntual por\(\sigma\), la desviación estándar de la muestra\(s\), y usar la\(t\) distribución del estudiante para corregir esta falta de información.

Al probar hipótesis nos encontramos ante este mismo problema y la solución es exactamente la misma. A saber: Si se desconoce la desviación estándar poblacional, y el tamaño muestral es menor a 30\(s\), sustituya, la estimación puntual para la desviación estándar poblacional\(\sigma\),, en la fórmula para el estadístico de prueba y utilizar la\(t\) distribución del estudiante. Todas las fórmulas y cifras anteriores se mantienen sin cambios excepto por esta sustitución y cambiando la\(Z\) distribución a la distribución t del estudiante en la gráfica. Recuerde que la distribución t del estudiante sólo se puede computar conociendo los grados de libertad adecuados para el problema. En este caso, los grados de libertad se computan como antes con intervalos de confianza:\(df = (n-1)\). El valor t calculado se compara con el valor t asociado con el nivel de confianza preestablecido requerido en la prueba,\(t_{\alpha, df}\) que se encuentra en las tablas t del estudiante. Si no lo sabemos\(\sigma\), pero el tamaño de la muestra es de 30 o más, simplemente\(s\) sustituimos\(\sigma\) y usamos la distribución normal.

En el cuadro 9.4 se resumen estas reglas.

Un enfoque sistemático para probar una hipótesis

Un enfoque sistemático de las pruebas de hipótesis sigue los siguientes pasos y en este orden. Esta plantilla funcionará para todas las hipótesis que alguna vez probarás.

Establecer la hipótesis nula y alternativa. Esta suele ser la parte más difícil del proceso. Aquí se revisa la pregunta que se hace. ¿Qué parámetro se está probando, una media, una proporción, diferencias en medias, etc. ¿Es ésta una prueba de una cola o una prueba de dos colas? Recuerda, si alguien está haciendo un reclamo siempre será una prueba de una cola.
Decidir el nivel de significancia requerido para este caso particular y determinar el valor crítico. Estos se pueden encontrar en la tabla estadística correspondiente. Los niveles de confianza típicos para los negocios son 80, 90, 95, 98 y 99. Sin embargo, el nivel de significancia es una decisión política y debe basarse en el riesgo de cometer un error de Tipo I, rechazando un buen nulo. Considera las consecuencias de cometer un error de Tipo I.
A continuación, sobre la base de las hipótesis y el tamaño de la muestra, seleccionar el estadístico de prueba apropiado y encontrar el valor crítico relevante:\(Z_\alpha\),\(t_\alpha\), etc. Dibujar la distribución de probabilidad relevante y marcar el valor crítico siempre es de gran ayuda. Asegúrese de hacer coincidir la gráfica con la hipótesis, especialmente si se trata de una prueba de una cola.
Tomar una (s) muestra (s) y calcular los parámetros relevantes: media de la muestra, desviación estándar o proporción. Usando la fórmula para el estadístico de prueba desde arriba en el paso 2, ahora calcule el estadístico de prueba para este caso en particular usando los parámetros que acaba de calcular.
Comparar el estadístico de prueba calculado y el valor crítico. Marcarlos en la gráfica dará una buena imagen visual de la situación. Ahora solo hay dos situaciones:
1. El estadístico de prueba está en la cola: No se puede aceptar el nulo, la probabilidad de que esta media muestral (proporción) provenga de la distribución hipotética es demasiado pequeña para creer que es el hogar real de estos datos de muestra.
2. El estadístico de prueba no está en la cola: No se puede Rechazar el nulo, los datos de la muestra son compatibles con el parámetro de población hipotético.
Llegar a una conclusión. Lo mejor es articular la conclusión de dos maneras diferentes. Primero una conclusión estadística formal como “Con un nivel de significancia del 5% no podemos aceptar las hipótesis nulas de que la media poblacional es igual a XX (unidades de medida)”. El segundo enunciado de la conclusión es menos formal y establece la acción, o falta de acción, requerida. Si la conclusión formal fue la anterior, entonces la informal podría ser, “La máquina está rota y tenemos que apagarla y pedir reparaciones”.

Todas las hipótesis probadas pasarán por este mismo proceso. Los únicos cambios son las fórmulas relevantes y las que están determinadas por la hipótesis requerida para responder a la pregunta original.