10.7: Error Tipo II y Poder Estadístico

Última actualización
Guardar como PDF

Page ID: 151749

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

En el ejemplo anterior, el estadístico no logró rechazar la Hipótesis Null debido a que la probabilidad de cometer un error de Tipo I (rechazar una verdadera Hipótesis Null) excedió el nivel de significancia de 5%. Sin embargo, el estadístico podría haber cometido un error Tipo II si la máquina realmente está funcionando incorrectamente. Una de las tareas importantes y muchas veces pasadas por alto es analizar la probabilidad de cometer el error Tipo II (\(\beta\)). Por lo general, los estadísticos miran el poder estadístico que es el complemento de\(\beta\).

Beta (\(\beta\)): La probabilidad de no rechazar la hipótesis nula cuando en realidad es falsa.

Poder (o Poder Estadístico): La probabilidad de rechazar la hipótesis nula cuando en realidad es falsa.

Tanto la beta como la potencia se calculan para valores específicos posibles de la Hipótesis Alternativa.

	No Rechazar\(H_o\)	Rechazar\(H_o\)
\(H_o\)es verdad	\(1-\alpha\)	\(\alpha\)Error de tipo I
\(H_o\)es falso	\(\beta\)Error de tipo II	\(1-\beta\)Poder

Si una prueba de hipótesis tiene baja potencia, entonces sería difícil rechazarla\(H_o\), aunque\(H_o\) fuera falsa; la investigación sería una pérdida de tiempo y dinero. Sin embargo, analizar el poder es difícil ya que hay muchos valores del parámetro poblacional que sustentan\(H_a\). Por ejemplo, en el ejemplo de embotellado de salsa de soja, la Hipótesis Alternativa fue que la media no era de 16 onzas. Esto significa que la máquina podría estar llenando las botellas con una media de 16.0001 onzas, haciendo que Ha sea técnicamente cierto. Entonces, al analizar el poder y el error Tipo II, necesitamos elegir un valor para la media poblacional bajo la Hipótesis Alternativa (\(\mu_a\)) que sea “prácticamente diferente” de la media bajo la Hipótesis Null (\(\mu_o\)). Esta diferencia práctica se llama el tamaño del efecto.

Definición: Tamaño del efecto

Tamaño del efecto: La “diferencia práctica” entre\(\mu_{o}\) y\(\mu_a=\left|\mu_{o}-\mu_{a}\right|\)

donde

\(\mu_{o}\): El valor de la media poblacional bajo la Hipótesis Nula

\(\mu_{a}\): El valor de la media poblacional bajo la Hipótesis Alternativa

Supongamos que estamos realizando una prueba de una cola de la media poblacional:

\[H_o: \mu=\mu_{0} \qquad Ha: \mu>\mu_{0} \nonumber \]

Considera las dos gráficas que se muestran a continuación. La gráfica superior es la distribución de la media muestral bajo la Hipótesis Null, la cual fue cubierta en una sección anterior. El área a la derecha del valor crítico es la región de rechazo.

Ahora agregamos la gráfica inferior, que representa la distribución de la media muestral bajo la Hipótesis Alternativa para el valor específico\(\mu a\).

Ahora podemos medir el Poder de la prueba (el área en verde) y beta (el área en púrpura) en la gráfica inferior.

Existen varios métodos para aumentar el Poder, pero todos tienen compensaciones:

Maneras de aumentar el poder	Intercambiar
Aumentar el tamaño de la muestra	Mayor costo o falta de disponibilidad de los datos
Aumentar el nivel de significancia (\(\alpha\))	Más como Rechazar un verdadero\(H_o\) (error Tipo I)
Elija un\(\mu_{a}\) valor de\(\mu_{o}\)	El resultado puede ser menos significativo
Redefinir la población para disminuir la desviación estándar	El resultado puede ser demasiado limitado para tener valor
Conducta como una prueba de una cola en lugar de una prueba de dos colas	Puede producir un resultado sesgado

Ejemplo: Pastillas de freno de bus

Se afirma que las pastillas de freno de autobús duran en promedio al menos 60,000 millas y la compañía quiere probar esta afirmación. La compañía de autobuses considera que un valor “práctico” para fines de seguridad de autobuses es que las almohadillas duren al menos 58 mil millas. Si la desviación estándar es de 5,000 y el tamaño de la muestra es 50, encuentra la potencia de la prueba cuando la media es realmente de 58,000 millas. (Asumir\(\alpha = .05\))

Solución

Primero, encontrar el valor crítico de la prueba.

Rechazar\(H_o\) cuando\(Z < ‐1.645\)

A continuación, encontrar el valor de que corresponde al valor crítico.

\[\overline{X}=\mu_{o}+\dfrac{Z \sigma}{\sqrt{n}}=60000-(1.645)(5000) / \sqrt{50}=58837 \nonumber \]

\(H_o\)se rechaza cuando\(\overline{X}<58837\)

Finalmente, encuentra la probabilidad de rechazar\(H_o\) si Ha es verdadera.

\ [\ begin {alineado}
P (\ overline {X} <58837) &=P\ izquierda (Z<\ dfrac {\ izquierda (58837-\ mu_ {a}\ derecha)} {\ sigma/\ sqrt {n}}\ derecha)\\
&=P\ izquierda (Z<\ dfrac {(58837-58000)} {5000/\ sqrt {50}}\ derecha)\\
&=P (Z<1.18)\\
&=.8810
\ end {alineado} \ nonumber\]

Por lo tanto, esta prueba tiene 88% de potencia y\(\beta\) sería 12%

Valores de Cálculo de Potencia

Valores de entrada

\(\mu_{o}\)= 60.000 millas

\(\mu_{a}\)= 58,000 millas

\(\alpha\)= 0.05

\(n\)= 50

\(\sigma\)= 5000 millas

Valores calculados

Tamaño del efecto = 2000 millas

Valor Crítico = 58,837 millas

\(\beta\)= 0.1190 o aproximadamente 12%

Potencia = 0.8810 o aproximadamente 88%

Search

Text Color

Text Size

Margin Size

Font Type