11.2: Pruebas de significación
- Page ID
- 152384
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
- Describir cómo se usa un valor de probabilidad para poner en duda la hipótesis nula
- Definir “estadísticamente significativo”
- Distinguir entre significancia estadística y significación práctica
- Distinguir entre dos enfoques para pruebas de significancia
Un valor de probabilidad bajo arroja dudas sobre la hipótesis nula. ¿Qué tan bajo debe ser el valor de probabilidad para concluir que la hipótesis nula es falsa? Aunque claramente no hay una respuesta correcta o incorrecta a esta pregunta, es convencional concluir que la hipótesis nula es falsa si el valor de probabilidad es menor que\(0.05\). Investigadores más conservadores concluyen que la hipótesis nula es falsa solo si el valor de probabilidad es menor que\(0.01\). Cuando un investigador concluye que la hipótesis nula es falsa, se dice que el investigador rechazó la hipótesis nula. El valor de probabilidad por debajo del cual se rechaza la hipótesis nula se denomina nivel\(\alpha\) (alfa) o simplemente\(\alpha\). También se le llama el nivel de significancia.
Cuando se rechaza la hipótesis nula, se dice que el efecto es estadísticamente significativo. Por ejemplo, en el estudio de caso Reacciones de los médicos, el valor de probabilidad es\(0.0057\). Por lo tanto, el efecto de la obesidad es estadísticamente significativo y se rechaza la hipótesis nula de que la obesidad no hace diferencia. Es muy importante tener en cuenta que la significancia estadística significa sólo que se rechace la hipótesis nula de exactamente ningún efecto; no significa que el efecto sea importante, que es lo que generalmente significa “significativo”. Cuando un efecto es significativo, puedes tener confianza en que el efecto no es exactamente cero. Encontrar que un efecto es significativo no te dice qué tan grande o importante es el efecto.
No confundir la significación estadística con la significación práctica. Un pequeño efecto puede ser muy significativo si el tamaño de la muestra es lo suficientemente grande.
¿Por qué la palabra “significativo” en la frase “estadísticamente significativo” significa algo tan diferente de otros usos de la palabra? Curiosamente, esto se debe a que el significado de “significativo” en el lenguaje cotidiano ha cambiado. Resulta que cuando se desarrollaron los procedimientos para la prueba de hipótesis, algo era “significativo” si significaba algo. Así, encontrar que un efecto es estadísticamente significativo significa que el efecto es real y no por casualidad. A lo largo de los años, el significado de “significativo” cambió, lo que llevó a la posible mala interpretación.
Existen dos enfoques (al menos) para realizar pruebas de significancia. En uno (favorecido por R. Fisher), se realiza una prueba de significancia y el valor de probabilidad refleja la fuerza de la evidencia frente a la hipótesis nula. Si la probabilidad está por debajo\(0.01\), los datos proporcionan una fuerte evidencia de que la hipótesis nula es falsa. Si el valor de probabilidad está por debajo\(0.05\) pero mayor que\(0.01\), entonces la hipótesis nula suele ser rechazada, pero no con tanta confianza como lo sería si el valor de probabilidad estuviera por debajo\(0.01\). Los valores de probabilidad entre\(0.05\) y\(0.10\) proporcionan evidencia débil contra la hipótesis nula y, por convención, no se consideran lo suficientemente bajos como para justificar su rechazo. Las probabilidades más altas proporcionan menos evidencia de que la hipótesis nula es falsa.
El enfoque alternativo (favorecido por los estadísticos Neyman y Pearson) es especificar un nivel α antes de analizar los datos. Si el análisis de datos da como resultado un valor de probabilidad por debajo del\(\alpha\) nivel, entonces se rechaza la hipótesis nula; si no lo es, entonces no se rechaza la hipótesis nula. Según esta perspectiva, si un resultado es significativo, entonces no importa cuán significativo sea. Además, si no es significativo, entonces no importa lo cerca que esté de ser significativo. Por lo tanto, si se está utilizando el\(0.05\) nivel, entonces los valores de probabilidad de\(0.049\) y\(0.001\) se tratan de manera idéntica. Del mismo modo, los valores de probabilidad de\(0.06\) y\(0.34\) se tratan de manera idéntica.
El primer enfoque (preferido por Fisher) es más adecuado para la investigación científica y se adoptará aquí. Este último es más adecuado para aplicaciones en las que se debe tomar una decisión de sí/no. Por ejemplo, si se emprendiera un análisis estadístico para determinar si una máquina en una planta de fabricación estaba funcionando mal, el análisis estadístico se utilizaría para determinar si la máquina debe apagarse o no para su reparación. El gerente de planta estaría menos interesado en evaluar el peso de la evidencia que en saber qué acciones se deben tomar. No hay necesidad de una decisión inmediata en la investigación científica donde un investigador pueda concluir que hay alguna evidencia contra la hipótesis nula, pero que se necesita más investigación antes de que se pueda sacar una conclusión definitiva.