11.1: Introducción a las pruebas de hipótesis

Última actualización
Guardar como PDF

Page ID: 152395

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Objetivos de aprendizaje

Describir la lógica por la cual se puede concluir que alguien puede distinguir entre dos cosas
Indique si la asignación aleatoria garantiza que todas las fuentes de variación no controladas serán iguales
Definir con precisión cuál es la probabilidad de que se compute para llegar a la conclusión de que una diferencia no se debe al azar
Distinguir entre la probabilidad de un evento y la probabilidad de un estado del mundo
Definir “hipótesis nula”
Ser capaz de determinar la hipótesis nula a partir de una descripción de un experimento
Definir “hipótesis alternativa”

El estadístico R. Fisher explicó el concepto de prueba de hipótesis con una historia de una dama degustando té. Aquí presentaremos un ejemplo basado en James Bond quien insistió en que los martinis deben ser sacudidos en lugar de agitados. Consideremos un experimento hipotético para determinar si el señor Bond puede notar la diferencia entre un martini agitado y uno agitado. Supongamos que le dimos al señor Bond una serie de pruebas de\(16\) sabor. En cada prueba, volteamos una moneda justa para determinar si remover o agitar el martini. Después le presentamos el martini al señor Bond y le pedimos que decidiera si estaba agitado o agitado. Digamos que el señor Bond estaba en lo cierto sobre las pruebas\(13\) de\(16\) sabor. ¿Prueba esto que el señor Bond tiene al menos alguna habilidad para decir si el martini fue sacudido o revuelto?

Este resultado no prueba que lo haga; podría ser que solo tuvo suerte y\(13\) adivinó de\(16\) vez en cuando. Pero, ¿qué tan plausible es la explicación de que solo tuvo suerte? Para evaluar su plausibilidad, determinamos la probabilidad de que alguien que solo estaba adivinando sea\(13/16\) tiempos correctos o más. Esta probabilidad se puede calcular a partir de la distribución binomial, y la calculadora de distribución binomial muestra que es\(0.0106\). Esta es una probabilidad bastante baja, y por lo tanto alguien tendría que tener mucha suerte para estar en lo correcto\(13\) o más veces fuera de\(16\) si solo estuviera adivinando. Entonces o el señor Bond tuvo mucha suerte, o puede decir si la bebida fue agitada o agitada. La hipótesis que estaba adivinando no está demostrada falsa, sino que se echa una duda considerable sobre ella. Por lo tanto, hay pruebas contundentes de que el señor Bond puede decir si una bebida fue agitada o agitada.

Calculadora binomial

Consideremos otro ejemplo. El estudio de caso Physicians' Reacciones buscó determinar si los médicos pasan menos tiempo con pacientes obesos. Los médicos fueron muestreados aleatoriamente y a cada uno se le mostró una gráfica de un paciente quejándose de migraña. Luego se les pidió que calcularan cuánto tiempo pasarían con el paciente. Las gráficas eran idénticas excepto que para la mitad de las gráficas, el paciente era obeso y para la otra mitad, el paciente tenía peso promedio. La gráfica que vio un médico en particular se determinó aleatoriamente. Treinta y tres médicos vieron tablas de pacientes con peso promedio y\(38\) los médicos vieron tablas de pacientes obesos.

La media de tiempo que los médicos informaron que pasarían con pacientes obesos fue de\(24.7\) minutos en comparación con una media de\(31.4\) minutos para los pacientes con peso promedio. ¿Cómo podría haber ocurrido esta diferencia entre medias? Una posibilidad es que los médicos fueron influenciados por el peso de los pacientes. Por otro lado, quizás por casualidad, los médicos que vieron gráficos de los pacientes obesos tienden a ver a los pacientes por menos tiempo que los otros médicos. La asignación aleatoria de gráficos no garantiza que los grupos sean iguales en todos los aspectos distintos del gráfico que vieron. De hecho, es cierto que los dos grupos difirieron de muchas maneras por casualidad. Los dos grupos no podrían tener exactamente la misma edad media (si se mide con suficiente precisión como en días). Quizás la edad de un médico afecte el tiempo que los médicos atienden a los pacientes. Existen innumerables diferencias entre los grupos que podrían afectar el tiempo que ven a los pacientes. Con esto en mente, ¿es plausible que estas diferencias de azar sean responsables de la diferencia de tiempos?

Para evaluar la plausibilidad de la hipótesis de que la diferencia en los tiempos medios se debe al azar, calculamos la probabilidad de obtener una diferencia tan grande o mayor que la diferencia observada (\(31.4 - 24.7 = 6.7\)minutos) si la diferencia se debió, de hecho, únicamente al azar. Utilizando métodos presentados en otra sección, esta probabilidad puede calcularse para ser\(0.0057\). Dado que esta es una probabilidad tan baja, tenemos confianza en que la diferencia de tiempos se debe al peso del paciente y no se debe al azar.

El valor de probabilidad

Es muy importante entender con precisión qué significan los valores de probabilidad. En el ejemplo de James Bond, la probabilidad calculada de\(0.0106\) es la probabilidad de que estaría correcto en\(13\) o más pruebas de sabor (fuera de\(16\)) si solo estuviera adivinando.

Es fácil confundir esta probabilidad de\(0.0106\) como la probabilidad de que no pueda distinguir la diferencia. Esto no es en absoluto lo que significa.

La probabilidad de\(0.0106\) es la probabilidad de que un determinado resultado (\(13\)o más fuera de\(16\)) asumiendo un cierto estado del mundo (James Bond solo estaba adivinando). No es la probabilidad de que un estado del mundo sea cierto. Aunque esto pueda parecer una distinción sin diferencia, considere el siguiente ejemplo. Un entrenador de animales afirma que un ave entrenada puede determinar si los números son o no uniformemente divisibles por\(7\). En un experimento que evalúa esta afirmación, el ave recibe una serie de ensayos de\(16\) prueba. En cada prueba, se muestra un número en una pantalla y el pájaro picotea una de las dos teclas para indicar su elección. Los números se eligen de tal manera que la probabilidad de que cualquier número sea uniformemente divisible por\(7\) es\(0.50\). El ave es correcta en\(9/16\) las elecciones. Usando la calculadora binomial, podemos calcular que la probabilidad de ser correcto nueve o más veces fuera de\(16\) si uno solo está adivinando es\(0.40\). Dado que un pájaro que solo está adivinando haría esto bien\(40\%\) de la época, estos datos no proporcionan evidencia convincente de que el ave pueda notar la diferencia entre los dos tipos de números. Como científico, estarías muy escéptico de que el ave tuviera esta habilidad. ¿Concluirías que existe la\(0.40\) probabilidad de que el ave pueda notar la diferencia? ¡Desde luego que no! Se pensaría que la probabilidad es mucho menor que\(0.0001\).

Para reiterar, el valor de probabilidad es la probabilidad de un resultado (\(9/16\)o mejor) y no la probabilidad de un estado particular del mundo (el ave solo estaba adivinando). En estadística, es convencional referirse a posibles estados del mundo como hipótesis ya que son estados hipotéticos del mundo. Usando esta terminología, el valor de probabilidad es la probabilidad de un resultado dada la hipótesis. No es la probabilidad de la hipótesis dado el resultado.

Esto no quiere decir que ignoremos la probabilidad de la hipótesis. Si la probabilidad del resultado dada la hipótesis es suficientemente baja, tenemos evidencia de que la hipótesis es falsa. Sin embargo, no calculamos la probabilidad de que la hipótesis sea falsa. En el ejemplo de James Bond, la hipótesis es que no puede distinguir entre martinis agitados y agitados. El valor de probabilidad es bajo (\(0.0106\)), proporcionando así evidencia de que puede decir la diferencia. Sin embargo, no hemos calculado la probabilidad de que pueda decir la diferencia. Una rama de la estadística llamada estadística bayesiana proporciona métodos para computar las probabilidades de las hipótesis. Estos cálculos requieren que se especifique la probabilidad de la hipótesis antes de que se consideren los datos y, por lo tanto, son difíciles de aplicar en algunos contextos.

La hipótesis nula

La hipótesis de que un efecto aparente se debe al azar se denomina hipótesis nula. En el ejemplo de Reacciones de los médicos, la hipótesis nula es que en la población de médicos, el tiempo medio que se espera que se pase con pacientes obesos es igual al tiempo medio que se espera que se pase con pacientes de peso promedio. Esta hipótesis nula puede escribirse como:

\[\mu _{obese}=\mu _{average}\]

o como

\[\mu _{obese}-\mu _{average}=0\]

La hipótesis nula en un estudio correlacional de la relación entre los grados de secundaria y los grados universitarios normalmente sería que la correlación poblacional es\(0\). Esto se puede escribir como

\[\rho =0\]

donde\(\rho \) está la correlación poblacional (no confundir con\(r\), la correlación en la muestra).

Aunque la hipótesis nula suele ser que el valor de un parámetro es\(0\), hay ocasiones en las que la hipótesis nula es un valor distinto a\(0\). Por ejemplo, si se estuviera probando si un sujeto difería del azar en su capacidad para determinar si una moneda volteada vendría de cabeza o de cola, la hipótesis nula sería esa\(\pi =0.5\).

Hay que tener en cuenta que la hipótesis nula suele ser la opuesta a la hipótesis del investigador. En el estudio Physicians' Reacciones, los investigadores plantearon la hipótesis de que los médicos esperarían pasar menos tiempo con pacientes obesos. La hipótesis nula de que los dos tipos de pacientes son tratados de manera idéntica se plantea con la esperanza de que pueda ser desacreditado y por lo tanto rechazado. Si la hipótesis nula fuera cierta, sería muy poco probable que ocurriera una diferencia tan grande o mayor que la diferencia muestral de\(6.7\) minutos. Por lo tanto, los investigadores rechazaron la hipótesis nula de no diferencia y concluyeron que en la población, los médicos pretenden pasar menos tiempo con pacientes obesos.

Si se rechaza la hipótesis nula, entonces se acepta la alternativa a la hipótesis nula (llamada hipótesis alternativa). La hipótesis alternativa es simplemente la inversa de la hipótesis nula. Si\(\mu _{obese}=\mu _{average}\) se rechaza la hipótesis nula, entonces hay dos alternativas:

\[\mu _{obese}<\mu _{average}\]

\[\mu _{obese}>\mu _{average}\]

Naturalmente, la dirección de las medias muestrales determina qué alternativa se adopta. Algunos libros de texto han argumentado incorrectamente que rechazar la hipótesis nula de que dos medias de población son iguales no justifica una conclusión sobre qué media poblacional es mayor. Kaiser (\(1960\)) mostró cómo se justifica sacar una conclusión sobre la dirección de la diferencia.

Kaiser, H. F. (1960) Decisiones estadísticas direccionales. Revisión Psicológica, 67, 160-167.