Saltar al contenido principal
LibreTexts Español

8.3: Introducción a la Inferencia Estadística y Prueba de Hipótesis

  • Page ID
    132518
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje

    • Explicar las propiedades de la distribución normal
    • Explicar el concepto de puntaje z y calcularlo
    • Realizar una prueba de hipótesis (prueba de diferencias de medias)
    • Diferenciar entre errores de tipo I y tipo II

    La inferencia estadística se define como el proceso de análisis de datos generados por una muestra, pero luego se utilizan para determinar alguna característica de la población más grande. Recuerde, los análisis de encuestas son el pan y la mantequilla de la ciencia política cuantitativa. Como lo más probable es que no podamos encuestar a todos en cada población, como todos los votantes registrados en Estados Unidos, generamos una muestra que permita sacar inferencias o sacar conclusiones sobre la población estudiada. Las muestras son útiles ya que permite a los estudiosos probar las relaciones entre variables sin tener que gastar los millones necesarios para investigar una población más grande.

    Antes de discutir los conceptos de inferencia estadística y los medios para probar las relaciones, comencemos revisitando la Figura 8.1 ubicada al final de la sección anterior (Sección 8.2). Notarás que la curva tiene forma de campana, con los puntajes de los exámenes alcanzando su punto máximo en el medio. Esta curva se denomina distribución normal donde el valor de la media, mediana y el modo es el mismo, y los datos cercanos a la media son más frecuentes en ocurrencia. Es seguro decir que se puede suponer que la mayoría de las variables que interesan a los politólogos se distribuyen normalmente. Pero, ¿qué representa esta curva? La altura de la línea representa la densidad de una observación particular.

    ¿Se nota que el pico de la curva se encuentra a mitad de la distribución? Significa que hay muchas más observaciones con el valor de la media o cerca de ella que cualquier otro valor en una variable normalmente distribuida. En otras palabras, a medida que te alejas (o te desvías) de la media, verás menos observaciones. Puede tener sentido más intuitivo usando el ejemplo de puntaje de prueba de la sección anterior. El puntaje medio de prueba de 85 significa que una gran proporción de estudiantes obtuvo algo cercano a 85. ¿Recuerdas la idea de desviación estándar? Aproximadamente 68% de los puntajes caerán entre la primera desviación estándar de la media. En el ejemplo anterior, señalamos que 68% de los estudiantes caen entre los puntajes de 80 y 90.

    Otra cosa que podrías notar sobre la curva de distribución normal es que es simétrica. La mitad de las observaciones caen por encima de la media y la otra mitad se encuentra debajo de la media. Nuevamente, una distribución normal tiene el mismo valor para media, mediana y modo, lo que significa que el valor de la media es el que más ocurre y también es el valor medio. Ante esto, la distribución normal suele denominarse N (μ, σ 2).

    En ocasiones, te puede interesar comparar ciertos valores utilizando diferentes medidas que están diseñadas para medir conceptos similares. Tomemos el SAT y ACT para este ejemplo (adoptado de la forma OpenIntro Statistics). Los estudiantes de secundaria que estén interesados en postularse a colegios y universidades de cuatro años, están obligados a completar al menos uno de estos exámenes de aptitud. Luego, las universidades y colegios utilizan el puntaje SAT o ACT, junto con una combinación de otros insumos, como GPA y servicio comunitario, para determinar si se acepta la solicitud de un estudiante. Es importante señalar que el SAT se puntúa sobre 1600 y que el ACT se puntúa alrededor de 36. Por ejemplo, digamos Carlos tomó el SAT y anotó un 1300, y Tomoko tomó el ACT y anotó un 24. ¿Cómo se puede comparar y determinar quién ha tenido un mejor desempeño? Bueno, una forma es estandarizar los puntajes si se dispone de ciertas estadísticas: la media y la desviación estándar. Con la media y desviación estándar junto con los valores de interés (en este caso los puntajes de las pruebas de Carlos y Tomoko), podemos calcular el puntaje Z, que nos indica el número de desviaciones estándar que una observación particular cae por encima o por debajo de la media.

    Puntaje Z = x-μ/σ (8.6)

    En la Ecuación 9.6, x representa una observación que te interesa. La media está representada por μ y σ denota la desviación estándar del conjunto de datos. Entonces, para que podamos comparar la puntuación de Carlos y Tomoko, primero calculamos las puntuaciones z para ambos y las comparamos. También necesitamos la siguiente información para llevar a cabo esta tarea.

    Estadísticas SAT ACTO
    Media (μ) 1100 21
    Desviación estándar (σ) 200 6

    Carlos se llevó el SAT y anotó 1300 por lo que su puntaje z es:

    Z = (1300-1100) /200 = 1

    Carlos se llevó el ACT y anotó 24 por lo que su puntaje z es:

    Z = (24-21) /6= 0.5

    Estas estadísticas significan que el puntaje de Carlos estuvo 1 desviación estándar por encima de la media mientras que el puntaje de Tomoko fue 0.5 desviación estándar por encima de la media. Entonces, ¿quién se desempeñó mejor en la prueba estandarizada? La respuesta es Carlos ya que 1 desviación estándar por encima de la media es mejor que 0.5 desviación estándar por encima de la media. Tenga en cuenta que es muy probable que una puntuación z también tenga un valor negativo. Esto simplemente significa que la desviación estándar está por debajo de la media por una cierta distancia. Los puntajes Z permiten a los investigadores comparar las puntuaciones del mismo examen realizado en diferentes secciones de clase, siempre que se disponga de la media y la desviación estándar para ambas clases.

    Una vez que se establecen las técnicas de comparación de datos, como los puntajes para el SAT y el ACT, la investigación puede comenzar a desarrollar hipótesis estadísticas. Las hipótesis estadísticas son declaraciones sobre algunas características de una variable o una colección de variables. Existen dos tipos de hipótesis utilizadas en las pruebas de hipótesis estadísticas. Una hipótesis nula (Ho) es una declaración de trabajo que postula la ausencia de relación estadística entre dos o más variables. En estadística, deseamos probar si una declaración de trabajo puede demostrarse falsa. Relacionada con la hipótesis nula está la hipótesis alternativa (Ha). También conocida como hipótesis de investigación, es simplemente una declaración de trabajo alternativa a la hipótesis nula. Esencialmente, es la afirmación que está haciendo un investigador al probar las relaciones entre los datos. Para ilustrar mejor las hipótesis estadísticas, las hipótesis nulas y alternativas, consideremos los siguientes datos y pasemos por el proceso de prueba de hipótesis.

    El Departamento de Ciencias Políticas del San Diego City College quería ver si las sesiones de estudio adicionales tendrán algún efecto en el desempeño de los estudiantes en el examen de mitad de período. Hemos seleccionado aleatoriamente estudiantes para asistir a sesiones de estudio adicionales.
    para la clase política estadounidense (media poblacional) fue de 75, con una desviación estándar de 7 entre 200 estudiantes. La puntuación media de los estudiantes que asistieron a la sesión extra de estudio (media muestral) fue de 82 y hubo 50 estudiantes que asistieron. ¿Podemos averiguar si las sesiones extra de estudio en promedio tuvieron algún efecto en el rendimiento de los estudiantes?

    Para que podamos realizar esta prueba, tenemos que decidir un par de cosas más. Primero, tenemos que determinar el nivel de probabilidad con el que te sientes cómodo en términos de aceptar erróneamente la hipótesis alternativa. A esto se le llama significancia estadística o el nivel alfa. En otras palabras, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Por ejemplo, un alfa de 0.05 significa que queremos tener 95% de confianza, y este es típicamente el nivel que la mayoría de los politólogos estarían de acuerdo como aceptable. Para este ejemplo, usemos el alfa de 0.05 (95% de confianza). Esta decisión nos lleva a identificar otro elemento crítico necesario para las pruebas de hipótesis: el puntaje z crítico. Este valor nos dice si necesitamos rechazar o no la afirmación de la investigación. Dado que hemos decidido que el alfa que se va a utilizar aquí es 0.05, el puntaje z crítico es 1.96. Puede identificar este número mediante una tabla de probabilidad de puntaje z que a menudo se encuentra en la parte posterior de un libro de texto introductorio de estadísticas. Además, tenemos que decidir si vamos a estar realizando una prueba de una cola o de dos colas. Dado que esto está más allá del alcance de este libro de texto, utilizaré la prueba de dos colas para este ejemplo. El resumen de la información que tenemos para este ejemplo se puede encontrar en la siguiente tabla.

    Estadística Valor
    Media de la población (μ) 75
    Desviación poblacional (σ) 7
    Media de la muestra (Y_barra inferior) 82
    Tamaño de la muestra (n) 50
    Nivel alfa 0.05
    Puntaje z crítico 1.96
    Hipótesis nula (Ho) Y_Barra inferior = μ
    Hipótesis alternativasI (Ha) Y_barra inferior = μ o Y_barra inferior > μ

    Ahora tenemos toda la información necesaria, podemos realizar las pruebas de hipótesis usando este ejemplo. En última instancia, una prueba de hipótesis implica el examen del estadístico de prueba observado relativo al umbral que ha determinado (puntaje z crítico). Si el estadístico de prueba observado va más allá del valor crítico, podemos decir con seguridad que su afirmación de investigación puede ser correcta. Calcular el estadístico de prueba observado (en este caso, puntaje z para las muestras) utilizando la siguiente ecuación.

    Z obs = |Y_Barra inferior - μ|/

    Z obs = |82-75|/7* sqrt (50)

    Ahora compare la puntuación z observada y la puntuación z crítica.

    Z trabajos: |7.07|>1.96 (Z crítico)

    En este caso, dado que la puntuación z observada fue mayor que el umbral de 1.96 podemos decir que la afirmación de que Y_underbar = μ puede ser rechazada. Por el contrario, si la puntuación z observada era menor a 1.96, diremos, no pudimos rechazar la hipótesis nula. Es importante señalar que nunca aceptamos la hipótesis nula. Entonces, ¿qué significa esto en última instancia? De acuerdo con el resultado de la prueba aquí, podemos decir con seguridad que la observación de que el puntaje promedio de quienes recibieron apoyo extra fue mayor que el promedio poblacional no fue el resultado del cambio. En otras palabras, podemos hacer una conjetura de que el apoyo extra puede haber contribuido al promedio más alto para el grupo de muestra (soporte extra). Si bien nuestro ejemplo utilizó la comparación de las medias usando puntuaciones z, podemos usar el mismo concepto para la comparación de las pruebas de medias con la prueba t y una comparación de proporciones también.

    Al realizar una prueba de hipótesis para hacer una inferencia estadística, es posible que sus decisiones sobre si rechazar o no la hipótesis nula fueran incorrectas. Es posible que rechaces erróneamente la hipótesis nula que era cierta. Este tipo de error se denomina error tipo-I, y este es el caso de la conclusión “falso-positiva”. Cuando un investigador no rechaza la hipótesis nula que es falsa, el investigador ha cometido un error tipo II (conclusión “falso-negativa”). Podemos tratar de salvaguardar contra estos errores. El nivel de significancia que discutimos anteriormente (nivel alfa) es la probabilidad de que cometerás un error tipo-I. Al aumentar el nivel alfa, puede asegurarse de que se reduzca su probabilidad de cometer este tipo o error. En cuanto a un error de tipo II, la probabilidad de cometer este error se relaciona con el concepto de “potencia” en las pruebas. En pocas palabras, cuanto mayor sea la muestra incluida en la prueba, menos probable es que el estudio sufra un error tipo 2.

    En esta sección, hemos introducido los conocimientos fundamentales para ampliar su interés en avanzar en sus habilidades de método cuantitativo. Lo que te expusieron aquí es una pequeña punta de un enorme iceberg estadístico. Si te interesa la investigación política cuantitativa, te animamos encarecidamente a inscribirte en un curso de estadística de nivel introductorio, preferentemente en ciencias políticas (si tu escuela ofrece) o en otro departamento de ciencias sociales y del comportamiento.