Saltar al contenido principal
LibreTexts Español

4.14: Estimación de un intervalo de confianza

  • Page ID
    150464
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Estadísticas significa no tener que decir que estás seguro — Origen desconocido

    Hasta este punto en este capítulo, hemos esbozado los fundamentos de la teoría del muestreo en los que se basan los estadísticos para hacer conjeturas sobre los parámetros de la población a partir de una muestra de datos. Como ilustra esta discusión, una de las razones por las que necesitamos toda esta teoría de muestreo es que cada conjunto de datos nos deja algo de incertidumbre, por lo que nuestras estimaciones nunca van a ser perfectamente precisas. Lo que ha estado faltando en esta discusión es un intento de cuantificar la cantidad de incertidumbre en nuestra estimación. No basta con poder adivinar que el coeficiente intelectual medio de los estudiantes de licenciatura en psicología es de 115 (sí, acabo de inventar ese número). También queremos poder decir algo que exprese el grado de certeza que tenemos en nuestra conjetura. Por ejemplo, sería bueno poder decir que hay un 95% de posibilidades de que la verdadera media se encuentre entre 109 y 121. El nombre para esto es un intervalo de confianza para la media.

    Armado con una comprensión de las distribuciones de muestreo, construir un intervalo de confianza para la media es bastante fácil. Así es como funciona. Supongamos que la verdadera media poblacional es\(\mu\) y la desviación estándar es\(\sigma\). Acabo de terminar de dirigir mi estudio que tiene\(N\) participantes, y el coeficiente intelectual medio entre esos participantes es\(\bar{X}\). Sabemos por nuestra discusión del teorema del límite central que la distribución muestral de la media es aproximadamente normal. También sabemos por nuestra discusión sobre la distribución normal que existe un 95% de probabilidad de que una cantidad normalmente distribuida caiga dentro de dos desviaciones estándar de la media verdadera. Para ser más precisos, podemos usar la función qnorm () para calcular los percentiles 2.5 y 97.5 de la distribución normal

    qnorm( p = c(.025, .975) ) [1] -1.959964 1.959964
    

    Bien, entonces mentí antes. La respuesta más correcta es que un 95% de probabilidad de que una cantidad normalmente distribuida caiga dentro de 1.96 desviaciones estándar de la media verdadera.

    A continuación, recordemos que la desviación estándar de la distribución muestral es referida como el error estándar, y el error estándar de la media se escribe como SEM. Cuando juntamos todas estas piezas, aprendemos que existe una probabilidad del 95% de que la media muestral\(\bar{X}\) que hemos observado se encuentre dentro de 1.96 errores estándar de la media poblacional. Oof, eso es mucha charla matemática ahí. Lo aclararemos, no te preocupes.

    Matemáticamente, escribimos esto como:

    \[\mu - \left( 1.96 \times \mbox{SEM} \right) \ \leq \ \bar{X}\ \leq \ \mu + \left( 1.96 \times \mbox{SEM} \right) \nonumber \]

    donde el SEM es igual a\(\sigma / \sqrt{N}\), y podemos estar 95% seguros de que esto es cierto.

    Sin embargo, eso no es responder a la pregunta que realmente nos interesa. La ecuación anterior nos dice qué debemos esperar de la media muestral, dado que sabemos cuáles son los parámetros poblacionales. Lo que queremos es tener este trabajo al revés: queremos saber qué debemos creer sobre los parámetros poblacionales, dado que hemos observado una muestra en particular. No obstante, no es demasiado difícil hacer esto. Usando un poco de álgebra de secundaria, una forma furtiva de reescribir nuestra ecuación es así:

    \[\bar{X} - \left( 1.96 \times \mbox{SEM} \right) \ \leq \ \mu \ \leq \ \bar{X} + \left( 1.96 \times \mbox{SEM}\right) \nonumber \]

    Lo que esto está diciendo es que el rango de valores tiene una probabilidad del 95% de contener la media poblacional\(\mu\). Nos referimos a este rango como un intervalo de confianza del 95%, denotado\(\mbox{CI}_{95}\). En definitiva, siempre y cuando\(N\) sea suficientemente grande —lo suficientemente grande como para que creamos que la distribución muestral de la media es normal— entonces podemos escribir esto como nuestra fórmula para el intervalo de confianza del 95%:

    \[\mbox{CI}_{95} = \bar{X} \pm \left( 1.96 \times \frac{\sigma}{\sqrt{N}} \right) \nonumber \]

    Por supuesto, no hay nada especial en el número 1.96: simplemente pasa a ser el multiplicador que necesitas usar si quieres un intervalo de confianza del 95%. Si hubiera querido un intervalo de confianza del 70%, podría haber usado la función qnorm () para calcular los cuantiles 15 y 85:

    qnorm( p = c(.15, .85) ) [1] -1.036433 1.036433
    

    y así la fórmula para\(\mbox{CI}_{70}\) sería la misma que la fórmula para\(\mbox{CI}_{95}\) excepto que usaríamos 1.04 como nuestro número mágico en lugar de 1.96.

    Un ligero error en la fórmula

    Como siempre, mentí. La fórmula que he dado anteriormente para el intervalo de confianza del 95% es aproximadamente correcta, pero pasé por alto un detalle importante en la discusión. Observe mi fórmula requiere que use el error estándar de la media, SEM, que a su vez requiere que use la verdadera desviación estándar de la población\(\sigma\).

    Sin embargo, antes recalcamos el hecho de que en realidad no conocemos los verdaderos parámetros poblacionales. Debido a que no conocemos el verdadero valor de\(\sigma\), tenemos que usar una estimación de la desviación estándar de la población\(\hat{\sigma}\) en su lugar. Esto es bastante sencillo de hacer, pero esto tiene la consecuencia de que necesitamos usar los cuantiles de la\(t\) distribución en lugar de la distribución normal para calcular nuestro número mágico; y la respuesta depende del tamaño de la muestra. Además, todavía no hemos hablado de la\(t\) distribución.

    Cuando usamos la\(t\) distribución en lugar de la distribución normal, obtenemos números más grandes, lo que indica que tenemos más incertidumbre. ¿Y por qué tenemos esa incertidumbre extra? Bueno, ¡porque nuestra estimación de la desviación estándar de la población\(\hat\sigma\) podría estar equivocada! Si está mal, implica que estamos un poco menos seguros de cómo se ve realmente nuestra distribución muestral de la media... y esta incertidumbre termina reflejándose en un intervalo de confianza más amplio.


    This page titled 4.14: Estimación de un intervalo de confianza is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.