Saltar al contenido principal
LibreTexts Español

10.7: Intervalo de confianza para la media

  • Page ID
    151991
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    • Utilice la calculadora de distribución normal inversa para encontrar el valor de usar\(z\) para un intervalo de confianza
    • Calcular un intervalo de confianza en la media cuando\(\sigma\) se conoce
    • Determinar si usar una\(t\) distribución o una distribución normal
    • Calcular un intervalo de confianza sobre la media cuando\(\sigma\) se estima

    Cuando computas un intervalo de confianza sobre la media, calculas la media de una muestra para estimar la media de la población. Claramente, si ya conocías la media poblacional, no habría necesidad de un intervalo de confianza. Sin embargo, para explicar cómo se construyen los intervalos de confianza, vamos a trabajar hacia atrás y comenzar asumiendo características de la población. Luego mostraremos cómo se pueden usar los datos de muestra para construir un intervalo de confianza.

    Supongamos que los pesos\(10\) de los niños de un año se distribuyen normalmente con una media de\(90\) y una desviación estándar de\(36\). ¿Cuál es la distribución muestral de la media para un tamaño de muestra de\(9\)? Recordemos de la sección sobre la distribución muestral de la media que la media de la distribución muestral es\(\mu\) y el error estándar de la media es

    \[\sigma _M=\frac{\sigma }{\sqrt{N}}\]

    Para el presente ejemplo, la distribución muestral de la media tiene una media de\(90\) y una desviación estándar de\(36/3 = 12\). Tenga en cuenta que la desviación estándar de una distribución de muestreo es su error estándar. La figura\(\PageIndex{1}\) muestra esta distribución. El área sombreada representa la mitad\(95\%\) de la distribución y se extiende desde\(66.48\) hasta\(113.52\). Estos límites se calcularon sumando y restando desviaciones\(1.96\) estándar a/de la media de la\(90\) siguiente manera:

    \[90 - (1.96)(12) = 66.48\]

    \[ 90 + (1.96)(12) = 113.52\]

    El valor de\(1.96\) se basa en el hecho\(95\%\) de que del área de una distribución normal se encuentra dentro de las desviaciones\(1.96\) estándar de la media;\(12\) es el error estándar de la media.

    ci1.gif
    Figura\(\PageIndex{1}\): La distribución muestral de la media para\(N=9\). La mitad\(95\%\) de la distribución está sombreada

    La figura\(\PageIndex{1}\) muestra que\(95\%\) de las medias no son más que\(23.52\) unidades (desviaciones\(1.96\) estándar) de la media de\(90\). Ahora considere la probabilidad de que una media muestral calculada en una muestra aleatoria esté dentro de\(23.52\) unidades de la media poblacional de\(90\). Dado que\(95\%\) de la distribución está dentro\(23.52\) de\(90\), la probabilidad de que la media de cualquier muestra dada esté dentro\(23.52\) de\(90\) es\(0.95\). Esto significa que si calculamos repetidamente la media (\(M\)) a partir de una muestra, y creamos un intervalo que va de\(M - 23.52\) a\(M + 23.52\), este intervalo contendrá la media poblacional\(95\%\) del tiempo. En general, calcula el intervalo de\(95\%\) confianza para la media con la siguiente fórmula:

    \[\text{Lower limit} = M - Z_{0.95}\sigma _M\]

    \[\text{Upper limit} = M + Z_{0.95}\sigma _M\]

    donde\(Z_{0.95}\) es el número de desviaciones estándar que se extienden desde la media de una distribución normal requerida para contener\(0.95\) del área y\(\sigma _M\) es el error estándar de la media.

    Si miras de cerca esta fórmula para un intervalo de confianza, notarás que necesitas conocer la desviación estándar (\(\sigma\)) para estimar la media. Esto puede sonar poco realista, y lo es. Sin embargo, calcular un intervalo de confianza cuando\(\sigma\) se conoce es más fácil que cuando se\(\sigma\) tiene que estimar, y tiene un propósito pedagógico. Posteriormente en esta sección mostraremos cómo calcular un intervalo de confianza para la media cuando se\(\sigma\) tiene que estimar.

    Supongamos que los siguientes cinco números fueron muestreados de una distribución normal con una desviación estándar de\(2.5: 2, 3, 5, 6,\; and\; 9\). Para calcular el intervalo de\(95\%\) confianza, comience calculando la media y el error estándar:

    \[M = \frac{2 + 3 + 5 + 6 + 9}{5} = 5\]

    \[\sigma _M=\frac{2.5}{\sqrt{5}}=1.118\]

    \(Z_{0.95}\)se puede encontrar usando la calculadora de distribución normal y especificando que el área sombreada es\(0.95\) e indicando que desea que el área esté entre los puntos de corte. Como se muestra en la Figura\(\PageIndex{2}\), el valor es\(1.96\). Si hubiera querido calcular el intervalo de\(99\%\) confianza, habría establecido el área sombreada en\(0.99\) y el resultado habría sido\(2.58\).

    nc1.gif
    Figura\(\PageIndex{2}\):\(95\%\) del área está entre\(-1.96\) y\(1.96\)

    El intervalo de confianza se puede calcular de la siguiente manera:

    \[\text{Lower limit} = 5 - (1.96)(1.118)= 2.81\]

    \[\text{Upper limit} = 5 + (1.96)(1.118)= 7.19\]

    Debe usar la\(t\) distribución en lugar de la distribución normal cuando no se conoce la varianza y tiene que estimarse a partir de datos de muestra. Cuando el tamaño de la muestra es grande, digamos\(100\) o superior, la distribución t es muy similar a la distribución normal estándar. Sin embargo, con tamaños de muestra más pequeños, la\(t\) distribución es leptoúrtica, lo que significa que tiene relativamente más puntuaciones en sus colas que la distribución normal. Como resultado, hay que extenderse más lejos de la media para contener una proporción dada del área. Recordemos que con una distribución normal,\(95\%\) de la distribución se encuentra dentro de las desviaciones\(1.96\) estándar de la media. El uso de la\(t\) distribución, si tiene un tamaño de muestra de solo\(5\),\(95\%\) del área está dentro de las desviaciones\(2.78\) estándar de la media. Por lo tanto, el error estándar de la media se multiplicaría por\(2.78\) más que por\(1.96\).

    Los valores de\(t\) a utilizar en un intervalo de confianza se pueden buscar en una tabla de la\(t\) distribución. Una versión pequeña de dicha tabla se muestra en la Tabla\(\PageIndex{1}\). La primera columna,\(df\), significa grados de libertad, y para intervalos de confianza en la media,\(df\) es igual a\(N - 1\), donde\(N\) está el tamaño de la muestra.

    Tabla\(\PageIndex{1}\):\(t\) Tabla abreviada
    df 0.95 0.99
    2 4.303 9.925
    3 3.182 5.841
    4 2.776 4.604
    5 2.571 4.032
    8 2.306 3.355
    10 2.228 3.169
    20 2.086 2.845
    50 2.009 2.678
    100 1.984 2.626

    También puede usar la calculadora de “distribución t inversa” para encontrar los\(t\) valores a usar en intervalos de confianza. Conocerás más sobre la\(t\) distribución en la siguiente sección.

    Supongamos que se muestrean los cinco números siguientes a partir de una distribución normal:\(2, 3, 5, 6,\; and\; 9\) y que no se conoce la desviación estándar. Los primeros pasos son calcular la media y varianza de la muestra:

    \[M=5\; \text{and}\; S^2=7.5\]

    El siguiente paso es estimar el error estándar de la media. Si conociéramos la varianza poblacional, podríamos usar la siguiente fórmula:

    \[\sigma _M=\frac{\sigma }{\sqrt{N}}\]

    En su lugar calculamos una estimación del error estándar (\(s_M\)):

    \[s _M=\frac{s}{\sqrt{N}}=1.225\]

    El siguiente paso es encontrar el valor de\(t\). Como puede ver en Tabla\(\PageIndex{1}\), el valor para el\(95\%\) intervalo para\(df = N - 1 = 4\) es\(2.776\). El intervalo de confianza se calcula entonces tal como es cuando\(\sigma _M\). Las únicas diferencias son eso\(s_M\) y t más bien que\(\sigma _M\) y\(Z\) se utilizan.

    \[\text{Lower limit} = 5 - (2.776)(1.225) = 1.60\]

    \[\text{Upper limit} = 5 + (2.776)(1.225) = 8.40\]

    De manera más general, la fórmula para el intervalo de\(95\%\) confianza en la media es:

    \[\text{Lower limit} = M - (t_{CL})(s_M)\]

    \[\text{Upper limit} = M + (t_{CL})(s_M)\]

    donde\(M\) está la media de la muestra,\(t_{CL}\) es la\(t\) para el nivel de confianza deseado (\(0.95\)en el ejemplo anterior), y\(s_M\) es el error estándar estimado de la media.

    Terminaremos con un análisis del Stroop Data. Específicamente, calcularemos un intervalo de confianza sobre la puntuación de diferencia media. Recordemos que\(47\) los sujetos nombraron el color de la tinta en el que estaban escritas las palabras. Los nombres entraban en conflicto para que, por ejemplo, nombraran el color de tinta de la palabra "azul" escrita en tinta roja. La respuesta correcta es decir “rojo” e ignorar el hecho de que la palabra es “azul”. En una segunda condición, los sujetos nombraron el color de tinta de los rectángulos de colores.

    Tabla\(\PageIndex{2}\): Tiempos de respuesta en segundos para\(10\) sujetos
    Nombrar Rectángulo de Color Interferencia Diferencia
    17 38 21
    15 58 43
    18 35 17
    20 39 19
    18 33 15
    20 32 12
    20 45 25
    19 52 33
    17 31 14
    21 29 8

    \(\PageIndex{2}\)La tabla muestra la diferencia de tiempo entre las condiciones de interferencia y de nombre\(10\) de color para los\(47\) sujetos. La diferencia de tiempo promedio para todos los\(47\) sujetos es\(16.362\) segundos y la desviación estándar es\(7.470\) segundos. El error estándar de la media es\(1.090\). Una\(t\) tabla muestra el valor crítico de\(t\) para\(47 - 1 = 46\) grados de libertad es\(2.013\) (para un intervalo de\(95\%\) confianza). Por tanto, el intervalo de confianza se calcula de la siguiente manera:

    \[\text{Lower limit} = 16.362 - (2.013)(1.090) = 14.17\]

    \[\text{Upper limit} = 16.362 - (2.013)(1.090) = 18.56\]

    Por lo tanto, es probable que el efecto de interferencia (diferencia) para toda la población sea entre\(14.17\) y\(18.56\) segundos.


    This page titled 10.7: Intervalo de confianza para la media is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.