Saltar al contenido principal
LibreTexts Español

6.2: Intervalos básicos de confianza

  • Page ID
    149739
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Al igual que en otras partes de este capítulo, asumimos que estamos trabajando con alguna población (grande) sobre la que se define un RV cuantitativo\(X\). \(\ \mu_x\)Se desconoce la media poblacional, y queremos estimarla. mundo, inmutable pero también probablemente desconocida, simplemente porque para calcularla tendríamos que tener acceso a los valores de\(X\) para toda la población.

    Seguimos también con nuestra extraña suposición de que si bien desconocemos\(\ \mu_x\), sí conocemos la desviación estándar poblacional\(\ \sigma_x\), de\(X\).

    Nuestra estrategia para estimar\(\ \mu_x\) es tomar un SRS de tamaño\(n\), calcular la media\(\overline{x}\) de la\(X\) muestra y luego adivinar eso\(\ \mu_x\approx\overline{x}\). Pero esto nos deja preguntándonos qué tan buena\(\overline{x}\) es una aproximación de\(\ \mu_x\).

    La estrategia que tomamos para esto es averiguar qué tan cerca\(\ \mu_x\) debe estar\(\overline{x}\) —o\(\overline{x}\) de\(\ \mu_x\), es lo mismo, y de hecho ser lo suficientemente precisos como para decir cuál es la probabilidad de que\(\ \mu_x\) esté a cierta distancia de \(\overline{x}\). Es decir, si elegimos una probabilidad objetivo, llamarlo\(L\), queremos hacer un intervalo de números reales centrados en\(\overline{x}\) con la probabilidad de\(\ \mu_x\) estar en ese intervalo siendo\(L\).

    En realidad, eso no es realmente algo sensato de pedir: la probabilidad, recuerden, es la fracción de veces que algo sucede en experimentos repetidos. Pero no estamos eligiendo repetidamente\(\ \mu_x\) y viendo si está en ese intervalo. Justo lo contrario, de hecho:\(\ \mu_x\) es fijo (aunque desconocido para nosotros), y cada vez que elegimos un nuevo SRS — ese es el experimento repetido, ¡elegir nuevos SRS! — podemos calcular un nuevo intervalo y esperar que ese nuevo intervalo pueda contener\(\ \mu_x\). La probabilidad\(L\) corresponderá a qué fracción de esos intervalos recién calculados que contienen el (fijo, pero desconocido)\(\ \mu_x\).

    ¿Cómo hacer incluso esto?

    Bueno, el Teorema del Límite Central nos dice que la distribución de\(\overline{x}\) como tomamos SRS repetidos —exactamente el experimento repetible que estamos imaginando hacer— es aproximadamente Normal con media\(\ \mu_x\) y desviación estándar\(\ \sigma_x/\sqrt{n}\). Por la Regla 68-95-99.7:

    1. 68% del tiempo que tomamos muestras, el resultado\(\overline{x}\) será dentro de\(\ \sigma_x/\sqrt{n}\) unidades en la línea numérica de\(\ \mu_x\). Equivalentemente (ya que la distancia de A a B es la misma que la distancia de B a A!) , 68% del tiempo que tomemos muestras,\(\ \mu_x\) estará dentro\(\ \sigma_x/\sqrt{n}\) de\(\overline{x}\). Es decir, 68% de las veces que tomemos muestras,\(\ \mu_x\) pasará a estar en el intervalo de\(\overline{x}-\ \sigma_x/\sqrt{n}\) a\(\overline{x}+\ \sigma_x/\sqrt{n}\).

    2. De igual manera, 95% del tiempo que tomamos muestras, el resultado\(\overline{x}\) será dentro de\(2\ \sigma_x/\sqrt{n}\) unidades en la línea numérica de\(\ \mu_x\). Equivalentemente (ya que la distancia de A a B sigue siendo la misma que la distancia de B a A!) , 95% del tiempo que tomemos muestras,\(\ \mu_x\) estará dentro\(2\ \sigma_x/\sqrt{n}\) de\(\overline{x}\). Es decir, 95% de las veces que tomemos muestras,\(\ \mu_x\) pasará a estar en el intervalo de\(\overline{x}-2\ \sigma_x/\sqrt{n}\) a\(\overline{x}+2\ \sigma_x/\sqrt{n}\).

    3. De igual manera, 99.7% del tiempo que tomamos muestras, el resultado\(\overline{x}\) será dentro de\(3\ \sigma_x/\sqrt{n}\) unidades en la línea numérica de\(\ \mu_x\). Equivalentemente (ya que la distancia de A a B sigue siendo la misma que la distancia de B a A!) , 99.7% del tiempo que tomemos muestras,\(\ \mu_x\) estará dentro\(3\ \sigma_x/\sqrt{n}\) de\(\overline{x}\). Es decir, el 99.7% del tiempo que tomemos muestras,\(\ \mu_x\) pasará a estar en el intervalo de\(\overline{x}-3\ \sigma_x/\sqrt{n}\) a\(\overline{x}+3\ \sigma_x/\sqrt{n}\).

    Observe que la forma general aquí es que el intervalo va de\(\overline{x}-z_L^*\ \sigma_x/\sqrt{n}\) a\(\overline{x}+z_L^*\ \sigma_x/\sqrt{n}\), donde este número\(z_L^*\) tiene un nombre:

    [def:criticalvalue] El valor crítico\(z_L^*\) con probabilidad\(L\) para la distribución Normal es el número tal que la distribución Normal\(N(\ \mu_x, \ \sigma_x)\) tiene probabilidad\(L\) entre \(\ \mu_x-z_L^*\ \sigma_x\)y\(\ \mu_x+z_L^*\ \sigma_x\).

    Tenga en cuenta que la probabilidad\(L\) en esta definición suele llamarse nivel de confianza.

    Si lo piensas bien, la Regla 68-95-99.7 nos está diciendo exactamente que\(z_L^*=1\) si\(L=.68\),\(z_L^*=2\) si\(L=.95\), y\(z_L^*=3\) si\(L=.997\). De hecho, es conveniente hacer una tabla de valores similares, que se pueden calcular en una computadora a partir de la fórmula para la distribución Normal.

    [fact:critvaltable] Aquí hay una tabla útil de valores críticos para un rango de posibles niveles de confianza:

    \(L\) .5 .8 .9 .95 .99 .999
    \(z_L^*\) .674 1.282 1.645 1.960 2.576 3.291

    Tenga en cuenta que, curiosamente, el\(z_L^*\) aquí para no\(L=.95\) es\(2\), sino más bien\(1.96\)! Este es en realidad un valor más preciso de usar, que puede elegir usar, o puede continuar usando\(z_L^*=2\) cuando\(L=.95\), si lo desea, por fidelidad a la Regla 68-95-99.7.

    Ahora, usando estos valores críticos precisos podemos definir un intervalo que nos dice dónde esperamos que se encuentre el valor de\(\ \mu_x\).

    [def:confint] Para un valor de probabilidad\(L\), llamado nivel de confianza, el intervalo de números reales de\(\overline{x}-z_L^*\ \sigma_x/\sqrt{n}\) a\(\overline{x}+z_L^*\ \sigma_x/\sqrt{n}\) se denomina intervalo de confianza para\(\ \mu_x\) con nivel de confianza \(L\).

    El significado de la confianza aquí es bastante preciso (y un poco extraño):

    [fact:confidence] Cualquier intervalo de confianza en particular con nivel de confianza\(L\) podría o no contener realmente el parámetro solicitado\(\ \mu_x\). Más bien, lo que significa tener nivel de confianza\(L\) es que si tomamos SRS repetidos e independientes y calculamos nuevamente el intervalo de confianza para cada nuevo\(\overline{x}\) de los nuevos SRS, entonces una fracción del tamaño\(L\) de estos nuevos intervalos contendrá \(\ \mu_x\).

    Tenga en cuenta que cualquier intervalo de confianza en particular podría o\(\ \mu_x\) no contener no porque\(\ \mu_x\) se está moviendo, sino que los SRS son diferentes cada vez, por lo que\(\overline{x}\) es (potencialmente) diferente, y por lo tanto el intervalo se mueve alrededor. El\(\ \mu_x\) es fijo (pero desconocido), mientras que los intervalos de confianza se mueven.

    A veces a la pieza que sumamos y restamos del\(\overline{x}\) para hacer un intervalo de confianza se le da un nombre propio:

    [def:marginoferror] Cuando escribimos un intervalo de confianza para la media poblacional\(\ \mu_x\) de alguna variable cuantitativa\(X\) en la forma\(\overline{x}-E\) a\(\overline{x}+E\)\(E=z_L^*\ \sigma_x/\sqrt{n}\), donde, llamamos\(E\) al margen de error [o, a veces, el error de muestreo] del intervalo de confianza.

    Obsérvese que si se da un intervalo de confianza sin un nivel de confianza declarado, particularmente en la prensa popular, debemos asumir que el nivel implícito fue de .95.

    Pestituciones

    Lo que más a menudo sale mal al usar intervalos de confianza es que los datos de muestra utilizados para calcular la media de la muestra\(\overline{x}\) y luego los puntos finales\(\overline{x}\pm E\) del intervalo no son de un buen SRS. Es difícil conseguir SRS, así que esto no es inesperado. Pero sin embargo, con frecuencia asumimos que alguna muestra es un SRS, de manera que podemos usarlo para hacer un intervalo de confianza, incluso de esa suposición no está realmente justificada.

    Otra cosa que puede suceder para que los intervalos de confianza sean menos precisos es elegir un tamaño de muestra demasiado pequeño\(n\). Hemos visto que nuestro enfoque de los intervalos de confianza se basa en el CLT, por lo que normalmente necesita muestras de tamaño al menos 30.

    [eg:CI1] Una encuesta a 463 estudiantes de primer año de la Universidad Estatal de Euphoria [ESU] encontró que el promedio [muestra] de cuánto tiempo reportaron estudiar por semana fue de 15.3 horas. Supongamos que de alguna manera sabemos que la desviación estándar poblacional de horas de estudio por semana en la USE es de 8.5. Entonces podemos encontrar un intervalo de confianza en el nivel de confianza del 99% para el estudio medio por semana de todos los estudiantes de primer año calculando el margen de error a ser\[E==z_L^*\ \sigma_x/\sqrt{n} = 2.576\cdot8.5/\sqrt{463} = 1.01759\] y luego señalando que el intervalo de confianza va de\[\overline{x}-E = 15.3 - 1.01759 = 14.28241\] a\[\overline{x}+E = 15.3 + 1.01759 = 16.31759\,.\]

    Tenga en cuenta que para que este cálculo esté haciendo lo que queremos que haga, debemos asumir que los 463 estudiantes de primer año fueron un SRS de toda la población de estudiantes de primer año en ESU.

    Obsérvese también que lo que significa que tenemos 99% de confianza en este intervalo de 14.28241 a 16.31759 (o\([14.28241, 16.31759]\) en notación de intervalo) no es, de hecho, que tengamos alguna confianza en absoluto en esos números particulares. Más bien, tenemos confianza en el método, en el sentido de que si imaginamos independientemente tomar muchas SRS futuras de tamaño 463 y recalcular nuevos intervalos de confianza, entonces el 99% de estos intervalos futuros contendrán el uno, fijo, desconocido\(\ \mu_x\).


    This page titled 6.2: Intervalos básicos de confianza is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Jonathan A. Poritz via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.