Saltar al contenido principal
LibreTexts Español

6.1: El Teorema del Límite Central

  • Page ID
    149730
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Tomar el promedio [media] de una muestra de datos cuantitativos es en realidad un proceso muy agradable: la aritmética es simple, y el promedio a menudo tiene la propiedad agradable de estar más cerca del centro de los datos que los propios valores que se combinan o promedian. Esto se debe a que si bien una muestra aleatoria puede haber elegido aleatoriamente algunos valores particularmente grandes (o particularmente pequeños) de los datos, probablemente también eligió algunos otros valores pequeños (o grandes), de modo que la media estará en el medio. Resulta que estas observaciones generales de lo agradable que una muestra media puede explicarse y formalizarse en un Teorema muy importante:

    HECHO 6.1.1. El Teorema del Límite Central [CLT] Supongamos que tenemos una gran población sobre la que se define una variable aleatoria cuantitativa\(X\) cuya media poblacional es\(\ \mu_X\) y cuya desviación estándar poblacional es\(\ \sigma_X\) . Arreglar un número entero\(n\ge30\). A medida que tomamos SRS repetidos e independientes de tamaño\(n\), la distribución de las medias\(\overline{x}\) muestrales de estas SRS es aproximadamente\(N(\ \mu_X, \sigma_X/\sqrt{n})\). Es decir, la distribución de\(\overline{x}\) es aproximadamente Normal con media\(\ \mu_X\) y desviación estándar\(\sigma_X/\sqrt{n}\).

    Además, a medida que\(n\) se hace más grande, la aproximación Normal mejora.

    Tenga en cuenta que el CLT tiene varias piezas bonitas. En primer lugar, nos dice que la mitad del histograma de medias muestrales, a medida que obtenemos muestras independientes repetidas, es la misma que la media de la población original — la media de las medias de la muestra es la media poblacional. Podríamos escribir esto como\(\ \sigma_{\bar{X}} = \mu_X\).

    En segundo lugar, el CLT nos dice precisamente cuánta menor variación hay en las medias de la muestra debido al proceso señalado anteriormente en el que los promedios están más cerca de la mitad de algunos datos que los propios valores de los datos. La fórmula es\(\ \sigma_{\bar{X}} = \sigma_x/\sqrt{n}\).

    Por último y lo más sorprendente, el CLT en realidad nos dice exactamente para qué sirve la forma de la distribución\(\overline{x}\) —y resulta ser esa fórmula complicada que le dimos Definición 4.3.19. Esto es completamente inesperado, pero de alguna manera el universo conoce esa fórmula para la función de densidad de distribución Normal y la hace aparecer cuando construimos el histograma de medias muestrales.

    Aquí hay un ejemplo de cómo usamos el CLT:

    EJEMPLO 6.1.2. Hemos dicho en otra parte que las alturas de los machos americanos adultos en pulgadas se distribuyen como\(N(69, 2.8)\). Suponiendo que esto es cierto, descubramos cuál es la probabilidad de que 52 hombres estadounidenses adultos elegidos al azar, acostados seguidos con los pies de cada uno tocando la cabeza del siguiente, estiren la longitud de un campo de fútbol. [¿Por qué 52? Bueno, un equipo de futbol americano puede tener hasta 53 personas en su roster activo, y uno de ellos tiene que permanecer de pie para supervisar la formación de todos los demás tendidos en el campo...]

    En primer lugar, observe que un campo de fútbol tiene 100 yardas de largo, lo que mide 300 pies o 3600 pulgadas. Si cada uno de nuestros hombres elegidos al azar fuera exactamente la estatura promedio para los hombres adultos, eso sería un total de\(52*69=3588\) pulgadas, por lo que no se estirarían toda la longitud. Pero hay variación de las alturas, así que a lo mejor va a suceder a veces...

    Así que imagina que hemos elegido 52 hombres americanos adultos al azar. Mida cada una de sus alturas, y llame a esos números\(x_1, x_2, \dots, x_{52}\). Lo que estamos tratando de averiguar es si\(\sum x_i \ge 3600\). Más precisamente, queremos saber\[P\left(\sum x_i \ge 3600\right)\ .\] Nada en eso parece familiar, pero recuerda que los 52 hombres adultos fueron elegidos al azar. La mejor manera de elegir algún número, llamarlo\(n=52\), de individuos de una población es elegir un SRS de tamaño\(n\).

    Supongamos también que lo hicimos aquí. Ahora bien, al tener un SRS, sabemos por el CLT que la media muestral\(\overline{x}\) es\(N(69, 2.8/\sqrt{52})\) o, haciendo la aritmética,\(N(69, .38829)\).

    Pero la pregunta que estamos considerando aquí no menciona\(\overline{x}\), ¡lloras! Bueno, casi lo hace:\(\overline{x}\) es la media muestral dada por\[\overline{x} = \frac{\sum x_i}{n} = \frac{\sum x_i}{52} \ .\] Lo que eso significa es que la desigualdad\[\sum x_i \ge 3600\] equivale exactamente a lo mismo, dividiendo ambos lados por 52, como la desigualdad\[\frac{\sum x_i}{52} \ge \frac{3600}{52}\] o, en otras palabras,\[\overline{x} \ge 69.23077\ .\] ya que todas estas desigualdades equivalen a lo mismo cosa, tienen las mismas probabilidades, así que\[P\left(\sum x_i \ge 3600\right) = P\left(\overline{x} \ge 69.23077\right)\ .\] Pero recuerda que\(\overline{x}\) fue\(N(69, .38829)\), así podemos calcular esta probabilidad con LibreOffice Calc o Microsoft Excel como\[\begin{aligned} P\left(\overline{x} \ge 69.23077\right) & = 1 - P\left(\overline{x} < 69.23077\right)\\ & = \text{ NORM.DIST}(69.23077, 69, .38829, 1)\\ & = .72385\end{aligned}\] donde aquí primero usamos el regla de probabilidad para complementos para dar vuelta a la desigualdad en la dirección que calcula NORM.DIST.

    Así, la posibilidad de que 52 hombres adultos elegidos al azar, acostados en una columna larga, sean tan largos como un campo de fútbol, es de 72.385%.


    This page titled 6.1: El Teorema del Límite Central is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Jonathan A. Poritz via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.