8.1: El teorema del límite central para las medias muestrales

Última actualización
Guardar como PDF

Page ID: 151596

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Primero, piense en una variable aleatoria\(X\) de una población que se define por alguna función de distribución de probabilidad o densidad. Esta variable aleatoria podría ser datos continuos o discretos. El muestreo es la obtención repetida de valores de esta variable aleatoria.

Definiremos una Muestra Aleatoria\(X_{1}, X_{2}, \ldots, X_{n}\) en la que cada una de las variables aleatorias\(X_{i}\) tiene la misma distribución de probabilidad y son mutuamente independientes entre sí. La media muestral es una función de estas variables aleatorias (sumarlas y dividirlas por el tamaño de la muestra), por lo que\(\overline{X}\) es una variable aleatoria. Entonces, ¿de qué sirve la Función de Distribución de Probabilidad (pdf)\(\overline{X}\)?

Para responder a esta pregunta, realice el siguiente experimento. Rodaremos muestras de\(n\) dados, determinaremos el rollo medio, y crearemos un pdf para diferentes valores de\(n\). Para el caso\(n=1\), la distribución de la media muestral es la misma que la distribución de la variable aleatoria. Dado que cada dado tiene la misma posibilidad de ser elegido, la distribución es de forma rectangular centrada en 3.5:

Para el caso\(n=2\), la distribución de la media muestral comienza a tomar una forma triangular ya que algunos valores tienen más probabilidades de ser enrollados que otros. Por ejemplo, hay seis formas de rodar un total de 7 y obtener una media muestral de 3.5, pero sólo una forma de rodar un total de 2 y obtener una media de muestra de 1. Observe que el pdf sigue centrado en 3.5.

Para el caso\(n=10\), el pdf de la media muestral adquiere ahora una forma de campana familiar que parece una Distribución Normal. El centro se encuentra todavía en 3.5 y los valores están ahora más agrupados alrededor de la media, lo que implica que la desviación estándar ha disminuido.

Por último, para el caso\(n=30\), el pdf sigue pareciéndose a la Distribución Normal centrada alrededor de la misma media de 3.5, pero más agrupada que el ejemplo anterior:

Este ejemplo de muero demuestra las tres observaciones importantes del Teorema del Límite Central sobre el PDF\(\overline{X}\) en comparación con el pdf de la variable aleatoria original.

La media se mantiene igual.
La desviación estándar se hace más pequeña.
A medida que aumenta el tamaño de la muestra, el pdf de\(\overline{X}\) es aproximadamente una Distribución Normal.

Teorema del límite central para la media muestral

Si\(X_{1}, X_{2}, \ldots, X_{n}\) es una muestra aleatoria de una población que tiene una media\(\mu\) y una desviación estándar\(\sigma\), y\(n\) es suficientemente grande (\(n \geq 30\)) entonces:

\(\mu_{\bar{X}}=\mu\)
\(\sigma_{\bar{X}}=\dfrac{\sigma}{\sqrt{n}}\)
La Distribución de\(\overline{X}\) es aproximadamente Normal.

Combinando todo lo anterior en una sola fórmula:\(Z=\dfrac{\overline{X}-\mu}{\sigma / \sqrt{n}}\), donde\(Z\) representa la Distribución Normal Estándar.

Este potente resultado nos permite utilizar la media muestral\(\overline{X}\) como estimador de la media poblacional\(\mu\). De hecho, la mayoría de las estadísticas inferenciales practicadas hoy en día no serían posibles sin el Teorema del Límite Central.

Ejemplo: Altura media de los hombres

La estatura media de los hombres estadounidenses (edades 20-29) es\(\mu = 69.2\) pulgadas. Si se selecciona una muestra aleatoria de 60 hombres en este grupo de edad, ¿cuál es la probabilidad de que la estatura media para la muestra sea mayor a 70 pulgadas? Asumir\(\sigma=2.9^{\prime \prime}\)

Solución

Debido al Teorema del Límite Central, sabemos que la distribución de la Muestra tendrá aproximadamente una Distribución Normal:

\[P(\overline{X}>70)=P\left(Z>\dfrac{(70-69.2)}{2.9 / \sqrt{60}}\right)=P(Z>2.14)=0.0162 \nonumber \]

Compare esto con la probabilidad mucho mayor de que un macho elegido tenga más de 70 pulgadas de alto:

\[P(X>70)=P\left(Z>\dfrac{(70-69.2)}{2.9}\right)=P(Z>0.28)=0.3897 \nonumber \]

Este ejemplo demuestra cómo la media muestral se agrupará hacia la media poblacional a medida que aumenta el tamaño de la muestra.

Ejemplo: Mensajes de texto

El tiempo de espera hasta recibir un mensaje de texto sigue una distribución exponencial con un tiempo de espera esperado de 1.5 minutos. Encuentra la probabilidad de que el tiempo medio de espera para los 50 mensajes de texto supere los 1.6 minutos.

Solución

Para la distribución exponencial, la media es igual a la desviación estándar. Dado que el tamaño de la muestra es superior a 30, la distribución de\(\overline{X}\) será normal, a pesar de que la distribución de\(X\) es muy sesgada.

\(\mu=1.6 \qquad \sigma=1.6 \qquad n=50\)

\ (\ begin {alineado}
P (\ bar {X} >1.6) &=P\ izquierda (Z>\ frac {(1.6-1.5)} {1.5/\ sqrt {50}}\ derecha)\\
&=P (Z>0.47)\\ &=0.3192
\ end {alineado}\)