Saltar al contenido principal
LibreTexts Español

9.3: Teorema de Límite Central para Ensayos Independientes Continuos

  • Page ID
    150256
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Hemos visto en la Sección 1.2 que la función de distribución para la suma de un gran número\(n\) de variables aleatorias discretas independientes con media\(\mu\) y varianza\(\sigma^2\) tiende a parecerse a una densidad normal con media\(n\mu\) y varianza\(n\sigma^2\). Lo que es notable de este resultado es que se mantiene para cualquier distribución con media finita y varianza. Veremos en esta sección que el mismo resultado también es válido para variables aleatorias continuas que tienen una función de densidad común.

    Empecemos por mirar algunos ejemplos para ver si tal resultado es incluso plausible.

    Sumas estandarizadas

    Supongamos que elegimos números\(n\) aleatorios del intervalo\([0,1]\) con densidad uniforme. Dejemos\(X_1\)\(X_2\),,...,\(X_n\) denotar estas elecciones, y\(S_n = X_1 + X_2 +\cdots+ X_n\) su suma.

    Vimos en Ejemplo [examen 7.12] que la función de densidad para\(S_n\) tiende a tener una forma normal, pero se centra en\(n/2\) y se aplana. Con el fin de comparar las formas de estas funciones de densidad para diferentes valores de\(n\), procedemos como en la sección anterior: nosotros\(S_n\) definiendo\[S_n^* = \frac {S_n - n\mu}{\sqrt n \sigma}\ .\] Entonces vemos que para todos\(n\) tenemos\[\begin{aligned} E(S_n^*) & = & 0\ , \\ V(S_n^*) & = & 1\ .\end{aligned}\] La función de densidad para\(S_n^*\) es solo una versión estandarizada de la densidad función para\(S_n\) (ver Figura [fig 9.7]).

    Hagamos lo mismo, pero ahora escoja números del intervalo\([0,+\infty)\) con una densidad exponencial con parámetro\(\lambda\). Luego (ver Ejemplo [examen 6.21])

    \[\begin{aligned} \mu & = & E(X_i) = \frac 1\lambda\ , \\ \sigma^2 & = & V(X_j) = \frac 1{\lambda^2}\ .\end{aligned}\]

    Aquí conocemos la función de densidad para\(S_n\) explícitamente (ver Sección [sec 7.2]). Podemos usar Corolario [cor 5.1] para calcular la función de densidad para\(S_n^*\). Obtenemos

    \[\begin{aligned} f_{S_n}(x) & = & \frac {\lambda e^{-\lambda x}(\lambda x)^{n - 1}}{(n - 1)!}\ , \\ f_{S_n^*}(x) & = & \frac {\sqrt n}\lambda f_{S_n} \left( \frac {\sqrt n x + n}\lambda \right)\ .\end{aligned}\]La gráfica de la función de densidad para\(S_n^*\) se muestra en la Figura [fig 9.9].

    Estos ejemplos hacen que parezca plausible que la función de densidad para la variable aleatoria normalizada\(S_n^*\) para grande\(n\) se parecerá mucho a la densidad normal con media 0 y varianza 1 en el caso continuo así como en el caso discreto. El Teorema del Límite Central hace que esta afirmación sea precisa.

    Teorema de Límite Central

    [thm 9.4.7] (Teorema de Límite Central) Let\(S_n = X_1 + X_2 +\cdots+ X_n\) Ser la suma de variables aleatorias continuas\(n\) independientes con función de densidad común\(p\) teniendo valor esperado\(\mu\) y varianza\(\sigma^2\). Vamos\(S_n^* = (S_n - n\mu)/\sqrt n \sigma\). Entonces tenemos, para todos\(a < b\),\[\lim_{n \to \infty} P(a < S_n^* < b) = \frac 1{\sqrt{2\pi}} \int_a^b e^{-x^2/2}\, dx\ .\]

    Daremos una prueba de este teorema en la Sección [sec 10.3]. Ahora veremos algunos ejemplos.

    [examen 9.10] Supongamos que un topógrafo quiere medir una distancia conocida, digamos de 1 milla, utilizando un tránsito y algún método de triangulación. Sabe que debido al posible movimiento del tránsito, las distorsiones atmosféricas y el error humano, cualquier medición es apta para ser ligeramente errónea. Planea hacer varias medidas y tomar un promedio. Asume que sus mediciones son variables aleatorias independientes con una distribución común de media\(\mu = 1\) y desviación estándar\(\sigma = .0002\) (así, si los errores se distribuyen aproximadamente normalmente, entonces sus mediciones están dentro de 1 pie de la distancia correcta alrededor del 65% del tiempo). ¿Qué puede decir del promedio?

    Puede decir que si\(n\) es grande, el promedio\(S_n/n\) tiene una función de densidad que es aproximadamente normal, con\(\mu = 1\) milla media, y\(\sigma = .0002/\sqrt n\) millas de desviación estándar.

    ¿Cuántas medidas debe hacer para estar razonablemente seguro de que su promedio se encuentra dentro de .0001 del verdadero valor? La desigualdad de Chebyshev dice\[P\left(\left| \frac {S_n}n - \mu \right| \geq .0001 \right) \leq \frac {(.0002)^2}{n(10^{-8})} = \frac 4n\ ,\] así que debemos tener\(n \ge 80\) ante la probabilidad de que su error sea menor que .0001 supere .95.

    Ya nos hemos dado cuenta de que la estimación en la desigualdad de Chebyshev no siempre es buena, y aquí hay un caso en cuestión. Si asumimos que\(n\) es lo suficientemente grande como para que la densidad para\(S_n\) sea aproximadamente normal, entonces tenemos

    \[\begin{aligned} P\left(\left| \frac {S_n}n - \mu \right| < .0001 \right) &=& P\bigl(-.5\sqrt{n} < S_n^* < +.5\sqrt{n}\bigr) \\ &\approx& \frac 1{\sqrt{2\pi}} \int_{-.5\sqrt{n}}^{+.5\sqrt{n}} e^{-x^2/2}\, dx\ ,\end{aligned}\]y esta última expresión es mayor que .95 si\(.5\sqrt{n} \ge 2.\) Esto dice que basta con tomar\(n = 16\) medidas para los mismos resultados. Este segundo cálculo es más fuerte, pero depende de la suposición de que\(n = 16\) es lo suficientemente grande como para establecer la densidad normal como una buena aproximación a\(S_n^*\), y por lo tanto a\(S_n\). El Teorema del Límite Central aquí no dice nada sobre lo grande que\(n\) tiene que ser. En la mayoría de los casos que involucran sumas de variables aleatorias independientes, una buena regla general es que para\(n \ge 30\), la aproximación es buena. En el presente caso, si asumimos que los errores se distribuyen aproximadamente normalmente, entonces la aproximación probablemente sea bastante buena incluso para\(n = 16\).

    Estimación de la media

    (Continuación del Ejemplo [examen 9.10]) Ahora supongamos que nuestro topógrafo está midiendo una distancia desconocida con los mismos instrumentos en las mismas condiciones. Toma 36 medidas y las promedia. ¿Qué tan seguro puede estar de que su medida se encuentra dentro de .0002 del verdadero valor?

    De nuevo usando la aproximación normal, obtenemos\[\begin{aligned} P\left(\left|\frac {S_n}n - \mu\right| < .0002 \right) &=& P\bigl(|S_n^*| < .5\sqrt n\bigr) \\ &\approx& \frac 2{\sqrt{2\pi}} \int_{-3}^3 e^{-x^2/2}\, dx \\ &\approx& .997\ .\end{aligned}\]

    Esto significa que el topógrafo puede estar 99.7 por ciento seguro de que su promedio se encuentra dentro de .0002 del valor verdadero. Para mejorar su confianza, puede tomar más medidas, o requerir menos precisión, o mejorar la calidad de sus mediciones (es decir, reducir la varianza\(\sigma^2\)). En cada caso, el Teorema de Límite Central da información cuantitativa sobre la confianza de un proceso de medición, asumiendo siempre que la aproximación normal es válida.

    Ahora supongamos que el topógrafo no conoce la media o desviación estándar de sus medidas, pero asume que son independientes. ¿Cómo debe proceder?

    Nuevamente, realiza varias mediciones de una distancia conocida y las promedia. Como antes, el error promedio se distribuye aproximadamente normalmente, pero ahora con media y varianza desconocidas.

    Media de la Muestra

    Si sabe que la varianza\(\sigma^2\) de la distribución de errores es .0002, entonces puede estimar la media\(\mu\) tomando la o de, digamos, 36 mediciones:\[\bar \mu = \frac {x_1 + x_2 +\cdots+ x_n}n\ ,\] dónde\(n = 36\). Entonces, como antes,\(E(\bar \mu) = \mu\). Además, el argumento anterior muestra que\[P(|\bar \mu - \mu| < .0002) \approx .997\ .\] El intervalo\((\bar \mu - .0002, \bar \mu + .0002)\) es llamado para\(\mu\) (ver Ejemplo [examen 9.4.1]).

    Varianza de la muestra

    Si no conoce la varianza\(\sigma^2\) de la distribución de errores, entonces puede estimar\(\sigma^2\) por el:\[\bar \sigma^2 = \frac {(x_1 - \bar \mu)^2 + (x_2 - \bar \mu)^2 +\cdots+ (x_n - \bar \mu)^2}n\ ,\] dónde\(n = 36\). La Ley de Números Grandes, aplicada a las variables aleatorias\((X_i - \bar \mu)^2\), dice que para grandes\(n\), la varianza muestral\(\bar \sigma^2\) se encuentra cercana a la varianza\(\sigma^2\), de manera que el topógrafo puede utilizar\(\bar \sigma^2\) en lugar de\(\sigma^2\) en el argumento anterior.

    La experiencia ha demostrado que, en la mayoría de los problemas prácticos de este tipo, la varianza muestral es una buena estimación para la varianza, y puede ser utilizada en lugar de la varianza para determinar los niveles de confianza para la media muestral. Esto significa que podemos confiar en la Ley de Números Grandes para estimar la varianza, y en el Teorema del Límite Central para estimar la media.

    Podemos comprobarlo en algunos casos especiales. Supongamos que sabemos que la distribución de errores es con media y varianza desconocidas. Entonces podemos tomar una muestra de\(n\) medidas, encontrar la media de la muestra\(\bar \mu\) y varianza de la muestra\(\bar \sigma^2\), y formar\[T_n^* = \frac {S_n - n\bar\mu}{\sqrt{n}\bar\sigma}\ ,\] dónde\(n = 36\). Esperamos\(T_n^*\) que sea una buena aproximación para\(S_n^*\) para grandes\(n\).

    \(t\)-Densidad

    El estadístico W. S. Gosset 13 ha demostrado que en este caso\(T_n^*\) tiene una función de densidad que no es normal sino más bien una con\(n\) grados de libertad. (El número\(n\) de grados de libertad es simplemente un parámetro que nos dice qué\(t\) -densidad usar). En este caso podemos usar la\(t\) -densidad en lugar de la densidad normal para determinar los niveles de confianza para\(\mu\). A medida que\(n\) aumenta, la\(t\) -densidad se acerca a la densidad normal. En efecto, incluso para\(n = 8\) la\(t\) -densidad y la densidad normal son prácticamente las mismas (ver Figura [fig 9.12]).

    Ejercicios

    Notas de problemas informáticos

    a)

    \(\\)Simulación: Recordemos (ver Corolario [cor 5.2]) que\[X = F^{-1}(rnd)\] simulará una variable aleatoria con densidad\(f(x)\) y distribución\[F(X) = \int_{-\infty}^x f(t)\, dt\ .\] En el caso de que\(f(x)\) sea una función de densidad normal con media\(\mu\) y desviación estándar\(\sigma\), donde\(F\) ni \(F^{-1}\)se puede expresar en forma cerrada, use en su lugar\[X = \sigma\sqrt {-2\log(rnd)} \cos 2\pi(rnd) + \mu\ .\]

    b)

    \(\\)Gráficos de barras: debes apuntar a alrededor de 20 a 30 barras (de igual ancho) en tu gráfica. Esto se puede lograr mediante una buena elección del rango\([x{\rm min}, x{\rm min}]\) y el número de barras (por ejemplo,\([\mu - 3\sigma, \mu + 3\sigma]\) con 30 barras funcionarán en muchos casos). ¡Experimento!

    Ejercicios\(\PageIndex{1}\)

    Dejar\(X\) ser una variable aleatoria continua con media\(\mu(X)\) y varianza\(\sigma^2(X)\), y dejar\(X^* = (X - \mu)/\sigma\) ser su versión estandarizada. Verifica directamente eso\(\mu(X^*) = 0\) y\(\sigma^2(X^*) = 1\).

    Ejercicios\(\PageIndex{2}\)

    Let\(\{X_k\}\)\(1 \leq k \leq n\),, ser una secuencia de variables aleatorias independientes, todas con media 0 y varianza 1, y let\(S_n\),\(S_n^*\), y\(A_n\) ser su suma, suma estandarizada, y promedio, respectivamente. Verifica directamente eso\(S_n^* = S_n/\sqrt{n} = \sqrt{n} A_n\).

    Ejercicios\(\PageIndex{3}\)

    Sea\(\{X_k\}\),\(1 \leq k \leq n\), una secuencia de variables aleatorias, todas con media\(\mu\) y varianza\(\sigma^2\), y\(Y_k = X_k^*\) sean sus versiones estandarizadas. Dejar\(S_n\) y\(T_n\) ser la suma de la\(X_k\) y\(Y_k\), y\(S_n^*\) y\(T_n^*\) su versión estandarizada. \(S_n^* = T_n^* = T_n/\sqrt{n}\)Demuéstralo.

    Ejercicios\(\PageIndex{4}\)

    Supongamos que elegimos independientemente 25 números al azar (densidad uniforme) del intervalo\([0,20]\). Escriba las densidades normales que se aproximen a las densidades de su suma\(S_{25}\), su suma\(S_{25}^*\) estandarizada y su promedio\(A_{25}\).

    Ejercicios\(\PageIndex{5}\)

    Escribe un programa para elegir independientemente 25 números al azar\([0,20]\), computar su suma\(S_{25}\) y repetir este experimento 1000 veces. Hacer una gráfica de barras para la densidad de\(S_{25}\) y compararla con la aproximación normal de Ejercicio [exer 9.4.4]. ¿Qué tan bueno es el ajuste? Ahora haz lo mismo para la suma estandarizada\(S_{25}^*\) y la media\(A_{25}\).

    Ejercicios\(\PageIndex{6}\)

    En general, el Teorema del Límite Central da una mejor estimación que la desigualdad de Chebyshev para el promedio de una suma. Para ver esto, deja\(A_{25}\) ser el promedio calculado en Ejercicio [exer 9.4.5], y dejar\(N\) ser la aproximación normal para\(A_{25}\). Modifique su programa en Ejercicio [exer 9.4.5] para proporcionar una tabla de la\(F(x) = P(|A_{25} - 10| \geq x) = {}\) fracción de función del total de 1000 ensayos para los cuales\(|A_{25} - 10| \geq x\). Haz lo mismo para la función\(f(x) = P(|N - 10| \geq x)\). (Puede usar la tabla normal, Tabla [tabl 9.1], o el procedimiento NormalArea para esto.) Ahora trazar en los mismos ejes las gráficas de\(F(x)\),\(f(x)\), y la función de Chebyshev\(g(x) = 4/(3x^2)\). ¿Cómo hacer\(f(x)\) y\(g(x)\) comparar como estimaciones para\(F(x)\)?

    Ejercicios\(\PageIndex{7}\)

    El Teorema del Límite Central dice que las sumas de variables aleatorias independientes tienden a verse normales, sin importar la distribución loca que tengan las variables individuales. Probemos esto mediante una simulación por computadora. Elija independientemente 25 números del intervalo\([0,1]\) con la densidad de probabilidad\(f(x)\) dada a continuación, y calcule su suma\(S_{25}\). Repita este experimento 1000 veces, y haga un gráfico de barras de los resultados. Ahora trazar en la misma gráfica la densidad\(\phi(x) = \mbox {normal \,\,\,}(x,\mu(S_{25}),\sigma(S_{25}))\). ¿Qué tan bien se ajusta la densidad normal a tu gráfica de barras en cada caso?

    1. \(f(x) = 1\).
    2. \(f(x) = 2x\).
    3. \(f(x) = 3x^2\).
    4. \(f(x) = 4|x - 1/2|\).
    5. \(f(x) = 2 - 4|x - 1/2|\).

    Ejercicios\(\PageIndex{8}\)

    Repite el experimento descrito en Ejercicio [exer 9.4.7] pero ahora elige los 25 números de\([0,\infty)\), usando\(f(x) = e^{-x}\).

    Ejercicios\(\PageIndex{9}\)

    ¿Qué tan grande debe\(n\) ser antes de\(S_n = X_1 + X_2 +\cdots+ X_n\) que sea aproximadamente normal? Este número suele ser sorprendentemente pequeño. Exploremos esta pregunta con una simulación por computadora. Elija\(n\) números de\([0,1]\) con densidad de probabilidad\(f(x)\), donde\(n = 3\), 6, 12, 20, y\(f(x)\) es cada una de las densidades en Ejercicio [exer 9.4.7]. Calcular su suma\(S_n\), repetir este experimento 1000 veces, y hacer un gráfico de barras de 20 barras de los resultados. ¿Qué tan grande debe\(n\) ser antes de obtener un buen ajuste?

    Ejercicios\(\PageIndex{10}\)

    Un topógrafo mide la altura de un acantilado conocido por ser de unos 1000 pies. Asume que su instrumento está debidamente calibrado y que sus errores de medición son independientes, con media\(\mu = 0\) y varianza\(\sigma^2 = 10\). Planea tomar\(n\) medidas y formar el promedio. Estimar, utilizando (a) la desigualdad de Chebyshev y (b) la aproximación normal, qué tan grande\(n\) debe ser si quiere estar 95 por ciento seguro de que su promedio cae dentro de 1 pie del valor verdadero. Ahora estime, utilizando (a) y (b), ¿qué valor debe\(\sigma^2\) tener si quiere hacer sólo 10 mediciones con la misma confianza?

    Ejercicios\(\PageIndex{11}\)

    El precio de una acción de la Compañía de Cerveza Pilsdorff (ver Ejercicio [sec 8.2]. [exer 8.2.12]) se da por\(Y_n\) el día\(n\) th del año. Finn observa que las diferencias\(X_n = Y_{n + 1} - Y_n\) parecen ser variables aleatorias independientes con una distribución común que tiene media\(\mu = 0\) y varianza\(\sigma^2 = 1/4\). Si\(Y_1 = 100\), estime la probabilidad de\(Y_{365}\) que

    1. \({} \geq 100\).
    2. \({} \geq 110\).
    3. \({} \geq 120\).

    Ejercicios\(\PageIndex{1}\)

    Pon a prueba tus conclusiones en Ejercicio [exer 9.4.11] mediante simulación por computadora. Primero elige 364 números\(X_i\) con densidad\(f(x) = \mbox {normal}(x,0,1/4)\). Ahora forma la suma\(Y_{365} = 100 + X_1 + X_2 +\cdots+ X_{364}\), y repite este experimento 200 veces. Conformar una gráfica de barras sobre\([50,150]\) de los resultados, superponiendo la gráfica de la densidad normal aproximada. ¿Qué dice esta gráfica de tus respuestas en Ejercicio [exer 9.4.11]?

    Ejercicios\(\PageIndex{1}\)

    Los físicos dicen que las partículas en un tubo largo se mueven constantemente hacia adelante y hacia atrás a lo largo del tubo, cada una con una velocidad\(V_k\) (en cm/s) en cualquier momento dado que se distribuye normalmente, con media\(\mu = 0\) y varianza\(\sigma^2 = 1\). Supongamos que hay\(10^{20}\) partículas en el tubo.

    1. Encuentra la media y varianza de la velocidad promedio de las partículas.
    2. ¿Cuál es la probabilidad de que la velocidad promedio sea\({} \geq 10^{-9}\) cm/s?

    Ejercicios\(\PageIndex{1}\)

    Un astrónomo realiza\(n\) mediciones de la distancia entre Júpiter y una determinada de sus lunas. La experiencia con los instrumentos utilizados la lleva a creer que para las unidades adecuadas las medidas se distribuirán normalmente con la media\(d\), la distancia verdadera y la varianza 16. Ella realiza una serie de\(n\) mediciones. Dejar\[A_n = \frac {X_1 + X_2 +\cdots+ X_n}n\] ser el promedio de estas mediciones.

    1. Demostrar que\[P\left(A_n - \frac 8{\sqrt n} \leq d \leq A_n + \frac 8{\sqrt n}\right) \approx .95.\]
    2. Cuando se tomaron nueve mediciones, el promedio de las distancias resultó ser de 23.2 unidades. Poner los valores observados en (a) da el para la distancia desconocida\(d\). Compute este intervalo.
    3. ¿Por qué no decir en (b) más simplemente que la probabilidad es .95 de que el valor de\(d\) yace en el intervalo de confianza calculado?
    4. ¿Qué cambios harías en el procedimiento anterior si quisieras calcular un intervalo de confianza del 99 por ciento?

    Ejercicios\(\PageIndex{1}\)

    Trace una gráfica de barras similar a la de la Figura [fig 9.61] para las alturas de los padres medios en los datos de Galton como se indica en el Apéndice B y compare esta gráfica de barras con la curva normal apropiada.


    This page titled 9.3: Teorema de Límite Central para Ensayos Independientes Continuos is shared under a GNU Free Documentation License 1.3 license and was authored, remixed, and/or curated by Charles M. Grinstead & J. Laurie Snell (American Mathematical Society) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.