Saltar al contenido principal

# 7.3: El teorema del límite central para las proporciones

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

El Teorema del Límite Central nos dice que la estimación puntual para la media muestral$$\overline x$$,, proviene de una distribución normal de$$\overline x$$'s. Esta distribución teórica se llama distribución muestral de$$\overline x$$'s. Ahora investigamos la distribución muestral para otro parámetro importante que deseamos estimar; a$$p$$ partir de la función binomial de densidad de probabilidad.

Si la variable aleatoria es discreta, como para datos categóricos, entonces el parámetro que deseamos estimar es la proporción poblacional. Esta es, por supuesto, la probabilidad de dibujar un éxito en cualquier sorteo aleatorio. A diferencia del caso que se acaba de discutir para una variable aleatoria continua donde no conocíamos la distribución poblacional de$$X$$'s, aquí realmente conocemos la función de densidad de probabilidad subyacente para estos datos; es el binomio. La variable aleatoria es$$X =$$ el número de éxitos y el parámetro que deseamos conocer es$$p$$, la probabilidad de obtener un éxito que es, por supuesto, la proporción de éxitos en la población. La pregunta en cuestión es: ¿de qué distribución se$$p^{\prime}=\frac{x}{n}$$ extrajo la proporción muestral? El tamaño de la muestra$$X$$ es$$n$$ y es el número de éxitos encontrados en esa muestra. Esta es una pregunta paralela a la que acaba de responder el Teorema del Límite Central: ¿de qué distribución fue la muestra media,$$\overline x$$, dibujada? Vimos que una vez que supimos que la distribución era la distribución Normal entonces pudimos crear intervalos de confianza para el parámetro poblacional,$$\mu$$. También utilizaremos esta misma información para probar hipótesis sobre la media poblacional más adelante. Deseamos ahora poder desarrollar intervalos de confianza para el parámetro poblacional "$$p$$"” a partir de la función binomial de densidad de probabilidad.

Para encontrar la distribución de la que provienen las proporciones de la muestra, necesitamos desarrollar la distribución muestral de las proporciones de la muestra tal como lo hicimos para las medias de la muestra. Entonces, nuevamente imagina que probamos aleatoriamente digamos a 50 personas y les preguntamos si apoyan la nueva emisión de bonos escolares. A partir de esto encontramos una proporción de muestra$$p^{\prime}$$,, y la graficamos en el eje de$$p$$'s. Hacemos esto una y otra vez etc., etc. hasta que tengamos la distribución teórica de$$p$$'s. Algunas proporciones muestrales mostrarán alta favorabilidad hacia la emisión de bonos y otras mostrarán baja favorabilidad porque el muestreo aleatorio reflejará la variación de puntos de vista dentro de la población. Lo que hemos hecho se puede ver en la Figura$$\PageIndex{9}$$. El panel superior es la distribución poblacional de probabilidades para cada valor posible de la variable aleatoria$$X$$. Si bien no sabemos cómo es la distribución específica porque desconocemos$$p$$, el parámetro poblacional, sí sabemos que debe verse algo así. En realidad, no conocemos ni la media ni la desviación estándar de esta distribución poblacional, la misma dificultad que enfrentamos al analizar los$$X$$'s previamente.

Figura$$\PageIndex{9}$$ coloca la media sobre la distribución de las probabilidades poblacionales como$$\mu=np$$ pero claro que en realidad no conocemos la media poblacional porque desconocemos la probabilidad poblacional de éxito,$$p$$. Por debajo de la distribución de los valores poblacionales se encuentra la distribución muestral de$$p$$'s. Nuevamente el Teorema del Límite Central nos dice que esta distribución se distribuye normalmente igual que en el caso de la distribución muestral para$$\overline x$$'s. Esta distribución muestral también tiene una media, la media de la $$p$$'s, y una desviación estándar,$$\sigma_{p^{\prime}}$$.

Es importante destacar que en el caso del análisis de la distribución de medias muestrales, el Teorema del Límite Central nos dijo el valor esperado de la media de las medias muestrales en la distribución muestral, y la desviación estándar de la distribución muestral. Nuevamente el Teorema del Límite Central proporciona esta información para la distribución muestral para proporciones. Las respuestas son:

1. El valor esperado de la media de distribución muestral de las proporciones muestrales,$$\mu_{p^{\prime}}$$, es la proporción poblacional,$$p$$.
2. La desviación estándar de la distribución muestral de las proporciones muestrales$$\sigma_{p^{\prime}}$$,, es la desviación estándar poblacional dividida por la raíz cuadrada del tamaño de la muestra,$$n$$.

Ambas conclusiones son las mismas que encontramos para la distribución muestral para las medias muestrales. Sin embargo, en este caso, debido a que tanto la media como la desviación estándar de la distribución binomial se basan en pp, la fórmula para la desviación estándar de la distribución muestral requiere manipulación algebraica para ser útil. Eso lo retomaremos en el próximo capítulo. A continuación se proporciona la prueba de estas importantes conclusiones del Teorema del Límite Central.

$E\left(p^{\prime}\right)=E\left(\frac{x}{n}\right)=\left(\frac{1}{n}\right) E(x)=\left(\frac{1}{n}\right) n p=p\nonumber$

(El valor esperado de$$X$$,$$E(x)$$, es simplemente la media de la distribución binomial que sabemos que es np.)

$\sigma_{\mathrm{p}}^{2}=\operatorname{Var}\left(p^{\prime}\right)=\operatorname{Var}\left(\frac{x}{n}\right)=\frac{1}{n^{2}}(\operatorname{Var}(x))=\frac{1}{n^{2}}(n p(1-p))=\frac{p(1-p)}{n}\nonumber$

La desviación estándar de la distribución muestral para las proporciones es así:

$\sigma_{\mathrm{p}},=\sqrt{\frac{p(1-P)}{n}}\nonumber$

\ (\ PageIndex {2}\) “>
Parámetro Distribución de la población Muestra Distribución de muestreo de$$p$$'s
Media $$\mu = np$$ $$p^{\prime}=\frac{x}{n}$$\) \ (p\)'s” class="lt-stats-4585">$$p^{\prime} \text { and } E(p^{\prime})=p$$
Desviación estándar $$\sigma=\sqrt{n p q}$$ \ (p\)'s” class="lt-stats-4585">$$\sigma_{p^{\prime}}=\sqrt{\frac{p(1-p)}{n}}$$
Mesa$$\PageIndex{2}$$

La tabla$$\PageIndex{2}$$ resume estos resultados y muestra la relación entre la población, la muestra y la distribución muestral. Observe el paralelo entre esta Tabla y Tabla$$\PageIndex{1}$$ para el caso donde la variable aleatoria es continua y estábamos desarrollando la distribución de muestreo para medias.

Revisando la fórmula para la desviación estándar de la distribución muestral para proporciones vemos que a medida que$$n$$ aumenta la desviación estándar disminuye. Esta es la misma observación que hicimos para la desviación estándar para la distribución muestral para las medias. Nuevamente, a medida que aumenta el tamaño de la muestra, la estimación puntual para cualquiera$$\mu$$ o$$p$$ se encuentra que proviene de una distribución con una distribución cada vez más estrecha. Concluimos que con un determinado nivel de probabilidad, el rango del que proviene la estimación puntual es menor a medida que aumenta el tamaño de la muestra$$n$$,,. La figura$$\PageIndex{8}$$ muestra este resultado para el caso de medias muestrales. Simplemente sustituya$$p^{\prime}$$$$\overline x$$ y podemos ver el impacto del tamaño de la muestra en la estimación de la proporción muestral.

This page titled 7.3: El teorema del límite central para las proporciones is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform.