8.3: Un intervalo de confianza para una proporción de población

Última actualización
Guardar como PDF

Page ID: 150623

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Durante un año electoral, vemos artículos en el diario que establecen intervalos de confianza en términos de proporciones o porcentajes. Por ejemplo, una encuesta para un candidato en particular que se postula a presidente podría mostrar que el candidato tiene el 40% del voto dentro de tres puntos porcentuales (si la muestra es lo suficientemente grande). A menudo, las encuestas electorales se calculan con 95% de confianza, por lo que, los encuestadores estarían 95% seguros de que la verdadera proporción de votantes que favorecieron al candidato estaría entre 0.37 y 0.43.

Los inversionistas en el mercado de valores están interesados en la verdadera proporción de acciones que suben y bajan cada semana. Los negocios que venden computadoras personales están interesados en la proporción de hogares en Estados Unidos que poseen computadoras personales. Los intervalos de confianza se pueden calcular para la verdadera proporción de existencias que suben o bajan cada semana y para la verdadera proporción de hogares en Estados Unidos que poseen computadoras personales.

El procedimiento para encontrar el intervalo de confianza para una proporción poblacional es similar al de la media poblacional, pero las fórmulas son un poco diferentes aunque conceptualmente idénticas. Si bien las fórmulas son diferentes, se basan en el mismo fundamento matemático que nos ha dado el Teorema del Límite Central. Debido a esto veremos el mismo formato básico utilizando los mismos tres datos: el valor muestral del parámetro en cuestión, la desviación estándar de la distribución muestral relevante y el número de desviaciones estándar que necesitamos para tener la confianza en nuestra estimación que deseamos.

¿Cómo sabes que estás lidiando con un problema de proporción? Primero, la distribución subyacente tiene una variable aleatoria binaria y por lo tanto es una distribución binomial. (No se menciona una media o promedio.) Si\(X\) es una variable aleatoria binomial, entonces\(X \sim B(n, p)\) dónde\(n\) está el número de ensayos y\(p\) es la probabilidad de éxito. Para formar una proporción muestral, tomar\(X\), la variable aleatoria para el número de éxitos y dividirla por\(n\), el número de ensayos (o el tamaño de la muestra). La variable aleatoria\(P^{\prime}\) (léase “P prime”) es la proporción muestral,

\[P^{\prime}=\frac{X}{n} \nonumber\]

(A veces la variable aleatoria se denota como\(\hat{P}\), leer “P hat”.)

\(P^{\prime}\)= la proporción estimada de éxitos o proporción muestral de éxitos (\(P^{\prime}\)es una estimación puntual para\(p\), la verdadera proporción poblacional, y por lo tanto\(q\) es la probabilidad de un fracaso en cualquier ensayo.)
\(x\)= el número de éxitos en la muestra
\(n\)= el tamaño de la muestra

La fórmula para el intervalo de confianza para una proporción poblacional sigue el mismo formato que para una estimación de una media poblacional. Recordando la distribución muestral para la proporción del Capítulo 7, se encontró que la desviación estándar fue:

\[\sigma_{\mathrm{p}^{\prime}}=\sqrt{\frac{p(1-p)}{n}}\nonumber\]

El intervalo de confianza para una proporción poblacional, por lo tanto, se convierte en:

\[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

\(Z_{\left(\frac{a}{2}\right)}\)se establece de acuerdo con nuestro grado de confianza deseado y\(\sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\) es la desviación estándar de la distribución muestral.

Las proporciones muestrales\(\bf{p^{\prime}}\) y\(\bf{q^{\prime}}\) son estimaciones de las proporciones poblacionales desconocidas\(\bf{p}\) y\(\bf{q}\). Las proporciones estimadas\(p^{\prime}\) y se\(q^{\prime}\) utilizan porque\(p\) y no\(q\) se conocen.

Recuerde que a medida que\(p\) se aleja de 0.5 la distribución binomial se vuelve menos simétrica. Debido a que estamos estimando el binomio con la distribución normal simétrica cuanto más lejos de la simétrica se vuelve el binomio, menos confianza tenemos en la estimación.

Esta conclusión se puede demostrar a través del siguiente análisis. Las proporciones se basan en la distribución binomial de probabilidad. Los posibles resultados son binarios, ya sea “éxito” o “fracaso”. Esto da lugar a una proporción, es decir, el porcentaje de los resultados que son “éxitos”. Se demostró que la distribución binomial podría entenderse completamente si conociéramos sólo la probabilidad de éxito en cualquier ensayo, llamado\(p\). Se encontró que la media y la desviación estándar del binomio fueron:

\[\mu=\mathrm{np}\nonumber\]

\[\sigma=\sqrt{npq}\nonumber\]

También se demostró que el binomio podría estimarse por la distribución normal si AMBOS\(np\) Y\(nq\) fueran mayores a 5. De la discusión anterior, se encontró que la fórmula estandarizadora para la distribución binomial es:

\[Z=\frac{\mathrm{p}^{\prime}-p}{\sqrt{\left(\frac{p q}{n}\right)}}\nonumber\]

que no es más que una reafirmación de la fórmula general normalizadora con sustituciones apropiadas para\(\mu\) y\(\sigma\) desde el binomio. Podemos usar la distribución normal estándar, la razón\(Z\) está en la ecuación, porque la distribución normal es la distribución limitante del binomio. Este es otro ejemplo del Teorema del Límite Central. Ya hemos visto que la distribución muestral de las medias se distribuye normalmente. Recordemos la discusión extendida en el Capítulo 7 sobre la distribución muestral de proporciones y las conclusiones del Teorema del Límite Central.

Ahora podemos manipular esta fórmula de la misma manera que lo hicimos para encontrar los intervalos de confianza para una media, pero para encontrar el intervalo de confianza para el parámetro binomial de población,\(p\).

\[\mathrm{p}^{\prime}-Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}} \leq p \leq \mathrm{p}^{\prime}+Z_{\alpha} \sqrt{\frac{\mathrm{p}^{\prime} \mathrm{q}^{\prime}}{n}}\nonumber\]

Donde\(p^{\prime} = x/n\), la estimación puntual de\(p\) tomada de la muestra. Observe que\(p^{\prime}\) ha reemplazado\(p\) en la fórmula. Esto es porque no sabemos\(p\), efectivamente, esto es justo lo que estamos tratando de estimar.

Desafortunadamente, no existe un factor de corrección para los casos en los que el tamaño de la muestra es pequeño, por lo\(np^{\prime}\) que siempre\(nq^{\prime}\) debe ser mayor a 5 para desarrollar una estimación de intervalo para\(p\).

Ejemplo\(\PageIndex{1}\)

Supongamos que se contrata a una firma de investigación de mercado para estimar el porcentaje de adultos que viven en una gran ciudad que tienen teléfonos celulares. Quinientos adultos residentes seleccionados al azar en esta ciudad son encuestados para determinar si tienen teléfonos celulares. De las 500 personas muestreadas, 421 respondieron que sí -son dueños de celulares. Utilizando un nivel de confianza del 95%, computa una estimación del intervalo de confianza para la verdadera proporción de adultos residentes de esta ciudad que tienen teléfonos celulares.

Contestar

La solución paso a paso.

Let\(X\) = el número de personas en la muestra que tienen celulares. \(X\)es binomial: la variable aleatoria es binaria, la gente o bien tiene un celular o no.

Para calcular el intervalo de confianza, debemos encontrar\(p^{\prime}, q^{\prime}\).

\(n = 500\)

\(x=\text { the number of successes in the sample }=421\)

\(p^{\prime}=\frac{x}{n}=\frac{421}{500}=0.842\)

\(p^{\prime}=0.842\)es la proporción muestral; esta es la estimación puntual de la proporción poblacional.

\(q^{\prime}=1-p^{\prime}=1-0.842=0.158\)

Ya que el nivel de confianza solicitado es\(CL = 0.95\), entonces\(\alpha=1-C L=1-0.95=0.05\left(\frac{\alpha}{2}\right)=0.025\).

Entonces\(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\)

Esto se puede encontrar usando la tabla de probabilidad Normal Estándar en Tabla\(\PageIndex{6}\). Esto también se puede encontrar en la tabla t de estudiantes en la columna 0.025 e infinidad de grados de libertad porque a infinitos grados de libertad la distribución t de los estudiantes se convierte en la distribución normal estándar,\(Z\).

El intervalo de confianza para la proporción binomial verdadera de la población es

\(\text{Substituting in the values from above we find the confidence interval is : } 0.810 \leq p \leq 0.874\)

Interpretación

Estimamos con 95% de confianza que entre 81% y 87.4% de todos los adultos residentes de esta ciudad cuentan con celulares.

Explicación del nivel de confianza del 95%

El noventa y cinco por ciento de los intervalos de confianza construidos de esta manera contendrían el verdadero valor para la proporción poblacional de todos los adultos residentes de esta ciudad que tienen teléfonos celulares.

Ejercicio\(\PageIndex{1}\)

Supongamos que 250 personas seleccionadas al azar son encuestadas para determinar si poseen una tableta. De los 250 encuestados, 98 reportaron poseer una tableta. Usando un nivel de confianza del 95%, computa una estimación del intervalo de confianza para la verdadera proporción de personas que poseen tabletas.

Ejemplo\(\PageIndex{2}\)

La Escuela de Adiestramiento de Perros de Dundee tiene una proporción mayor que la media de clientes que compiten en eventos profesionales competitivos. Se construye un intervalo de confianza para la proporción poblacional de perros que compiten en eventos profesionales de 150 escuelas de entrenamiento diferentes. Se determina que el límite inferior es 0.08 y el límite superior es 0.16. Determinar el nivel de confianza utilizado para construir el intervalo de la proporción poblacional de perros que compiten en eventos profesionales.

Contestar

Comenzamos con la fórmula para un intervalo de confianza para una proporción porque la variable aleatoria es binaria; o el cliente compite en eventos caninos competitivos profesionales o no.

\[p=p^{\prime} \pm\left[Z_{\left(\frac{a}{2}\right)} \sqrt{\frac{p^{\prime}\left(1-p^{\prime}\right)}{n}}\right]\nonumber\]

A continuación encontramos la proporción muestral:

\[p^{\prime}=\frac{0.08+0.16}{2}=0.12\nonumber\]

El\(\pm\) que conforma el intervalo de confianza es así\(0.04; 0.12 + 0.04 = 0.16\) y\(0.12 − 0.04 = 0.08\), los límites del intervalo de confianza. Por último, resolvemos para\(Z\).

\(\left[Z \cdot \sqrt{\frac{0.12(1-0.12)}{150}}\right]=0.04, \textbf { therefore } \bf{z=1.51}\)

Y luego busque la probabilidad de 1.51 desviaciones estándar en la tabla normal estándar.

\(p(Z=1.51)=0.4345, p(Z) \cdot 2=0.8690 \textbf { or } 86.90 \%\).

Ejemplo\(\PageIndex{3}\)

Un funcionario financiero de una empresa quiere estimar el porcentaje de cuentas por cobrar que tienen más de 30 días de atraso. Encuesta 500 cuentas y encuentra que 300 tienen más de 30 días de atraso. Calcule un intervalo de confianza del 90% para el porcentaje real de cuentas por cobrar que tengan más de 30 días de atraso e interprete el intervalo de confianza.

Contestar

La solución es paso a paso:

El noventa por ciento de todos los intervalos de confianza construidos de esta manera contienen el valor verdadero para la población por ciento de cuentas por cobrar que están atrasadas 30 días.

Explicación del nivel de confianza del 90%

\(x = 300\)y\(n = 500\)

\(p^{\prime}=\frac{x}{n}=\frac{300}{500}=0.600\)

\(q^{\prime}=1-p^{\prime}=1-0.600=0.400\)

Desde el nivel de confianza =\(0.90\), entonces\(a=1-\text { confidence level }=(1-0.90)=0.10\left(\frac{\alpha}{2}\right)=0.05\)

\(Z_{\frac{\alpha}{2}}=Z_{0.05}=1.645\)

Este valor Z se puede encontrar usando una tabla de probabilidad normal estándar. También se puede utilizar la mesa t del estudiante ingresando la tabla en la columna 0.05 y leyendo en la línea para obtener infinitos grados de libertad. La distribución t es la distribución normal a infinitos grados de libertad. Este es un truco útil para recordar al encontrar valores Z para los niveles de confianza comúnmente utilizados. Usamos esta fórmula para un intervalo de confianza para una proporción:

Sustituyendo en los valores anteriores encontramos que el intervalo de confianza para la verdadera proporción binomial poblacional es\(0.564 \leq p \leq 0.636\)

Interpretación

Estimamos con 90% de confianza que el verdadero porcentaje de todas las cuentas por cobrar vencidas 30 días está entre 56.4% y 63.6%. Redacción Alterna: Estimamos con 90% de confianza que entre 56.4% y 63.6% de TODAS las cuentas están atrasadas 30 días.

Ejercicio\(\PageIndex{2}\)

Un alumno sondea a su escuela para ver si los alumnos del distrito escolar están a favor o en contra de la nueva legislación en materia de uniformes escolares. Encuesta a 600 estudiantes y encuentra que 480 están en contra de la nueva legislación.

Calcular un intervalo de confianza del 90% para el verdadero porcentaje de estudiantes que están en contra de la nueva legislación, e interpretar el intervalo de confianza.
En una muestra de 300 alumnos, 68% dijo poseer un iPod y un teléfono inteligente. Calcule un intervalo de confianza del 97% para el verdadero porcentaje de estudiantes que poseen un iPod y un teléfono inteligente.