7.4: Distribución Normal
- Page ID
- 151733
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)La distribución de probabilidad más importante en Estadística es la Distribución Normal, la icónica curva en forma de campana. La Distribución Normal es simétrica y se define por dos parámetros: el valor esperado (media)\(\mu\) que describe el centro de la distribución y la desviación estándar\(\sigma\), que describe el spread.
La función de distribución de probabilidad extremadamente complicada para la Distribución Normal es:
\[f(x)=\dfrac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^{2}},-\infty<X<\infty \nonumber \]
Aquí se muestran ejemplos de la Distribución Normal.
Hay muchos ejemplos de datos que son simétricos y agrupados hacia la media. Por ejemplo, creamos parcelas de puntos de los pesos de manzanas y naranjas en el Capítulo 2. Se puede ver que ambas gráficas están agrupadas hacia el centro y son simétricas. Una distribución normal sería un modelo apropiado para el peso de manzanas y naranjas
Distribución Normal Estándar
Un caso especial de la Distribución Normal es cuándo\(\mu=0\) y\(\sigma=1\).
Esta variable aleatoria se conoce como la Distribución Normal Estándar y siempre está representada por la letra\(Z\).
Para el cálculo de probabilidades y percentiles de la Distribución Normal se necesitan tablas, calculadoras gráficas o computadoras. Para fines ilustrativos, rellenaremos algunas de estas probabilidades para la Distribución Normal Estándar mostrando áreas bajo la curva:
\(P(-1<Z<1)=0.3413+0.3413=0.6826\)
\(P(-2<Z<2)=0.3413+0.3413+0.1359+0.1359=0.9544\)
\(P(-3<Z<3)=0.3413+0.3413+0.1359+0.1359+0.0214+0.0214=0.9972\)
Esto significa que para la Distribución Normal estándar ese 68% de la probabilidad está entre 1 y ‐1, 95% de la probabilidad está entre ‐2 y 2 y 99.7% de la probabilidad está entre ‐3 y 3.
Estos porcentajes pueden parecer familiares a partir de la Regla Empírica del Capítulo 3.
El 68% de los datos se encuentra dentro de 1 desviación estándar de la media.
El 95% de los datos se encuentra dentro de 2 desviaciones estándar de la media.
El 99.7% de los datos se encuentra dentro de 3 desviaciones estándar de la media.
La Regla Empírica proviene directamente de la Distribución Normal Estándar,\(Z\). De hecho, cualquier Variable Normal Aleatoria,\(X\) con Valor Esperado\(\mu\) y Desviación Estándar se\(\sigma\) puede convertir a una Distribución Normal Estándar usando la fórmula:\(Z=\dfrac{X-\mu}{\sigma}\)
Ejemplo: Uso de agua
El uso diario de agua por persona en un pueblo normalmente se distribuye con una media (valor esperado) de 20 galones y una desviación estándar de 5 galones.
- Determinar la proporción de personas que utilizan entre 15 y 25 galones de agua.
- Determinar la proporción de personas que usan entre 10 y 30 galones de agua
- ¿Entre qué dos valores esperarías encontrar cerca del 95% de los usuarios de agua?
Solución
- \ (\ begin {alineado}
P (15<X<25) &=P\ izquierda (\ dfrac {15-20} {5} <Z<\ dfrac {25-20} {5}\ derecha)\\
&=P (-1<Z<1)\\ &=0.6826
\ end {alineado}\) - \ (\ begin {alineado}
P (10<X<30) &=P\ izquierda (\ dfrac {10-20} {5} <Z<\ dfrac {30-20} {5}\ derecha)\\
&=P (-2<Z<2)\\ &=0.9544
\ end {alineado}\) - Ya que\(P(-2<Z<2)=0.9544\), podemos decir que alrededor del 95% de los usuarios de agua se encuentran dentro de dos desviaciones estándar de la media, o que utilizan entre 10 y 30 galones por día.
Distribución de probabilidad normal (parámetros:\(\mu, \sigma\))
\(\mu\)= Valor esperado de X, media poblacional
\(\sigma\)= Desviación estándar poblacional
\(f(x)=\dfrac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^{2}},-\infty<X<\infty\)
Cálculo de probabilidades | Cálculo de percentiles |
---|---|
\(Z=\dfrac{X-\mu}{\sigma}\) \(P(a<X<b)=P\left(\dfrac{a-\mu}{\sigma}<Z<\dfrac{b-\mu}{\sigma}\right)\) |
\(X=\mu+Z \sigma\) \(P\left(Z<z_{p}\right)=P\left(X<\mu+z_{p} \sigma\right)=p\) |
En general, las preguntas de probabilidad y percentiles que utilizan la Distribución Normal requerirán tablas o tecnología que puedan calcular probabilidades o percentiles de Distribución Normal para\(Z\) valores no enteros
Ejemplo: Uso de agua
El uso diario de agua por persona en un pueblo normalmente se distribuye con una media de 20 galones y una desviación estándar de 5 galones.
- ¿Cuál es la probabilidad de que una persona del pueblo seleccionado al azar use menos de 18 galones por persona por día?
- ¿Qué proporción de las personas usa entre 18 y 24 galones por persona por día?
- ¿Qué porcentaje de la población utiliza más de 26.2 galones por persona y día?
- Se va a cobrar un impuesto especial sobre el 5% superior de los usuarios de agua. Encontrar el valor del uso diario de agua que genera el impuesto especial.
Solución
- \ (\ begin {alineado}
P (X<18) &=P\ izquierda (Z<\ dfrac {18-20} {5}\ derecha)\\
&=P (Z<-0.40)\\ &=0.3446
\ end {alineado}\)
- \ (\ begin {alineado}
P (18<X<24) &=P\ izquierda (\ dfrac {18-20} {5} <Z<\ dfrac {24-20} {5}\ derecha)\\
&=P (-0.40<Z<0.80)\\ &=0.4435
\ end {alineado}\)
- \ (\ begin {alineado}
P (X>26.2) &=P\ left (Z>\ dfrac {26.2-20} {5}\ derecha)\\
&=P (Z>1.24)\\ &=10.75\%
\ end {alineado}\)
- Este problema es realmente encontrar el\(95^{th}\) percentil.
El\(Z\) valor asociado al\(95^{th}\) percentil =1.645
\(X_{95}=20 + 5(1.645) = 28.2\)galones por día
Ejemplo: Gradaje en la curva
El profesor Kurv ha determinado que los promedios finales en su curso de estadística se distribuyen normalmente con una media de 77.1 y una desviación estándar de 11.2. Decide asignar sus calificaciones para su curso actual de tal manera que el 15% superior de los alumnos reciban una A.
¿Cuál es el promedio más bajo que un estudiante puede recibir para obtener una A?
Solución
El 15% superior sería el hallazgo del\(85^{th}\) percentil. El\(Z\) valor correspondiente es 1.04.
La nota mínima para una A:\(X=77.1+(1.04)(11.2)\), o\(X=88.75\) puntos.
Ejemplo: sugerencia de servidor
El monto de propina que reciben los servidores en un restaurante exclusivo por turno normalmente se distribuye con una media de $80 y una desviación estándar de $10. Shelli siente que ha prestado un mal servicio si su propina total para el turno es inferior a 65 dólares. (Esto no quiere decir que haya dado un mal servicio, sino que simplemente se sienta como lo hizo).
¿Qué porcentaje del tiempo sentirá que brindó un servicio deficiente?
Solución
Deja\(y\) ser la cantidad de propina.
El\(Z\) valor asociado a\(X=65\) es\(Z= (65‐80)/10= ‐1.5\).
Así\(P(X<65)=P(Z<-1.5)=.0668\)