6.3: Uso de R para modelar las propiedades de una distribución normal
- Page ID
- 69340
Dada una media y una desviación estándar, podemos usar la función dnorm ()
de R para trazar la distribución normal correspondiente
dnorm (x, media, sd)
donde media
es el valor para\(\mu\), sd
es el valor para\(\sigma\), y x
es un vector de valores que abarca el rango de valores del eje x que queremos trazar.
# definir la media y la desviación estándar
mu = 12
sigma = 2
# crear vector para valores de x que abarcan un rango suficiente de
# desviaciones estándar a cada lado de la media; aquí usamos valores
# para x que son cuatro desviaciones estándar a cada lado de la media
x = seq (4, 20, 0.01)
# usar dnorm () para calcular probabilidades para cada x
y = dnorm (x, media = mu, sd = sigma)
# curva de distribución normal
plot (x, y, type = “l”, lwd = 2, col = “azul”, ylab = “probabilidad”, xlab = “x”)
Para anotar la curva de distribución normal para mostrar un área de interés para nosotros, utilizamos la función polygon ()
de R, como se ilustra aquí para la curva de distribución normal en la Figura\(\PageIndex{1}\), mostrando el área que incluye valores entre 8 y 15.
# definir la media y la desviación estándar
mu = 12
sigma = 2
# crear vector para valores de x que abarcan un rango suficiente de
# desviaciones estándar a cada lado de la media; aquí usamos valores
# para x que son cuatro desviaciones estándar a cada lado de la media
x = seq (4, 20, 0.01)
# usar dnorm () para calcular probabilidades para cada x
y = dnorm (x, media = mu, sd = sigma)
# trazar curva de distribución normal; las opciones xaxt = “i” y yaxt = “i”
# forzar los ejes a comenzar y terminar en los límites de los datos
plot (x, y, type = “l”, lwd = 2, col = “ivory4", ylab = “probabilidad”, xlab = “x”, xaxs = “i”, yaxs = “i”)
# crear vector para valores de x entre un límite inferior de 8 y un límite superior de 15
lowlim = 8
uplim = 15
dx = seq (lowlim, uplim, 0.01)
# usar polígono para rellenar el área; x e y son vectores de coordenadas x, y
# que definen la forma que luego se rellena usando el color deseado
polígono (x = c (lowlim, dx, uplim), y = c (0, dnorm (dx, media = 12, sd = 2), 0), frontera = NA, col = “marfil4")
Para encontrar la probabilidad de obtener un valor dentro del área sombreada, usamos el comando pnorm ()
de R
pnorm (q, media, sd, baja.cola)
donde q
es un límite de interés, media
es el valor para\(\mu\), sd
es el valor para\(\sigma\), y lower.tail
es un valor lógico que indica si devolvemos la probabilidad para valores por debajo del límite (lower.tail = TRUE
) o para valores superiores el límite (inferior.cola = FALSO
). Por ejemplo, para encontrar la probabilidad de obtener un resultado entre 8 y 15, dado\(\mu = 12\) y\(\sigma = 2\), utilizamos las siguientes líneas de código.
# encontrar probabilidad de obtener un resultado mayor a 15
prob_greater15 = pnorm (15, media = 12, sd = 2, inferior.cola = FALSO)
# encontrar probabilidad de obtener un resultado menor a 8
prob_less8 = pnorm (8, media = 12, sd = 2, inferior.cola = VERDADERO)
# encontrar probabilidad de obtener un resultado entre 8 y 15
prob_between = 1 - prob_greater15 - prob_less8 # mostrar resultados
prob_greater15
[1] 0.0668072
prob_less8
[1] 0.02275013
prob_between
[1] 0.9104427
Así, el 91.04% de los valores caen entre los límites de 8 y 15.