Inicio
Química
Química Analítica
Quimiometría usando R (Harvey)
6: Incertidumbre de datos
6.3: Uso de R para modelar las propiedades de una distribución normal

6.3: Uso de R para modelar las propiedades de una distribución normal

Última actualización
Guardar como PDF

Page ID: 69340

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Dada una media y una desviación estándar, podemos usar la función dnorm () de R para trazar la distribución normal correspondiente

dnorm (x, media, sd)

donde media es el valor para\(\mu\), sd es el valor para\(\sigma\), y x es un vector de valores que abarca el rango de valores del eje x que queremos trazar.

# definir la media y la desviación estándar

mu = 12 sigma = 2

# crear vector para valores de x que abarcan un rango suficiente de

# desviaciones estándar a cada lado de la media; aquí usamos valores

# para x que son cuatro desviaciones estándar a cada lado de la media

x = seq (4, 20, 0.01)

# usar dnorm () para calcular probabilidades para cada x

y = dnorm (x, media = mu, sd = sigma)

# curva de distribución normal

plot (x, y, type = “l”, lwd = 2, col = “azul”, ylab = “probabilidad”, xlab = “x”)

Para anotar la curva de distribución normal para mostrar un área de interés para nosotros, utilizamos la función polygon () de R, como se ilustra aquí para la curva de distribución normal en la Figura\(\PageIndex{1}\), mostrando el área que incluye valores entre 8 y 15.

# definir la media y la desviación estándar

mu = 12 sigma = 2

# crear vector para valores de x que abarcan un rango suficiente de

# desviaciones estándar a cada lado de la media; aquí usamos valores

# para x que son cuatro desviaciones estándar a cada lado de la media

x = seq (4, 20, 0.01)

# usar dnorm () para calcular probabilidades para cada x

y = dnorm (x, media = mu, sd = sigma)

# trazar curva de distribución normal; las opciones xaxt = “i” y yaxt = “i”

# forzar los ejes a comenzar y terminar en los límites de los datos

plot (x, y, type = “l”, lwd = 2, col = “ivory4", ylab = “probabilidad”, xlab = “x”, xaxs = “i”, yaxs = “i”)

# crear vector para valores de x entre un límite inferior de 8 y un límite superior de 15 lowlim = 8

uplim = 15

dx = seq (lowlim, uplim, 0.01)

# usar polígono para rellenar el área; x e y son vectores de coordenadas x, y

# que definen la forma que luego se rellena usando el color deseado

polígono (x = c (lowlim, dx, uplim), y = c (0, dnorm (dx, media = 12, sd = 2), 0), frontera = NA, col = “marfil4")

Figura\(\PageIndex{2}\): Gráfica que muestra la curva de distribución normal para una población con\(\mu = 12\) y\(\sigma = 2\), y destacando la probabilidad de obtener un resultado entre 8 y 15.

Para encontrar la probabilidad de obtener un valor dentro del área sombreada, usamos el comando pnorm () de R

pnorm (q, media, sd, baja.cola)

donde q es un límite de interés, media es el valor para\(\mu\), sd es el valor para\(\sigma\), y lower.tail es un valor lógico que indica si devolvemos la probabilidad para valores por debajo del límite (lower.tail = TRUE) o para valores superiores el límite (inferior.cola = FALSO). Por ejemplo, para encontrar la probabilidad de obtener un resultado entre 8 y 15, dado\(\mu = 12\) y\(\sigma = 2\), utilizamos las siguientes líneas de código.

# encontrar probabilidad de obtener un resultado mayor a 15

prob_greater15 = pnorm (15, media = 12, sd = 2, inferior.cola = FALSO)

# encontrar probabilidad de obtener un resultado menor a 8

prob_less8 = pnorm (8, media = 12, sd = 2, inferior.cola = VERDADERO)

# encontrar probabilidad de obtener un resultado entre 8 y 15

prob_between = 1 - prob_greater15 - prob_less8 # mostrar resultados

prob_greater15

[1] 0.0668072

prob_less8

[1] 0.02275013

prob_between

[1] 0.9104427

Así, el 91.04% de los valores caen entre los límites de 8 y 15.