Saltar al contenido principal

# 5.12: La distribución lognormal

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$
$$\newcommand{\R}{\mathbb{R}}$$$$\newcommand{\N}{\mathbb{N}}$$$$\newcommand{\E}{\mathbb{E}}$$$$\newcommand{\P}{\mathbb{P}}$$$$\newcommand{\var}{\text{var}}$$$$\newcommand{\sd}{\text{sd}}$$$$\newcommand{\cov}{\text{cov}}$$$$\newcommand{\cor}{\text{cor}}$$$$\newcommand{\skw}{\text{skew}}$$$$\newcommand{\kur}{\text{kurt}}$$

## Teoría Básica

### Definición

Supongamos que$$Y$$ tiene la distribución normal con media$$\mu \in \R$$ y desviación estándar$$\sigma \in (0, \infty)$$. Después$$X = e^Y$$ tiene la distribución lognormal con parámetros$$\mu$$ y$$\sigma$$.

1. El parámetro$$\sigma$$ es el parámetro shape de la distribución.
2. El parámetro$$e^\mu$$ es el parámetro de escala de la distribución.

Si$$Z$$ tiene la distribución normal estándar entonces$$W = e^Z$$ tiene la distribución lognormal estándar.

Entonces, de manera equivalente, si$$X$$ tiene una distribución lognormal entonces$$\ln X$$ tiene una distribución normal, de ahí el nombre. La distribución lognormal es una distribución continua$$(0, \infty)$$ y se utiliza para modelar cantidades aleatorias cuando se cree que la distribución está sesgada, como ciertas variables de ingresos y de vida útil. Es fácil escribir una variable lognormal general en términos de una variable lognormal estándar. Supongamos que$$Z$$ tiene la distribución normal estándar y let$$W = e^Z$$ así que$$W$$ tiene la distribución lognormal estándar. Si$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$ entonces$$Y = \mu + \sigma Z$$ tiene la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$ y por lo tanto$$X = e^Y$$ tiene la distribución lognormal con parámetros$$\mu$$ y$$\sigma$$. Pero$X = e^Y = e^{\mu + \sigma Z} = e^\mu \left(e^Z\right)^\sigma = e^\mu W^\sigma$

### Funciones de distribución

Supongamos que$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$.

La función de densidad de probabilidad$$f$$ de$$X$$ viene dada por$f(x) = \frac{1}{\sqrt{2 \pi} \sigma x} \exp \left[-\frac{\left(\ln x - \mu\right)^2}{2 \sigma^2} \right], \quad x \in (0, \infty)$

1. $$f$$aumenta y luego disminuye con el modo en$$x = \exp\left(\mu - \sigma^2\right)$$.
2. $$f$$es cóncavo hacia arriba luego hacia abajo y luego hacia arriba nuevamente, con puntos de inflexión$$x = \exp\left(\mu - \frac{3}{2} \sigma^2 \pm \frac{1}{2} \sigma \sqrt{\sigma^2 + 4}\right)$$
3. $$f(x) \to 0$$como$$x \downarrow 0$$ y como$$x \to \infty$$.
Prueba

La forma del PDF se desprende del teorema del cambio de variables. Dejar$$g$$ denotar el PDF de la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$, de modo que$g(y) = \frac{1}{\sqrt{2 \pi} \sigma} \exp\left[-\frac{1}{2}\left(\frac{y - \mu}{\sigma}\right)^2\right], \quad y \in \R$ El mapeo$$x = e^y$$ mapea$$\R$$ uno a uno$$(0, \infty)$$ con inverso$$y = \ln x$$. De ahí que el PDF$$f$$ de$$X = e^Y$$ es$f(x) = g(y) \frac{dy}{dx} = g\left(\ln x\right) \frac{1}{x}$ Sustituyendo da el resultado. Las partes (a) — (d) siguen del cálculo estándar.

En el simulador de distribución especial, seleccione la distribución lognormal. Varíe los parámetros y anote la forma y ubicación de la función de densidad de probabilidad. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad verdadera.

Dejar$$\Phi$$ denotar la función de distribución normal estándar, de modo que esa$$\Phi^{-1}$$ es la función cuantil normal estándar. Recordemos que los valores de$$\Phi$$ y se$$\Phi^{-1}$$ pueden obtener de la calculadora de distribución especial, así como paquetes estándar de software matemático y estadístico, y de hecho estas funciones se consideran funciones especiales en matemáticas. Los siguientes dos resultados muestran cómo calcular la función de distribución lognormal y los cuantiles en términos de la función de distribución normal estándar y los cuantiles.

La función$$F$$ de distribución de$$X$$ viene dada por$F(x) = \Phi \left( \frac{\ln x - \mu}{\sigma} \right), \quad x \in (0, \infty)$

Prueba

Una vez más, escribe$$X = e^{\mu + \sigma Z}$$ donde$$Z$$ tiene la distribución normal estándar. Para$$x \gt 0$$,$F(x) = \P(X \le x) = \P\left(Z \le \frac{\ln x - \mu}{\sigma}\right) = \Phi \left( \frac{\ln x - \mu}{\sigma} \right)$

La función cuantil de$$X$$ viene dada por$F^{-1}(p) = \exp\left[\mu + \sigma \Phi^{-1}(p)\right], \quad p \in (0, 1)$

Prueba

Esto sigue resolviendo$$p = F(x)$$ para$$x$$ en términos de$$p$$.

En la calculadora de distribución especial, seleccione la distribución lognormal. Variar los parámetros y anotar la forma y ubicación de la función de densidad de probabilidad y la función de distribución. Con$$\mu = 0$$ y$$\sigma = 1$$, encontrar la mediana y el primer y tercer cuartiles.

### Momentos

Los momentos de la distribución lognormal se pueden calcular a partir de la función de generación de momento de la distribución normal. Una vez más, asumimos que$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$.

Para$$t \in \R$$,$\E\left(X^t\right) = \exp \left( \mu t + \frac{1}{2} \sigma^2 t^2 \right)$

Prueba

Recordemos que si$$Y$$ tiene la distribución normal con media$$\mu \in \R$$ y desviación estándar$$\sigma \in (0, \infty)$$, entonces$$Y$$ tiene la función de generación de momento dada por$\E\left(e^{t Y}\right) = \exp\left(\mu t + \frac{1}{2} \sigma^2 t^2\right), \quad t \in \R$ De ahí el resultado sigue inmediatamente desde entonces$$\E\left(X^t\right) = \E\left(e^{t Y}\right)$$.

En particular, la media y varianza de$$X$$ son

1. $$\E(X) = \exp\left(\mu + \frac{1}{2} \sigma^2\right)$$
2. $$\var(X) = \exp\left[2 (\mu + \sigma^2)\right] - \exp\left(2 \mu + \sigma^2\right)$$

En la simulación del simulador de distribución especial, seleccione la distribución lognormal. Varíe los parámetros y anote la forma y ubicación de la barra de desviación$$\pm$$ estándar media. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare los momentos empíricos con los momentos verdaderos.

A partir de la fórmula general para los momentos, también podemos calcular la asimetría y curtosis de la distribución logarítmica normal.

La asimetría y curtosis de$$X$$ son

1. $$\skw(X) = \left(e^{\sigma^2} + 2\right) \sqrt{e^{\sigma^2} - 1}$$
2. $$\kur(X) = e^{4 \sigma^2} + 2 e^{3 \sigma^2} + 3 e^{2 \sigma^2} - 3$$
Prueba

Estos resultados se derivan de los primeros 4 momentos de la distribución logarítmica normal y las fórmulas computacionales estándar para asimetría y curtosis.

El hecho de que la asimetría y la curtosis no dependan de ello$$\mu$$ se debe a que$$\mu$$ es un parámetro de escala. Recordemos que la asimetría y la curtosis se definen en términos de la puntuación estándar y por lo tanto son independientes de los parámetros de ubicación y escala. Naturalmente, la distribución logarítmica normal está sesgada positivamente. Por último, señalar que el exceso de curtosis es$\kur(X) - 3 = e^{4 \sigma^2} + 2 e^{3 \sigma^2} + 3 e^{2 \sigma^2} - 6$

Aunque la distribución lognormal tiene momentos finitos de todos los órdenes, la función de generación de momento es infinita en cualquier número positivo. Esta propiedad es una de las razones de la fama de la distribución lognormal.

$$\E\left(e^{t X}\right) = \infty$$para cada$$t \gt 0$$.

Prueba

Por definición,$$X = e^Y$$ donde$$Y$$ tiene la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$. Usando la fórmula de cambio de variables por valor esperado tenemos$\E\left(e^{t X}\right) = \E\left(e^{t e^Y}\right) = \int_{-\infty}^\infty \exp(t e^y) \frac{1}{\sqrt{2 \pi} \sigma} \exp\left[-\frac{1}{2}\left(\frac{y - \mu}{\sigma}\right)^2\right] dy = \frac{1}{\sqrt{2 \pi} \sigma} \int_{-\infty}^\infty \exp\left[t e^y - \frac{1}{2} \left(\frac{y - \mu}{\sigma}\right)^2\right] dy$ Si$$t \gt 0$$ el integrando en la última integral diverge a$$\infty$$ as$$y \to \infty$$, entonces no hay esperanza de que la integral converja.

Las relaciones más importantes son las que existen entre las distribuciones lognormal y normal en la definición: si$$X$$ tiene una distribución lognormal entonces$$\ln X$$ tiene una distribución normal; a la inversa si$$Y$$ tiene una distribución normal entonces$$e^Y$$ tiene una distribución lognormal. La distribución lognormal es también una familia de escalas.

Supongamos que$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$ y eso$$c \in (0, \infty)$$. Después$$c X$$ tiene la distribución lognormal con parámetros$$\mu + \ln c$$ y$$\sigma$$.

Prueba

A partir de la definición, podemos escribir$$X = e^Y$$ donde$$Y$$ tiene la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$. De ahí$c X = c e^Y = e^{\ln c} e^Y = e^{\ln c + Y}$ Pero$$\ln c + Y$$ tiene la distribución normal con media$$\ln c + \mu$$ y desviación estándar$$\sigma$$.

El recíproco de una variable lognormal también es lognormal.

Si$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$ luego$$1 / X$$ tiene la distribución lognormal con parámetros$$-\mu$$ y$$\sigma$$.

Prueba

Nuevamente a partir de la definición, podemos escribir$$X = e^Y$$ donde$$Y$$ tiene la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$. De ahí$$1 / X = e^{-Y}$$. Pero$$-Y$$ tiene la distribución normal con media$$-\mu$$ y desviación estándar$$\sigma$$.

La distribución lognormal se cierra bajo potencias distintas de cero de la variable subyacente. En particular, esto generaliza el resultado anterior.

Supongamos que$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$ y eso$$a \in \R \setminus \{0\}$$. Después$$X^a$$ tiene la distribución lognormal con parámetros con parámetros$$a \mu$$ y$$|a| \sigma$$.

Prueba

Nuevamente a partir de la definición, podemos escribir$$X = e^Y$$ donde$$Y$$ tiene la distribución normal con media$$\mu$$ y desviación estándar$$\sigma$$. De ahí$$X^a = e^{a Y}$$. Pero$$a Y$$ tiene la distribución normal con media$$a \mu$$ y desviación estándar$$|a| \sigma$$.

Dado que la distribución normal se cierra bajo sumas de variables independientes, no es sorprendente que la distribución lognormal se cierre bajo productos de variables independientes.

Supongamos que$$n \in \N_+$$ y que$$(X_1, X_2, \ldots, X_n)$$ es una secuencia de variables independientes, donde$$X_i$$ tiene la distribución lognormal con parámetros$$\mu_i \in \R$$ y$$\sigma_i \in (0, \infty)$$ para$$i \in \{1, 2, \ldots, n\}$$. Después$$\prod_{i=1}^n X_i$$ tiene la distribución lognormal con parámetros$$\mu$$ y$$\sigma$$ dónde$$\mu = \sum_{i=1}^n \mu_i$$ y$$\sigma^2 = \sum_{i=1}^n \sigma_i^2$$.

Prueba

Nuevamente a partir de la definición, podemos escribir$$X_i = e^{Y_i}$$ dónde$$Y_i$$ tiene la distribución normal con media$$\mu_i$$ y desviación estándar$$\sigma_i$$ para$$i \in \{1, 2, \ldots, n\}$$ y dónde$$(Y_1, Y_2, \ldots, Y_n)$$ es una secuencia independiente. De ahí$$\prod_{i=1}^n X_i = \exp\left(\sum_{i=1}^n Y_i\right)$$. Pero$$\sum_{i=1}^n Y_i$$ tiene la distribución normal con media$$\sum_{i=1}^n \mu_i$$ y varianza$$\sum_{i=1}^n \sigma_i^2$$.

Finalmente, la distribución lognormal pertenece a la familia de distribuciones exponenciales generales.

Supongamos que$$X$$ tiene la distribución lognormal con parámetros$$\mu \in \R$$ y$$\sigma \in (0, \infty)$$. La distribución de$$X$$ es una familia exponencial de 2 parámetros con parámetros naturales y estadísticas naturales, respectivamente, dada por

1. $$\left( -1 / 2 \sigma^2, \mu / \sigma^2 \right)$$
2. $$\left(\ln^2(X), \ln X\right)$$
Prueba

Esto se desprende de la definición de la familia exponencial general, ya que podemos escribir el PDF lognormal en la forma$f(x) = \frac{1}{\sqrt{2 \pi} \sigma} \exp\left(-\frac{\mu^2}{2 \sigma^2}\right) \frac{1}{x} \exp\left[-\frac{1}{2 \sigma^2} \ln^2(x) + \frac{\mu}{\sigma^2} \ln x\right], \quad x \in (0, \infty)$

## Ejercicios Computacionales

Supongamos que el ingreso$$X$$ de una persona elegida al azar en una determinada población (en $1000 unidades) tiene la distribución lognormal con parámetros$$\mu = 2$$ y$$\sigma = 1$$. Encuentra$$\P(X \gt 20)$$. Contestar $$\P(X \gt 20) = 0.1497$$ Supongamos que el ingreso$$X$$ de una persona elegida al azar en una determinada población (en$1000 unidades) tiene la distribución lognormal con parámetros$$\mu = 2$$ y$$\sigma = 1$$. Encuentra cada uno de los siguientes:

1. $$\E(X)$$
2. $$\var(X)$$
Contestar
1. $$\E(X) = e^{5/2} \approx 12.1825$$
2. $$\sd(X) = \sqrt{e^6 - e^5} \approx 15.9629$$

This page titled 5.12: La distribución lognormal is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform.