5.36: La distribución de Pareto

Última actualización
Guardar como PDF

Page ID: 151659

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\(\newcommand{\P}{\mathbb{P}}\)\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\var}{\text{var}}\)\(\newcommand{\sd}{\text{sd}}\)\(\newcommand{\N}{\mathbb{N}}\)\(\newcommand{\skw}{\text{skew}}\)\(\newcommand{\kur}{\text{kurt}}\)

La distribución de Pareto es una distribución sesgada, de cola pesada que a veces se utiliza para modelar la distribución de los ingresos y otras variables financieras.

La distribución básica de Pareto

Funciones de distribución

La distribución básica de Pareto con parámetro de forma\(a \in (0, \infty)\) es una distribución continua\( [1, \infty) \) con función de distribución\( G \) dada por\[ G(z) = 1 - \frac{1}{z^a}, \quad z \in [1, \infty) \] El caso especial\( a = 1 \) da la distribución estándar de Pareto.

Prueba

Claramente\( G \) es creciente y continuo en\( [1, \infty) \), con\( G(1) = 0 \) y\( G(z) \to 1 \) como\( z \to \infty \).

La distribución de Pareto lleva el nombre del economista Vilfredo Pareto.

La función de densidad de probabilidad\(g\) viene dada por\[ g(z) = \frac{a}{z^{a+1}}, \quad z \in [1, \infty)\]

\(g\)está disminuyendo con el modo\( z = 1 \)
\( g \)es cóncavo hacia arriba.

Prueba

Recordemos eso\( g = G^\prime \). Las partes (a) y (b) siguen del cálculo estándar.

La razón por la que la distribución de Pareto es de cola pesada es que las\( g \) disminuciones a una tasa de potencia más que a una tasa exponencial.

Abra el simulador de distribución especial y seleccione la distribución de Pareto. Variar el parámetro shape y anotar la forma de la función de densidad de probabilidad. Para los valores seleccionados del parámetro, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función quantile\( G^{-1} \) viene dada por\[ G^{-1}(p) = \frac{1}{(1 - p)^{1/a}}, \quad p \in [0, 1) \]

El primer cuartil es\( q_1 = \left(\frac{4}{3}\right)^{1/a} \).
La mediana es\( q_2 = 2^{1/a} \).
El tercer cuartil es\( q_3 = 4^{1/a} \).

Prueba

La fórmula para\( G^{-1}(p) \) viene de resolver\( G(z) = p \) para\( z \) en términos de\( p \).

Abra la calculadora de distribución especial y seleccione la distribución de Pareto. Variar el parámetro shape y anotar la forma de las funciones de densidad de probabilidad y distribución. Para valores seleccionados de los parámetros, compute algunos valores de las funciones de distribución y cuantiles.

Momentos

Supongamos que la variable aleatoria\( Z \) tiene la distribución básica de Pareto con el parámetro shape\( a \in (0, \infty) \). Debido a que la distribución es de cola pesada, la media, la varianza y otros momentos de\( Z \) son finitos solo si el parámetro shape\(a\) es suficientemente grande.

Los momentos de\( Z \) (alrededor de 0) son

\(\E(Z^n) = \frac{a}{a - n}\)si\(0 \lt n \lt a\)
\(\E(Z^n) = \infty\)si\(n \ge a\)

Prueba

Tenga en cuenta que\[ E(Z^n) = \int_1^\infty z^n \frac{a}{z^{a+1}} dz = \int_1^\infty a z^{-(a + 1 - n)} dz \] La integral diverge a\( \infty \) si\( a + 1 - n \le 1 \) y evalúa a\(\frac{a}{a - n} \) si\( a + 1 - n \gt 1 \).

De ello se deduce que la función de generación de momento de\( Z \) no puede ser finita en ningún intervalo alrededor de 0.

En particular, la media y varianza\(Z\) de

\(\E(Z) = \frac{a}{a - 1}\)si\(a \gt 1\)
\(\var(Z) = \frac{a}{(a - 1)^2 (a - 2)}\)si\(a \gt 2\)

Prueba

Estos resultados se derivan de la fórmula general de momento anterior y la fórmula computacional\( \var(Z) = \E\left(Z^2\right) - [E(Z)]^2 \).

En el simulador de distribución especial, seleccione la distribución de Pareto. Varíe los parámetros y anote la forma y ubicación de la barra de desviación\( \pm \) estándar media. Para cada uno de los siguientes valores de parámetros, ejecute la simulación 1000 veces y anote el comportamiento de los momentos empíricos:

\(a = 1\)
\(a = 2\)
\(a = 3\)

La asimetría y curtosis de\( Z \) son las siguientes:

Si\( a \gt 3 \),\[ \skw(Z) = \frac{2 (1 + a)}{a - 3} \sqrt{1 - \frac{2}{a}}\]
Si\( a \gt 4 \),\[ \kur(Z) = \frac{3 (a - 2)(3 a^2 + a + 2)}{a (a - 3)(a - 4)} \]

Prueba

Estos resultados se derivan de las fórmulas computacionales estándar para asimetría y curtosis, y los primeros 4 momentos\( Z \) dados anteriormente.

Entonces la distribución está positivamente sesgada y\( \skw(Z) \to 2 \) como\( a \to \infty \) while\( \skw(Z) \to \infty \) as\( a \downarrow 3 \). De igual manera,\( \kur(Z) \to 9 \) como\( a \to \infty \) y\( \kur(Z) \to \infty \) como\( a \downarrow 4 \). Recordemos que el exceso de curtosis\( Z \) de\[ \kur(Z) - 3 = \frac{3 (a - 2)(3 a^2 + a + 2)}{a (a - 3)(a - 4)} - 3 = \frac{6 (a^3 + a^2 - 6 a - 1)}{a(a - 3)(a - 4)} \]

Distribuciones Relacionadas

La distribución básica de Pareto es invariante bajo potencias positivas de la variable subyacente.

Supongamos que\( Z \) tiene la distribución básica de Pareto con parámetro shape\( a \in (0, \infty) \) y eso\( n \in (0, \infty) \). Después\( W = Z^n \) tiene la distribución básica de Pareto con parámetro shape\( a / n \).

Prueba

Utilizamos el CDF de\( Z \) dado anteriormente. \[ \P(W \le w) = \P\left(Z \le w^{1/n}\right) = 1 - \frac{1}{w^{a/n}}, \quad w \in [1, \infty) \]En función de\( w \), este es el Pareto CDF con parámetro shape\( a / n \).

En particular, si\( Z \) tiene la distribución estándar de Pareto y\( a \in (0, \infty) \), entonces\( Z^{1/a} \) tiene la distribución básica de Pareto con parámetro shape\( a \). Así, todas las variables básicas de Pareto se pueden construir a partir de la estándar.

La distribución básica de Pareto tiene una relación recíproca con la distribución beta.

Supongamos que\( a \in (0, \infty) \).

Si\(Z\) tiene la distribución básica de Pareto con el parámetro shape\(a\) entonces\(V = 1 / Z\) tiene la distribución beta con el parámetro izquierdo\(a\) y el parámetro derecho 1.
Si\( V \) tiene la distribución beta con el parámetro izquierdo\( a \) y el parámetro derecho 1, entonces\( Z = 1 / V \) tiene la distribución básica de Pareto con el parámetro shape\( a \).

Prueba

Utilizaremos el teorema de cambio estándar de variables. Las transformaciones son\( v = 1 / z \) y\( z = 1 / v \) para\( z \in [1, \infty) \) y\( v \in (0, 1] \). Estos son inversos el uno del otro. Dejar\( g \) y\( h \) denotar PDFs de\( Z \) y\( V \) respectivamente.

Empezamos con\( g(z) = a \big/ z^{a+1} \) for\( z \in [1, \infty) \), el PDF de\( Z \) dado anteriormente. Entonces\[ h(v) = g(z) \left|\frac{dz}{dv}\right| = \frac{a}{(1 / v)^{a+1}} \frac{1}{v^2} = a v^{a-1}, \quad v \in (0, 1] \] cual es el PDF de la distribución beta con parámetro izquierdo\( a \) y parámetro derecho 1.
Empezamos con\( h(v) = a v^{a-1} \) para\( v \in (0, 1] \). Entonces\[ g(z) = h(v) \left|\frac{dv}{dz}\right] = a\left(\frac{1}{z}\right)^{a-1} \frac{1}{z^2} = \frac{a}{z^{a+1}}, \quad z \in [1, \infty) \] cual es el PDF de la distribución básica de Pareto con parámetro shape\( a \).

La distribución básica de Pareto tiene las conexiones habituales con la distribución uniforme estándar por medio de la función de distribución y la función cuantil calculadas anteriormente.

Supongamos que\( a \in (0, \infty) \).

Si\( U \) tiene la distribución uniforme estándar entonces\( Z = 1 \big/ U^{1/a} \) tiene la distribución básica de Pareto con el parámetro shape\( a \).
Si\( Z \) tiene la distribución básica de Pareto con el parámetro shape\( a \) entonces\( U = 1 \big/ Z^a \) tiene la distribución uniforme estándar.

Prueba

Si\( U \) tiene la distribución uniforme estándar, entonces también lo hace\( 1 - U \). De ahí\( Z = G^{-1}(1 - U) = 1 \big/ U^{1/a} \) que tenga la distribución básica de Pareto con parámetro shape\( a \).
Si\( Z \) tiene la distribución básica de Pareto con parámetro shape\( a \), entonces\( G(Z) \) tiene la distribución uniforme estándar. Pero entonces\( U = 1 - G(Z) = 1 \big/ Z^a \) también tiene la distribución uniforme estándar.

Dado que la función quantile tiene una forma cerrada simple, la distribución básica de Pareto se puede simular usando el método de cuantil aleatorio.

Abrir el experimento de cuantiles aleatorios y seleccionar la distribución de Pareto. Variar el parámetro shape y anotar la forma de las funciones de distribución y densidad de probabilidad. Para los valores seleccionados del parámetro, ejecute el experimento 1000 veces y compare la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

La distribución básica de Pareto también tiene conexiones simples con la distribución exponencial.

Supongamos que\( a \in (0, \infty) \).

Si\( Z \) tiene la distribución básica de Pareto con el parámetro shape\( a \), entonces\( T = \ln Z \) tiene la distribución exponencial con el parámetro rate\( a \).
Si\( T \) tiene la distribución exponencial con el parámetro rate\( a \), entonces\( Z = e^T \) tiene la distribución básica de Pareto con el parámetro shape\( a \).

Prueba

Utilizamos el CDF de Pareto dado anteriormente y el CDF de la distribución exponencial.

Si\( t \in [0, \infty) \) entonces\[ \P(T \le t) = \P\left(Z \le e^t\right) = 1 - \frac{1}{\left(e^t\right)^a} = 1 - e^{-a t}\] cual es el CDF de la distribución exponencial con parámetro rate\( a \).
Si\( z \in [1, \infty) \) entonces\[ \P(Z \le z) = \P(T \le \ln z) = 1 - \exp(-a \ln z) = 1 - \frac{1}{z^z} \] cual es el CDF de la distribución básica de Pareto con parámetro shape\( a \).

La distribución general de Pareto

Al igual que con muchas otras distribuciones que gobiernan variables positivas, la distribución de Pareto a menudo se generaliza agregando un parámetro de escala. Recordemos que una transformación de escala suele corresponder a un cambio de unidades (dólares a euros, por ejemplo) y así tales transformaciones son de fundamental importancia.

Supongamos que\(Z\) tiene la distribución básica de Pareto con parámetro shape\(a \in (0, \infty)\) y eso\(b \in (0, \infty)\). La variable aleatoria\(X = b Z\) tiene la distribución de Pareto con el parámetro shape\(a\) y el parámetro scale\(b\).

Tenga en cuenta que\(X\) tiene una distribución continua en el intervalo\([b, \infty)\).

Funciones de distribución

Supongamos nuevamente que\( X \) tiene la distribución de Pareto con parámetro shape\( a \in (0, \infty) \) y parámetro scale\( b \in (0, \infty) \).

\( X \)tiene función de distribución\( F \) dada por\[ F(x) = 1 - \left( \frac{b}{x} \right)^a, \quad x \in [b, \infty) \]

Prueba

Recordemos que\( F(x) = G\left(\frac{x}{b}\right) \) para\( x \in [b, \infty) \) donde\( G \) está el CDF de la distribución básica con parámetro shape\( a \).

\( X \)tiene la función de densidad de probabilidad\( f \) dada por\[ f(x) = \frac{a b^a}{x^{a + 1}}, \quad x \in [b, \infty) \]

Prueba

Recordemos que\( f(x) = \frac{1}{b} g\left(\frac{x}{b}\right) \) para\( x \in [b, \infty) \) donde\( g \) esta el PDF de la distribucion basica con parámetro shape\( a \).

Abra el simulador de distribución especial y seleccione la distribución de Pareto. Varíe los parámetros y anote la forma y ubicación de la función de densidad de probabilidad. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

\( X \)tiene función cuantil\( F^{-1} \) dada por\[ F^{-1}(p) = \frac{b}{(1 - p)^{1/a}}, \quad p \in [0, 1) \]

El primer cuartil es\( q_1 = b \left(\frac{4}{3}\right)^{1/a} \).
La mediana es\( q_2 = b 2^{1/a} \).
El tercer cuartil es\( q_3 = b 4^{1/a} \).

Prueba

Recordemos que\( F^{-1}(p) = b G^{-1}(p) \) para\( p \in [0, 1) \) donde\( G^{-1} \) está la función cuantil de la distribución básica con parámetro shape\( a \).

Abra la calculadora de distribución especial y seleccione la distribución de Pareto. Varíe los parámetros y anote la forma y ubicación de las funciones de densidad de probabilidad y distribución. Para valores seleccionados de los parámetros, compute algunos valores de las funciones de distribución y cuantiles.

Momentos

Supongamos de nuevo que\( X \) tiene la distribución de Pareto con parámetro de forma\( a \in (0, \infty) \) y parámetro de escala\( b \in (0, \infty) \)

Los momentos de\( X \) son dados por

\(\E(X^n) = b^n \frac{a}{a - n}\)si\(0 \lt n \lt a\)
\(\E(X^n) = \infty\)si\(n \ge a\)

Prueba

Por definición podemos tomar\( X = b Z \) donde\( Z \) tiene la distribución básica de Pareto con parámetro shape\( a \). Por la linealidad del valor esperado,\( \E(X^n) = b^n \E(Z^n) \), por lo que el resultado se desprende de los momentos de\( Z \) dado anteriormente.

La media y varianza\( X \) de

\(\E(X) = b \frac{a}{a - 1}\)si\(a \gt 1\)
\(\var(X) = b^2 \frac{a}{(a - 1)^2 (a - 2)}\)si\(a \gt 2\)

Abra el simulador de distribución especial y seleccione la distribución de Pareto. Varíe los parámetros y anote la forma y ubicación de la barra de desviación\( \pm \) estándar media. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

La asimetría y curtosis de\( X \) son las siguientes:

Si\( a \gt 3 \),\[ \skw(X) = \frac{2 (1 + a)}{a - 3} \sqrt{1 - \frac{2}{a}}\]
Si\( a \gt 4 \),\[ \kur(X) = \frac{3 (a - 2)(3 a^2 + a + 2)}{a (a - 3)(a - 4)} \]

Prueba

Recordemos que la asimetría y la curtosis se definen en términos de la puntuación estándar, y por lo tanto son invariantes bajo transformaciones de escala. Así la asimetría y curtosis de\( X \) son las mismas que las asimetría y curtosis\( Z = X / b \) dadas anteriormente.

Distribuciones Relacionadas

Dado que la distribución de Pareto es una familia de escalas para valores fijos del parámetro shape, se cierra trivialmente bajo transformaciones de escala.

Supongamos que\(X\) tiene la distribución de Pareto con parámetro shape\(a \in (0, \infty)\) y parámetro scale\(b \in (0, \infty)\). Si\(c \in (0, \infty)\) entonces\(Y = c X\) tiene la distribución de Pareto con parámetro shape\(a\) y parámetro scale\(b c\).

Prueba

Por definición podemos tomar\( X = b Z \) donde\( Z \) tiene la distribución básica de Pareto con parámetro shape\( a \). Pero entonces\( Y = c X = (b c) Z \).

La distribución de Pareto se cierra bajo potencias positivas de la variable subyacente.

Supongamos que\( X \) tiene la distribución de Pareto con parámetro shape\( a \in (0, \infty) \) y parámetro scale\( b \in (0, \infty) \). Si\( n \in (0, \infty) \) entonces\( Y = X^n \) tiene la distribución de Pareto con parámetro shape\( a / n \) y parámetro scale\( b^n \).

Prueba

Nuevamente podemos escribir\( X = b Z \) donde\( Z \) tiene la distribución básica de Pareto con parámetro shape\( a \). Entonces a partir del resultado de potencia anterior\( Z^n \) tiene la distribución básica de Pareto con el parámetro shape\( a / n \) y por lo tanto\( Y = X^n = b^n Z^n \) tiene la distribución de Pareto con parámetro shape\( a / n \) y parámetro scale\( b^n \).

Todas las variables de Pareto se pueden construir a partir de la estándar. Si\( Z \) tiene la distribución estándar de Pareto y\( a, \, b \in (0, \infty) \) luego\( X = b Z^{1/a} \) tiene la distribución de Pareto con parámetro de forma\( a \) y parámetro de escala\( b \).

Como antes, la distribución de Pareto tiene las conexiones habituales con la distribución uniforme estándar por medio de la función de distribución y la función cuantil dadas anteriormente.

Supongamos que\( a, \, b \in (0, \infty) \).

Si\( U \) tiene la distribución uniforme estándar entonces\( X = b \big/ U^{1/a} \) tiene la distribución de Pareto con parámetro de forma\( a \) y parámetro de escala\( b \).
Si\( X \) tiene la distribución de Pareto con parámetro de forma\( a \) y parámetro de escala\( b \), entonces\( U = (b / X)^a \) tiene la distribución uniforme estándar.

Prueba

Si\( U \) tiene la distribución uniforme estándar, entonces también lo hace\( 1 - U \). De ahí\( X = F^{-1}(1 - U) = b \big/ U^{1/a} \) que tenga la distribución de Pareto con parámetro de forma\( a \) y parámetro de escala\( b \).
Si\( X \) tiene la distribución de Pareto con parámetro de forma\( a \) y parámetro de escala\( b \), entonces\( F(X) \) tiene la distribución uniforme estándar. Pero entonces\( U = 1 - F(X) = (b / X)^a \) también tiene la distribución uniforme estándar.

Nuevamente, dado que la función quantile tiene una forma cerrada simple, la distribución básica de Pareto se puede simular usando el método de cuantil aleatorio.

Abrir el experimento de cuantiles aleatorios y seleccionar la distribución de Pareto. Varíe los parámetros y anote la forma de las funciones de distribución y densidad de probabilidad. Para valores seleccionados de los parámetros, ejecute el experimento 1000 veces y compare la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

La distribución de Pareto se cierra con respecto al condicionamiento en un evento de cola derecha.

Supongamos que\( X \) tiene la distribución de Pareto con parámetro shape\( a \in (0, \infty) \) y parámetro scale\( b \in (0, \infty) \). Para\( c \in [b, \infty) \), la distribución condicional de\( X \) dado\( X \ge c \) es Pareto con parámetro de forma\( a \) y parámetro de escala\( c \).

Prueba

No es sorprendente que sea mejor usar funciones de distribución de cola derecha. Recordemos que esta es la función\( F^c = 1 - F \) donde\( F \) se encuentra el CDF ordinario dado anteriormente. Si\( x \ge c \), ellos\[ \P(X \gt x \mid X \gt c) = \frac{\P(X \gt x)}{\P(X \gt c)} = \frac{(b / x)^a}{(b / c)^a} = (c / x)^a \]

Finalmente, la distribución de Pareto es una distribución exponencial general con respecto al parámetro shape, para un valor fijo del parámetro scale.

Supongamos que\( X \) tiene la distribución de Pareto con parámetro shape\( a \in (0, \infty) \) y parámetro scale\( b \in (0, \infty) \). Para fijo\( b \), la distribución de\( X \) es una distribución exponencial general con parámetro natural\( -(a + 1) \) y estadística natural\( \ln X \).

Prueba

Esto se desprende de la definición de la familia exponencial general, ya que el pdf anterior se puede escribir en la forma\[ f(x) = a b^a \exp[-(a + 1) \ln x], \quad x \in [b, \infty) \]

Ejercicios Computacionales

Supongamos que el ingreso de una determinada población tiene la distribución de Pareto con el parámetro de forma 3 y el parámetro de escala 1000. Encuentra cada uno de los siguientes:

La proporción de la población con ingresos entre 2000 y 4000.
El ingreso medio.
El primer y tercer cuartiles y el rango intercuartil.
El ingreso medio.
La desviación estándar de los ingresos.
El percentil 90.

Responder

\(\P(2000 \lt X \lt 4000) = 0.1637\)por lo que la proporción es 16.37%
\(Q_2 = 1259.92\)
\(Q_1 = 1100.64\),\(Q_3 = 1587.40\),\(Q_3 - Q_1 = 486.76\)
\(\E(X) = 1500\)
\(\sd(X) = 866.03\)
\(F^{-1}(0.9) = 2154.43\)