5.30: La distribución extrema del valor

Última actualización
Guardar como PDF

Page ID: 151701

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\(\newcommand{\R}{\mathbb{R}}\)\(\newcommand{\N}{\mathbb{N}}\)\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\P}{\mathbb{P}}\)\(\newcommand{\var}{\text{var}}\)\(\newcommand{\sd}{\text{sd}}\)\(\newcommand{\skw}{\text{skew}}\)\(\newcommand{\kur}{\text{kurt}}\)

Las distribuciones de valores extremos surgen como distribuciones limitantes para máximos o mínimos (valores extremos) de una muestra de variables aleatorias independientes, distribuidas idénticamente, a medida que aumenta el tamaño de la muestra. Por lo tanto, estas distribuciones son importantes en la estadística de probabilidad y matemática.

La distribución estándar para máximos

Funciones de distribución

La distribución estándar de valores extremos (para máximos) es una distribución continua\(\R\) con función de distribución\( G \) dada por\[ G(v) = \exp\left(-e^{-v}\right), \quad v \in \R \]

Prueba

Tenga en cuenta que\( G \) es continuo, creciente, y satisface\( G(v) \to 0 \) como\( v \to -\infty \) y\( G(v) \to 1 \) como\( v \to \infty \).

La distribución también se conoce como la distribución estándar de Gumbel en honor a Emil Gumbel. Como mostraremos a continuación, surge como el límite del máximo de variables aleatorias\(n\) independientes, cada una con la distribución exponencial estándar (cuando este máximo está apropiadamente centrado). Este hecho es la razón principal por la que la distribución es especial, y es la razón del nombre. Para el resto de esta discusión, supongamos que la variable aleatoria\( V \) tiene la distribución estándar de Gumbel.

La función de densidad de probabilidad\( g \) de\( V \) viene dada por\[ g(v) = e^{-v} \exp\left(-e^{-v}\right) = \exp\left[-\left(e^{-v} + v\right)\right], \quad v \in \R \]

\(g\)aumenta y luego disminuye con el modo\( v = 0 \)
\(g\)es cóncava hacia arriba, luego hacia abajo, luego hacia arriba nuevamente, con puntos de inflexión en\( v = \ln\left[(3 \pm \sqrt{5}) \big/ 2)\right] \approx \pm 0.9264\).

Prueba

Estos resultados se derivan del cálculo estándar. El PDF es\( g = G^\prime \).

La primera derivada de\( g \) satisface\(g^\prime(v) = g(v)\left(e^{-v} - 1\right)\) para\( v \in \R \).
La segunda derivada de\( g \) satisface\( g^{\prime \prime}(v) = g(v) \left(e^{-2 v} - 3 e^{-v} + 1\right)\) para\( v \in \R \).

En el simulador de distribución especial, seleccione la distribución de valor extremo. Mantenga los valores de los parámetros predeterminados y anote la forma y ubicación de la función de densidad de probabilidad. En particular, señalar la falta de simetría. Ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función cuantil\( G^{-1} \) de\( V \) viene dada por\[ G^{-1}(p) = -\ln[-\ln(p)], \quad p \in (0, 1) \]

El primer cuartil es\(-\ln(-\ln 4) \approx -0.3266\).
La mediana es\(-\ln(-\ln 2) \approx 0.3665\)
El tercer cuartil es\(-\ln(\ln 4 - \ln 3) \approx 1.2459\)

Prueba

La fórmula para\( G^{-1} \) sigue de resolver\( p = G(v) \) para\( v \) en términos de\( p \).

En la calculadora de distribución especial, seleccione la distribución de valores extremos. Mantenga los valores de los parámetros predeterminados y anote la forma y ubicación de las funciones de densidad de probabilidad y distribución. Calcular los cuantiles de orden 0.1, 0.3, 0.6 y 0.9

Momentos

Supongamos nuevamente que\( V \) tiene la distribución estándar de Gumbel. La función generadora de momentos de\( V \) tiene una expresión simple en términos de la función gamma\( \Gamma \).

La función de generación de momento\( m \) de\( V \) viene dada por\[ m(t) = \E\left(e^{t V}\right) = \Gamma(1 - t), \quad t \in (-\infty, 1) \]

Prueba

Tenga en cuenta que\[ m(t) = \int_{-\infty}^\infty e^{t v} \exp\left(-e^{-v}\right) e^{-v} dv \] La sustitución\( x = e^{-v} \),\( dx = -e^{-v} dv \) da\(m(t) = \int_0^\infty x^{-t} e^{-x} dx = \Gamma(1 - t)\) por\(t \in (-\infty, 1)\).

A continuación damos la media y varianza. Primero, recordemos que la constante de Euler, llamada así por Leonhard Euler se define por\[ \gamma = -\Gamma^\prime(1) = -\int_0^\infty e^{-x} \ln x \, dx \approx 0.5772156649 \]

La media y varianza de\( V \) son

\(\E(V) = \gamma\)
\(\var(V) = \frac{\pi^2}{6}\)

Prueba

Estos resultados se derivan de la función de generación de momento.

\( m^\prime(t) = -\Gamma^\prime(1 - t) \)y así\( \E(V) = m^\prime(0) = - \Gamma^\prime(1) = \gamma \).
\( m^{\prime \prime}(t) = \Gamma^{\prime \prime}(1 - t) \)y\[ \E(V^2) = m^{\prime \prime}(0) = \Gamma^{\prime \prime}(1) = \int_0^\infty (\ln x)^2 e^{-x} dx = \gamma^2 + \frac{\pi^2}{6} \] Por lo tanto\( \var(V) = \E(V^2) - [\E(V)]^2 = \frac{\pi^2}{6} \)

En el simulador de distribución especial, seleccione la distribución de valores extremos y mantenga los valores de parámetros predeterminados. Observe la forma y ubicación de la barra de desviación\( \pm \) estándar media. Ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

A continuación le damos la asimetría y curtosis de\( V \). La asimetría implica un valor de la función zeta de Riemann\( \zeta \), nombrada por supuesto por Georg Riemann. Recordemos que\( \zeta \) se define por\[ \zeta(n) = \sum_{k=1}^\infty \frac{1}{k^n}, \quad n \gt 1 \]

La asimetría y curtosis de\( V \) son

\( \skw(V) = 12 \sqrt{6} \zeta(3) \big/ \pi^3 \approx 1.13955 \)
\( \kur(V) = \frac{27}{5} \)

El valor particular de la función zeta,\( \zeta(3) \), se conoce como la constante de Apéry. De (b), se deduce que el exceso de curtosis es\( \kur(V) - 3 = \frac{12}{5} \).

Distribuciones Relacionadas

La distribución estándar de Gumbel tiene las conexiones habituales a la distribución uniforme estándar por medio de la función de distribución y la función cuantil dadas anteriormente. Recordemos que la distribución uniforme estándar es la distribución uniforme continua en el intervalo\( (0, 1) \).

Las distribuciones estándar de Gumbel y uniformes estándar están relacionadas de la siguiente manera:

Si\( U \) tiene la distribución uniforme estándar entonces\( V = G^{-1}(U) = -\ln(-\ln U) \) tiene la distribución estándar de Gumbel.
Si\( V \) tiene la distribución estándar de Gumbel entonces\( U = G(V) = \exp\left(e^{-V}\right) \) tiene la distribución uniforme estándar.

Así podemos simular la distribución estándar de Gumbel usando el método de cuantil aleatorio habitual.

Abra el experimento de cuantiles aleatorios y seleccione la distribución de valores extremos. Mantenga los valores de los parámetros predeterminados y anote nuevamente la forma y ubicación de las funciones de densidad de probabilidad y distribución. Ejecute la simulación 1000 veces y compare la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

La distribución estándar de Gumbel también tiene conexiones simples con la distribución exponencial estándar (la distribución exponencial con el parámetro de tasa 1).

Las distribuciones estándar de Gumbel y exponenciales estándar se relacionan de la siguiente manera:

Si\(X\) tiene la distribución exponencial estándar entonces\(V = -\ln X\) tiene la distribución estándar de Gumbel.
Si\(V\) tiene la distribución estándar de Gumbel entonces\(X = e^{-V}\) tiene la distribución exponencial estándar.

Prueba

Estos resultados se derivan del teorema habitual del cambio de variables. Las transformaciones son\( v = -\ln x \) y\( x = e^{-v} \) para\( x \in (0, \infty) \) y\( v \in \R \), y estas son inversas unas de otras. Dejar\( f \) y\( g \) denotar PDFs de\( X \) y\( V \) respectivamente.

Empezamos con\( f(x) = e^{-x} \) for\( x \in (0, \infty) \) y luego\[ g(v) = f(x) \left|\frac{dx}{dv}\right| = \exp\left(-e^{-v}\right) e^{-v}, \quad v \in \R \] también lo\( V \) ha hecho la distribución estándar de Gumbel.
Empezamos con\( g(v) = \exp\left(-e^{-v}\right) e^{-v} \) for\( v \in \R \) y luego\[ f(x) = g(v) \left|\frac{dv}{dx}\right| = \exp\left[-\exp(\ln x)\right] \exp(\ln x) \frac{1}{x} = e^{-x}, \quad x \in (0, \infty) \] también lo\( X \) ha hecho la distribución exponencial estándar.

Como se señaló en la introducción, el siguiente teorema proporciona la motivación para el nombre distribución de valores extremos.

Supongamos que\( (X_1, X_2, \ldots) \) es una secuencia de variables aleatorias independientes, cada una con la distribución exponencial estándar. La distribución de\(Y_n = \max\{X_1, X_2, \ldots, X_n\} - \ln n \) converge a la distribución estándar de Gumbel como\( n \to \infty \).

Prueba

Vamos\( X_{(n)} = \max\{X_1, X_2, \ldots, X_n\} \), así que esa\( X_{(n)} \) es la estadística de orden\( n \) th de la muestra aleatoria\( (X_1, X_2, \ldots, X_n) \). Vamos a\( G \) denotar el CDF exponencial estándar, de modo que\( G(x) = 1 - e^{-x} \) para\( x \in [0, \infty) \). Tenga en cuenta que\( X_{(n)} \) tiene CDF\( G^n \). Vamos a\( F_n \) denotar el CDF de\( Y_n \). Para\( x \in \R \)\[ F_n(x) = \P(Y_n \le x) = \P\left[X_{(n)} \le x + \ln n\right] = G^n(x + \ln n) = \left[1 - e^{-(x + \ln n)}\right]^n = \left(1 - \frac{e^{-x}}{n} \right)^n \] Por un famoso límite de cálculo,\( F_n(x) \to e^{-e^{-x}} \) como\( n \to \infty \).

La distribución general del valor extremo

Al igual que con muchas otras distribuciones que hemos estudiado, la distribución estándar de valores extremos puede generalizarse aplicando una transformación lineal a la variable estándar. Primero, si\( V \) tiene la distribución estándar de Gumbel (la distribución estándar de valores extremos para máximos), entonces\( -V \) tiene la distribución estándar de valores extremos para mínimos. Aquí está la definición general.

Supongamos que\(V\) tiene la distribución estándar de Gumbel, y eso\( a, \, b \in \R \) con\( b \ne 0 \). Luego\( X = a + b V \) tiene la distribución de valores extremos con parámetro de ubicación\( a \) y parámetro de escala\( |b| \).

Si\( b \gt 0 \), entonces la distribución corresponde a máximos.
Si\( b \lt 0 \), entonces la distribución corresponde a mínimos.

Entonces la familia de distribuciones con\( a \in \R \) y\( b \in (0, \infty) \) es una familia de escala de ubicación asociada con la distribución estándar para máximos, y la familia de distribuciones con\( a \in \R \) y\( b \in (-\infty, 0) \) es la familia de escala de ubicación asociada a la distribución estándar para mínimos.. Las distribuciones también se conocen más simplemente como distribuciones de Gumbel en lugar de distribuciones de valores extremos. Las aplicaciones web en este proyecto utilizan solo las distribuciones de valor extremo para máximos. Como verá a continuación, las diferencias en la distribución para máximos y la distribución para mínimos son menores. Para lo que resta de esta discusión, supongamos que\( X \) tiene la forma dada en la definición.

Funciones de distribución

Lef\( F \) denotan la función de distribución de\( X \).

Si\( b \gt 0 \) entonces\[ F(x) = \exp\left[-\exp\left(-\frac{x - a}{b}\right)\right], \quad x \in \R \]
Si\( b \lt 0 \) entonces\[ F(x) = 1 - \exp\left[-\exp\left(-\frac{x - a}{b}\right)\right], \quad x \in \R \]

Prueba

Vamos a\( G \) denotar el CDF de\( V \). Entonces

\( F(x) = G\left(\frac{x - a}{b}\right) \)para\( x \in \R \)
\( F(x) = 1 - G\left(\frac{x - a}{b}\right) \)para\( x \in \R \)

Dejar\( f \) denotar la función de densidad de probabilidad de\( X \). Entonces\[ f(x) = \frac{1}{|b|} \exp\left(-\frac{x - a}{b}\right) \exp\left[-\exp\left(-\frac{x - a}{b}\right)\right], \quad x \in \R \]

Prueba

Vamos a\( g \) denotar el PDF de\( V \). Por el cambio de fórmula de variables,\[ f(x) = \frac{1}{|b|} g\left(\frac{x - a}{b}\right), \quad x \in \R\]

Abra el simulador de distribución especial y seleccione la distribución de valor extremo. Varíe los parámetros y anote la forma y ubicación de la función de densidad de probabilidad. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función cuantil\( F^{-1} \) de\( X \) se da de la siguiente manera

Si\( b \gt 0 \) entonces\(F^{-1}(p) = a - b \ln(-\ln p)\) por\(p \in (0, 1)\).
Si\( b \lt 0 \) entonces\( F^{-1}(p) = a - b \ln[-\ln(1 - p)],\) por\(p \in (0, 1) \)

Prueba

Dejar\( G^{-1} \) denotar la función cuantil de\( V \). Entonces

\( F^{-1}(p) = a + b G^{-1}(p) \)para\( p \in (0, 1) \).
\( F^{-1}(p) = a - b G^{-1}(1 - p) \)para\( p \in (0, 1) \).

Abra la calculadora de distribución especial y seleccione la distribución de valor extremo. Varíe los parámetros y anote la forma y ubicación de las funciones de densidad de probabilidad y distribución. Para valores seleccionados de los parámetros, compute algunos valores de la función cuantil y la función de distribución.

Momentos

Supongamos nuevamente que\( X = a + b V \) donde\( V \) tiene la distribución estándar de Gumbel, y eso\( a, \, b \in \R \) con\( b \ne 0 \).

El momento que genera la función\( M \) de la\( X \) viene dada por\(M(t) = e^{a t} \Gamma(1 - b t)\).

Con dominio\( t \in (-\infty, 1 / b) \) si\( b \gt 0 \)
Con dominio\( t \in (1 / b, \infty) \) si\( b \lt 0 \)

Prueba

Vamos a\( m \) denotar el MGF de\( V \). Entonces\( M(t) = e^{a t} m(b t) \) para\( b t \lt 1 \)

La media y varianza de\( X \) son

\(\E(X) = a + b \gamma\)
\(\var(X) = b^2 \frac{\pi^2}{6}\)

Prueba

Estos resultados se derivan de la media y varianza\( V \) y propiedades básicas del valor esperado y varianza.

\( \E(X) = a + b \E(V) \)
\( \var(X) = b^2 \var(V) \)

Abra el simulador de distribución especial y seleccione la distribución de valor extremo. Varíe los parámetros y anote el tamaño y la ubicación de la barra de desviación\( \pm \) estándar media. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

La asimetría de\( X \) es

\( \skw(X) = 12 \sqrt{6} \zeta(3) \big/ \pi^3 \approx 1.13955 \)si\( b \gt 0 \).
\( \skw(X) = -12 \sqrt{6} \zeta(3) \big/ \pi^3 \approx -1.13955 \)si\( b \lt 0 \)

Prueba

Recordemos que la asimetría se define en términos de la puntuación estándar, y por lo tanto es invariante bajo transformaciones lineales con pendiente positiva. Una transformación lineal con pendiente negativa cambia el signo de la asimetría. De ahí que estos resultados se deriven de la asimetría de\( V \).

La curtosis de\( X \) es\( \kur(X) = \frac{27}{5} \)

Prueba

Recordemos que la curtosis se define en términos de la puntuación estándar y es invariante bajo transformaciones lineales con pendiente distinta de cero. De ahí que este resultado se deduce de la curtosis de\( V \).

Una vez más, el exceso de curtosis es\( \kur(X) - 3 = \frac{12}{5} \).

Distribuciones Relacionadas

Dado que las distribuciones generales de valores extremos son familias de escala de ubicación, se cierran trivialmente bajo transformaciones lineales de las variables subyacentes (con pendiente distinta de cero).

Supongamos que\( X \) tiene la distribución de valores extremos con parámetros\( a, \, b \) con\( b \ne 0 \) y que\( c, \, d \in \R \) con\( d \ne 0 \). Después\( Y = c + d X \) tiene la distribución de valores extremos con parámetros\( a d + c \) y\( b d \).

Prueba

Por definición, podemos escribir\( X = a + b V \) donde\( V \) tiene la distribución estándar de Gumbel. De ahí\( Y = c + d X = (ad + c) + (b d) V \).

Anote si\( d \gt 0 \) entonces\( X \) y\( Y \) tienen la misma asociación (max, max) o (min, min). Si\( d \lt 0 \) entonces\( X \) y\( Y \) tienen asociaciones opuestas (max, min) o (min, max).

Al igual que con la distribución estándar de Gumbel, la distribución general de Gumbel tiene las conexiones habituales con la distribución uniforme estándar por medio de las funciones de distribución y cuantiles. Dado que la función cuantil tiene una forma cerrada simple, esta última conexión conduce al método habitual de simulación de cuantiles aleatorios. Declaramos el resultado para máximos.

Supongamos que\( a, \, b \in \R \) con\( b \ne 0 \). Dejar\( F \) denotar la función de distribución y dejar\( F^{-1} \) denotar la función cuantil anterior

Si\( U \) tiene la distribución uniforme estándar entonces\( X = F^{-1}(U) \) tiene la distribución de valores extremos con parámetros\( a \) y\( b \).
Si\( X \) tiene la distribución de valores extremos con parámetros\( a \) y\( b \) luego\( U = F(X) \) tiene la distribución uniforme estándar.

Abra el experimento de cuantiles aleatorios y seleccione la distribución de valores extremos. Varíe los parámetros y anote nuevamente la forma y ubicación de las funciones de densidad de probabilidad y distribución. Para los valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

La distribución de valores extremos para máximos tiene una conexión simple con la distribución de Weibull, y esto generaliza la conexión entre el Gumbel estándar y las distribuciones exponenciales anteriores. Hay un resultado similar para la distribución de valores extremos para mínimos.

El valor extremo y las distribuciones de Weibull se relacionan de la siguiente manera:

Si\(X\) tiene la distribución de valores extremos con parámetros\(a \in \R\) y\(b \in (0, \infty)\), entonces\(Y = e^{-X}\) tiene la distribución de Weibull con parámetro de forma\(\frac{1}{b}\) y parámetro de escala\(e^{-a}\).
Si\(Y\) tiene la distribución Weibull con parámetro de forma\(k \in (0, \infty)\) y parámetro de escala\(b \in (0, \infty)\) entonces\(X = -\ln Y\) tiene la distribución de valores extremos con parámetros\(-\ln b\) y\(\frac{1}{k}\).

Prueba

Como antes, estos resultados se pueden obtener utilizando el teorema de cambio de variables para funciones de densidad de probabilidad. Damos una prueba alternativa usando formas especiales de las variables aleatorias.

Podemos escribir\( X = a + b V \) donde\( V \) tiene la distribución estándar de Gumbel. Por lo tanto,\[ Y = e^{-X} = e^{-a} \left(e^{-V}\right)^b \] como se muestra anteriormente,\( e^{-V} \) tiene la distribución exponencial estándar y por lo tanto\( Y \) tiene la distribución de Weibull con parámetro de forma\( 1/b \) y parámetro de escala\( e^{-a} \).
Podemos escribir\( Y = b U^{1/k} \) donde\( U \) tiene la distribución exponencial estándar. Por lo tanto,\[ X = -\ln Y = -\ln b + \frac{1}{k}(-\ln U) \] como se muestra anteriormente,\( -\ln U \) tiene la distribución estándar de Gumbel y por lo tanto\( X \) tiene la distribución de Gumbel con parámetro de ubicación\( -\ln b \) y parámetro de escala\( \frac{1}{k} \).