Saltar al contenido principal
LibreTexts Español

5.29: La distribución logística

  • Page ID
    151801
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \(\newcommand{\R}{\mathbb{R}}\)\(\newcommand{\N}{\mathbb{N}}\)\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\P}{\mathbb{P}}\)\(\newcommand{\var}{\text{var}}\)\(\newcommand{\sd}{\text{sd}}\)\(\newcommand{\cov}{\text{cov}}\)\(\newcommand{\cor}{\text{cor}}\)\(\newcommand{\skw}{\text{skew}}\)\(\newcommand{\kur}{\text{kurt}}\)

    La distribución logística se utiliza para diversos modelos de crecimiento, y se utiliza en cierto tipo de regresión, conocida apropiadamente como regresión logística.

    La distribución logística estándar

    Funciones de distribución

    La distribución logística estándar es una distribución continua\( \R \) con función de distribución\( G \) dada por\[ G(z) = \frac{e^z}{1 + e^z}, \quad z \in \R \]

    Prueba

    Tenga en cuenta que\( G \) es continuo, y\( G(z) \to 0 \) como\( z \to -\infty \) y\( G(z) \to 1 \) como\( z \to \infty \). Además,\[ G^\prime(z) = \frac{e^z}{\left(1 + e^z\right)^2} \gt 0, \quad z \in \R \] así\( G \) es cada vez mayor.

    La función\(g\) de densidad de probabilidad de la distribución logística estándar viene dada por\[ g(z) = \frac{e^z}{\left(1 + e^z\right)^2}, \quad z \in \R \]

    1. \(g\)es simétrico sobre\(x = 0\).
    2. \(g\)aumenta y luego disminuye con el modo\(x = 0\).
    3. \( g \)es cóncava hacia arriba, luego hacia abajo, luego hacia arriba nuevamente con puntos de inflexión en\( x = \pm \ln\left(2 + \sqrt{3}\right) \approx = \pm 1.317 \).
    Prueba

    Estos resultados se derivan del cálculo estándar. Primero recordemos eso\( g = G^\prime \).

    1. La simetría de no\( g \) es obvia al principio, pero tenga en cuenta que\[ g(-z) = \frac{e^{-z}}{\left(1 + e^{-z}\right)^2} \frac{e^{2z}}{e^{2z}} = \frac{e^z}{\left(1 + e^z\right)^2} = g(z) \]
    2. La primera derivada de\( g \) es\[ g^\prime(z) = \frac{e^z (1 - e^z)}{(1 + e^z)^3} \]
    3. La segunda derivada de\( g \) es\[ g^{\prime \prime}(z) = \frac{e^z \left(1 - 4 e^z + e^{2z}\right)}{(1 + e^z)^4} \]

    En el simulador de distribución especial, seleccione la distribución logística. Mantenga los valores de los parámetros predeterminados y anote la forma y ubicación de la función de densidad de probabilidad. Ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

    La función cuantil\( G^{-1} \) de la distribución logística estándar viene dada por\[ G^{-1}(p) = \ln \left( \frac{p}{1 - p} \right), \quad p \in (0, 1) \]

    1. El primer cuartil es\( -\ln 3 \approx -1.0986\).
    2. La mediana es 0.
    3. El tercer cuartil es\( \ln 3 \approx 1.0986 \)
    Prueba

    La fórmula para\( G^{-1} \) sigue resolviendo\( p = G(z) \) para\( z \) en términos de\( p \).

    Recordemos que\(p : 1 - p\) son las probabilidades a favor de un evento con probabilidad\(p\). Así, la distribución logística tiene la interesante propiedad de que los cuantiles son los logaritmos de los odds ratios correspondientes. En efecto, esta función de a veces\(p\) se llama la función logit. El hecho de que la mediana sea 0 también se desprende de la simetría, por supuesto.

    En la calculadora de distribución especial, seleccione la distribución logística. Mantenga los valores de los parámetros predeterminados y anote la forma y ubicación de la función de densidad de probabilidad y la función de distribución. Encuentra los cuantiles de orden 0.1 y 0.9.

    Momentos

    Supongamos que\( Z \) tiene la distribución logística estándar. La función de generación de momentos de\( Z \) tiene una representación simple en términos de la función beta\( B \), y por lo tanto también en términos de la función gamma\( \Gamma \)

    La función de generación de momento\( m \) de\( Z \) viene dada por

    \[ m(t) = B(1 + t, 1 - t) = \Gamma(1 + t) \, \Gamma(1 - t), \quad t \in (-1, 1) \]
    Prueba

    Tenga en cuenta\(u = \frac{e^z}{1 + e^z}\) que\[ m(t) = \int_{-\infty}^\infty e^{t z} \frac{e^z}{\left(1 + e^z\right)^2} dx \] Let para que\( du = \frac{e^z}{\left(1 + e^z\right)^2} dz \) y\( e^z = \frac{u}{1 - u} \). De ahí\[ m(t) = \int_0^1 \left(\frac{u}{1 - u}\right)^t du = \int_0^1 u^t (1 - u)^{-t} \, du \] que la última integral, por definición, sea\( B(1 + t, 1 - t) \) para\( t \in (-1, 1) \)

    Dado que la función de generación de momento es finita en un intervalo abierto que contiene 0, la variable aleatoria\( Z \) tiene momentos de todos los órdenes. Por simetría, los momentos de orden impar son 0. Los momentos de orden par se pueden representar en términos de números de Bernoulli, nombrados por supuesto por Jacob Bernoulli. Deje\( \beta_n \) Bernoulli número de orden\( n \in \N \).

    Let\( n \in \N \)

    1. Si\( n \) es impar entonces\( \E(Z^n) = 0 \).
    2. Si\( n \) es incluso entonces\( \E\left(Z^n\right) = (2^n - 2) \pi^n \left|\beta_n\right| \)
    Prueba
    1. De nuevo, esto se desprende de la simetría
    2. Recordemos que los momentos de se\( Z \) pueden computar integrando potencias de la función cuantil. De ahí que\[ \E\left(Z^n\right) = \int_0^1 \left[\ln\left(\frac{p}{1 - p}\right)\right]^n dp \] esta integral evalúe a la expresión anterior involucrando los números de Bernoulli.

    En particular, tenemos la media y varianza.

    La media y varianza\( Z \) de

    1. \(\E(Z) = 0\)
    2. \(\var(Z) = \frac{\pi^2}{3}\)
    Prueba
    1. Nuevamente,\( \E(Z) = 0 \) por simetría.
    2. El segundo número de Bernoulli es\( \beta_2 = \frac{1}{6} \). De ahí\( \var(Z) = \E\left(Z^2\right) = (2^2 - 2) \pi^2 \frac{1}{6} = \frac{\pi^2}{ 3 } \).

    En el simulador de distribución especial, seleccione la distribución logística. Mantenga los valores de los parámetros predeterminados y anote la forma y ubicación de la barra de desviación\( \pm \) estándar media. Ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

    La asimetría y curtosis de\( Z \) son

    1. \( \skw(Z) = 0 \)
    2. \( \kur(Z) = \frac{21}{5} \)
    Prueba
    1. Nuevamente,\( \skw(Z) = 0 \) por la simetría de la distribución.
    2. Recordemos que por simetría,\( \E(Z) = \E\left(X^3\right) = 0 \). También,\( \left|\beta_4\right| = \frac{1}{30} \), entonces\( \E\left(Z^4\right) = (2^4 - 2) \pi^4 \frac{1}{30} = \frac{7 \pi^4}{15} \). De ahí que a partir de la fórmula computacional habitual para la curtosis,\[ \kur(Z) = \frac{\E\left(Z^4\right)}{[\var(Z)]^2} = \frac{7 \pi^4 / 15}{\pi^4 / 9} = \frac{21}{5} \]

    De ello se deduce que el exceso de curtosis de\( Z \) es\( \kur(Z) - 3 = \frac{6}{5} \).

    Distribuciones Relacionadas

    La distribución logística estándar tiene las conexiones habituales con la distribución uniforme estándar por medio de la función de distribución y la función cuantil dadas anteriormente. Recordemos que la distribución uniforme estándar es la distribución uniforme continua en el intervalo\( (0, 1) \).

    Conexiones con la distribución uniforme estándar.

    1. Si\( Z \) tiene la distribución logística estándar entonces\[ U = G(Z) = \frac{e^Z}{1 + e^Z} \] tiene la distribución uniforme estándar.
    2. Si\( U \) tiene la distribución uniforme estándar entonces\[ Z = G^{-1}(U) = \ln\left(\frac{U}{1 - U}\right) = \ln(U) - \ln(1 - U) \] tiene la distribución logística estándar.

    Dado que la función quantile tiene una forma cerrada simple, podemos usar el método de cuantil aleatorio habitual para simular la distribución logística estándar.

    Abra el experimento de cuantiles aleatorios y seleccione la distribución logística. Mantenga los valores de los parámetros predeterminados y anote la forma de las funciones de densidad de probabilidad y distribución. Ejecute la simulación 1000 veces y compare la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

    La distribución logística estándar también tiene varias conexiones simples con la distribución exponencial estándar (la distribución exponencial con el parámetro de tasa 1).

    Conexiones con la distribución exponencial estándar:

    1. Si\( Z \) tiene la distribución logística estándar, entonces\( Y = \ln\left(e^X + 1\right) \) tiene la distribución exponencial estándar.
    2. Si\( Y \) tiene la distribución exponencial estándar entonces\( Z = \ln\left(e^Y - 1\right) \) tiene la distribución logística estándar.
    Prueba

    Estos resultados se derivan de la fórmula estándar de cambio de variables. Las transformaciones, inversas unas de otras por supuesto, son\( y = \ln\left(e^z + 1\right) \) y\( z = \ln\left(e^y - 1\right) \) para\( z \in \R \) y\( y \in (0, \infty) \). Dejar\( g \) y\( h \) denotar los PDF de\( Z \) y\( Y \) respectivamente.

    1. Por definición,\( g(z) = e^z \big/ (1 + e^z)^2 \) para\( z \in \R \) lo\[ h(y) = g(z) \frac{dz}{dy} = \frac{\exp\left[\ln\left(e^y - 1\right)\right]}{\left(1 + \exp\left[\ln\left(e^y - 1\right)\right]\right)^2} \frac{e^y}{e^y - 1} = e^{-y}, \quad y \in (0, \infty) \] cual es el PDF de la distribución exponencial estándar.
    2. Por definición,\( g(y) = e^{-y} \) para\( y \in (0, \infty) \) lo\[ g(z) = h(y) \frac{dy}{dz} = \exp\left[-\ln\left(e^z + 1\right)\right] \frac{e^z}{e^z + 1} = \frac{e^z}{\left(e^z + 1\right)^2}, \quad z \in \R \] cual es el PDF de la distribución logística estándar.

    Supongamos que\( X \) y\( Y \) son variables aleatorias independientes, cada una con la distribución exponencial estándar. Después\( Z = \ln(X / Y) \) tiene la distribución logística estándar.

    Prueba

    Para\( z \in \R \),\[ \P(Z \le z) = \P[\ln(X / Y) \le z] = \P\left(X / Y \le e^z\right) = \P\left(Y \ge e^{-z} X\right) \] Recordemos eso\( \P(Y \ge y) = e^{-y} \) para\( y \in (0, \infty) \) y\( X \) tiene PDF\( x \mapsto e^{-x} \) on\( (0, \infty) \). Condicionamos\( X \):\[ \P(Z \le z) = \E\left[\P\left(Y \ge e^{-z} X \mid X\right)\right] = \int_0^\infty e^{-e^{-z} x} e^{-x} dx = \int_0^\infty e^{(e^{-z} + 1)x} dx = \frac{1}{e^{-z} + 1} = \frac{e^z}{1 + e^z} \] En función de\( z \), esta es la función de distribución de la distribución logística estándar.

    También hay conexiones simples entre la distribución logística estándar y la distribución de Pareto.

    Conexiones con la distribución de Pareto:

    1. Si\( Z \) tiene la distribución logística estándar, entonces\( Y = e^Z + 1 \) tiene la distribución de Pareto con el parámetro de forma 1.
    2. Si\(Y\) tiene la distribución de Pareto con el parámetro de forma 1, entonces\(Z = \ln(Y - 1)\) tiene la distribución logística estándar.
    Prueba

    Estos resultados se derivan del teorema básico del cambio de variables. La transformación, inversas unas de otras por supuesto, son\( y = e^z + 1 \),\( z = \ln(y - 1) \) para\( z \in \R \) y\( y \in (1, \infty) \). Dejar\( g \) y\( h \) denotar PDF de\( Z \) y\( Y \) respectivamente.

    1. Por definición,\( g(z) = e^z \big/ \left(1 + e^z\right)^2 \) para\( z \in \R \). De ahí\[ h(y) = g(z) \frac{dz}{dy} = \frac{\exp[\ln(y - 1)]}{\left(1 + \exp[\ln(y - 1)]\right)^2} \frac{1}{y - 1} = \frac{1}{y^2}, \quad y \in (1, \infty) \] que es el PDF de la distribución de Pareto con el parámetro de forma 1.
    2. Por definición,\( h(y) = 1 / y^2 \) para\( y \in (1, \infty) \). De ahí\[ g(z) = h(y) \frac{dy}{dz} = \frac{1}{(e^z + 1)^2} e^z, \quad z \in \R\] que sea el PDF de la distribución logística estándar.

    Por último, hay conexiones simples a la distribución de valores extremos.

    Si\( X \) y\( Y \) son independientes y cada uno tiene la distribución estándar de Gumbel, ellos\( Z = Y - X \) tienen la distribución logística estándar.

    Prueba

    La función de distribución de\( Y \) es\( G(y) = \exp\left(-e^{-y}\right) \) para\( y \in \R \) y la función de densidad de\( X \) es\( g(x) = e^{-x} \exp\left(-e^{-x}\right) \) para\( x \in \R \). Para\( z \in \R \), condicionamiento en\( X \) da\[ \P(Z \le z) = \P(Y \le X + z) = \E[\P(Y \le X + z \mid X)] = \int_{-\infty}^\infty \exp\left(-e^{-(x + z)}\right) e^{-x} \exp\left(-e^{-x}\right) dx\] Sustitución\( u = -e^{-(x + z)} \) da\[ \P(Z \le z) = \int_{-\infty}^0 e^u \exp(e^z u) e^z du = e^z \int_{-\infty}^0 \exp\left[u(1 + e^z)\right] du = \frac{e^z}{1 + e^z}, \quad z \in \R \] En función de\( z \), esta es la función de distribución logística estándar.

    La distribución logística general

    La distribución logística general es la familia de escala de ubicación asociada a la distribución logística estándar.

    Supongamos que\(Z\) tiene la distribución logística estándar. Para\(a \in \R\) y\( b \in (0, \infty) \), variable aleatoria\( X = a + b Z \) tiene la distribución logística con parámetro de ubicación\(a\) y parámetro de escala\(b\).

    Funciones de distribución

    Las analogías de los resultados anteriores para la distribución logística general se derivan fácilmente de las propiedades básicas de la transformación a escala de ubicación. Supongamos que\( X \) tiene la distribución logística con parámetro de ubicación\( a \in \R \) y parámetro de escala\( b \in (0, \infty) \).

    La función de densidad de probabilidad\( f \) de\( X \) viene dada por\[ f(x) = \frac{\exp \left(\frac{x - a}{b} \right)}{b \left[1 + \exp \left(\frac{x - a}{b} \right) \right]^2}, \quad x \in \R \]

    1. \( f \)es simétrico sobre\( x = a \).
    2. \( f \)aumenta y luego disminuye, con modo\( x = a \).
    3. \( f \)es cóncava hacia arriba, luego hacia abajo, luego hacia arriba nuevamente, con puntos de inflexión en\( x = a \pm \ln\left(2 + \sqrt{3}\right) b \).
    Prueba

    Recordemos que\[ f(x) = \frac{1}{b} g\left(\frac{x - a}{b}\right), \quad x \in \R \] dónde\( g \) está el PDF logístico estándar.

    En el simulador de distribución especial, seleccione la distribución logística. Varíe los parámetros y anote la forma y ubicación de la función de densidad de probabilidad. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

    La función\( F \) de distribución de\( X \) viene dada por\[ F(x) = \frac{\exp \left( \frac{x - a}{b} \right)}{1 + \exp \left( \frac{x - a}{b} \right)}, \quad x \in \R \]

    Prueba

    Recordemos que\[ F(x) = G\left(\frac{x - a}{b}\right), \quad x \in \R \] donde\( G \) está el CDF logístico estándar.

    La función cuantil\( F^{-1} \) de\( X \) viene dada por\[ F^{-1}(p) = a + b \ln \left( \frac{p}{1 - p} \right), \quad p \in (0, 1) \]

    1. El primer cuartil es\( a - b \ln 3\).
    2. La mediana es\( a \).
    3. El tercer cuartil es\( a + b \ln 3 \)
    Prueba

    Recordemos que\( F^{-1}(p) = a + b G^{-1}(p) \) para\( p \in (0, 1) \), donde\( G^{-1} \) está la función cuantil logística estándar.

    En la calculadora de distribución especial, seleccione la distribución logística. Variar los parámetros y anotar la forma y ubicación de la función de densidad de probabilidad y la función de distribución. Para valores seleccionados de los parámetros, encuentre los cuantiles de orden 0.1 y 0.9.

    Momentos

    Supongamos nuevamente que\( X \) tiene la distribución logística con parámetro de ubicación\( a \in \R \) y parámetro de escala\( b \in (0, \infty) \). Recordemos que\( B \) denota la función beta y\( \Gamma \) la función gamma.

    La función de generación de momento\( M \) de\( X \) viene dada por\[ M(t) = e^{a t} B(1 + b t, 1 - b t) = e^{a t} \Gamma(1 + b t) \, \Gamma(1 - b t), \quad t \in (-1, 1) \]

    Prueba

    Recordemos que\( M(t) = e^{a t} m(b t) \) donde\( m \) está el MGF logístico estándar.

    La media y varianza\( X \) de

    1. \(\E(X) = a\)
    2. \(\var(X) = b^2 \frac{\pi^2}{3}\)
    Prueba

    Por definición podemos suponer\( X = a + b Z \) donde\( Z \) tiene la distribución logística estándar. Usando la media y varianza de\( Z \) tenemos

    1. \( \E(X) = a + b \E(Z) = a \)
    2. \( \var(X) = b^2 \var(Z) = b^2 \frac{\pi^2}{3} \)

    En el simulador de distribución especial, seleccione la distribución logística. Varíe los parámetros y anote la forma y ubicación de la barra de desviación\( \pm \) estándar media. Para valores seleccionados de los parámetros, ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

    La asimetría y curtosis de\( X \) son

    1. \( \skw(X) = 0 \)
    2. \( \kur(X) = \frac{21}{5} \)
    Prueba

    Recordemos que la asimetría y la curtosis se definen en términos de la puntuación estándar, y por lo tanto son invariantes bajo transformaciones de escala de ubicación. Entonces la asimetría y curtosis de\( Z \) son las mismas que la asimetría y curtosis de\( Z \).

    Una vez más, se deduce que el exceso de curtosis de\( X \) es\( \kur(X) - 3 = \frac{6}{5} \). Los momentos centrales de se\( X \) pueden dar en términos de los números de Bernoulli. Como antes, vamos a\( \beta_n \) denotar el número de orden de Bernoulli\( n \in \N \).

    Vamos\( n \in \N \).

    1. Si\( n \) es impar entonces\( \E\left[(X - a)^n\right] = 0 \).
    2. Si\( n \) es incluso entonces\( \E\left[(X - a)^n\right] = (2^n - 2) \pi^n b^n \left|\beta_n\right| \)
    Prueba

    Nuevamente por definición podemos tomar\( X = a + b Z \) donde\( Z \) tiene la distribución logística estándar. Entonces\( \E\left[(X - a)^n\right] = b^n \E(Z^n) \) así los resultados siguen de los momentos de\( Z \).

    Distribuciones Relacionadas

    La distribución logística general es una familia a escala de ubicación, por lo que se cierra trivialmente bajo transformaciones a escala de ubicación.

    Supongamos que\( X \) tiene la distribución logística con parámetro de ubicación\( a \in \R \) y parámetro de escala\( b \in (0, \infty) \), y eso\( c \in \R \) y\( d \in (0, \infty) \). Luego\( Y = c + d X \) tiene la distribución logística con parámetro de ubicación\( c + a d \) y parámetro de escala\( b d \).

    Prueba

    Nuevamente por definición podemos tomar\( X = a + b Z \) donde\( Z \) tiene la distribución logística estándar. Entonces\( Y = c + d X = (c + a d) + (b d) Z \).


    This page titled 5.29: La distribución logística is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.