5: Distribuciones especiales
- Page ID
- 151529
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En este capítulo, estudiamos varias familias generales de distribuciones de probabilidad y varias familias paramétricas especiales de distribuciones. A diferencia de los demás capítulos expositivos de este texto, las secciones no están ordenadas linealmente y por lo que este capítulo sirve principalmente de referencia. Es posible que desee estudiar estos temas a medida que surja la necesidad.
Primero, debemos discutir qué hace que una distribución de probabilidad sea especial en primer lugar. En algunos casos, una distribución puede ser importante porque está conectada con otras distribuciones especiales de manera interesante (vía transformaciones, límites, condicionamiento, etc.). En algunos casos, una familia paramétrica puede ser importante porque puede ser utilizada para modelar una amplia variedad de fenómenos aleatorios. Este puede ser el caso debido a principios fundamentales subyacentes, o simplemente porque la familia tiene una rica colección de funciones de densidad de probabilidad con un pequeño número de parámetros (generalmente 3 o menos). Como principio filosófico general, tratamos de modelar un proceso aleatorio con el menor número de parámetros posible; esto a veces se conoce como el principio de parsimonia de parámetros. A su vez, se trata de un caso especial de la navaja de Ockham, nombrada en honor a Guillermo de Ockham, principio que establece que se debe utilizar el modelo más simple que describa adecuadamente un fenómeno dado. La parsimonia es importante porque a menudo los parámetros no se conocen y deben ser estimados.
En muchos casos, una familia paramétrica especial de distribuciones tendrá uno o más miembros estándar distinguidos, correspondientes a valores especificados de algunos de los parámetros. Por lo general, las distribuciones estándar serán matemáticamente más simples y, a menudo, otros miembros de la familia se pueden construir a partir de las distribuciones estándar mediante transformaciones simples en la variable aleatoria estándar subyacente.
A lo largo de los años se ha estudiado una increíble variedad de distribuciones especiales, y constantemente se agregan nuevas a la literatura. Para merecer verdaderamente el adjetivo especial, una distribución debe tener cierto nivel de elegancia matemática y economía, y debe surgir en aplicaciones interesantes y diversas.
- 5.1: Familias a escala de ubicación
- Como es habitual, nuestro punto de partida es un experimento aleatorio modelado por un espacio de probabilidad (Ω, F, P), de manera que Ω es el conjunto de resultados, F la colección de eventos y P la medida de probabilidad en el espacio muestral (Ω, F). En esta sección, suponemos que fijamos la variable aleatoria Z definida en el espacio de probabilidad, tomando valores en R.
- 5.2: Familias Exponenciales Generales
- Muchas de las distribuciones especiales estudiadas en este capítulo son familias exponenciales generales, al menos con respecto a algunos de sus parámetros. Por otro lado, lo más común es que una familia paramétrica no sea una familia exponencial general porque el conjunto de soporte depende del parámetro. Los siguientes teoremas dan una serie de ejemplos. Las pruebas se entregarán en las secciones individuales.
- 5.3: Distribuciones estables
- Las distribuciones estables son una clase general importante de distribuciones de probabilidad en R que se definen en términos de transformaciones a escala de ubicación. Las distribuciones estables ocurren como límites (en distribución) de sumas escaladas y centradas de variables independientes distribuidas idénticamente. Tales límites generalizan el teorema del límite central, y así las distribuciones estables generalizan la distribución normal en cierto sentido. El trabajo pionero en distribuciones estables fue realizado por Paul Lévy.
- 5.4: Distribuciones infinitamente divisibles
- Varias distribuciones especiales son infinitamente divisibles. Las pruebas de los resultados que se indican a continuación se dan en las secciones individuales.
- 5.5: Distribuciones de la serie de energía
- Las distribuciones de la serie de potencia son distribuciones discretas en (un subconjunto de) N construidas a partir de la serie de potencia. Esta clase de distribuciones es importante porque la mayoría de las distribuciones especiales y discretas son distribuciones de serie de potencia.
- 5.6: La distribución normal
- La distribución normal tiene un papel honrado en la probabilidad y la estadística, principalmente por el teorema del límite central, uno de los teoremas fundamentales que forma un puente entre los dos sujetos. Además, como veremos, la distribución normal tiene muchas propiedades matemáticas agradables. A la distribución normal también se le llama distribución gaussiana, en honor a Carl Friedrich Gauss, quien estuvo entre los primeros en utilizar la distribución.
- 5.7: La distribución normal multivariada
- La distribución normal multivariada se encuentra entre las distribuciones multivariadas más importantes, particularmente en la inferencia estadística y el estudio de procesos gaussianos como el movimiento browniano. La distribución surge naturalmente de transformaciones lineales de variables normales independientes. En esta sección, consideramos primero la distribución normal bivariada, porque se pueden dar resultados explícitos y porque las interpretaciones gráficas son posibles.
- 5.8: La distribución Gamma
- En esta sección estudiaremos una familia de distribuciones que tiene especial importancia en probabilidad y estadística. En particular, los tiempos de llegada al proceso de Poisson tienen distribuciones gamma, y la distribución chi-cuadrada en estadística es un caso especial de la distribución gamma. Además, la distribución gamma es ampliamente utilizada para modelar cantidades físicas que toman valores positivos.
- 5.9: Chi-Cuadrado y Distribución Relacionada
- En esta sección estudiaremos una distribución, y algunos familiares, que tienen especial importancia en la estadística. En particular, la distribución chi-cuadrada surgirá en el estudio de la varianza muestral cuando la distribución subyacente sea normal y en pruebas de bondad de ajuste.
- 5.10: La distribución del t estudiantil
- En esta sección estudiaremos una distribución que tiene especial importancia en la estadística. En particular, esta distribución surgirá en el estudio de una versión estandarizada de la media muestral cuando la distribución subyacente sea normal.
- 5.11: La distribución F
- En esta sección estudiaremos una distribución que tiene especial importancia en la estadística. En particular, esta distribución surge de proporciones de sumas de cuadrados cuando se muestrea a partir de una distribución normal, por lo que es importante en la estimación y en el modelo normal de dos muestras y en las pruebas de hipótesis en el modelo normal de dos muestras.
- 5.12: La distribución lognormal
- La distribución lognormal es una distribución continua en (0, ∞) y se utiliza para modelar cantidades aleatorias cuando se cree que la distribución está sesgada, como ciertas variables de ingresos y de vida útil.
- 5.13: La distribución normal plegada
- La distribución normal plegada es la distribución del valor absoluto de una variable aleatoria con una distribución normal. Como se ha enfatizado antes, la distribución normal es quizás la más importante en probabilidad y se utiliza para modelar una increíble variedad de fenómenos aleatorios.
- 5.14: La distribución de Rayleigh
- La distribución de Rayleigh, llamada así por William Strutt, Lord Rayleigh, es la distribución de la magnitud de un vector aleatorio bidimensional cuyas coordenadas son independientes, distribuidas idénticamente, significan 0 variables normales. La distribución tiene una serie de aplicaciones en entornos donde las magnitudes de las variables normales son importantes.
- 5.15: La distribución Maxwell
- La distribución de Maxwell, llamada así por James Clerk Maxwell, es la distribución de la magnitud de un vector aleatorio tridimensional cuyas coordenadas son independientes, distribuidas idénticamente, significan 0 variables normales. La distribución tiene una serie de aplicaciones en entornos donde las magnitudes de las variables normales son importantes, particularmente en física. La distribución de Maxwell está estrechamente relacionada con la distribución de Rayleigh.
- 5.16: La distribución Lévy
- La distribución de Lévy, llamada así por el matemático francés Paul Lévy, es importante en el estudio del movimiento browniano, y es una de las tres distribuciones estables cuya función de densidad de probabilidad se puede expresar en una forma simple y cerrada.
- 5.17: La distribución beta
- En esta sección, estudiaremos la distribución beta, la distribución más importante que tiene soporte acotado. Pero antes de poder estudiar la distribución beta debemos estudiar la función beta.
- 5.18: La distribución Beta Prime
- La distribución beta prime es la distribución de la razón de probabilidades asociada a una variable aleatoria con la distribución beta. Dado que las variables con distribuciones beta se utilizan a menudo para modelar probabilidades y proporciones aleatorias, las odds ratios correspondientes también ocurren naturalmente.
- 5.19: La distribución del arcoseno
- La distribución del arcoseno es importante en el estudio del movimiento browniano y números primos, entre otras aplicaciones.
- 5.20: Distribuciones Uniformes Generales
- Esta sección explora distribuciones uniformes en un entorno abstracto. Si eres un nuevo estudiante de probabilidad, o no estás familiarizado con la teoría de medidas, es posible que quieras saltarte esta sección y leer las secciones sobre la distribución uniforme en un intervalo y las distribuciones uniformes discretas.
- 5.21: La distribución uniforme en un intervalo
- La distribución uniforme continua en un intervalo de R es una de las distribuciones de probabilidad más simples, pero sin embargo muy importante. En particular, las distribuciones uniformes continuas son las herramientas básicas para simular otras distribuciones de probabilidad. La distribución uniforme corresponde a escoger un punto al azar del intervalo.
- 5.22: Distribuciones Uniformes Discretas
- La distribución uniforme discreta es un caso especial de la distribución uniforme general con respecto a una medida, en este caso contando la medida. La distribución corresponde a escoger un elemento de S al azar. La mayoría de los modelos clásicos de probabilidad combinatoria se basan en distribuciones uniformes discretas subyacentes. El capítulo sobre Modelos de Muestreo Finito explora varios de estos modelos.
- 5.24: La distribución del triángulo
- Al igual que la distribución del semicírculo, la distribución del triángulo se basa en una forma geométrica simple. La distribución surge de forma natural cuando las variables aleatorias distribuidas uniformemente se transforman de diversas maneras.
- 5.25: La distribución Irwin-Hall
- La distribución Irwin-Hall, llamada así por Joseph Irwin y Phillip Hall, es la distribución que gobierna la suma de variables aleatorias independientes, cada una con la distribución uniforme estándar. También se le conoce como la distribución uniforme de la suma. Dado que el uniforme estándar es una de las distribuciones más simples y básicas (y corresponde en informática a un número aleatorio), el Irwin-Hall es una familia natural de distribuciones. También sirve como un buen ejemplo del teorema del límite central.
- 5.26: La distribución U-Power
- La distribución de energía en U es una familia de distribuciones en forma de U basada en una familia simple de funciones de potencia.
- 5.27: La distribución sinusoidal
- La distribución sinusoidal es una distribución de probabilidad simple basada en una porción de la curva sinusoidal. También es conocida como distribución sinusoidal de Gilbert, llamada así por el geólogo estadounidense Grove Karl (GK) Gilbert que utilizó la distribución en 1892 para estudiar cráteres en la luna.
- 5.28: La distribución de Laplace
- La distribución de Laplace, llamada así por Pierre Simon Laplace surge naturalmente como la distribución de la diferencia de dos variables exponenciales independientes, distribuidas idénticamente. Por esta razón, también se le llama la distribución doble exponencial.
- 5.29: La distribución logística
- La distribución logística se utiliza para diversos modelos de crecimiento, y se utiliza en cierto tipo de regresión, conocida apropiadamente como regresión logística.
- 5.30: La distribución extrema del valor
- Las distribuciones de valores extremos surgen como distribuciones limitantes para máximos o mínimos (valores extremos) de una muestra de variables aleatorias independientes, distribuidas idénticamente, a medida que aumenta el tamaño de la muestra. Por lo tanto, estas distribuciones son importantes en la estadística de probabilidad y matemática.
- 5.31: La distribución secante hiperbólica
- La distribución secante hiperbólica es una familia a escala de ubicación con una serie de interesantes paralelismos con la distribución normal. Como su nombre indica, la función secante hiperbólica juega un papel importante en la distribución, por lo que primero debemos revisar algunas definiciones.
- 5.32: La distribución de Cauchy
- La distribución de Cauchy, llamada por supuesto por el ubicuo Augustin Cauchy, es interesante por un par de razones. En primer lugar, se trata de una familia sencilla de distribuciones para las que no existe el valor esperado (y otros momentos). Segundo, la familia se cierra bajo la formación de sumas de variables independientes, y por lo tanto es una familia infinitamente divisible de distribuciones.
- 5.33: La distribución exponencial-logarítmica
- La distribución exponencial-logarítmica surge cuando el parámetro de tasa de la distribución exponencial es aleatorizado por la distribución logarítmica. La distribución exponencial-logarítmica tiene aplicaciones en la teoría de la confiabilidad en el contexto de dispositivos u organismos que mejoran con la edad, por endurecimiento o inmunidad.
- 5.34: La distribución Gompertz
- El distributon Gompertz, llamado así por Benjamin Gompertz, es una distribución de probabilidad continua en [0, ∞) que tiene una tasa de fallas exponencialmente creciente. Desafortunadamente, la tasa de mortalidad de humanos adultos aumenta exponencialmente, por lo que la distribución de Gompertz es ampliamente utilizada en la ciencia actuarial.
- 5.35: La distribución log-logística
- Como su nombre indica, la distribución log-logística es la distribución de una variable cuyo logaritmo tiene la distribución logística. La distribución log-logística se utiliza a menudo para modelar tiempos de vida aleatorios y, por lo tanto, tiene aplicaciones en confiabilidad.
- 5.36: La distribución de Pareto
- La distribución de Pareto es una distribución sesgada, de cola pesada que a veces se utiliza para modelar la distribución de los ingresos y otras variables financieras.
- 5.37: La distribución de Wald
- La distribución de Wald, llamada así por Abraham Wald, es importante en el estudio del movimiento browniano. Específicamente, la distribución gobierna la primera vez que un movimiento browniano con deriva positiva alcanza un valor fijo y positivo. En el movimiento browniano, la distribución de la posición aleatoria en un tiempo fijo tiene una distribución normal (gaussiana), y así la distribución de Wald, que gobierna el tiempo aleatorio en una posición fija, a veces se denomina distribución gaussiana inversa.
- 5.38: La distribución de Weibull
- La distribución de Weibull lleva el nombre de Waloddi Weibull. Weibull no fue la primera persona en utilizar la distribución, sino que fue la primera en estudiarla extensamente y reconocer su amplio uso en aplicaciones. La distribución estándar de Weibull es la misma que la distribución exponencial estándar. Pero como veremos, cada variable aleatoria de Weibull se puede obtener a partir de una variable estándar de Weibull mediante una simple transformación determinista, por lo que la terminología está justificada.
- 5.39: Ley de Benford
- La ley de Benford se refiere a distribuciones de probabilidad que parecen gobernar los dígitos significativos en conjuntos de datos reales. La ley lleva el nombre del físico e ingeniero estadounidense Frank Benford, aunque la ley en realidad fue descubierta anteriormente por el astrónomo y matemático Simon Newcomb.
- 5.40: La distribución Zeta
- La distribución zeta se utiliza para modelar el tamaño o rangos de ciertos tipos de objetos elegidos aleatoriamente de ciertos tipos de poblaciones. Los ejemplos típicos incluyen la frecuencia de ocurrencia de una palabra elegida aleatoriamente de un texto, o el rango poblacional de una ciudad elegida aleatoriamente de un país. La distribución zeta también es conocida como la distribución Zipf, en honor al lingüista estadounidense George Zipf.
- 5.41: La distribución logarítmica en serie
- La distribución de series logarítmicas, como su nombre indica, se basa en la expansión de la serie de potencia estándar de la función logaritmo natural. También a veces se le conoce más simplemente como la distribución logarítmica.