5.2: Familias Exponenciales Generales
- Page ID
- 151559
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Teoría Básica
Definición
Comenzamos con un espacio de probabilidad\( (\Omega, \mathscr F, \P) \) como modelo para un experimento aleatorio. Entonces, como es habitual,\( \Omega \) es el conjunto de resultados,\( \mathscr F \) el\( \sigma \) álgebra de eventos, y\( \P \) la medida de probabilidad en el espacio muestral\( (\Omega, \mathscr F) \). Para la formulación general que queremos en esta sección, necesitamos dos espacios adicionales, un espacio de medida\( (S, \mathscr S, \mu) \) (donde vivirán las distribuciones de probabilidad) y un espacio medible\( (T, \mathscr T) \) (que sirva al papel de un espacio de parámetros). Por lo general, estos espacios caen dentro de nuestras dos categorías estándar. En concreto, el espacio de medida suele ser uno de los siguientes:
- Discreta. \( S \)es contable,\( \mathscr S \) es la colección de todos los subconjuntos de\( S \), y\( \mu = \# \) es medida de conteo.
- Euclidiana. \( S \)es un subconjunto suficientemente agradable de Borel medible de\( \R^n \) para algunos\( n \in \N_+ \),\( \mathscr S \) es el\( \sigma \) -álgebra de los subconjuntos medibles de Borel de\( S \), y\( \mu = \lambda_n \) es\( n \) -dimensional medida Lebesgue.
Del mismo modo, el espacio de parámetros\( (T, \mathscr T) \) suele ser discreto, por lo que\( T \) es contable y\( \mathscr T \) la colección de todos los subconjuntos de\( T \), o Euclides por lo que\( T \) es un subconjunto suficientemente agradable mensurable de Borel de\( \R^m \) para algunos\( m \in \N_+ \) y\( \mathscr T \) es el \( \sigma \)-álgebra de Borel subconjuntos medibles de\( T \).
Supongamos ahora que\(X\) es variable aleatoria definida en el espacio de probabilidad, tomando valores en\(S\), y que la distribución de\(X\) depende de un parámetro\(\theta \in T\). Porque\( \theta \in T \) suponemos que la distribución de\( X \) tiene función de densidad de probabilidad\(f_\theta\) con respecto a\( \mu \).
para\( k \in \N_+ \), la familia de distribuciones de\(X\) es una familia exponencial\(k\) -parámetro si\[ f_\theta(x) = \alpha(\theta) \, g(x) \, \exp \left( \sum_{i=1}^k \beta_i(\theta) \, h_i(x) \right); \quad x \in S, \, \theta \in T\] donde\(\alpha\) y\(\left(\beta_1, \beta_2, \ldots, \beta_k\right)\) son funciones medibles desde\( T \) dentro\( \R \), y donde\(g\) y\(\left(h_1, h_2, \ldots, h_k\right)\) son funciones medibles desde\( S \) en\( \R \). Además,\(k\) se supone que es el número entero más pequeño de este tipo.
- \(\left(\beta_1(\theta), \beta_2(\theta), \ldots, \beta_k(\theta)\right)\)Los parámetros se denominan los parámetros naturales de la distribución.
- las variables aleatorias se\(\left(h_1(X), h_2(X), \ldots, h_k(X)\right)\) denominan estadísticas naturales de la distribución.
Aunque la definición puede parecer intimidante, las familias exponenciales son útiles porque muchos resultados teóricos importantes en la estadística se mantienen para familias exponenciales, y porque muchas familias paramétricas especiales de distribuciones resultan ser familias exponenciales. Es importante destacar que la representación de\( f_\theta(x) \) dado en la definición debe sostenerse para todos\( x \in S \) y\( \theta \in T \). Si la representación sólo se sostiene para un conjunto de\( x \in S \) eso depende de lo particular\( \theta \in T \), entonces la familia de distribuciones no es una familia exponencial general.
El siguiente resultado muestra que si tomamos muestras de la distribución de una familia exponencial, entonces la distribución de la muestra aleatoria es en sí misma una familia exponencial con los mismos parámetros naturales.
Supongamos que la distribución de la variable aleatoria\(X\) es una familia exponencial\(k\) -parámetro con parámetros naturales\((\beta_1(\theta), \beta_2(\theta), \ldots, \beta_k(\theta))\), y estadísticas naturales\((h_1(X), h_2(X), \ldots, h_k(X))\). Dejar\(\bs X = (X_1, X_2, \ldots, X_n)\) ser una secuencia de variables aleatorias\(n\) independientes, cada una con la misma distribución que\(X\). Luego\(\bs X\) es una familia exponencial\(k\) -parámetro con parámetros naturales\((\beta_1(\theta), \beta_2(\theta), \ldots, \beta_k(\theta))\), y estadísticas naturales\[ u_j(\boldsymbol{X}) = \sum_{i=1}^n h_j(X_i), \quad j \in \{1, 2, \ldots, k\} \]
Prueba
Dejar\( f_\theta \) denotar el PDF de\( X \) correspondiente al valor del parámetro\( \theta \in T \), de manera que\( f_\theta(x) \) tenga la representación dada en la definición para\( x \in S \) y\( \theta \in T \). Entonces para\( \theta \in T \),\( \bs X = (X_1, X_2, \ldots, X_n) \) tiene PDF\( g_\theta \) dado por\[ g_\theta(x_1, x_2, \ldots, x_n) = f_\theta(x_1) f_\theta(x_2) \cdots f_\theta(x_n), \quad (x_1, x_2, \ldots, x_n) \in S^n \] Sustituyendo y simplificando da el resultado.
Ejemplos y Casos Especiales
Distribuciones especiales
Muchas de las distribuciones especiales estudiadas en este capítulo son familias exponenciales generales, al menos con respecto a algunos de sus parámetros. Por otro lado, lo más común es que una familia paramétrica no sea una familia exponencial general porque el conjunto de soporte depende del parámetro. Los siguientes teoremas dan una serie de ejemplos. Las pruebas se entregarán en las secciones individuales.
La distribución de Bernoulli es una familia exponencial de un parámetro en el parámetro éxito\( p \in [0, 1] \)
La distribución beta es una familia exponencial de dos parámetros en los parámetros de forma\( a \in (0, \infty) \),\( b \in (0, \infty) \).
La distribución beta prima es una familia exponencial de dos parámetros en los parámetros de forma\( a \in (0, \infty) \),\( b \in (0, \infty) \).
La distribución binomial es una familia exponencial de un parámetro en el parámetro de éxito\( p \in [0, 1] \) para un valor fijo del parámetro de ensayo\( n \in \N_+ \).
La distribución chi-cuadrada es una familia exponencial de un parámetro en los grados de libertad\( n \in (0, \infty) \).
La distribución exponencial es una familia exponencial de un parámetro (suficientemente apropiada), en el parámetro rate\( r \in (0, \infty) \).
La distribución gamma es una familia exponencial de dos parámetros en el parámetro shape\( k \in (0, \infty) \) y el parámetro scale\( b \in (0, \infty) \).
La distribución geométrica es una familia exponencial de un parámetro en la probabilidad de éxito\( p \in (0, 1) \).
La distribución media normal es una familia exponencial de un parámetro en el parámetro de escala\( \sigma \in (0, \infty) \)
La distribución de Laplace es una familia exponencial de un parámetro en el parámetro scale\( b \in (0, \infty) \) para un valor fijo del parámetro location\( a \in \R \).
La distribución de Lévy es una familia exponencial de un parámetro en el parámetro scale\( b \in (0, \infty) \) para un valor fijo del parámetro location\( a \in \R \).
La distribución logarítmica es una familia exponencial de un parámetro en el parámetro shape\( p \in (0, 1) \)
La distribución lognormal es una familia exponencial de dos parámetros en los parámetros de forma\( \mu \in \R \),\( \sigma \in (0, \infty) \).
La distribución Maxwell es una familia exponencial de un parámetro en el parámetro de escala\( b \in (0, \infty) \).
La distribución multinomial\( k \) -dimensional es una familia exponencial\( k \) -parámetro en los parámetros de probabilidad\( (p_1, p_2, \ldots, p_k) \) para un valor fijo del parámetro de ensayo\( n \in \N_+ \).
La distribución normal multivariada\( k \) -dimensional es una familia exponencial\( \frac{1}{2}(k^2 + 3 k) \) -parámetro con respecto al vector medio\( \bs{\mu} \) y la matriz varianza-covarianza\( \bs{V} \).
La distribución binomial negativa es una familia exponencial de un parámetro en el parámetro éxito\( p \in (0, 1) \) para un valor fijo del parámetro de detención\( k \in \N_+ \).
La distribución normal es una familia exponencial de dos parámetros en la media\( \mu \in \R \) y la desviación estándar\( \sigma \in (0, \infty) \).
La distribución de Pareto es una familia exponencial de un parámetro en el parámetro shape para un valor fijo del parámetro scale.
La distribución de Poisson es una familia exponencial de un parámetro.
La distribución de Rayleigh es una familia exponencial de un parámetro.
La distribución de potencia U es una familia exponencial de un parámetro en el parámetro shape, para valores fijos de los parámetros de ubicación y escala.
La distribución de Weibull es una familia exponencial de un parámetro en el parámetro scale para un valor fijo del parámetro shape.
La distribución zeta es una familia exponencial de un parámetro.
La distribución de Wald es una familia exponencial de dos parámetros.