5.20: Distribuciones Uniformes Generales
- Page ID
- 151627
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Esta sección explora distribuciones uniformes en un entorno abstracto. Si eres un nuevo estudiante de probabilidad, o no estás familiarizado con la teoría de medidas, es posible que quieras saltarte esta sección y leer las secciones sobre la distribución uniforme en un intervalo y las distribuciones uniformes discretas.
Teoría Básica
Definición
Supongamos que\( (S, \mathscr S, \lambda) \) es un espacio de medida. Es decir,\( S \) es un conjunto,\( \mathscr S \) un\( \sigma \) -álgebra de subconjuntos de\( S \), y\( \lambda \) una medida positiva sobre\( \mathscr S \). Supongamos también eso\( 0 \lt \lambda(S) \lt \infty \), así que esa\( \lambda \) es una medida finita, positiva.
Variable aleatoria\( X \) con valores en\( S \) tiene la distribución uniforme on\( S \) (con respecto a\( \lambda \)) si\[ \P(X \in A) = \frac{\lambda(A)}{\lambda(S)}, \quad A \in \mathscr S \]
Así, la probabilidad asignada a un conjunto\( A \in \mathscr S\) depende únicamente del tamaño de\( A \) (medido por\( \lambda \)).
Los casos especiales más comunes son los siguientes:
- Discreto: El conjunto\( S \) es finito y no vacío,\( \mathscr S \) es el\( \sigma \) álgebra de todos los subconjuntos de\( S \), y\( \lambda = \# \) (medida de conteo).
- Euclidiana: Para\(n \in \N_+\), vamos\(\mathscr R_n\) denotar el\(\sigma\) -álgebra de los subconjuntos medibles de Borel\(\R^n\) y dejar\(\lambda_n\) denotar medida Lebesgue on\((\R^n, \mathscr R_n)\). En esta configuración,\(S \in \mathscr R_n\) con\(0 \lt \lambda_n(S) \lt \infty\),\(\mathscr S = \{A \in \mathscr R_n: A \subseteq S\}\), y la medida está\(\lambda_n\) restringida a\((S, \mathscr S)\).
En el caso euclidiano, recuerde que\( \lambda_1 \) es medida de longitud en\( \R \),\( \lambda_2 \) es medida de área\( \R^2 \) encendida,\( \lambda_3 \) es medida de volumen en\( \R^3 \), y en general\( \lambda_n \) a veces se denomina volumen\( n \) -dimensional. Así,\( S \in \mathscr R_n \) es un conjunto con volumen positivo, finito.
Propiedades
Supongamos que\((S, \mathscr S, \lambda)\) es un espacio de medida finito, positivo, como arriba, y que\( X \) se distribuye uniformemente sobre\( S \).
La función\( f \) de densidad de probabilidad de\( X \) (con respecto a\( \lambda \)) es\[ f(x) = \frac{1}{\lambda(S)}, \quad x \in S \]
Prueba
Esto se deduce directamente de la definición de la función de densidad de probabilidad:\[\int_A \frac 1 {\lambda(S)} \, d\lambda(x) = \frac{\lambda(A)}{\lambda(S)}, \quad A \in \mathscr S\]
Así, la propiedad definitoria de la distribución uniforme en un conjunto es la densidad constante en ese conjunto. Otra propiedad básica es que las distribuciones uniformes se conservan bajo condicionamiento.
Supongamos que\( R \in \mathscr S \) con\( \lambda(R) \gt 0 \). La distribución condicional de\( X \) dado\( X \in R \) es uniforme en\( R \).
Prueba
Para\(A \in \mathscr S\) con\( A \subseteq R \),\[ \P(X \in A \mid X \in R) = \frac{\P(X \in A)}{\P(X \in R)} = \frac{\lambda(A)/\lambda(S)}{\lambda(R)/\lambda(S)} = \frac{\lambda(A)}{\lambda(R)} \]
En la configuración del resultado anterior, supongamos que\( \bs{X} = (X_1, X_2, \ldots) \) es una secuencia de variables independientes, cada una distribuida uniformemente en\( S \). Vamos\( N = \min\{n \in \N_+: X_n \in R\} \). Después\( N \) tiene la distribución geométrica encendida\( \N_+ \) con parámetro de éxito\( p = \P(X \in R) \). Más importante aún, la distribución de\( X_N \) es la misma que la distribución condicional de\( X \) dado\( X \in R \), y por lo tanto es uniforme en\( R \). Esta es la base del método de rechazo de simulación. Si podemos simular una distribución uniforme en\( S \), entonces podemos simular una distribución uniforme en\( R \).
Si\( h \) es una función de valor real on\( S \), entonces\( \E[h(X)] \) es el valor promedio de\( h \) on\( S \), medido por\( \lambda \):
Si\( h: S \to \R \) es integrable con respecto a\( \lambda \) Entonces\[ \E[h(X)] = \frac{1}{\lambda(S)} \int_S h(x) \, d\lambda(x) \]
Prueba
Este resultado se desprende del cambio de teorema de variables por valor esperado, ya que\[ \E[h(X)] = \int_S h(x) f(x) \, d\lambda(x) = \frac 1 {\lambda(S)} \int_S h(x) \, d\lambda(x)\]
La entropía de la distribución uniforme\( S \) depende únicamente del tamaño de\( S \), medido por\( \lambda \):
La entropía de\( X \) es\( H(X) = \ln[\lambda(S)] \).
Prueba
\[ H(X) = \E\{-\ln[f(X)]\} = \int_S -\ln\left(\frac{1}{\lambda(S)}\right) \frac{1}{\lambda(S)} = -\ln\left(\frac{1}{\lambda(S)}\right) = \ln[\lambda(S)] \]Espacios de Productos
Supongamos ahora que\( (S, \mathscr S, \lambda) \) y\( (T, \mathscr T, \mu) \) son espacios finitos, de medida positiva, así que eso\( 0 \lt \lambda(S) \lt \infty \) y\( 0 \lt \mu(T) \lt \infty \). Recordemos el espacio del producto\( (S \times T, \mathscr S \otimes \mathscr T, \lambda \otimes \mu) \). El producto\( \sigma \) -álgebra\( \mathscr S \otimes \mathscr T \) es el\( \sigma \) -álgebra de subconjuntos de\( S \times T \) generados por conjuntos de productos\( A \times B \) donde\( A \in \mathscr S \) y\( B \in \mathscr T \). La medida del producto\( \lambda \otimes \mu \) es la medida positiva única\( (S \times T, \mathscr S \otimes \mathscr T) \) que satisface\( (\lambda \otimes \mu)(A \times B) = \lambda(A) \mu(B) \) para\( A \in \mathscr S \) y\( B \in \mathscr T \).
\( (X, Y) \)se distribuye uniformemente en\( S \times T \) si y solo si\( X \) se distribuye uniformemente en\( S \),\( Y \) se distribuye uniformemente en\( T \),\( X \) y\( Y \) son independientes.
Prueba
Supongamos primero que\( (X, Y) \) se distribuye uniformemente en\( S \times T\). Si\( A \in \mathscr S \) y\( B \in \mathscr T \) luego\[ \P(X \in A, Y \in B) = \P[(X, Y) \in A \times B] = \frac{(\lambda \otimes \mu)(A \times B)}{(\lambda \otimes \mu)(S \times T)} = \frac{\lambda(A) \mu(B)}{\lambda(S) \mu(T)} = \frac{\lambda(A)}{\lambda(S)} \frac{\mu(B)}{\mu(T)} \] Tomando\( B = T \) en la ecuación mostrada da\( \P(X \in A) = \lambda(A) \big/ \lambda(S) \) para\( A \in \mathscr S \), así\( X \) se distribuye uniformemente en\( S \). Tomando\( A = S \) en la ecuación mostrada da\( \P(Y \in B) = \mu(B) \big/ \mu(T) \) para\( B \in \mathscr T \), por lo que\( Y \) se distribuye uniformemente en\( T \). Volviendo a la ecuación mostrada generalmente da\( \P(X \in A, Y \in B) = \P(X \in A) \P(Y \in B) \) por\( A \in \mathscr S \) y\( B \in \mathscr T \), así\( X \) y\( Y \) son independientes.
Por el contrario, supongamos que\( X \) se distribuye uniformemente sobre\( S \),\( Y \) se distribuye uniformemente en\( T \),\( X \) y\( Y \) son independientes. Entonces para\( A \in \mathscr S \) y\( B \in \mathscr T \), A continuación\[ \P[(X, Y) \in A \times B] = \P(X \in A, Y \in B) = \P(X \in A) \P(Y \in B) = \frac{\lambda(A)}{\lambda(S)} \frac{\mu(B)}{\mu(T)} = \frac{\lambda(A) \mu(B)}{\lambda(S) \mu(T)} = \frac{(\lambda \otimes \mu)(A \times B)}{(\lambda \otimes \mu)(S \times T)} \] se sigue (véase el apartado sobre existencia y singularidad de medidas) que\( \P[(X, Y) \in C] = (\lambda \otimes \mu)(C) / (\lambda \otimes \mu)(S \times T) \) para cada\( C \in \mathscr S \otimes \mathscr T \), así\( (X, Y) \) se distribuye uniformemente sobre\( S \times T \).