5.23: La distribución del semicírculo

Última actualización
Guardar como PDF

Page ID: 151808

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\R}{\mathbb{R}} \)\( \newcommand{\N}{\mathbb{N}} \)\( \newcommand{\Z}{\mathbb{Z}} \)\( \newcommand{ \E}{\mathbb{E}} \)\( \newcommand{\P}{\mathbb{P}} \)\( \newcommand{\var}{\text{var}} \)\( \newcommand{\sd}{\text{sd}} \)\( \newcommand{\bs}{\boldsymbol} \)\( \newcommand{\sgn}{\text{sgn}} \)\( \newcommand{\skw}{\text{skew}} \)\( \newcommand{\kur}{\text{kurt}} \)

La distribución del semicírculo

La distribución semicírculo juega un papel muy importante en el estudio de las matrices aleatorias. También se le conoce como la distribución Wigner en honor al físico Eugene Wigner, quien realizó un trabajo pionero en matrices aleatorias.

La distribución semicírculo estándar

Funciones de distribución

La distribución semicírculo estándar es una distribución continua en el intervalo\( [-1, 1] \) con la función de densidad de probabilidad\( g \) dada por\[ g(x) = \frac{2}{\pi} \sqrt{1 - x^2}, \quad x \in [-1, 1] \]

Prueba

La gráfica de\(x \mapsto \sqrt{1 - x^2}\) for\(x \in [-1, 1]\) es la mitad superior del círculo de radio 1 centrada en el origen. De ahí que el área bajo esta gráfica es\(\pi / 2\) y por lo tanto\(g\) es un PDF válido: la constante\( 2 / \pi \) en\( g \) es la constante normalizadora

Como se señala en la prueba,\(x \mapsto \sqrt{1 - x^2}\) para\(x \in [-1, 1]\) es la mitad superior del círculo de radio 1 centrada en el origen, de ahí el nombre.

La función estándar de densidad de probabilidad de semicírculo\(g\) satisface las siguientes propiedades:

\( g \)es simétrico sobre\( x = 0 \).
\( g \)aumenta y luego disminuye con el modo en\( x = 0 \).
\( g \)es cóncavo hacia abajo.

Prueba

Como se señaló anteriormente, a excepción de la constante normalizadora, la gráfica de\( g \) es la mitad superior del círculo de radio 1 centrada en el origen, por lo que estas propiedades son obvias.

Abra el simulador de distribución especial y seleccione la distribución semicírculo. Con el valor de parámetro predeterminado, anote la forma de la función de densidad de probabilidad. Ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función de distribución semicírculo estándar\( G \) viene dada por\[ G(x) = \frac{1}{2} + \frac{1}{\pi} x \sqrt{1 - x^2} + \frac{1}{\pi} \arcsin x , \quad x \in [-1, 1] \]

Prueba

Por supuesto\( G(x) = \int_{-1}^x g(t) \, dt \) para\( -1 \le x \le 1 \). La integral se evalúa mediante el uso de la sustitución trigonométrica\( t = \sin \theta \).

No podemos dar la función quantile\( G^{-1} \) en forma cerrada, pero los valores de esta función pueden ser aproximados. Claramente por simetría,\( G^{-1}\left(\frac{1}{2} - p\right) = -G^{-1}\left(\frac{1}{2} + p\right) \) para\( 0 \le p \le \frac{1}{2} \). En particular, la mediana es 0.

Abra el simulador de distribución especial y seleccione la distribución de semicírculo. Con el valor de parámetro predeterminado, anote la forma de la función de distribución. Computar el primer y tercer cuartiles.

Momentos

Supongamos que\(X\) tiene la distribución semicírculo estándar. Los momentos de\(X\) aproximadamente 0 se pueden computar explícitamente. En particular, los momentos de orden impar son 0 por simetría.

Porque\( n \in \N \), el momento del orden\(2 n + 1\) es\(\E\left(X^{2n+1}\right) = 0\) y el momento del orden\(2 n\) es\[\E\left(X^{2n}\right) = \left(\frac{1}{2}\right)^{2n} \frac{1}{n + 1} \binom{2n}{n} \]

Prueba

Claramente\( X \) tiene momentos de todos los pedidos ya que el PDF\( g \) está acotado y el intervalo de soporte está acotado. Entonces, por simetría, los momentos de orden impar son 0, y solo necesitamos probar el resultado para los momentos de orden par. Tenga en cuenta que\[ \E\left(X^{2n}\right) = \int_{-1}^1 x^{2n} \frac{2}{\pi} \sqrt{1 - x^2} \, dx \] Utilizamos la sustitución\( x = \sin \theta \) para obtener\[ \E\left(X^{2n}\right) = \int_{-\pi/2}^{\pi/2} \frac{2}{\pi} \sin^{2n}(\theta) \cos^2(\theta) \, d\theta \] Esta integral puede ser evaluada por métodos estándar de cálculo para dar el resultado anterior.

Los números\( C_n = \frac{1}{n+1} \binom{2n}{n}\) para\( n \in \N \) son conocidos como los números catalanes, y llevan el nombre del matemático belga Eugene Catalan. En particular, podemos calcular la media, varianza, asimetría y curtosis.

La media y varianza de\( X \) son

\( \E(X) = 0 \)
\( \var(X) = \frac{1}{4} \)

Abra el simulador de distribución especial y seleccione la distribución de semicírculo. Con el valor de parámetro predeterminado, anote el tamaño y la ubicación de la barra de desviación\(\pm\) estándar media. Ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media verdadera y la desviación estándar.

La asimetría y curtosis de\( X \) son

\( \skw(X) = 0 \)
\( \kur(X) = 2 \)

Prueba

El puntaje estándar de\( X \) es\( 2 X \). De ahí\( \skw(X) = E\left(2^3 X^3\right) = 0 \). Por supuesto, esto también queda claro a partir de la simetría de la distribución de\( X \). Del mismo modo, por la fórmula de momento,\[ \kur(X) = \E\left(2^4 X^4\right) = 2^4 \left(\frac{1}{2}\right)^4 \frac{1}{3}\binom{4}{2} = 2 \]

De ello se deduce que el exceso de curtosis es\(\kur(X) - 3 = -1\).

Distribuciones Relacionadas

La distribución semicírculo tiene conexiones simples a la distribución uniforme continua.

Si\((X, Y)\) se distribuye uniformemente en la región circular en\(\R^2\) centrado en el orgin con radio 1, entonces\(X\) y\(Y\) cada uno tiene la distribución semicircular estándar.

Prueba

\((X, Y)\)tiene PDF conjunto\((x, y) \mapsto 1/\pi\) en\(C = \{(x, y) \in \R^2: x^2 + y^2 \le 1\}\). De ahí\(X\) que tenga PDF\[ g(x) = \int_{-\sqrt{1 - x^2}}^{\sqrt{1 - x^2}} \frac{1}{\pi} \, dy = \frac{2}{\pi} \sqrt{1 - x^2}, \quad x \in [-1, 1] \]

Es fácil simular un punto aleatorio que se distribuye uniformemente en la región circular en el teorema anterior, y esto proporciona una manera de simular una distribución semicírculo estándar. Esto es importante ya que no podemos usar el método de simulación de cuantiles aleatorios.

Supongamos que\(U\)\(V\),, y\(W\) son variables aleatorias independientes, cada una con la distribución uniforme estándar (números aleatorios). Dejar\(R = \max\{U, V\}\) y\(\Theta = 2 \pi W\), y luego dejar\(X = R \cos \Theta\),\(Y = R \sin \Theta\). Entonces\((X, Y)\) se distribuye uniformemente sobre la región circular de radio 1 centrada en el origen, y por lo tanto\(X\) y\(Y\) cada uno tiene la distribución semicírculo estándar.

Prueba

\(U\)y\(V\) tener CDF\(u \mapsto u\) para\(u \in [0, 1]\) y por lo tanto\(R\) tiene CDF\(r \mapsto r^2\) para\(r \in [0, 1]\). De ahí\(R\) que tenga PDF\(r \mapsto 2 r\) para\(r \in [0, 1]\). Por otro lado,\(\Theta\) se distribuye uniformemente sobre\([0, 2 \pi)\) y por lo tanto tiene densidad\(\theta \mapsto 1 / 2 \pi\) sobre\([0, 2 \pi)\). Por independencia, el PDF Conjunto de\((R, \Theta)\) está\((r, \theta) \mapsto (2 r)(1 / 2 \pi) = r / \pi \) encendido\(\{(r, \theta): 0 \le r \le 1, 0 \le \theta \le 2 \pi\}\). Para la transformación de coordenadas polares\((x, y) \mapsto (r \cos \theta , r \sin \theta)\), el jacobiano es\(r\). De ahí que por el cambio de teorema de variables,\((X, Y)\) tiene PDF\[ (x, y) \mapsto \frac{r}{\pi} \frac{1}{r} = \frac{1}{\pi} \text{ on } \{(x, y) \in \R^2: x^2 + y^2 \le 1\} \]

Por supuesto, tenga en cuenta que\(X\) y\(Y\) en el teorema anterior no son independientes. Otro método de simulación es utilizar el método de rechazo. Este método funciona bien ya que la distribución semicírculo tiene un intervalo de soporte limitado y una función de densidad de probabilidad limitada.

Abra la aplicación del método de rechazo y seleccione la distribución de semicírculo. Mantenga los parámetros predeterminados para obtener la distribución estándar del semicírculo. Ejecute la simulación 1000 veces y anote los puntos en la gráfica de dispersión. Comparar la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.

La distribución general del semicírculo

Como tantas distribuciones estándar, la distribución semicírculo estándar generalmente se generaliza agregando parámetros de ubicación y escala.

Definición

Supongamos que\(Z\) tiene la distribución semicírculo estándar. Para\(a \in \R\) y\(r \in (0, \infty)\),\(X = a + r Z\) tiene la distribución semicírculo con centro (parámetro de ubicación)\(a\) y radio (parámetro de escala)\(r\).

Funciones de distribución

Supongamos que\( X \) tiene la distribución semicírculo con centro\( a \in \R \) y radio\( r \in (0, \infty) \).

\(X\)tiene la función de densidad de probabilidad\(f\) dada por\[ f(x) = \frac{2}{\pi r^2} \sqrt{r^2 - (x - a)^2}, \quad x \in [a - r, a + r] \]

Prueba

Esto se desprende de un resultado estándar para familias a escala de ubicación. Recordemos que\[ f(x) = \frac{1}{r} g\left(\frac{x - a}{r}\right), \quad \frac{x - a}{r} \in [-1, 1] \] dónde\( g \) está el semicírculo estándar PDF.

La gráfica de\( x \mapsto \sqrt{r^2 - (x - a)^2} \) for\( x \in [a - r, a + r] \) es la mitad superior del círculo de radio\( r \) centrada en\(a\). El área bajo este semicírculo es\( \pi r^2 / 2 \) así como un chequeo de nuestro trabajo, vemos que\( f \) es una función válida de densidad de probabilidad.

La función\( f \) de densidad de probabilidad de\( X \) satisface las siguientes propiedades:

\( f \)es simétrico sobre\( x = a \).
\( f \)aumenta y luego disminuye con el modo en\( x = a \).
\( f \)es cóncavo hacia abajo.

Abra el simulador de distribución especial y seleccione la distribución semicírculo. Varíe el centro\(a\) y el radio\( r \), y anote la forma de la función de densidad de probabilidad. Para valores seleccionados de\(a\) y\( r \), ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función\( F \) de distribución de\( X \) es\[ F(x) = \frac{1}{2} + \frac{x - a}{\pi r^2} \sqrt{r^2 - (x - a)^2} + \frac{1}{\pi} \arcsin\left(\frac{x - a}{r}\right), \quad x \in [a - r, a + r] \]

Prueba

Esto se desprende de un resultado estándar para familias a escala de ubicación:\[ F(x) = G\left(\frac{x - a}{r}\right), \quad \frac{x - a}{r} \in [-1, 1]\] donde\( G \) está el semicírculo estándar CDF.

Como en el caso estándar, no podemos dar la función quantile\( F^{-1} \) en forma cerrada, pero los valores de esta función pueden ser aproximados. Recordemos que\(F^{-1}(p) = a + r G^{-1}(p)\) donde\( G^{-1} \) está la función de cuantil semicírculo estándar. En particular,\( F^{-1}\left(\frac{1}{2} - p\right) = 2 a - F^{-1}\left(\frac{1}{2} + p\right) \) para\( 0 \le p \le \frac{1}{2} \). La mediana es\(a\).

Abra el simulador de distribución especial y seleccione la distribución de semicírculo. Varíe el centro\(a\) y el radio\( r \), y anote la forma de la función de distribución. Para valores seleccionados de\(a\) y\( r \), compute el primer y tercer cuartiles.

Momentos

Supongamos nuevamente que\( X \) tiene la distribución semicírculo con centro\( a \in \R \) y radio\( r \in (0, \infty) \), así que por definición podemos suponer\( X = a + r Z \) donde\( Z \) tiene la distribución semicírculo estándar. Los momentos de se\(X\) pueden computar a partir de los momentos de\(Z\). Utilizando el teorema binomial y la linealidad del valor esperado tenemos\[ \E\left(X^n\right) = \sum_{k=0}^n \binom{n}{k} r^k a^{n-k} \E\left(Z^k\right), \quad n \in \N \] En particular,

La media y varianza de\( X \) son

\( \E(X) = a \)
\( \var(X) = r^2 / 4 \)

Cuando el centro es 0, los momentos generales tienen una forma simple:

Supongamos que\( a = 0 \). Porque\( n \in \N \) el momento del orden\( 2 n + 1 \) es\(\E\left(X^{2n+1}\right) = 0\) y el momento del orden\( 2 n \) es\[\E\left(X^{2n}\right) = \left(\frac{r}{2}\right)^{2n} \frac{1}{n + 1} \binom{2n}{n} \]

Prueba

Esto se deduce del momento resulta para\(Z\) desde\(X^m = r^m Z^m\) para\(m \in \N\).

Abra el simulador de distribución especial y seleccione la distribución de semicírculo. Varíe el centro\(a\) y el radio\( r \), y anote el tamaño y la ubicación de la barra de desviación\( \pm \) estándar media. Para valores seleccionados de\(a\) y\( r \), ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

La asimetría y curtosis de\( X \) son

\( \skw(X) = 0 \)
\( \kur(X) = 2 \)

Prueba

Estos resultados se derivan inmediatamente de la asimetría y curtosis de la distribución estándar. Recordemos que la asimetría y curtosis se definen en términos de la puntuación estándar, la cual es independiente de los parámetros de ubicación y escala.

Una vez más, el exceso de curtosis es\( \kur(X) - 3 = -1 \).

Distribuciones Relacionadas

Dado que la distribución de semicírculo es una familia a escala de ubicación, es invariante bajo transformaciones a escala de ubicación.

Supongamos que\( X \) tiene la distribución semicírculo con centro\(a \in \R\) y radio\( r \in (0, \infty) \). Si\(b \in \R\) y\( c \in (0, \infty) \) luego\(b + c X \) tiene la distribución semicírculo con centro\(b + c a\) y radio\( c r \).

Prueba

Nuevamente a partir de la definición podemos tomar\(X = a + r Z\) donde\(Z\) tiene la distribución semicírculo estándar. Entonces\( b + c X = (b + c a) + (c r) Z \).

Un miembro de la familia beta de distribuciones es una distribución semicírculo:

La distribución beta con parámetro izquierdo\(3/2 \) y parámetro derecho\(3/2 \) es la distribución semicírculo con centro\(1/2\) y radio\(1/2\).

Prueba

Por definición, la distribución beta con parámetros izquierdo y derecho\(3/2\) tiene PDF\[ f(x) = \frac{1}{B(3/2, 3/2)}x^{1/2}(1 - x)^{1/2}, \quad x \in [0, 1] \] Pero\(B(3/2, 3/2) = \pi/8\) y\(x^{1/2}(1 - x)^{1/2} = \sqrt{x - x^2}\). Completar el cuadrado da\[ f(x) = \frac{8}{\pi} \sqrt{\frac{1}{4} - \left(x - \frac{1}{2}\right)^2}, \quad x \in [0, 1] \] cual es el PDF de la distribución del semicírculo con centro\(1/2\) y radio\(1/2\).

Ya que podemos simular una variable\(Z\) con la distribución semicírculo estándar por el método anterior, podemos simular una variable con la distribución semicírculo con centro\(a \in \R\) y radio\(r \in (0, \infty)\) por nuestra misma definición:\(X = a + r Z\). Una vez más, el método de rechazo también funciona bien ya que la fucnción de soporte y densidad de probabilidad de\(X\) están acotadas.

Abra la aplicación del método de rechazo y seleccione la distribución de semicírculo. Para valores seleccionados de\(a\) y\(r\), ejecute la simulación 1000 veces y anote los puntos en la gráfica de dispersión. Comparar la función de densidad empírica, la media y la desviación estándar con sus contrapartes distribucionales.