Saltar al contenido principal

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$
$$\newcommand{\R}{\mathbb{R}}$$$$\newcommand{\N}{\mathbb{N}}$$$$\newcommand{\E}{\mathbb{E}}$$$$\newcommand{\P}{\mathbb{P}}$$$$\newcommand{\var}{\text{var}}$$$$\newcommand{\sd}{\text{sd}}$$$$\newcommand{\skw}{\text{skew}}$$$$\newcommand{\kur}{\text{kurt}}$$$$\newcommand{\bs}{\boldsymbol}$$

En esta sección estudiaremos una distribución, y algunos familiares, que tienen especial importancia en la estadística. En particular, la distribución chi-cuadrada surgirá en el estudio de la varianza muestral cuando la distribución subyacente sea normal y en pruebas de bondad de ajuste.

## La distribución de Chi-Square

### Funciones de distribución

Para$$n \in (0, \infty)$$, la distribución gamma con parámetro de forma$$n / 2$$ y parámetro de escala 2 se denomina distribución chi-cuadrada con$$n$$ grados de libertad. La función de densidad de probabilidad$$f$$ viene dada por$f(x) = \frac{1}{2^{n/2} \Gamma(n/2)} x^{n/2 - 1} e^{-x/2}, \quad x \in (0, \infty)$

Por lo que la distribución chi-cuadrada es una distribución continua en$$(0, \infty)$$. Por razones que quedarán claras más adelante,$$n$$ suele ser un entero positivo, aunque técnicamente esto no es un requisito matemático. Cuando$$n$$ es un entero positivo, la función gamma en la constante normalizadora se puede dar explícitamente.

Si$$n \in \N_+$$ entonces

1. $$\Gamma(n/2) = (n/2 - 1)!$$si$$n$$ es par.
2. $$\Gamma(n/2) = \frac{(n - 1)!}{2^{n-1} (n/2 - 1/2)!} \sqrt{\pi}$$si$$n$$ es impar.

La distribución chi-cuadrada tiene una rica colección de formas.

La función de densidad de probabilidad chi-cuadrado con$$n \in (0, \infty)$$ grados de libertad satisface las siguientes propiedades:

1. Si$$0 \lt n \lt 2$$,$$f$$ es decreciente con$$f(x) \to \infty$$ as$$x \downarrow 0$$.
2. Si$$n = 2$$,$$f$$ está disminuyendo con$$f(0) = \frac{1}{2}$$.
3. Si$$n \gt 2$$,$$f$$ aumenta y luego disminuye con el modo en$$n - 2$$.
4. Si$$0 \lt n \le 2$$,$$f$$ es cóncava hacia abajo.
5. Si$$2 \lt n \le 4$$,$$f$$ es cóncavo hacia abajo y luego hacia arriba, con punto de inflexión en$$n - 2 + \sqrt{2 n - 4}$$
6. Si$$n \gt 4$$ entonces$$f$$ es cóncavo hacia arriba luego hacia abajo y luego hacia arriba nuevamente, con puntos de inflexión en$$n - 2 \pm \sqrt{2 n - 4}$$

En el simulador de distribución especial, seleccione la distribución chi-cuadrada. Varíe$$n$$ con la barra de desplazamiento y anote la forma de la función de densidad de probabilidad. Para valores seleccionados de$$n$$, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad verdadera.

La función de distribución y la función cuantil no tienen representaciones simples de forma cerrada para la mayoría de los valores del parámetro. Sin embargo, la función de distribución se puede dar en términos de las funciones gamma completas e incompletas.

Supongamos que$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad. La función$$F$$ de distribución de$$X$$ viene dada por$F(x) = \frac{\Gamma(n/2, x/2)}{\Gamma(n/2)}, \quad x \in (0, \infty)$

Los valores aproximados de las funciones de distribución y cuantiles se pueden obtener de la calculadora de distribución especial y de la mayoría de los paquetes de software matemáticos y estadísticos.

En la calculadora de distribución especial, seleccione la distribución chi-cuadrada. Varíe el parámetro y anote la forma de las funciones de densidad de probabilidad, distribución y cuantiles. En cada uno de los siguientes casos, encuentre la mediana, el primer y tercer cuartiles y el rango intercuartil.

1. $$n = 1$$
2. $$n = 2$$
3. $$n = 5$$
4. $$n = 10$$

### Momentos

La media, varianza, momentos y función generadora de momentos de la distribución chi-cuadrada se puede obtener fácilmente a partir de resultados generales para la distribución gamma.

Si$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad entonces

1. $$\E(X) = n$$
2. $$\var(X) = 2 n$$

En la simulación del simulador de distribución especial, seleccione la distribución chi-cuadrada. Varíe$$n$$ con la barra de desplazamiento y anote el tamaño y la ubicación de la barra de desviación$$\pm$$ estándar media. Para valores seleccionados de$$n$$, ejecute la simulación 1000 veces y compare los momentos empíricos con los momentos de distribución.

La asimetría y curtosis de la distribución de chi-cuadrado se dan a continuación.

Si$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad, entonces

1. $$\skw(X) = 2 \sqrt{2 / n}$$
2. $$\kur(X) = 3 + 12/n$$

Tenga en cuenta que$$\skw(X) \to 0$$ y$$\kur(X) \to 3$$ como$$n \to \infty$$. En particular, el exceso de curtosis$$\kur(X) - 3 \to 0$$ como$$n \to \infty$$.

En la simulación del simulador de distribución especial, seleccione la distribución chi-cuadrada. Aumente$$n$$ con la barra de desplazamiento y anote la forma de la función de densidad de probabilidad a la luz de los resultados previos sobre asimetría y curtosis. Para valores seleccionados de$$n$$, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad verdadera.

El siguiente resultado da los momentos generales de la distribución chi-cuadrada.

Si$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad, entonces para$$k \gt -n/2$$,$\E\left(X^k\right) = 2^k \frac{\Gamma(n/2 + k)}{\Gamma(n/2)}$

En particular, si$$k \in \N_+$$ entonces$\E\left(X^k\right) = 2^k \left(\frac{n}{2}\right)\left(\frac{n}{2} + 1\right) \cdots \left(\frac{n}{2} + k - 1\right)$ Tenga en cuenta también$$\E\left(X^k\right) = \infty$$ si$$k \le -n/2$$.

Si$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad, entonces$$X$$ tiene función de generación de momento$\E\left(e^{t X}\right) = \frac{1}{(1 - 2 t)^{n / 2}}, \quad t \lt \frac{1}{2}$

### Relaciones

La distribución chi-cuadrada está conectada a una serie de otras distribuciones especiales. Por supuesto, la relación más importante es la definición —la distribución chi-cuadrada con$$n$$ grados de libertad es un caso especial de la distribución gamma, correspondiente al parámetro de forma$$n/2$$ y parámetro de escala 2. Por otro lado, cualquier variable distribuida gamma puede ser re-escalada en una variable con una distribución chi-cuadrada.

Si$$X$$ tiene la distribución gamma con el parámetro shape$$k \in (0, \infty)$$ y el parámetro scale$$b \in (0, \infty)$$ entonces$$Y = \frac{2}{b} X$$ tiene la distribución chi-cuadrado con$$2 k$$ grados de libertad.

Prueba

Dado que la distribución gamma es una familia de escalas,$$Y$$ tiene una distribución gamma con parámetro de forma$$k$$ y parámetro de escala$$b \frac{2}{b} = 2$$. De ahí que$$Y$$ tenga la distribución chi-cuadrada con$$2 k$$ grados de libertad.

La distribución chi-cuadrada con 2 grados de libertad es la distribución exponencial con el parámetro de escala 2.

Prueba

La distribución chi-cuadrada con 2 grados de libertad es la distribución gamma con el parámetro de forma 1 y el parámetro de escala 2, que ya sabemos es la distribución exponencial con el parámetro de escala 2.

Si$$Z$$ tiene la distribución normal estándar entonces$$X = Z^2$$ tiene la distribución chi-cuadrada con 1 grado de libertad.

Prueba

Como es habitual, dejar$$\phi$$ y$$\Phi$$ denotar el PDF y CDF de la distribución normal estándar, respectivamente Entonces para$$x \gt 0$$,$\P(X \le x) = \P(-\sqrt{x} \le Z \le \sqrt{x}) = 2 \Phi\left(\sqrt{x}\right) - 1$ Diferenciando con respecto a$$x$$ da la función$$f$$ de densidad de$$X$$:$f(x) = \phi\left(\sqrt{x}\right) x^{-1/2} = \frac{1}{\sqrt{2 \pi}} x^{-1/2} e^{-x / 2}, \quad x \in (0, \infty)$ que reconocemos como el PDF chi-cuadrado con 1 grado de libertad.

Recordemos que si agregamos variables gamma independientes con un parámetro de escala común, la variable aleatoria resultante también tiene una distribución gamma, con el parámetro de escala común y con el parámetro shape que es la suma de los parámetros de forma de los términos. Especializados en la distribución chi-cuadrada, tenemos el siguiente resultado importante:

Si$$X$$ tiene la distribución chi-cuadrada con$$m \in (0, \infty)$$ grados de libertad,$$Y$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad, y$$X$$ y$$Y$$ son independientes, entonces$$X + Y$$ tiene la distribución chi-cuadrada con$$m + n$$ grados de libertad.

Los dos últimos resultados conducen al siguiente teorema, el cual es fundamentalmente importante en la estadística.

Supongamos que$$n \in \N_+$$ y esa$$(Z_1, Z_2, \ldots, Z_n)$$ es una secuencia de variables normales estándar independientes. Entonces la suma de los cuadrados$V = \sum_{i=1}^n Z_i^2$ tiene la distribución chi-cuadrada con$$n$$ grados de libertad:

Este teorema es la razón por la que la distribución chi-cuadrada merece un nombre propio, y la razón por la que el parámetro grados de libertad suele ser un entero positivo. Las sumas de cuadrados de las variables normales independientes ocurren frecuentemente en las estadísticas.

Del teorema del límite central, y de los resultados previos para la distribución gamma, se deduce que si$$n$$ es grande, la distribución chi-cuadrada con$$n$$ grados de libertad puede aproximarse por la distribución normal con media$$n$$ y varianza$$2 n$$. Aquí está la declaración precisa:

Si$$X_n$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad, entonces la distribución de la puntuación estándar$Z_n = \frac{X_n - n}{\sqrt{2 n}}$ converge a la distribución normal estándar como$$n \to \infty$$.

En la simulación del simulador de distribución especial, seleccione la distribución chi-cuadrada. Empezar con$$n = 1$$ y aumentar$$n$$. Anote la forma de la función de densidad de probabilidad a la luz del teorema anterior. Para valores seleccionados de$$n$$, ejecute el experimento 1000 veces y compare la función de densidad empírica con la función de densidad verdadera.

Al igual que la distribución gamma, la distribución chi-cuadrada es infinitamente divisible:

Supongamos que$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad. For$$k \in \N_+$$,$$X$$ tiene la misma distribución que$$\sum_{i=1}^k X_i$$, donde$$(X_1, X_2, \ldots, X_k)$$ hay una secuencia de variables aleatorias independientes, cada una con la distribución chi-cuadrada con$$n / k$$ grados de libertad.

También al igual que la distribución gamma, la distribución chi-cuadrada es un miembro de la familia exponencial general de distribuciones:

La distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad es una familia exponencial de un parámetro con parámetro$$n/2 - 1$$ natural y estadística natural$$\ln X$$.

Prueba

Esto se desprende de la definición de la familia exponencial general. El PDF se puede escribir como$f(x) = \frac{e^{-x/2}}{2^{n/2} \Gamma(n/2)} \exp\left[(n/2 - 1) \ln x\right], \quad x \in (0, \infty)$

## La distribución de Chi

La distribución chi, apropiadamente, es la distribución de la raíz cuadrada de una variable con la distribución chi-cuadrada

Supongamos que$$X$$ tiene la distribución chi-cuadrada con$$n \in (0, \infty)$$ grados de libertad. Después$$U = \sqrt{X}$$ tiene la distribución chi con$$n$$ grados de libertad.

Entonces, al igual que la distribución chi-cuadrada, la distribución chi es una distribución continua en$$(0, \infty)$$.

### Funciones de distribución

La función$$G$$ de distribución de la distribución chi con$$n \in (0, \infty)$$ grados de libertad viene dada por$G(u) = \frac{\Gamma(n/2, u^2/2)}{\Gamma(n/2)}, \quad u \in (0, \infty)$

Prueba

Supongamos que$$U$$ tiene la distribución chi con$$n$$ grados de libertad así que$$X = U^2$$ tiene la distribución chi-cuadrada con$$n$$ grados de libertad. Para$$u \in (0, \infty)$$,$G(u) = \P(U \le u) = \P(U^2 \le u^2) = \P(X \le u^2) = F(x^2)$ donde$$F$$ está la función de distribución chi-cuadrada con$$n$$ grados de libertad.

La función$$g$$ de densidad de probabilidad de la distribución chi con$$n \in (0, \infty)$$ grados de libertad viene dada por$g(u) = \frac{1}{2^{n/2 - 1} \Gamma(n/2)} u^{n-1} e^{-u^2/2}, \quad u \in (0, \infty)$

Prueba

Supongamos nuevamente que$$U$$ tiene la distribución chi con$$n$$ grados de libertad para que$$X = U^2$$ tenga la distribución chi-cuadrada con$$n$$ grados de libertad. La transformación$$u = \sqrt{x}$$ mapea$$(0, \infty)$$ uno a uno en$$(0, \infty)$$. La transformación inversa es$$x = u^2$$ con$$dx/du = 2 u$$. De ahí por el cambio estándar de variables fórmula,$g(u) = f(x) \frac{dx}{du} = f(u^2) 2 u$ donde$$f$$ está el chi-cuadrado PDF.

La función de densidad de probabilidad chi también tiene una variedad de formas.

La función de densidad de probabilidad chi con$$n \in (0, \infty)$$ grados de libertad satisface las siguientes propiedades:

1. Si$$0 \lt n \lt 1$$,$$g$$ es decreciente con$$g(u) \to \infty$$ as$$u \downarrow 0$$.
2. Si$$n = 1$$,$$g$$ es decreciente con$$g(0) = \sqrt{2 / \pi}$$ as$$u \downarrow 0$$.
3. Si$$n \gt 1$$,$$g$$ aumenta y luego disminuye con el modo$$u = \sqrt{n - 1}$$
4. Si$$0 \lt n \lt 1$$,$$g$$ es cóncava hacia arriba.
5. Si$$1 \le n \le 2$$,$$g$$ es cóncavo hacia abajo y luego hacia arriba con punto de inflexión en$$u = \sqrt{\frac{1}{2}[2 n - 1 + \sqrt{8 n - 7}]}$$
6. Si$$n \gt 2$$,$$g$$ es cóncavo hacia arriba luego hacia abajo y luego hacia arriba nuevamente con puntos de inflexión en$$u = \sqrt{\frac{1}{2}[2 n - 1 \pm \sqrt{8 n - 7}]}$$

### Momentos

Los momentos brutos de la distribución chi son fáciles de calcular en términos de la función gamma.

Supongamos que$$U$$ tiene la distribución chi con$$n \in (0, \infty)$$ grados de libertad. Entonces$\E(U^k) = 2^{k/2} \frac{\Gamma[(n + k) / 2]}{\Gamma(n/2)}, \quad k \in (0, \infty)$

Prueba

Por definición$E(U^k) = \int_0^\infty u^k g(u) \, du = \frac{1}{2^{n/2-1} \Gamma(n/2)} \int_0^\infty u^{n+k-1} e^{-u^2/2} du$ El cambio de variables$$v = u^2/2$$, por lo que$$u = 2^{1/2} v^{1/2}$$ y$$du = 2^{-1/2} v^{-1/2}$$ da (después de la simplificación)$E(U^k) = \frac{2^{k/2}}{\Gamma(n/2)} \int_0^\infty v^{(n+k)/2 - 1} e^{-v} dv$ La última integral es$$\Gamma[(n + k) / 2]$$.

Curiosamente, el segundo momento es simplemente el parámetro grados de libertad.

Supongamos nuevamente que$$U$$ tiene la distribución chi con$$n \in (0, \infty)$$ grados de libertad. Entonces

1. $$\E(U) = 2^{1/2} \frac{\Gamma[(n+1)/2]}{\Gamma(n/2)}$$
2. $$\E(U^2) = n$$
3. $$\var(U) = n - 2 \frac{\Gamma^2[(n+1)/2]}{\Gamma^2(n/2)}$$
Prueba

Para la parte (b), usando la identidad fundamental de la función gamma tenemos$\E(U^2) = 2 \frac{\Gamma(n/2 + 1)}{\Gamma(n/2)} = 2 \frac{(n/2) \Gamma(n/2)}{\Gamma(n/2)} = n$ Las otras partes siguen de la sustitución directa.

### Relaciones

La relación fundamental, por supuesto, es la que existe entre la distribución chi y la distribución chi-cuadrada dada en la definición. A su vez, esto conduce a una relación fundamental entre la distribución de chi y la distribución normal.

Supongamos que$$n \in \N_+$$ y esa$$(Z_1, Z_2, \ldots, Z_n)$$ es una secuencia de variables independientes, cada una con la distribución normal estándar. Después$U = \sqrt{Z_1^2 + Z_2^2 + \cdots + Z_n^2}$ tiene la distribución chi con$$n$$ grados de libertad.

Tenga en cuenta que la variable aleatoria$$U$$ en el último resultado es la norma euclidiana estándar de$$(Z_1, Z_2, \ldots, Z_n)$$, pensada como un vector en$$\R^n$$. Obsérvese también que la distribución chi con 1 grado de libertad es la distribución de$$\left|Z\right|$$, el valor absoluto de una variable normal estándar, la cual se conoce como la distribución media normal estándar.

## La distribución no central de Chi-Cuadrado

Gran parte de la importancia de la distribución chi-cuadrada deriva de que es la distribución la que gobierna la suma de cuadrados de variables normales estándar independientes. Una generalización natural, y una que es importante en las aplicaciones estadísticas, es considerar la distribución de una suma de cuadrados de variables normales independientes, cada una con varianza 1 pero con diferentes medias.

Supongamos que$$n \in \N_+$$ y que$$(X_1, X_2, \ldots, X_n)$$ es una secuencia de variables independientes, donde$$X_k$$ tiene la distribución normal con media$$\mu_k \in \R$$ y varianza 1 para$$k \in \{1, 2, \ldots, n\}$$. La distribución de$$Y = \sum_{k=1}^n X_k^2$$ es la distribución de chi-cuadrado no central con$$n$$ grados de libertad y parámetro de no centralidad$$\lambda = \sum_{k=1}^n \mu_k^2$$.

Tenga en cuenta que los grados de libertad es un entero positivo mientras que el parámetro de no centralidad$$\lambda \in [0, \infty)$$, pero pronto generalizaremos los grados de libertad.

### Funciones de distribución

Al igual que las distribuciones chi-cuadrado y chi, la distribución chi-cuadrada no central es una distribución continua en$$(0, \infty)$$. La función de densidad de probabilidad y la función de distribución no tienen expresiones simples y cerradas, pero hay una conexión fascinante con la distribución de Poisson. Para configurar la notación, dejar$$f_k$$ y$$F_k$$ denotar las funciones de densidad de probabilidad y distribución de la distribución chi-cuadrada con$$k \in (0, \infty)$$ grados de libertad. Supongamos que$$Y$$ tiene la distribución chi-cuadrada no central con$$n \in \N_+$$ grados de libertad y parámetro de no centralidad$$\lambda \in [0, \infty)$$. El siguiente teorema fundamental da la función de densidad de probabilidad$$Y$$ como una serie infinita, y muestra que la distribución de hecho depende sólo de$$n$$ y$$\lambda$$.

La función de densidad de probabilidad$$g$$ de$$Y$$ viene dada por$g(y) = \sum_{k=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} f_{n + 2 k}(y), \quad y \in (0, \infty)$

Prueba

Supongamos que$$\bs{X} = (X_1, X_2, \ldots, X_n)$$ es una secuencia de variables aleatorias independientes, donde$$X_i$$ tiene la distribución normal con media$$\mu_i$$ y varianza 1, y donde$$\lambda = \sum_{i=1}^n \mu_i^2$$. Entonces, por definición,$$Y = \sum_{i=1}^n X_i^2$$ tiene la distribución chi-cuadrada no central con$$n$$ grados de libertad y parámetro de no centralidad$$\lambda$$. El vector aleatorio$$\bs{X}$$ tiene una distribución normal multivariada con vector medio$$\bs{\mu} = (\mu_1, \mu_2, \ldots, \mu_n)$$ y matriz de varianza-covarianza$$I$$ (la matriz de$$n \times n$$ identidad). El PDF (conjunto)$$h$$ de$$\bs{X}$$ es simétrico sobre$$\bs{\mu}$$:$$h(\bs{\mu} - \bs{x}) = h(\bs{\mu} + \bs{x})$$ para$$\bs{x} \in \R^n$$. Debido a esta simetría, la distribución de$$Y$$ depende$$\bs{\mu}$$ solo a través del parámetro$$\lambda$$. De ello se deduce que$$Y$$ tiene la misma distribución que$$\sum_{i=1}^n U_i^2$$ donde$$(U_1, U_2, \ldots, U_n)$$ son independientes,$$U_1$$ tiene la distribución normal con media$$\sqrt{\lambda}$$ y varianza 1, y$$(U_2, U_3, \ldots, U_n)$$ son normales estándar.

La distribución de$$U_1^2$$ se encuentra por el cambio habitual de métodos de variables. Dejar$$\phi$$ y$$\Phi$$ denotar el PDF normal estándar y CDF, respectivamente, para que$$U_1$$ tenga CDF dado por$$\P(U_1 \le x) = \Phi\left(x - \sqrt{\lambda}\right)$$ for$$x \in \R$$. Así,$\P\left(U_1^2 \le x\right) = \P\left(-\sqrt{x} \le U_1 \le \sqrt{x}\right) = \Phi\left(\sqrt{x} - \sqrt{\lambda}\right) - \Phi\left(-\sqrt{x} - \sqrt{\lambda}\right), \quad x \in (0, \infty)$ Tomando derivados, el PDF$$g$$ de$$U_1^2$$ viene dado por$g(x) = \frac{1}{2 \sqrt{x}}\left[\phi\left(\sqrt{x} - \sqrt{\lambda}\right) + \phi\left(-\sqrt{x} - \sqrt{\lambda}\right)\right] \frac{1}{2 \sqrt{x}}\left[\phi\left(\sqrt{x} - \sqrt{\lambda}\right) + \phi\left(\sqrt{x} + \sqrt{\lambda}\right)\right], \quad x \in (0, \infty)$ But$$\phi(z) = \frac{1}{\sqrt{2 \pi}} e^{-z^2/2}$$ for$$z \in \R$$, así sustituyendo y simplificando da$g(x) = \frac{1}{\sqrt{2 \pi x}} e^{-\frac{1}{2}(x + \lambda)} \frac{1}{2} \left(e^{\sqrt{\lambda x}} + e^{- \sqrt{\lambda x}} \right) = \frac{1}{\sqrt{2 \pi x}} e^{-\frac{1}{2}(x + \lambda)} \cosh\left(\sqrt{\lambda x}\right), \quad x \in (0, \infty)$ Next, recordemos que la serie Taylor para la función coseno hiperbólica es la$\cosh(x) = \sum_{k=0}^\infty \frac{x^{2 k}}{(2 k)!}, \quad x \in \R$ que lleva a$g(x) = \sum_{k=0}^\infty \frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2}(x + \lambda)} \frac{\lambda^k x^{k - 1/2}}{(2 k)!}, \quad x \in (0, \infty)$ Después de un poco más álgebra, obtenemos la representación en el teorema, con$$n = 1$$. Es decir,$g(x) = \sum_{k=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} \frac{1}{2^{(2 k + 1) / 2} \Gamma[(2 k + 1) / 2]} x^{(2 k + 1)/2 - 1} e^{-x/2}, \quad x \in (0, \infty)$ O en forma funcional,$$g = \sum_{k=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} f_{2 k + 1}$$.

Para completar la prueba, sabemos que$$\sum_{j=2}^n U_j^2$$ tiene la distribución chi-cuadrada con$$n - 1$$ grados de libertad, y por lo tanto tiene PDF$$f_{n-1}$$, y es independiente de$$U_1$$. Por lo tanto, la distribución de$$\sum_{j=1}^n U_j^2$$ es$g * f_{n-1} = \left(\sum_{k=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} f_{2 k + 1}\right) * f_{n-1} = \sum_{k=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} f_{2 k + n}$ donde$$*$$ denota convolución como de costumbre, y donde hemos utilizado el resultado fundamental anterior sobre la suma de variables chi-cuadrado independientes.

La función$$k \mapsto e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!}$$ on$$\N$$ es la función de densidad de probabilidad de la distribución de Poisson con parámetro$$\lambda / 2$$. Entonces se deduce que si$$N$$ tiene la distribución de Poisson con parámetro$$\lambda / 2$$ y la distribución condicional de$$Y$$ dado$$N$$ es chi-cuadrado con parámetro$$n + 2 N$$, entonces$$Y$$ tiene la distribución discutida aquí—chi-cuadrado no central con$$n$$ grados de libertad y parámetro de no centralidad$$\lambda$$. Además, está claro que$$g$$ es una función de densidad de probabilidad válida para cualquiera$$n \in (0, \infty)$$, por lo que podemos generalizar un poco nuestra definición.

Para$$n \in (0, \infty)$$ y$$\lambda \in [0, \infty)$$, la distribución con la función de densidad de probabilidad$$g$$ anterior es la distribución chi-cuadrada no central con$$n$$ grados de libertad y parámetro de no centralidad$$\lambda$$.

La función de distribución$$G$$ viene dada por$G(y) = \sum_{k=0}^\infty e^{-\lambda/2} \frac{(\lambda / 2)^k}{k!} F_{n + 2 k}(y), \quad y \in (0, \infty)$

Prueba

Esto se deduce inmediatamente del resultado para el PDF, desde$$G(0) = 0$$ y$$G^\prime = g$$.

### Momentos

En esta discusión, asumimos nuevamente que$$Y$$ tiene la distribución chi-cuadrada no central con$$n \in (0, \infty)$$ grados de libertad y parámetro de no centralidad$$\lambda \in [0, \infty)$$.

La función de generación de momento$$M$$ de$$Y$$ viene dada por$M(t) = \E\left(e^{t Y}\right) = \frac{1}{(1 - 2 t)^{n/2}} \exp\left(\frac{\lambda t}{1 - 2 t}\right), \quad t \in (-\infty, 1/2)$

Prueba

Utilizaremos la relación fundamental mencionada anteriormente. Así, supongamos que$$N$$ tiene la distribución de Poisson con parámetro$$\lambda / 2$$, y eso dado$$N$$,$$Y$$ tiene la distribución chi-cuadrado con$$n + 2 N$$ grados de libertad. Acondicionar y usar el MGF de la distribución chi-cuadrado anterior da$E\left(e^{t Y}\right) = \E\left[\E\left(e^{t Y} \mid N\right)\right] = \E \left(\frac{1}{(1 - 2 t)^{(n + 2 N) / 2}}\right) = \frac{1}{(1 - 2 t)^{n/2}} \E\left[\left(\frac{1}{1 - 2 t}\right)^{N}\right]$ El último valor esperado es la función generadora de probabilidad de$$N$$, evaluado en$$\frac{1}{1 - 2 t}$$. De ahí$\E\left(e^{t Y}\right) = \frac{1}{1 - 2 t} \exp\left[\frac{\lambda}{2}\left(\frac{1}{1 - 2 t} - 1\right)\right] = \frac{1}{(1 - 2 t)^{n/2}} \exp\left(\frac{\lambda t}{1 - 2 t}\right)$

La media y varianza$$Y$$ de

1. $$\E(Y) = n + \lambda$$
2. $$\var(Y) = 2(n + 2 \lambda)$$
Prueba

Estos resultados se pueden obtener tomando derivados del MGF, pero la derivación usando la conexión con la distribución de Poisson es más interesante. Entonces supongamos nuevamente que$$N$$ tiene la distribución de Poisson con parámetro$$\lambda / 2$$ y que la distribución condicional de$$Y$$ dado$$N$$ es chi-cuadrado con$$n + 2 N$$ grados de libertad. Acondicionamiento y uso de los medios y varianzas de las distribuciones chi-cuadrado y Poisson, tenemos

1. $$\E(Y) = \E[\E(Y \mid N)] = \E(n + 2 N) = n + 2 (\lambda / 2) = n + \lambda$$
2. $$\var(Y) = \E[\var(Y \mid N)] + \var[\E(Y \mid N)] = \E[2 (n + 2 N)] + \var(n + 2 N) = 2 n + 4 (\lambda / 2) + 4 \lambda / 2 = 2 n + 4 \lambda$$

La asimetría y curtosis$$Y$$ de

1. $$\skw(Y) = 2^{3/2} \frac{n + 3 \lambda}{(n + 2 \lambda)^{3/2}}$$
2. $$\kur(Y) = 3 + 12 \frac{n + 4 \lambda}{(n + 2 \lambda)^2}$$

Tenga en cuenta que$$\skw(Y) \to 0$$ como$$n \to \infty$$ o como$$\lambda \to \infty$$. Tenga en cuenta también que el exceso de curtosis es$$\kur(Y) - 3 = 12 \frac{n + 4 \lambda}{(n + 2 \lambda)^2}$$. Entonces$$\kur(Y) \to 3$$ (la curtosis de la distribución normal) como$$n \to \infty$$ o como$$\lambda \to \infty$$.

### Relaciones

Trivialmente, por supuesto, la distribución chi-cuadrada ordinaria es un caso especial de la distribución chi-cuadrada no central, con el parámetro de no centralidad 0. La relación más importante es la definición orignal anterior. La distribución chi-cuadrada no central con$$n \in \N_+$$ grados de libertad y parámetro de no centralidad$$\lambda \in [0, \infty)$$ es la distribución de la suma de los cuadrados de variables normales$$n$$ independientes con varianza 1 y cuyas medias satisfacen$$\sum_{k=1}^n \mu_k^2 = \lambda$$. La siguiente relación más importante es la que surgió en la función de densidad de probabilidad y fue tan útil para calcular momentos. Declaramos esta otra vez para énfasis.

Supongamos que$$N$$ tiene la distribución de Poisson con parámetro$$\lambda / 2$$$$\lambda \in (0, \infty)$$, donde, y que la distribución condicional de$$Y$$ dado$$N$$ es chi-cuadrado con$$n + 2 N$$ grados de libertad, donde$$n \in (0, \infty)$$. Entonces la distribución (incondicional) de$$Y$$ es chi-cuadrado no central con$$n$$ grado de libertad y parámetro de no centralidad$$\lambda$$.

Prueba

Para$$j \in \N_+$$, vamos a$$f_j$$ denotar el PDF chi-cuadrado con$$j$$ grados de libertad. Entonces a partir de los supuestos,$$Y$$ se da el PDF$$g$$ de por el$g(y) = \sum_{n=0}^\infty \P(N = k) f_{n + 2 k}(y) = \sum_{n=0}^\infty e^{-\lambda / 2} \frac{(\lambda / 2)^k}{k!} f_{n + 2 k}(y), \quad y \in (0, \infty)$ cual es el PDF de la distribución chi-cuadrada no central con$$n$$ grados de libertad y parámetro de no centralidad$$\lambda$$, derivado anteriormente.

Como sugieren los resultados asintóticos para la asimetría y curtosis, también hay un teorema de límite central.

Supongamos que$$Y$$ tiene la distribución chi-cuadrada no central con$$n \in (0, \infty)$$ grados de libertad y parámetro de no centralidad$$\lambda \in (0, \infty)$$. Entonces la distribución de la puntuación estándar$\frac{Y - (n + \lambda)}{\sqrt{2(n + 2 \lambda)}}$ converge a la distribución normal estándar como$$n \to \infty$$ o como$$\lambda \to \infty$$.

## Ejercicios Computacionales

Supongamos que se dispara un misil contra un objetivo en el origen de un sistema de coordenadas de plano, con unidades en metros. Los misiles aterrizan en$$(X, Y)$$ donde$$X$$ y$$Y$$ son independientes y cada uno tiene la distribución normal con media 0 y varianza 100. El misil destruirá el objetivo si aterriza a menos de 20 metros del objetivo. Encuentra la probabilidad de este evento.

Contestar

Dejar$$Z$$ denotar la distancia desde el misil hasta el objetivo. $$\P(Z \lt 20) = 1 - e^{-2} \approx 0.8647$$

Supongamos que$$X$$ tiene la distribución chi-cuadrada con$$n = 18$$ grados de libertad. Para cada una de las siguientes, compute el valor verdadero usando la calculadora de distribución especial y luego compute la aproximación normal. Compara los resultados.

1. $$\P(15 \lt X \lt 20)$$
2. El percentil 75 de$$X$$.
Contestar
1. $$\P(15 \lt X \lt 20) = 0.3252$$,$$\P(15 \lt X \lt 20) \approx 0.3221$$
2. $$x_{0.75} = 21.605$$,$$x_{0.75} \approx 22.044$$

This page titled 5.9: Chi-Cuadrado y Distribución Relacionada is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform.