Saltar al contenido principal

# 5.40: La distribución Zeta

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$
$$\newcommand{\P}{\mathbb{P}}$$$$\newcommand{\E}{\mathbb{E}}$$$$\newcommand{\var}{\text{var}}$$$$\newcommand{\skw}{\text{skew}}$$$$\newcommand{\kur}{\text{kurt}}$$$$\newcommand{\N}{\mathbb{N}}$$$$\newcommand{\R}{\mathbb{R}}$$$$\newcommand{\Li}{\text{Li}}$$

La distribución zeta se utiliza para modelar el tamaño o rangos de ciertos tipos de objetos elegidos aleatoriamente de ciertos tipos de poblaciones. Los ejemplos típicos incluyen la frecuencia de ocurrencia de una palabra elegida aleatoriamente de un texto, o el rango poblacional de una ciudad elegida aleatoriamente de un país. La distribución zeta también es conocida como la distribución Zipf, en honor al lingüista estadounidense George Zipf.

## Teoría Básica

### La función Zeta

La función zeta de Riemann$$\zeta$$, que lleva el nombre de Bernhard Riemann, se define de la siguiente manera:$\zeta(a) = \sum_{n=1}^\infty \frac{1}{n^a}, \quad a \in (1, \infty)$

Tal vez recuerde del cálculo que la serie en la función zeta converge para$$a \gt 1$$ y diverge para$$a \le 1$$.

La función zeta satisface las siguientes propiedades:

1. $$\zeta$$es decreciente.
2. $$\zeta$$es cóncavo hacia arriba.
3. $$\zeta(a) \downarrow 1$$como$$a \uparrow \infty$$
4. $$\zeta(a) \uparrow \infty$$como$$a \downarrow 1$$

La función zeta es trascendental, y la mayoría de sus valores deben ser aproximados. Sin embargo, se$$\zeta(a)$$ puede dar explícitamente para valores enteros pares de$$a$$; en particular,$$\zeta(2) = \frac{\pi^2}{6}$$ y$$\zeta(4) = \frac{\pi^4}{90}$$.

### La función de densidad de probabilidad

La distribución zeta con parámetro shape$$a \in (1, \infty)$$ es una distribución discreta$$\N_+$$ con función de densidad de probabilidad$$f$$ dada por. $f(n) = \frac{1}{\zeta(a) n^a}, \quad n \in \N_+$

1. $$f$$está disminuyendo con el modo$$n = 1$$.
2. Cuando se alisa,$$f$$ es cóncava hacia arriba.
Prueba

Claramente$$f$$ es un PDF válido, ya que por definición,$$\zeta(a)$$ es la constante normalizadora para la función$$n \mapsto \frac{1}{n^a}$$ on$$\N_+$$. La parte (a) es clara. Para la parte (b), tenga en cuenta que la función$$x \mapsto x^{-a}$$ on$$[1, \infty)$$ tiene una segunda derivada positiva.

Abra el simulador de distribución especial y seleccione la distribución zeta. Variar el parámetro shape y anotar la forma de la función de densidad de probabilidad. Para los valores seleccionados del parámetro, ejecute la simulación 1000 veces y compare la función de densidad empírica con la función de densidad de probabilidad.

La función de distribución y la función cuantil no tienen formas simples cerradas, excepto en términos de otras funciones especiales.

Abra la calculadora de distribución especial y seleccione la distribución zeta. Varíe el parámetro y anote la forma de las funciones de distribución y densidad de probabilidad. Para los valores seleccionados del parámetro, compute la mediana y el primer y tercer cuartiles.

### Momentos

Supongamos que$$N$$ tiene la distribución zeta con parámetro shape$$a \in (1, \infty)$$. Los momentos de se$$X$$ pueden expresar fácilmente en términos de la función zeta.

Si$$k \ge a - 1$$,$$\E(X) = \infty$$. Si$$k \lt a - 1$$,$\E\left(N^k\right) = \frac{\zeta(a - k)}{\zeta(a)}$

Prueba

Tenga en cuenta que$\E\left(N^k\right) = \sum_{n=1}^\infty n^k \frac{1}{\zeta(a) n^a} = \frac{1}{\zeta(a)} \sum_{n=1}^\infty \frac{1}{n^{a - k}}$ Si$$a - k \le 1$$, la última suma diverge a$$\infty$$. Si$$a - k \gt 1$$, la suma converge a$$\zeta(a - k)$$

La media y varianza de$$N$$ son las siguientes:

1. Si$$a \gt 2$$,$\E(N) = \frac{\zeta(a - 1)}{\zeta(a)}$
2. Si$$a \gt 3$$,$\var(N) = \frac{\zeta(a - 2)}{\zeta(a)} - \left(\frac{\zeta(a - 1)}{\zeta(a)}\right)^2$

Abra el simulador de distribución especial y seleccione la distribución zeta. Varíe el parámetro y anote la forma y ubicación de la barra de desviación$$\pm$$ estándar media. Para los valores seleccionados del parámetro, ejecute la simulación 1000 veces y compare la media empírica y la desviación estándar con la media de distribución y la desviación estándar.

La asimetría y curtosis de$$N$$ son las siguientes:

1. Si$$a \gt 4$$,$\skw(N) = \frac{\zeta(a - 3) \zeta^2(a) - 3 \zeta(a - 1) \zeta(a - 2) \zeta(a) + 2 \zeta^3(a - 1)}{[\zeta(a - 2) \zeta(a) - \zeta^2(a - 1)]^{3/2}}$
2. Si$$a \gt 5$$,$\kur(N) = \frac{\zeta(a - 4) \zeta^3(a) - 4 \zeta(a - 1) \zeta(a - 3) \zeta^2(a) + 6 \zeta^2(a - 1) \zeta(a - 2) \zeta(a) - 3 \zeta^4(a - 1)}{\left[\zeta(a - 2) \zeta(a) - \zeta^2(a - 1)\right]^2}$
Prueba

Estos resultados se derivan del resultado del momento general anterior y las fórmulas computacionales estándar para asimetría y curtosis.

La función generadora de probabilidad de se$$N$$ puede expresar en términos de la función polilogaritmo$$\Li$$ que se introdujo en la sección sobre la distribución exponencial-logarítmica. Recordemos que el polilogaritmo de orden$$s \in \R$$ está definido por$\Li_s(x) = \sum_{k=1}^\infty \frac{x^k}{k^s}, \quad x \in (-1, 1)$

$$N$$tiene la función de generación de probabilidad$$P$$ dada por$P(t) = \E\left(t^N\right) = \frac{\Li_a(t)}{\zeta(a)}, \quad t \in (-1, 1)$

Prueba

Tenga en cuenta que$\E\left(t^N\right) = \sum_{n=1}^\infty t^n \frac{1}{n^a \zeta(a)} = \frac{1}{\zeta(a)} \sum_{n=1}^\infty \frac{t^n}{n^a}$ La última suma es$$\Li_a(t)$$.

### Distribuciones Relacionadas

En un sentido algebraico, la distribución zeta es una versión discreta de la distribución de Pareto. Recordemos que si$$a \gt 1$$, la distribución de Pareto con parámetro shape$$a - 1$$ es una distribución continua$$[1, \infty)$$ con función de densidad de probabilidad$f(x) = \frac{a - 1}{x^a}, \quad x \in [1, \infty)$

Naturalmente, los límites de la distribución zeta con respecto al parámetro shape$$a$$ son de interés.

La distribución zeta con parámetro shape$$a \in (1, \infty)$$ converge a masa puntual en 1 as$$a \to \infty$$.

Prueba

Para el PDF$$f$$ anterior, tenga en cuenta que$$f(1) = \zeta(a) \to 1$$ como$$a \to \infty$$ y para$$n \in \{2, 3, \ldots\}$$,$$f(n) = 1 \big/ n^a \zeta(a) \to 0$$ como$$a \to \infty$$

Finalmente, la distribución zeta es un miembro de la familia de distribuciones exponenciales generales.

Supongamos que$$N$$ tiene la distribución zeta con parámetro$$a$$. Entonces la distribución es una familia exponencial de un parámetro con parámetro natural$$a$$ y estadística natural$$-\ln N$$.

Prueba

Esto se desprende de la definición de la distribución exponencial general, ya que el PDF zeta se puede escribir en la forma$f(n) = \frac{1}{\zeta(a)} \exp(-a \ln n), \quad n \in \N_+$

## Ejercicios Computacionales

Vamos a$$N$$ denotar la frecuencia de ocurrencia de una palabra elegida al azar a partir de un cierto texto, y supongamos que$$X$$ tiene la distribución zeta con parámetro$$a = 2$$. Encuentra$$\P(N \gt 4)$$.

Contestar

$$\P(N \gt 4) = 1 - \frac{49}{6 \pi^2} \approx 0.1725$$

Supongamos que$$N$$ tiene la distribución zeta con parámetro$$a = 6$$. Aproximar cada uno de los siguientes:

1. $$\E(N)$$
2. $$\var(N)$$
3. $$\skw(N)$$
4. $$\kur(N)$$
Contestar
1. $$\E(N) \approx 1.109$$
2. $$\var(N) \approx 0.025$$
3. $$\skw(N) \approx 11.700$$
4. $$\kur(N) \approx 309.19$$

This page titled 5.40: La distribución Zeta is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform.