10.3: La Función Cuantil

Última actualización
Guardar como PDF

Page ID: 150888

Paul Pfeiffer
Rice University

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

La función de cuantil

La función cuantil para una distribución de probabilidad tiene muchos usos tanto en la teoría como en la aplicación de la probabilidad. Si\(F\) es una función de distribución de probabilidad, la función cuantil puede usarse para “construir” una variable aleatoria que tiene\(F\) como función de distribuciones. Este hecho sirve como base de un método de simulación del “muestreo” a partir de una distribución arbitraria con la ayuda de un generador de números aleatorios. Además, dada cualquier clase finita

\(\{X_i: 1 \le i \le n\}\)de variables aleatorias, se\(\{Y_i: 1 \le i \le n\}\) puede construir una clase independiente,\(Y_i\) teniendo cada una\(X_i\) y asociadas la misma distribución (marginal). Las funciones cuantiles para variables aleatorias simples pueden ser utilizadas para obtener un importante teorema de aproximación de Poisson (que no desarrollamos en este trabajo). La función quantile se utiliza para derivar una serie de formas especiales útiles para la expectativa matemática.

Concepto general: propiedades y ejemplos

Si\(F\) es una función de distribución de probabilidad, la función cuantil asociada\(Q\) es esencialmente una inversa de\(F\). La función cuantil se define en el intervalo unitario (0, 1). Para\(F\) continuo y estrictamente creciente en\(t\), luego\(Q(u) = t\) iff\(F(t) = u\). Así, si\(u\) es un valor de probabilidad,\(t = Q(u)\) es el valor de\(t\) para el cual\(P(X \le t) = u\).

Ejemplo 10.3.28: La distribución de Weibull (3, 2, 0)

\(u = F(t) = 1 - e^{-3t^2}\)\(t \ge 0\)\(\Rightarrow\)\(t = Q(u) = \sqrt{-\text{ln } (1 - u)/3}\)

Ejemplo 10.3.29: La distribución normal

La función m-norminv, basada en la función erfinv de MATLAB (función de error inverso), calcula los valores de\(Q\) para la distribución normal.

La restricción al caso continuo no es esencial. Consideramos una definición general que se aplica a cualquier función de distribución de probabilidad.

Definición: Si\(F\) es una función que tiene las propiedades de una función de distribución de probabilidad, entonces la función quantile for\(F\) viene dada por

\(Q(u) = \text{inf } \{t: F(t) \ge u\}\)\(\forall u \in (0, 1)\)

Tomamos nota

Si\(F(t^{*}) \ge u^{*}\), entonces\(t^{*} \ge \text{inf } \{t: F(t) \ge u^{*}\} = Q(u^{*})\)
Si\(F(t^{*}) < u^{*}\), entonces\(t^{*} < \text{inf } \{t: F(t) \ge u^{*}\} = Q(u^{*})\)

De ahí que tengamos la propiedad importante:

(Q1)\(Q(u) \le t\) iff\(u \le F(t)\)\(\forall u \in (0, 1)\)

La propiedad (Q1) implica la siguiente propiedad importante:

(Q2) Si\(U\) ~ uniforme (0, 1), entonces\(X = Q(U)\) tiene función de distribución\(F_X = F\). Para ver esto, tenga en cuenta que\(F_X(t) = P(Q(U) \le t] = P[U \le F(t)] = F(t)\).

Propiedad (Q2) implica que si\(F\) es alguna función de distribución, con función cuantil\(Q\), entonces la variable aleatoria\(X = Q(U)\), con\(U\) uniformemente distribuida on (0, 1), tiene función de distribución\(F\).

Ejemplo 10.3.30: Clases independientes con distribuciones prescritas

Supongamos que\(\{X_i: 1 \le i \le n\}\) es una clase arbitraria de variables aleatorias con funciones de distribución correspondientes\(\{F_i : 1 \le i \le n\}\). \(\{Q_i: 1 \le i \le n\}\)Dejen ser las respectivas funciones cuantiles. Siempre hay un uniforme\(\{U_i: 1 \le i \le n\}\) iid de clase independiente (0, 1) (marginales para la distribución uniforme conjunta en la unidad hipercubo con lados (0, 1)). Entonces las variables aleatorias\(Y_i = Q_i (U_i)\)\(1 \le i \le n\),, forman una clase independiente con los mismos marginales que la\(X_i\).

Se pueden establecer otras propiedades importantes de la función cuantil.

Figura 10.3.9. Gráfico de la función cuantil a partir de la gráfica de la función de distribución,

\(Q\)es continuo a la izquierda, mientras que\(F\) es continuo a la derecha.

Si los saltos están representados por segmentos de línea vertical, la construcción de la gráfica de se\(u = Q(t)\) puede obtener mediante el siguiente procedimiento de dos pasos:

Invertir toda la figura (incluidos los ejes), luego
Gire la figura resultante 90 grados en sentido antihorario

Esto se ilustra en la Figura 10.3.9. Si los saltos están representados por segmentos de línea verticales, entonces los saltos van a segmentos planos y los segmentos planos van a segmentos verticales.

Si\(X\) es discreto con probabilidad\(p_i\) en\(t_i\)\(1 \le i \le n\), entonces\(F\) tiene saltos en la cantidad\(p_i\) en cada uno\(t_i\) y es constante entre. La función cuantil es una función de paso continuo a la izquierda que tiene valor\(t_i\) en el intervalo\((b_{i - 1}, b_i]\), donde\(b_0 = 0\) y\(b_i = \sum_{j = 1}^{i} p_j\). Esto se puede afirmar

Si\(F(t_i) = b_i\), entonces\(Q(u) = t_i\) para\(F(t_{i - 1}) < u \le F(t_i)\)

Ejemplo 10.2.31: Función cuantil para una variable aleatoria simple

Supongamos que la variable aleatoria simple\(X\) tiene distribución

\(X =\)[-2 0 1 3]\ (PX = [0.2 0.1 0.3 0.4]

La Figura 1 muestra una gráfica de la función de distribución\(F_X\). Se refleja en el eje horizontal luego se gira en sentido antihorario para dar la gráfica de\(Q(u\) versus\(u\).

Figura 10.3.10. Funciones de distribución y cuantiles para el Ejemplo 10.3.31.

Utilizamos la caracterización analítica anterior en el desarrollo de una serie de funciones m y procedimientos m.

m-procedimientos para una variable aleatoria simple

La base para los cálculos de función cuantil para una variable aleatoria simple es la fórmula anterior. Esto se implementa en la función m dquant, que se utiliza como elemento de varios procedimientos de simulación. Para trazar la función quantile, utilizamos dquanplot que emplea la función stairs y plot\(X\) vs la función de distribución\(FX\). El procedimiento dsample emplea dquant para obtener una “muestra” de una población con distribución simple y para calcular frecuencias relativas de los diversos valores.

Ejemplo 10.3.32: Variable aleatoria simple

X =  [-2.3 -1.1 3.3 5.4 7.1 9.8];
PX = 0.01*[18 15 23 19 13 12];
dquanplot
Enter VALUES for X  X
Enter PROBABILITIES for X  PX     % See Figure 10.3.11 for plot of results
rand('seed',0)                 % Reset random number generator for reference
dsample
Enter row matrix of values  X
Enter row matrix of probabilities  PX
Sample size n  10000

    Value      Prob    Rel freq
   -2.3000    0.1800    0.1805
   -1.1000    0.1500    0.1466
    3.3000    0.2300    0.2320
    5.4000    0.1900    0.1875
    7.1000    0.1300    0.1333
    9.8000    0.1200    0.1201
Sample average ex = 3.325
Population mean E[X] = 3.305
Sample variance = 16.32
Population variance Var[X] = 16.33

Figura 10.3.11. Función cuantil para el Ejemplo 10.3.32.

A veces es deseable saber cuántos ensayos se requieren para alcanzar un cierto valor, o uno de un conjunto de valores. Hay un par de procedimientos m disponibles para la simulación de ese problema. El primero se llama targetset. Se llama a la distribución de la población y luego a la designación de un “conjunto objetivo” de posibles valores. El segundo procedimiento, targetrun, pide el número de repeticiones del experimento, y pide que se alcance el número de miembros del objetivo establecido. Una vez realizadas las corridas, se calculan y muestran diversas estadísticas sobre las corridas.

Ejemplo 10.3.33

X = [-1.3 0.2 3.7 5.5 7.3];     % Population values
PX = [0.2 0.1 0.3 0.3 0.1];     % Population probabilities
E = [-1.3 3.7];                 % Set of target states
targetset
Enter population VALUES  X
Enter population PROBABILITIES  PX
The set of population values is
   -1.3000    0.2000    3.7000    5.5000    7.3000
Enter the set of target values  E
Call for targetrun

rand('seed',0)                  % Seed set for possible comparison
targetrun
Enter the number of repetitions  1000
The target set is
   -1.3000    3.7000
Enter the number of target values to visit  2
The average completion time is 6.32
The standard deviation is 4.089
The minimum completion time is 2
The maximum completion time is 30
To view a detailed count, call for D.
The first column shows the various completion times;
the second column shows the numbers of trials yielding those times
% Figure 10.6.4 shows the fraction of runs requiring t steps or less

Figura 10.3.12. Fracción de corridas que requieren\(t\) pasos o menos.

m-procedimientos para funciones de distribución

Un procedimiento dfsetup utiliza la función de distribución para establecer una distribución simple aproximada. El procedimiento m quanplot se utiliza para trazar la función quantile. Este procedimiento es esencialmente el mismo que dquanplot, excepto que se usa la función plot ordinaria en el caso continuo mientras que la función de trazado stairs se usa en el caso discreto. Se utiliza el procedimiento m qsample para obtener una muestra de la población. Dado que hay tantos valores posibles, estos no se muestran como en el caso discreto.

Ejemplo 10.3.34: Función cuantil asociada a una función de distribución

F = '0.4*(t + 1).*(t < 0) + (0.6 + 0.4*t).*(t >= 0)';  % String
dfsetup
Distribution function F is entered as a string
variable, either defined previously or upon call
Enter matrix [a b] of X-range endpoints  [-1 1]
Enter number of X approximation points  1000
Enter distribution function F as function of t  F
Distribution is in row matrices X and PX
quanplot
Enter row matrix of values  X
Enter row matrix of probabilities  PX
Probability increment h  0.01          % See Figure 10.3.13 for plot
qsample
Enter row matrix of X values  X
Enter row matrix of X probabilities  PX
Sample size n  1000
Sample average ex = -0.004146
Approximate population mean E(X) = -0.0004002     % Theoretical = 0
Sample variance vx = 0.25
Approximate population variance V(X) = 0.2664

Figura 10.3.13. Función cuantil para el Ejemplo 10.3.34.

m-procedimientos para funciones de densidad

Se utiliza un procedimiento m- acsetup para obtener la distribución aproximada simple. Esto es esencialmente lo mismo que el procedimiento tuappr, excepto que la función de densidad se ingresa como una variable de cadena. Entonces se utilizan los procedimientos quanplot y qsample como en el caso de las funciones de distribución.

Ejemplo 10.3.35: Función cuantil asociada a una función de densidad

acsetup
Density f is entered as a string variable.
either defined previously or upon call.
Enter matrix [a b] of x-range endpoints  [0 3]
Enter number of x approximation points  1000
Enter density as a function of t  '(t.^2).*(t<1) + (1- t/3).*(1<=t)'
Distribution is in row matrices X and PX
quanplot
Enter row matrix of values  X
Enter row matrix of probabilities  PX
Probability increment h  0.01               % See Figure 10.3.14 for plot
rand('seed',0)
qsample
Enter row matrix of values  X
Enter row matrix of probabilities  PX
Sample size n  1000
Sample average ex = 1.352
Approximate population mean E(X) = 1.361  % Theoretical = 49/36 = 1.3622
Sample variance vx = 0.3242
Approximate population variance V(X) = 0.3474    % Theoretical = 0.3474

Figura 10.3.14. Función cuantil para Ejemplo 10.3.35.