10.2: La media muestral - Un estimador/ estimación
( \newcommand{\kernel}{\mathrm{null}\,}\)
Ilustremos la idea de la media muestral en términos de un experimento de volteo de monedas, en el que una moneda es volteadan veces. A diferencia de los casos anteriores, la moneda puede ser injusta, es decir, la probabilidad de cabezasθ,, puede no ser igual a1/2. Suponemos que no conocemos el valor deθ, y deseamos estimar aθ partir de los datos recopilados a través de volteretas den monedas. En otras palabras, se trata de un problema de estimación de parámetros, donde se encuentra el parámetro desconocidoθ. Si bien este capítulo sirve como requisito previo para los capítulos de subsecuencia sobre los métodos de Montecarlo -en los que aplicamos conceptos probabilísticos para calcular áreas y más generalmente integrales-, de hecho el capítulo actual se centra en cómo podríamos deducir parámetros físicos a partir de mediciones ruidosas. En definitiva, las estadísticas pueden aplicarse ya sea a cantidades físicas tratadas como variables aleatorias o a cantidades deterministas que se reinterpretan como aleatorias (o pseudoaleatorias).
Al igual que en el capítulo anterior, asociamos el resultado den flips con un vector aleatorio consistente en variables aleatorias de Bernoullin i.i.d.,(B1,B2,…,Bn), donde cada unaBi toma el valor de 1 con probablemente deθ y 0 con probabilidad de1−θ. Las variables aleatorias son i.i.d. porque el resultado de un flip es independiente de otro flip y estamos usando la misma moneda.
Definimos la media muestral de los volteos den monedas comoˉBn≡1nn∑i=1Bi, que es igual a la fracción de volteretas que son cabezas. Debido a queˉBn es una transformación (es decir, suma) de variables aleatorias, también es una variable aleatoria. Intuitivamente, dado un gran número de volteos, “esperamos” que la fracción de volteos que son cabezas -la frecuencia de las cabezas- se acerque a la probabilidad de una cabeza,θ, porn suficientemente grande. Por esta razón, la media muestral es nuestro estimador en el contexto de la estimación de parámetros. Debido a que el estimador estima el parámetroθ, lo denotaremos porˆΘn, y viene dado porˆΘn=ˉBn=1nn∑i=1Bi. Note que la media muestral es un ejemplo de una estadística -una función de una muestra que devuelva una variable aleatoria- que, en este caso, se pretende estimar la parámetroθ.
Deseamos estimar el parámetro a partir de una realización particular de volteos de monedas (es decir, una realización de nuestra muestra aleatoria). Para cualquier realización particular, calculamos nuestra estimación comoˆθn=ˆbn≡1nn∑i=1bi, dóndebi está el resultado particular deli -ésimo giro. Es importante señalar que losbi,i=1,…,n, son números, cada uno tomando el valor de 0 o 1. Así,ˆθn es un número y no una distribución (aleatoria). Resumamos las distinciones:
r.v.? | Descripción | |
---|---|---|
θ | no | Parámetro a estimar que gobierna el comportamiento de la distribución subyacente |
ˆΘn | si | Estimador para el parámetroθ |
ˆθn | no | Estimación para el parámetroθ obtenido de una realización particular de nuestra muestra |
En general, cómoˆΘn se distribuye la variable aleatoria -en particular sobreθ - determina siˆΘn es un buen estimador para el parámetroθ. Un ejemplo de convergencia deˆθn aθ conn se muestra en la Figura 10.1. A medida quen aumenta,ˆθ convergeθ para esencialmente toda realización deBi's Esto se desprende del hecho de queˆΘn es un estimador imparcial deθ - un estimador cuyo esperado valor es igual al parámetro true. Esto lo probaremos en breve.
Para obtener una mejor comprensión del comportamiento deˆΘn, podemos construir la distribución empírica deˆΘn realizando una gran cantidad de experimentos para un dadon. Denotemos el número de

experimentos pornexp. En el primer experimento, trabajamos con una realización(b1,b2,…,bn)exp1 y obtenemos la estimación calculando la media, es decir, deexp1:(b1,b2,…,bn)exp1⇒ˉbexp1n=1nn∑i=1(bi)exp1. manera similar, para el segundo experimento, trabajamos con una nueva realización para obtenerexp2:(b1,b2,…,bn)exp2⇒ˉbexp2n=1nn∑i=1(bi)exp2. Repitiendo losnexp tiempos del procedimiento, finalmente obtenemos expnexp:(b1,b2,…,bn)expnexp⇒ˉbexpnexpn=1nn∑i=1(bi)expnexp.Observamos queˉbn puede tomar cualquier valork/n,k=0,…,n. Podemos calcular la frecuencia deˉbn tomar un cierto valor, es decir, el número de experimentos que produceˉbn=k/n.
El resultado numérico de realizar 10,000 experimentos paran=2,10,100, y 1000 volteretas se muestran en la Figura 10.2. La distribución empírica deˆΘn espectáculos que conˆΘn mayor frecuencia toma los valores cercanos al parámetro subyacente aθ medida que aumenta el número de volteretasn,,. Así, el experimento numérico confirma que efectivamenteˆΘn es un buen estimador deθ sin es suficientemente grande.
Habiendo visto que nuestra estimación converge al parámetro verdaderoθ en la práctica, ahora analizaremos el comportamiento de convergencia con el parámetro verdadero relacionando la media de la muestra con una distribución binomial. Recordemos, que la distribución binomial representa el número de cabezas obtenidas al voltear una monedan veces, es decir, siZn∼B(n,θ), entoncesZn=n∑i=1Bi, dondeBi,i=1,…,n, son la variable aleatoria de Bernoulli i.d., que representa el resultado de los volteos de monedas (teniendo cada uno el probabilidad de cabeza deθ). La distribución binomial y la media muestral se relacionan porˆΘn=1nZn
(a)n=2
b)n=10
c)n=100
d)n=1000
Figura 10.2: Distribución empírica deˆΘn paran=2,10,100, y 1000 yθ=1/2 obtenida de 10,000 experimentos.
La media (un parámetro determinista) de la media muestral (una variable aleatoria) esE[ˆΘn]=E[1nZn]=1nE[Zn]=1n(nθ)=θ. En otras palabras,ˆΘn es un estimador imparcial deθ. La varianza de la mediaVar[ˆΘn]=E[(ˆΘn−E[ˆΘn])2]=E[(1nZn−1nE[Zn])2]=1n2E[(Zn−E[Zn])2]=1n2Var[Zn]=1n2nθ(1−θ)=θ(1−θ)n. muestral es La desviación estándar deˆΘn esσˆΘn=√Var[ˆΘn]=√θ(1−θ)n. Así, la desviación estándar deˆΘn disminuye conn, y en particular tiende a cero as1/√n. Esto implica queˆΘn→θ comon→∞ debido a que es muy poco probable queˆΘn va a tomar en un valor muchas desviaciones estándar alejadas de la media. En otras palabras, el estimador converge al parámetro verdadero con el número de volteos.