Loading [MathJax]/jax/output/HTML-CSS/jax.js
Saltar al contenido principal
Library homepage
 

Text Color

Text Size

 

Margin Size

 

Font Type

Enable Dyslexic Font
LibreTexts Español

10.2: La media muestral - Un estimador/ estimación

( \newcommand{\kernel}{\mathrm{null}\,}\)

Ilustremos la idea de la media muestral en términos de un experimento de volteo de monedas, en el que una moneda es volteadan veces. A diferencia de los casos anteriores, la moneda puede ser injusta, es decir, la probabilidad de cabezasθ,, puede no ser igual a1/2. Suponemos que no conocemos el valor deθ, y deseamos estimar aθ partir de los datos recopilados a través de volteretas den monedas. En otras palabras, se trata de un problema de estimación de parámetros, donde se encuentra el parámetro desconocidoθ. Si bien este capítulo sirve como requisito previo para los capítulos de subsecuencia sobre los métodos de Montecarlo -en los que aplicamos conceptos probabilísticos para calcular áreas y más generalmente integrales-, de hecho el capítulo actual se centra en cómo podríamos deducir parámetros físicos a partir de mediciones ruidosas. En definitiva, las estadísticas pueden aplicarse ya sea a cantidades físicas tratadas como variables aleatorias o a cantidades deterministas que se reinterpretan como aleatorias (o pseudoaleatorias).

Al igual que en el capítulo anterior, asociamos el resultado den flips con un vector aleatorio consistente en variables aleatorias de Bernoullin i.i.d.,(B1,B2,,Bn), donde cada unaBi toma el valor de 1 con probablemente deθ y 0 con probabilidad de1θ. Las variables aleatorias son i.i.d. porque el resultado de un flip es independiente de otro flip y estamos usando la misma moneda.

Definimos la media muestral de los volteos den monedas comoˉBn1nni=1Bi, que es igual a la fracción de volteretas que son cabezas. Debido a queˉBn es una transformación (es decir, suma) de variables aleatorias, también es una variable aleatoria. Intuitivamente, dado un gran número de volteos, “esperamos” que la fracción de volteos que son cabezas -la frecuencia de las cabezas- se acerque a la probabilidad de una cabeza,θ, porn suficientemente grande. Por esta razón, la media muestral es nuestro estimador en el contexto de la estimación de parámetros. Debido a que el estimador estima el parámetroθ, lo denotaremos porˆΘn, y viene dado porˆΘn=ˉBn=1nni=1Bi. Note que la media muestral es un ejemplo de una estadística -una función de una muestra que devuelva una variable aleatoria- que, en este caso, se pretende estimar la parámetroθ.

Deseamos estimar el parámetro a partir de una realización particular de volteos de monedas (es decir, una realización de nuestra muestra aleatoria). Para cualquier realización particular, calculamos nuestra estimación comoˆθn=ˆbn1nni=1bi, dóndebi está el resultado particular deli -ésimo giro. Es importante señalar que losbi,i=1,,n, son números, cada uno tomando el valor de 0 o 1. Así,ˆθn es un número y no una distribución (aleatoria). Resumamos las distinciones:

r.v.? Descripción
θ no Parámetro a estimar que gobierna el comportamiento de la distribución subyacente
ˆΘn si Estimador para el parámetroθ
ˆθn no Estimación para el parámetroθ obtenido de una realización particular de nuestra muestra

En general, cómoˆΘn se distribuye la variable aleatoria -en particular sobreθ - determina siˆΘn es un buen estimador para el parámetroθ. Un ejemplo de convergencia deˆθn aθ conn se muestra en la Figura 10.1. A medida quen aumenta,ˆθ convergeθ para esencialmente toda realización deBi's Esto se desprende del hecho de queˆΘn es un estimador imparcial deθ - un estimador cuyo esperado valor es igual al parámetro true. Esto lo probaremos en breve.

Para obtener una mejor comprensión del comportamiento deˆΘn, podemos construir la distribución empírica deˆΘn realizando una gran cantidad de experimentos para un dadon. Denotemos el número de

Screen Shot 2022-03-27 a las 8.53.26 PM.png
Figura 10.1: Convergencia de estimación conn una realización particular de volteretas de monedas.

experimentos pornexp. En el primer experimento, trabajamos con una realización(b1,b2,,bn)exp1 y obtenemos la estimación calculando la media, es decir, deexp1:(b1,b2,,bn)exp1ˉbexp1n=1nni=1(bi)exp1. manera similar, para el segundo experimento, trabajamos con una nueva realización para obtenerexp2:(b1,b2,,bn)exp2ˉbexp2n=1nni=1(bi)exp2. Repitiendo losnexp tiempos del procedimiento, finalmente obtenemos expnexp:(b1,b2,,bn)expnexpˉbexpnexpn=1nni=1(bi)expnexp.Observamos queˉbn puede tomar cualquier valork/n,k=0,,n. Podemos calcular la frecuencia deˉbn tomar un cierto valor, es decir, el número de experimentos que produceˉbn=k/n.

El resultado numérico de realizar 10,000 experimentos paran=2,10,100, y 1000 volteretas se muestran en la Figura 10.2. La distribución empírica deˆΘn espectáculos que conˆΘn mayor frecuencia toma los valores cercanos al parámetro subyacente aθ medida que aumenta el número de volteretasn,,. Así, el experimento numérico confirma que efectivamenteˆΘn es un buen estimador deθ sin es suficientemente grande.

Habiendo visto que nuestra estimación converge al parámetro verdaderoθ en la práctica, ahora analizaremos el comportamiento de convergencia con el parámetro verdadero relacionando la media de la muestra con una distribución binomial. Recordemos, que la distribución binomial representa el número de cabezas obtenidas al voltear una monedan veces, es decir, siZnB(n,θ), entoncesZn=ni=1Bi, dondeBi,i=1,,n, son la variable aleatoria de Bernoulli i.d., que representa el resultado de los volteos de monedas (teniendo cada uno el probabilidad de cabeza deθ). La distribución binomial y la media muestral se relacionan porˆΘn=1nZn

Screen Shot 2022-03-27 a las 8.54.36 PM.png

(a)n=2

Screen Shot 2022-03-27 a las 8.54.44 PM.png

b)n=10

Screen Shot 2022-03-27 a las 8.54.54 PM.png

c)n=100

Screen Shot 2022-03-27 a las 8.55.02 PM.png

d)n=1000

Figura 10.2: Distribución empírica deˆΘn paran=2,10,100, y 1000 yθ=1/2 obtenida de 10,000 experimentos.

La media (un parámetro determinista) de la media muestral (una variable aleatoria) esE[ˆΘn]=E[1nZn]=1nE[Zn]=1n(nθ)=θ. En otras palabras,ˆΘn es un estimador imparcial deθ. La varianza de la mediaVar[ˆΘn]=E[(ˆΘnE[ˆΘn])2]=E[(1nZn1nE[Zn])2]=1n2E[(ZnE[Zn])2]=1n2Var[Zn]=1n2nθ(1θ)=θ(1θ)n. muestral es La desviación estándar deˆΘn esσˆΘn=Var[ˆΘn]=θ(1θ)n. Así, la desviación estándar deˆΘn disminuye conn, y en particular tiende a cero as1/n. Esto implica queˆΘnθ comon debido a que es muy poco probable queˆΘn va a tomar en un valor muchas desviaciones estándar alejadas de la media. En otras palabras, el estimador converge al parámetro verdadero con el número de volteos.


This page titled 10.2: La media muestral - Un estimador/ estimación is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Masayuki Yano, James Douglass Penn, George Konidaris, & Anthony T Patera (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform.

Support Center

How can we help?