Saltar al contenido principal

# 6.4: Sesgo de muestreo

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

Objetivos de aprendizaje

• Reconocer sesgo de muestreo
• Distinguir entre sesgo de autoselección, sesgo de subcobertura y sesgo de supervivencia

Las descripciones de diversos tipos de muestreo, como el muestreo aleatorio simple y el muestreo aleatorio estratificado, se cubren en otra sección. Esta sección analiza varios tipos de sesgos de muestreo, incluyendo sesgo de autoselección y sesgo de supervivencia. También se darán ejemplos de otros sesgos de muestreo que no se categorizan fácilmente.

Es importante tener en cuenta que el sesgo de muestreo se refiere al método de muestreo, no a la muestra en sí. No hay garantía de que el muestreo aleatorio resulte en una muestra representativa de la población al igual que no todas las muestras obtenidas mediante un método de muestreo sesgado serán en gran medida no representativas de la población.

## Sesgo de autoselección

Imagínese que un periódico universitario publicara un anuncio pidiendo que los estudiantes se ofrezcan como voluntarios para un estudio en el que se discutirían detalles íntimos de su vida sexual. Claramente la muestra de estudiantes que se ofrecerían como voluntarios para tal estudio no sería representativa de los estudiantes de la universidad. De igual manera, una encuesta en línea sobre el uso de computadoras es probable que atraiga a personas más interesadas en la tecnología de lo típico. En ambos ejemplos, es probable que las personas que se “autoseleccionan” para el experimento difieran de manera importante de la población sobre la que el experimentador desea sacar conclusiones. Muchas de las encuestas sin duda “no científicas” realizadas en televisión o sitios web sufren mucho de sesgo de autoselección.

Un sesgo de autoselección puede resultar cuando el componente no aleatorio ocurre después de que el sujeto potencial se haya alistado en el experimento. Considerando nuevamente el hipotético experimento en el que se les va a pedir a los sujetos detalles íntimos de su vida sexual, asumir que los sujetos no sabían de qué iba a ser el experimento hasta que se presentaron.Muchos de los sujetos probablemente entonces abandonarían el experimento dando como resultado una muestra sesgada.

## Sesgo de cobertura insuficiente

Un tipo común de sesgo muestral es muestrear muy pocas observaciones de un segmento de la población. Un ejemplo comúnmente citado de subcobertura es la encuesta realizada por el Literary Digest en la$$1936$$ que indicaba que Landon ganaría una elección contra Roosevelt por un amplio margen cuando, de hecho, fue Roosevelt quien ganó por un amplio margen. Una explicación común es que las personas más pobres estaban encubiertas porque tenían menos probabilidades de tener teléfonos y que este grupo era más probable que apoyara a Roosevelt.

Un análisis detallado de Squire ($$1988$$) mostró que no fue solo un sesgo de subcobertura lo que resultó en la predicción defectuosa de los resultados electorales. Concluyó que, además de la subcobertura descrita anteriormente, existía un sesgo de falta de respuesta (una forma de sesgo de autoselección) tal que quienes favorecían a Landon tenían más probabilidades de devolver su encuesta que los que favorecían a Roosevelt.

## Sesgo de supervivencia

El sesgo de supervivencia ocurre cuando las observaciones registradas al final de la investigación son un conjunto no aleatorio de las presentes al inicio de la investigación. Las ganancias en fondos de acciones es un área en la que el sesgo de supervivencia a menudo juega un papel importante. El problema básico es que los fondos de bajo rendimiento a menudo se eliminan o se fusionan en otros fondos. Supongamos que se considera una muestra de fondos de acciones que existen en el presente y luego se calcula la apreciación media$$10$$ anual de esos fondos. ¿Pueden generalizarse válidamente estos resultados a otros fondos bursátiles del mismo tipo? El problema es que no se incluyen los fondos bursátiles de bajo rendimiento que aún no existen (no sobrevivieron durante$$10$$ años) y por lo tanto existe un sesgo hacia la selección de fondos con mejores resultados. Hay buena evidencia de que este sesgo de supervivencia es sustancial (Malkiel,$$1995$$).

En la Segunda Guerra Mundial, el estadístico Abraham Wald analizó la distribución de impactos de disparos antiaéreos en aviones que regresaban de misiones. La idea era que esta información sería útil para decidir dónde colocar armaduras adicionales. Un enfoque ingenuo sería poner armaduras en lugares que frecuentemente fueron golpeados para reducir el daño allí. Sin embargo, esto ignoraría el sesgo de supervivencia que ocurre porque solo regresa un subconjunto de aviones. El enfoque de Wald fue lo contrario: si hubo pocos impactos en cierto lugar en los aviones que regresaban, entonces los impactos en ese lugar probablemente derribarían un avión. Por lo tanto, recomendó que a las ubicaciones sin impactos en los aviones que regresaban se les diera armadura extra. Una descripción detallada y matemática de la obra de Wald se puede encontrar en Mangel y Samaniego ($$1984$$.)

## Referencias

1. Malkiel, B. G. (1995) Rentabilidad de invertir en fondos mutuos de capital 1971 a 1991. La Revista de Finanzas, 50, 549-572.
2. Mangel, M. & Samaniego, F. J. (1984) El trabajo de Abraham Wald sobre la supervivencia de los aviones. Revista de la Asociación Americana de Estadística, 79, 259-267.
3. Escudero, P. (1988) Por qué falló la encuesta de 1936 Literary Digest. Opinión Pública Trimestral, 52, 125-133.

This page titled 6.4: Sesgo de muestreo is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform.