Saltar al contenido principal

# 4.5: Sesgo en estudios estadísticos

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

En la última selección discutimos cómo los métodos de muestreo no probabilístico a menudo no crean una muestra representativa que sea necesaria para sacar conclusiones significativas. Estos métodos suelen crear dos tipos de sesgo.

## Sesgo de selección

El sesgo de selección ocurre cuando el método de muestreo no crea una muestra representativa para el estudio. El sesgo de selección ocurre frecuentemente cuando se utiliza muestreo de conveniencia.

Ejemplo: Cuota de biblioteca

Un colegio comunitario propone aumentar la cuota estudiantil en \$5.00 con el fin de crear más horas de apertura para la biblioteca. Se realizó una encuesta por parte de varios estudiantes investigadores para ver si había apoyo para esta tarifa. Los investigadores se pararon en la parte central del campus cerca de la biblioteca y seleccionaron a los estudiantes para su muestra mientras pasaban por allí. Los estudiantes sólo fueron muestreados durante las horas matutinas.

Esta es una muestra de conveniencia y probablemente no representativa para este estudio. Los estudiantes muestrearon solo estudiantes diurnos, excluyendo a los estudiantes nocturnos que tienen menos probabilidades de usar la biblioteca. Algunos estudiantes excluidos solo toman clases en línea y no usan la biblioteca. Por último, la encuesta se realizó cerca de la biblioteca, por lo que es más probable que la muestra contuviera usuarios de la biblioteca, quienes probablemente serían más propensos a apoyar servicios agregados. Este es un claro ejemplo de sesgo de selección.

## Sesgo de autoselección

El sesgo de autoselección ocurre cuando los individuos pueden ser voluntarios para formar parte del estudio, el método de muestreo autoseleccionado no probabilístico discutido anteriormente. Los voluntarios suelen tener una opinión más fuerte sobre la cuestión de investigación y por lo general no serán representativos de la población.

Muchos congresistas intentarán utilizar encuestas en línea para generar apoyo para su posición. Aquí hay un ejemplo durante el intento de 2017 de derogar la Ley de Cuidado de Salud Asequible (ObamaCare).

La diputada Marsha Blackburn (R‐Tenn.) publicó el martes una encuesta en Twitter para recibir comentarios sobre la derogación propuesta por los republicanos de ObamaCare. Sin embargo, resulta que la mayoría de los usuarios de Twitter que votaron recomendaron mantener vigente la ley de atención médica.

Si bien Blackburn podría haber esperado escuchar solo de su distrito de Tennessee —que fácilmente la reeligió en noviembre—, pronto encontró que la encuesta estaba inundada de votos en contra de una derogación de ObamaCare.

El sondeo de Blackburn, miembro del equipo de transición del presidente electo Trump, recibió 7.968 votos, con 84 por ciento oponiéndose a la derogación de ObamaCare. El lado de los oponentes de la derogación probablemente fue ayudado por un retweet del portavoz de la Casa Blanca, Eric Schultz. 59

El 84% de los encuestados no apoyó la derogación de ObamaCare, porcentaje muy superior al que se muestra en encuestas realizadas correctamente. Los partidarios de la Ley del Cuidado de Salud a Bajo Precio podrían alentar a otros a votar en la encuesta. Además, una encuesta en Twitter nunca va a ser representativa ya que la población muestreada es solo usuarios de Twitter. También es sesgada la redacción de la pregunta, fenómeno que se explorará más adelante en este apartado.

El sesgo también ocurre cuando una encuesta o encuesta produce resultados que no reflejan las verdaderas opiniones o creencias de la población en general. Esto suele ser resultado de los métodos utilizados para realizar la encuesta o de la redacción de las preguntas formuladas. 60

## Sesgo sin respuesta

El sesgo de no respuesta ocurre cuando las personas son excluidas intencionalmente o no intencionadamente de la participación o eligen no participar en una encuesta o encuesta. A veces la gente también le mentirá a los encuestadores.

Un ejemplo reciente de probable sesgo de no respuesta ocurrió durante las elecciones presidenciales de 2016 donde, en las que cada encuesta mostraba a Hillary Clinton ganando las elecciones sobre Donald Trump. A pesar de que Clinton ganó el voto popular, Trump ganó el voto electoral y la presidencia. 61

El Pew Center Research realizó una automortem de las encuestas electorales y señaló un probable sesgo de no respuesta:

Un probable culpable es lo que los encuestadores se refieren como sesgo de no respuesta. Esto ocurre cuando ciertos tipos de personas sistemáticamente no responden a encuestas a pesar del alcance de igualdad de oportunidades a todas las partes del electorado. Sabemos que algunos grupos —incluidos los votantes menos educados que fueron un grupo demográfico clave para Trump el día de las elecciones— son consistentemente difíciles de alcanzar para los encuestadores. Es posible que la frustración y los sentimientos antiinstitucionales que impulsaron la campaña de Trump también se hayan alineado con una falta de voluntad para responder a las encuestas. El resultado sería un segmento fuertemente pro-Trump de la población que simplemente no se presentó en las encuestas en proporción a su participación real de la población.

Algunos también han sugerido que muchos de los que fueron encuestados simplemente no fueron honestos sobre a quién pretendían votar. La idea de los llamados “tímidos Trumpers” sugiere que el apoyo a Trump era socialmente indeseable, y que sus partidarios no estaban dispuestos a admitir su apoyo a los encuestadores. Esta hipótesis recuerda al supuesto “efecto Bradley”, cuando el demócrata Tom Bradley, el alcalde negro de Los Ángeles, perdió la elección para gobernador de California de 1982 ante el republicano George Deukmejian a pesar de haber estado a la vanguardia en las encuestas, supuestamente porque los votantes se mostraron reacios a decirle a los entrevistadores que no iban a votar por un candidato negro.

El análisis de Pew mostró tres posibles fuentes de sesgo de no respuesta. Primero, puede haber sido más difícil llegar a los partidarios de Trump. Segundo, los partidarios de Trump, pueden ser menos honestos con los encuestadores. Finalmente, los encuestadores pueden haber identificado incorrectamente a los posibles votantes, lo que significa que los votantes de Trump fueron submuestreados

## Sesgo de respuesta

Las respuestas ocurren cuando las respuestas a una encuesta están influenciadas por la forma en que se hace la pregunta, o cuando las respuestas no reflejan la verdadera opinión del encuestado. Al realizar una encuesta o sondeo, el tipo, orden y redacción de las preguntas son consideraciones importantes. Las preguntas mal redactadas pueden invalidar los resultados de una encuesta.

Las preguntas deben hacerse de una manera equilibrada.

Considera las preguntas:

“¿Sientes que el costo creciente del proyecto ferroviario de alta velocidad es demasiado caro para California?”

“¿Sientes que el tren de alta velocidad será importante para la futura economía de California?”

“¿Aprueba o desaprueba la construcción de un sistema ferroviario de alta velocidad en California?”

La primera pregunta alienta a la gente a oponerse al tren de alta velocidad por el gasto. La segunda pregunta alienta a las personas a apoyar el tren de alta velocidad para apoyar la economía. La tercera pregunta simplemente plantea la opinión de la gente sin el sesgo principal.

Volvamos al ejemplo de encuesta de Twitter en el que Marsha Blackburn, opositora de la Ley del Cuidado de Salud Asequible, pidió a los seguidores que votaran sobre la pregunta: “¿Apoya la derogación del Obamacare? [Retwitea] si lo haces, y comparte lo que quieras ver como el reemplazo”.

Hay muchas fuentes de sesgo en esta pregunta. Primero, apoyar una derogación suena como apoyar, la postura más positiva. En segundo lugar, muchas encuestas han demostrado que el uso de las palabras “Obamacare” en lugar de “Ley del Cuidado de Salud Asequible” fomentará el apoyo para la derogación. Por último, la última parte de la pregunta es alentar a las personas a tomar medidas si apoyan la derogación.

Las preguntas no deben ser vagas.

Por ejemplo, la pregunta “¿Qué le pasa a la economía?” es vago. No está claro qué trata de determinar la pregunta.

Aquí algunas preguntas de encuestas y encuestas recientes sobre el matrimonio entre personas del mismo sexo. Discutir los temas de sesgo y equidad en estas preguntas:

¿Deberían los estados seguir discriminando a las parejas que quieren casarse y que son del mismo género?

¿Deberían obligarse a los estados a legalizar el matrimonio homosexual por los deseos de la mayoría de la gente?

¿Crees que los matrimonios entre parejas del mismo sexo deben o no ser reconocidos por la ley como válidos, con los mismos derechos que los matrimonios tradicionales?

Dar información explicativa a las personas puede cambiar sus opiniones

Se debe tener cuidado al proporcionar información explicativa sobre un tema; sin embargo, no proporcionar información también puede dar lugar a resultados engañosos. Por ejemplo, es posible que desee preguntar a las personas si apoyan el programa CHIP. La mayoría de la gente no tiene idea de qué es el programa CHIP, por lo que se necesita alguna explicación. A continuación se agrega el idioma: “El Programa de Seguro Médico Infantil (CHIP) es un programa administrado por el gobierno federal cuyo objetivo es ayudar a los estados a brindar seguros de salud a familias con hijos que estaban justo por encima del umbral económico de Medicaid”.

Ejemplo: Ayuda a Puerto Rico tras el huracán María

El 20 de septiembre de 2017, el huracán María causó daños catastróficos al territorio estadounidense de Puerto Rico. Esto se produjo poco después de que otros dos huracanes importantes azotaran a Estados Unidos, causando importantes daños en Texas y Florida.

No obstante, el apoyo público inicial a Puerto Rico parecía menor que el de Florida o Texas. Una encuesta a 2200 adultos estadounidenses realizada por Morning Consult mostró que solo 54% de los estadounidenses sabía que Puerto Rico era parte de Estados Unidos. 63

La encuesta luego dividió la muestra en dos grupos para responder a la pregunta “¿Debería Puerto Rico recibir ayuda gubernamental adicional para ayudar a reconstruir el territorio?” Al primer grupo no se le dio información sobre la ciudadanía puertorriqueña y 64% apoyó la prestación de ayuda. Al segundo grupo se le dijo por primera vez que los puertorriqueños eran ciudadanos estadounidenses, y el apoyo a la ayuda aumentó a 68%.

En conclusión, la redacción de las encuestas o proporcionar información adicional puede llevar a resultados sesgados y se debe tener cuidado para que la redacción de las preguntas sea clara y equilibrada.

This page titled 4.5: Sesgo en estudios estadísticos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform.