1.6: Sesgo
- Page ID
- 121618
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
Después de leer este capítulo, podrás hacer lo siguiente:
- Definir sesgo y diferenciarlo del error aleatorio
- Diferenciar entre los diferentes tipos de sesgo comunes a los estudios epidemiológicos, y proporcionar ejemplos ilustrativos de cada
Como aprendimos en el capítulo anterior, el error aleatorio existe en todos los estudios, porque existe hasta cierto punto en todas las mediciones. Se utilizan métodos estadísticos estándar para cuantificar el error aleatorio y el papel que puede o no haber jugado en la interpretación de los resultados de un estudio. Los errores aleatorios no se pueden eliminar por completo, y al interpretar correctamente los valores p y los intervalos de confianza (CI), podemos colocar nuestros resultados en el contexto apropiado.
El sesgo, por otro lado, se refiere a errores sistemáticos, es decir, que afectan desproporcionadamente a los datos en una sola dirección, así que, por ejemplo, siempre subestimamos o sobreestimaríamos siempre al cortar las 6 cucharadas de mantequilla para nuestro pastel (ver capítulo 5). Existen muchas fuentes potenciales de sesgo en los estudios epidemiológicos; aquí cubriremos algunas de las más comunes. Al igual que con el error aleatorio, todos los estudios contienen cierto grado de sesgo, y al igual que con el error aleatorio, hacemos nuestro mejor esfuerzo para minimizarlo. La diferencia es que los métodos estadísticos no pueden ayudarnos con el sesgo.
El sesgo da como resultado una medida calculada de asociación que está por encima o por debajo de lo que “debería” ser, porque nuestros datos estaban sesgados en una dirección u otra. Es imposible conocer la magnitud del sesgo o incluso la dirección. ¿Sobreestimamos o subestimamos la relación de riesgo (RR)? ¿Por cuánto? Nunca sabremos las respuestas a estas preguntas, pero al pensar en direcciones probables de errores sistemáticos (por ejemplo, las personas suelen sobreestimar cuánto ejercicio obtienen), a menudo podemos hacer conjeturas educadas sobre la dirección de un sesgo y quizás también su magnitud. Pero sólo son conjeturas.
El sesgo se puede minimizar con el diseño correcto del estudio y las técnicas de medición, pero nunca se puede omitir por completo. Todos los estudios tienen sesgos porque los humanos están involucrados, y los humanos son inherentemente sesgados. i Los buenos científicos reflexionarán sobre las posibles fuentes de sesgo durante las fases de planificación del estudio, trabajando para minimizarlas. También harán una valoración honesta del sesgo residual al final de un estudio y lo discutirán en la sección de limitaciones de la sección de discusión de un artículo (ver apéndice 1).
Validez interna versus externa
El sesgo puede afectar tanto la validez interna como la validez externa de un estudio. El primero es un tema mucho más grave. La validez interna se refiere al funcionamiento interno de un estudio: ¿Se utilizó el mejor diseño? ¿Se midieron las variables de manera razonable? ¿Los autores realizaron el conjunto correcto de análisis? Obsérvese que aunque no podemos medir ni cuantificar la validez interna, la comprensión de la epidemiología y la bioestadística permite una valoración cualitativa. Podemos creer los resultados de un estudio que parece ser válido internamente. Un estudio que tiene grandes problemas metodológicos, sin embargo, carece de validez interna, y probablemente no deberíamos aceptar los resultados.
Si un estudio carece de validez interna, deténgase. Rara vez es necesario evaluarlo más a fondo. Por otro lado, si un estudio parece tener validez interna, entonces evaluamos la validez externa, o generalizabilidad. La validez externa se refiere a qué tan bien podrían aplicarse los resultados de este estudio en particular a la población mayor. Recordemos del capítulo 1 que la población objetivo es el grupo sobre el que deseamos decir algo, utilizando datos recopilados de nuestra muestra. Ocasionalmente, encontramos un estudio que es internamente válido —es decir, se realizó de una manera completamente correcta— pero por alguna razón, la muestra no es suficientemente representativa de la población objetivo. Por ejemplo, durante mi trabajo de tesis, utilicé datos de cohortes para estimar los efectos de la actividad física materna durante el embarazo en diversos resultados de parto. ii Los datos provinieron de una gran cohorte de embarazo e incluyeron datos sobre cientos de exposiciones y docenas de resultados. iii Los criterios de inclusión fueron indulgentes: todas las mujeres embarazadas con un feto único que planeaban dar a luz en un determinado hospital eran elegibles. Al igual que encontramos en la población general, las embarazadas de esta cohorte fueron en su mayoría sedentarias. ii, iv
En algunos trabajos más recientes, estaba viendo específicamente la actividad física durante el embarazo como la única exposición; así, mi anuncio para reclutar mujeres en el estudio mencionó que estaba estudiando el ejercicio en el embarazo (más que el embarazo en general). [1] En este estudio más reciente, tuve muy pocas personas sedentarias, de hecho, ¡tengo algunas que reportaron correr medias maratones durante el embarazo! Como esto no es normal, mi estudio —aunque tiene una validez interna razonable— no puede generalizarse a todas las mujeres embarazadas sino solo a la subpoblación de ellas que realizan un poco de actividad física justa. Carece de validez externa. Debido a que tiene buena validez interna, puedo generalizar los resultados a mujeres embarazadas altamente activas, pero no a todas las mujeres embarazadas.
Representatividad de las muestras
Si se tiene una muestra que no es representativa de la población subyacente, esto afecta la validez externa. El grado en que esto es una preocupación, sin embargo, depende de la pregunta de investigación. Preguntas que se aplican principalmente a la biología (p. ej., ¿las estatinas reducen los niveles de colesterol sérico?) no necesariamente requieren muestras representativas, porque la fisiología no suele variar en gran medida entre personas con diferentes características demográficas (las diferencias por sexo son la única excepción): mi cuerpo probablemente procesa las estatinas de una manera casi idéntica a la de la mayoría de las demás mujeres. Sin embargo, cuando la pregunta de investigación involucra el comportamiento, entonces debemos estar muy preocupados por la representatividad, porque el comportamiento varía mucho según la demografía y el contexto social. Así, “¿Las estatinas bajan los niveles de colesterol sérico?” es una pregunta muy diferente a “Si le recetas estatinas a personas con colesterol alto, ¿vivirán más tiempo?” ya que este último requiere comportamiento tanto por parte del médico (proporcionar la prescripción) como de la parte del paciente (llenar la receta y luego tomar el medicamento según las indicaciones).
La Figura 6-1 ilustra la diferencia entre validez interna y validez externa. Esto usa el diagrama de cohortes, pero el mismo principio se aplica a todos los diseños de estudio:
Sesgo de selección
El sesgo de selección puede afectar la validez interna o externa de un estudio. El ejemplo anterior sobre el ejercicio en el embarazo (donde tuve una muestra no representativa de la población) es el tipo de sesgo de selección que afecta la validez externa: mis resultados son generalizables solo al subconjunto de la población de la que realmente se extrajo mi muestra y no a toda la población. Este tipo de sesgo de selección no es ideal, pero uno puede recuperarse fácilmente simplemente estrechando la población objetivo a la que se aplicarán los resultados. Preguntando “¿A quién obtuvieron los investigadores? ¿A quién extrañaron?” ayudará a evaluar el alcance del sesgo general de selección.
En otros casos, el sesgo de selección puede afectar la validez interna. Esto es mucho peor, ya que los resultados de ese estudio no se pueden aplicar a nadie, porque tiene fallas fundamentales. El sesgo de selección que afecta negativamente a la validez interna ocurre cuando los grupos expuestos y no expuestos (para un estudio de cohorte) o los grupos enfermos y no enfermos (para un estudio de casos y controles) no se extraen de la misma población. Por ejemplo, en un estudio de actividad física materna y resultados laborales, vi el grupo “activo” fue reclutado de una clase de ejercicio prenatal, pero el grupo “sedentario” fue reclutado en clínicas de atención prenatal. En la medida en que las personas que voluntariamente optan por pagar y asistir a una clase de ejercicio específicamente para mujeres embarazadas son diferentes al grupo general de mujeres que reciben atención prenatal, este estudio tiene un sesgo de selección que afecta la validez interna, debido a que los grupos expuestos y no expuestos (muestras) provienen de diferentes poblaciones. Nuevamente, preguntando: “¿A quién consiguieron? ¿A quién extrañaron?” y también “¿Fue esto diferente entre los dos grupos?” te ayudará aquí.
El sesgo de selección que afecta la validez interna puede aumentar de otras formas menos obvias, principalmente relacionadas con datos faltantes. ¿La tasa de participación fue diferente entre los 2 grupos? ¿Hubo más pérdida de seguimiento en un grupo frente al otro? Cualquiera de estos podría dar lugar a grupos que tal vez no reflejen la misma población subyacente, ya que los tipos de personas que aceptan participar en los estudios son diferentes a los que no, y los tipos de personas que abandonan los estudios son diferentes a los que no, por ejemplo, en estudios de adultos mayores, los los pacientes más enfermos tienden a abandonar la escuela porque se enferman demasiado para asistir a las visitas clínicas relacionadas con el estudio. Si esto ocurre más en un grupo de estudio que en el otro, conduce a sesgos de selección.
El sesgo de trabajador saludable es un tipo de sesgo de selección, y se refiere al hecho de que las personas que pueden trabajar son generalmente más saludables que la población general porque la población general incluye a personas que están demasiado enfermas para trabajar. Así, los estudios que reclutan de una población de personas que trabajan pueden carecer de generalización externa, lo cual está bien, siempre y cuando se tenga cuidado a la hora de aplicar los resultados del estudio. Sin embargo, el sesgo del trabajador sano también puede afectar la validez interna si un grupo es reclutado específicamente de una población de trabajadores y el otro de la población general. Por ejemplo, si sospechamos que la Fábrica A tiene una toxina ambiental (y el grupo expuesto de nuestro estudio de cohorte consiste en trabajadores de la Fábrica A), entonces nuestro grupo no expuesto necesita ser trabajadores de otro lugar, no, digamos, cónyuges o vecinos (que pueden o no trabajar) de los participantes expuestos.
Sesgo de clasificación errónea
La clasificación errónea se refiere simplemente a medir las cosas incorrectamente, de tal manera que los participantes del estudio se meten en la caja equivocada en la tabla 2 x 2: los llamamos “enfermos” cuando realmente no están (o viceversa); los llamamos “expuestos” cuando realmente no están (o viceversa).
Continuando con nuestro ejemplo de ejercicio en el embarazo, digamos reclutamos a mil mujeres embarazadas y evaluamos sus niveles de actividad física. Decidimos que cualquier persona que cumpla con la recomendación de actividad física durante el embarazo (30 minutos de actividad moderada, la mayoría de los días de la semana vii [2]) será clasificada como “expuesta”, y cualquiera que informe menos actividad quedará “no expuesta”. En general, todas las personas sobrereportarán sus niveles de actividad física. ix (p46) Así, en nuestro estudio de 1,000 mujeres, esperaríamos algún nivel de clasificación errónea, si todos sobrereportan ligeramente su cantidad de actividad física, entonces aquellas personas que realmente obtuvieron poco menos de la cantidad recomendada serán clasificadas incorrectamente porque su sobrereporte los chocará en el grupo expuesto (cumplió con los lineamientos).
Si así es como deberían verse los datos (imagina cualquier enfermedad que te guste aquí):
D+ | D- | |
E+ | 200 | 100 |
E- | 300 | 400 |
Pero en cambio, si clasificamos incorrectamente a algunas mujeres como expuestas debido al exceso de informes, la tabla podría verse así:
D+ | D- | |
E+ | 230 | 140 |
E- | 270 | 360 |
Esto se denomina clasificación errónea no diferencial, porque ocurre a la misma tasa (aquí, 10% de los no expuestos se clasificaron incorrectamente como expuestos) tanto en los grupos enfermos como en los no enfermos. La clasificación errónea no diferencial no es lo mismo que el error aleatorio; en el error aleatorio, podríamos tener una clasificación errónea del 10%, pero iría en ambas direcciones. Aquí realmente solo esperamos sobreinformar de la actividad física, por lo que es un error sistemático, o sesgo. La clasificación errónea, como todas las demás formas de sesgo, afecta a los estudios al darnos una estimación incorrecta de asociación.
Ejemplo\(\PageIndex{1}\): Misclassification
Usando la primera tabla 2 x 2 anterior (es decir, los datos “correctos”, tenga en cuenta que esto casi nunca es observable), la razón de probabilidades (OR) es:
\[\mathrm{OR}=\frac{200 \times 400}{300 \times 100}=2.67\]
Mientras que la razón de probabilidades para los datos sesgados (los que realmente recopilamos en nuestro estudio) es:
\[\mathrm{OR}=\frac{230 \times 360}{140 \times 270}=2.19\]
El resultado del cálculo con datos que incluyen clasificación errónea no diferencial está más cerca del nulo de lo que sería el correcto. En la vida real, nunca podemos observar la tabla “correcta”, y así no podemos saber por cuánto o en qué dirección está sesgada nuestra estimación, solo eso es.
Clasificación errónea no diferencial: ¿sesgo hacia el nulo?
En el ejemplo de ejercicio en el embarazo, la estimación OR basada en los datos sesgados estaba sesgada hacia el nulo (es decir, está más cerca de 1.0, el valor nulo para odds ratios), pero con la misma facilidad podría haber sido sesgado lejos del nulo. Algunos libros de texto de epidemiología más antiguos dirán que la clasificación errónea no diferencial siempre sesga hacia lo nulo, pero resulta que esto no es cierto. 9p143 Lo mejor es asumir que no sabes en qué dirección va el sesgo.
En el lado positivo, aunque los datos estén mal clasificados, siempre y cuando sea una clasificación errónea no diferencial, probablemente todavía hayamos clasificado a las personas correctamente. Si todos sobreestiman su actividad física, todavía podemos decir a los televidentes de los corredores de maratón. Así, aunque la estimación de asociación que calculamos con nuestros datos mal clasificados (en los que todos agregaron, digamos, 30—60 minutos a sus totales semanales de ejercicio) casi con certeza no es “correcta”, con clasificación errónea no diferencial, a menudo todavía podemos decir algo sobre los resultados (quizás que cuanto más ejercicio uno obtiene, ¿menor es el riesgo de enfermedad cardíaca?). Es casi seguro que esta afirmación seguirá siendo cierta, aunque hayamos podido corregir la sobreestimación de la actividad física de todos y generar una estimación imparcial de asociación.
La otra cara es la clasificación errónea diferencial. Con la clasificación errónea diferencial, nuevamente encontramos que algunas personas se meten en las casillas equivocadas en la tabla 2×2, pero esta vez no se distribuye equitativamente entre todos los grupos de estudio. Quizás las personas enfermas informan erróneamente más que las personas no enfermas. O tal vez los investigadores son inconscientemente más propensos a clasificar a alguien como “enfermo” si se sabe que está expuesto. La clasificación errónea diferencial se considera una amenaza fatal para la validez interna de un estudio. Los autores del estudio, sabiendo esto, a menudo reconocerán errores de medición en su estudio, pero afirman que no son diferenciales y, por lo tanto, esencialmente irrelevantes. Cuando te encuentres con tales afirmaciones, piénsalo bien por ti mismo y asegúrate de estar de acuerdo con los autores antes de citar su trabajo. La clasificación errónea diferencial es más común de lo que a muchos de nosotros nos gustaría admitir.
La clasificación errónea va por muchos otros nombres, incluyendo sesgo de deseabilidad social, sesgo entrevistador, sesgo clínico, sesgo de recuerdo, y así sucesivamente. Sin embargo, independientemente del nombre, la clasificación errónea se reduce a que las personas sean llamadas expuestas cuando no están, no expuestas cuando están, no enfermas cuando realmente lo están, o enfermas cuando realmente no lo están. Al considerar los datos autoreportados, como se discutió en el capítulo anterior, primero debe preguntarse: “¿La gente me puede decir esto?” Si no, detente. Pero si es así, entonces debes considerar: “¿La gente me dirá esto?” Si no, entonces los datos pueden tener sesgo de clasificación errónea.
Análisis de sensibilidad
A veces llamado análisis de sesgo, un análisis de sensibilidad es un conjunto de análisis adicionales realizados después de conocer los principales resultados de un estudio, con el objetivo de cuantificar cuánto sesgo pudo haber habido y en qué dirección desplazó los resultados. No todas las preguntas de investigación y conjuntos de datos son susceptibles de análisis de sensibilidad, pero para las que lo son, es una excelente manera para que los autores aumenten la validez percibida de sus resultados. No hay una forma establecida de realizar un análisis de sensibilidad; más bien, se examinan todos los supuestos hechos como parte de un análisis y se prueba hasta qué punto esos supuestos, más que una verdadera asociación subyacente, impulsaron los resultados.
Por ejemplo, si estuviéramos estudiando actividad física, y en nuestro análisis principal decidimos que cualquiera que cumpliera con los lineamientos era “activo” y todas las demás personas en el estudio eran “sedentarias”, entonces un análisis de sensibilidad podría cambiar este punto de corte (quizás ahora declaramos que cualquiera que acumule 2 o más horas por semana de ejercicio es “activa”, aunque esto sea menor de lo que sugieren los lineamientos) y ver cuál es la nueva estimación de asociación. Si la nueva estimación es cercana a la original, entonces podemos concluir que nuestra elección del punto de corte (una suposición que hicimos durante el análisis) no afectó extensamente los resultados. Esto por sí solo no excluye la posibilidad de que los resultados originales sean incorrectos, pero sí disminuye la posibilidad de que encontraríamos una respuesta muy diferente si repetimos el estudio utilizando métodos ligeramente diferentes.
La falta de datos sobre variables individuales también lleva a una clasificación errónea; por ejemplo, en Estados Unidos, a la gente no le gusta hablar de dinero, por lo que a menudo las preguntas sobre los ingresos quedan sin respuesta. Si el tipo de persona que deja en blanco la pregunta de ingresos es diferente al tipo de persona que la contesta, entonces los datos no faltan al azar. Si realmente faltan datos al azar (lo que podría suceder si, por ejemplo, algunas personas realmente no ven la pregunta debido a una peculiaridad en el diseño de la página), entonces el resultado es un tamaño de muestra ligeramente más pequeño (y correspondientemente menos potencia), pero por lo demás esto no tiene efectos adversos. Sin embargo, en la vida real, los datos casi nunca faltan al azar, lo que significa que faltan según algún patrón y, por lo tanto, están creando un sesgo. Si los autores del estudio afirman que faltan datos al azar, piense detenidamente en el escenario y asegúrese de estar de acuerdo. Más a menudo, los autores del estudio simplemente no mencionan datos faltantes en absoluto. [3] Si falta una variable importante en el análisis para más del 5% de la muestra, sin embargo esto no es discutido por los autores, entonces tenga cuidado con los resultados. Probablemente estén sesgados.
Sesgo de publicación
El sesgo de publicación surge porque los artículos con resultados más emocionantes tienen más probabilidades de ser publicados. Un artículo cuyo principal hallazgo es “no hay asociación entre x e y” es difícil de publicar, tanto es así que existe una revista completa, legítima y revisada por pares dedicada únicamente a publicar estos llamados resultados negativos.
Este tipo de sesgo no se aplica a estudios individuales, sino a áreas de la literatura en su conjunto. Si es más probable que se publiquen artículos con estimaciones más grandes de asociación y/o valores de p más pequeños, entonces cuando intentas mirar todo el cuerpo de literatura sobre un tema determinado (por ejemplo, ¿deberían las personas mayores tomar aspirina profiláctica para prevenir ataques cardíacos?) , la imagen que obtienes es sesgada, porque solo se publicaron los apasionantes artículos. No se publicaron todos los artículos que no mostraron ningún efecto de la aspirina sobre el ataque cardíaco. Esto vale la pena tenerlo en cuenta siempre que estés haciendo búsquedas literarias y se discute más a fondo en el capítulo 9.
Conclusión
Todos los estudios epidemiológicos incluyen sesgos. Los investigadores pueden minimizar los sesgos que están presentes a través de buenos métodos de diseño y medición, pero algunos siempre permanecerán. Esos sesgos que afectan la validez interna de un estudio (sesgo de selección que pertenece más a un grupo que a otro, o clasificación errónea diferencial) hacen que ese estudio sea completamente inútil o útil solo con extrema precaución. El sesgo de selección que afecta únicamente a la validez externa —la presencia de clasificación errónea no diferencial o sesgo de selección operando en toda la muestra— es manejable siempre y cuando se entiendan las limitaciones asociadas. Los datos faltantes, y la medida en que la no participación o el incumplimiento podrían haber afectado los resultados, siempre deben considerarse cuidadosamente.
Referencias
i. Johnson CY. Todos están sesgados: el trabajo del profesor de Harvard revela que apenas conocemos nuestras propias mentes. Boston Globe. 2013. https://www.boston.com/news/science/... -nuestras propias-mentes. Accedido noviembre 27, 2018. (Regreso)
ii. Bovbjerg M, Siega-Riz A, Evenson K, Goodnight W. Los métodos de evaluación de la exposición afectan las asociaciones entre la actividad física materna y el parto por cesárea. J Ley Phys Salud. 2015; 12 (1) :37-47. (Regreso 1) (Regreso 2)
iii. Embarazo, Infección y Nutrición (PIN). UNC Gillings Escuela de Salud Pública Global. https://sph.unc.edu/epid/pregnancy-i...nutrition-pin/. Accedido el 18 de octubre de 2018.
iv. Evenson KR, Savitz DA, Huston SL. Actividad física de tiempo libre en mujeres embarazadas en EU. Pediatr Perinat Epidemiol. 2004; 18 (6) :400-407. doi:10.1111/j.1365-3016.2004.00595.x (Regreso)
v. Rothman KJ, Gallacher JEJ, Hatch EE. Por qué se debe evitar la representatividad. Int J Epidemiol. 2013; 42 (4) :1012-1014. doi:10.1093/ije/dys223
vi. Beckmann CR, Beckmann CA. Efecto de un programa estructurado de ejercicio anteparto sobre el embarazo y el resultado del parto en primiparas. J Reprod Med. 1990; 35 (7) :704-709. (Regreso)
vii. Dictamen del comité ACOG. Ejercicio durante el embarazo y posparto. 2002. Colegio Americano de Obstetras y Ginecólogos. Int J Gynaecol Obstet Off Órgano Int Fed Gynaecol Obstet. 2002; 77 (1) :79-81. (Regreso)
viii. Actividad física para todos: Lineamientos. Centros para el Control y la Prevención de Enfermedades (CDC). http://www.cdc.gov/physicalactivity/...es/adults.html. Accedido el 10 de febrero de 2014. (Regreso)
ix. Dishman RK, Heath GW, Lee I-M. Epidemiología de la Actividad Física. 2a ed. Champaign, IL: Cinética humana; 2013. (Regreso)
- Toda investigación con participantes humanos debe ser aprobada por una junta de ética, generalmente llamada junta de revisión institucional (IRB) en Estados Unidos. El IRB debe aprobar todos los materiales de estudio, incluidos los anuncios, y todos esos anuncios deben exponer claramente la pregunta de investigación.
- El astuto entre ustedes notará que estas recomendaciones se parecen notablemente a las recomendaciones viii para las personas no embarazadas. En efecto, salvo ciertas complicaciones bien definidas y relativamente raras, las mujeres embarazadas deben ser tan activas como las no embarazadas.
- ¡Extraño pero cierto!