1.7: Confundir
- Page ID
- 121590
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Objetivos de aprendizaje
Después de leer este capítulo, podrás hacer lo siguiente:
- Explicar el concepto de confusión y cómo afecta los resultados de los estudios epidemiológicos
- Reiterar los criterios que una variable debe cumplir para ser un posible confuso
- Realizar un análisis estratificado para determinar si una variable es un confuso
- Proporcionar ejemplos de relaciones de exposición/resultado/confuso, en términos de criterios de confusión y requisitos de análisis
Al igual que el error aleatorio y el sesgo, la confusión es otra amenaza para la validez del estudio. En efecto, hay algunos textos, i (p.37) así como papeles, ii que se refieren a confundir como “sesgo confuso”. Prefiero el término confuso, sin la palabra sesgo, porque si bien también conduce a un error sistemático en los datos, confundir es un caso especial.
Imagine que está haciendo un estudio transversal en niños en edad de escuela primaria de tamaño de pie y capacidad de lectura:
En palabras, ¿el tamaño del pie afecta la capacidad de lectura?
Vas a una escuela primaria y mides tanto el tamaño del pie (medido como longitud en pulgadas) como la capacidad de lectura (medida en términos de palabras leídas por minuto, promediadas en un período de prueba de 5 minutos), y recolectas los siguientes datos:
Participante # | Tamaño del pie (pulgadas) | Velocidad de lectura (wpm) |
---|---|---|
1 | 7.2 | 40 |
2 | 7.7 | 85 |
3 | 7.2 | 63 |
4 | 7.6 | 52 |
5 | 7.4 | 51 |
6 | 7.1 | 41 |
7 | 7.0 | 82 |
8 | 7.2 | 60 |
9 | 7.6 | 53 |
10 | 7.5 | 55 |
11 | 8.3 | 123 |
12 | 8.2 | 97 |
13 | 8.5 | 108 |
14 | 8.1 | 111 |
15 | 8.2 | 109 |
16 | 8.2 | 99 |
17 | 8.7 | 95 |
18 | 8.0 | 110 |
19 | 8.5 | 121 |
20 | 8.2 | 108 |
21 | 9.4 | 128 |
22 | 8.1 | 117 |
23 | 9.8 | 115 |
24 | 8.8 | 109 |
25 | 9.1 | 112 |
26 | 9.3 | 112 |
27 | 9.8 | 106 |
28 | 9.2 | 125 |
29 | 9.6 | 163 |
30 | 9.0 | 137 |
Como se discute en el capítulo 4, en este libro siempre dicotomizaremos (es decir, dividiremos en dos) variables continuas para simplificar las matemáticas. Si dicotomizamos tanto el tamaño del pie como la velocidad de lectura, a 8.25” y 100 wpm, respectivamente [1], podemos dibujar la siguiente tabla de 2 x 2:
Velocidad de lectura | |||
<100 | 100+ | ||
Tamaño del pie | <8.25″ | 12 | 5 |
8.25″+ | 1 | 12 |
Debido a que se trata de un estudio transversal, calcularíamos la razón de probabilidades:
En palabras,
¡Guau! ¡Este es un hallazgo enorme! ¿Deberíamos darles hormonas de crecimiento a todos los niños de la escuela primaria para que aumenten los pies y aumenten sus velocidades de lectura?
No tan rápido.
Dado que la población objetivo para este estudio hipotético son los niños de grado escolar, parece probable que haya un confuso en el trabajo, es decir, el nivel de grado. Los niños en grados superiores tendrán pies más grandes porque son mayores, y también en general serán lectores más rápidos:
En este escenario, necesitamos controlar para el confuso (nivel de grado): necesitamos eliminar su influencia para obtener una estimación precisa de la asociación entre la exposición (tamaño del pie) y el resultado (capacidad de lectura).
Antes de profundizar en cómo controlar para los confusores, discutamos qué son los confusores desde una perspectiva teórica.
Criterios para Confundadores
Hay 3 criterios que una variable debe cumplir para que sea un posible confuso (digo “potencial” porque no todas las variables que cumplan con estos criterios realmente resultarán confundir los datos, esto lo resolverá durante el análisis):
- La variable debe estar asociada estadísticamente con la exposición.
- La variable debe causar el desenlace.
- La variable no debe estar en una vía causal.
Discutamos cada uno de estos con más detalle.
Criterio #1: Asociado con la exposición
La asociación es un término estadístico que no implica necesariamente una relación causal (esto se discute con más detalle más adelante, ver capítulo 10). Básicamente, asociación significa que la variable de confusión es más común en el grupo expuesto que en el grupo no expuesto (o viceversa), produciendo así una asociación estadística. El confuso no necesita causar o prevenir la exposición, solo necesita distribuirse desproporcionadamente entre los grupos expuestos y no expuestos. En nuestro ejemplo anterior, el nivel de grado se distribuye desproporcionadamente entre varios tamaños de pies: los niños en grados superiores tienen más probabilidades de tener pies más grandes en comparación con los niños de grados inferiores. Tenga en cuenta que puede haber una relación causal, con el confuso causando la exposición (pero no al revés, ver criterio 3), pero esto no es necesario. En nuestro ejemplo, el nivel de grado no está causando el tamaño del pie (la edad está causando el tamaño del pie), sino que están asociados.
Criterio #2: Causa el Resultado
En este caso, debe existir un nexo causal entre el confuso y el desenlace. No tiene que ser un vínculo causal probado, solo un vínculo de “es razonablemente posible que esta exposición cause (o impida) ese resultado”. En nuestro ejemplo de tamaño de pie/capacidad de lectura, el nivel de grado (el confuso) ciertamente causa una velocidad de lectura más rápida (el resultado).
Es importante destacar que el confuso debe causar el resultado, no al revés. Si el desenlace está causando el confuso, entonces no es un confuso. Hay muchas veces en epidemiología en las que no estamos seguros de qué dirección iría una flecha causal: ¿la enfermedad causa el confuso o el confuso la causa? Un ejemplo podría ser la pérdida excesiva de peso y la enfermedad. Perder una gran cantidad de peso rápidamente puede enfermarlo, pero estar enfermo también puede causar una gran pérdida de peso. En escenarios como este, donde no estamos seguros de en qué dirección apunta la flecha, lo que hacen los epidemiólogos en la práctica es asumir primero que la flecha va en una dirección y hacer el análisis en consecuencia (aquí, eso significaría incluir o no al posible confuso). Asumen entonces que la flecha va hacia el otro lado y vuelven a hacer el análisis. Si los resultados de ambos análisis son similares, entonces la dirección de la flecha no es importante. Pero si los 2 análisis producen resultados muy diferentes, entonces reportaríamos ambos y dejaríamos que el lector decida cuál es más aplicable para ellos.
Criterio #3: No en la Vía Causal
El criterio final para que una variable sea un posible factor de confusión es que no esté en la vía causal desde la exposición hasta el desenlace. En otras palabras, no queremos este escenario:
Un ejemplo de una variable en una vía causal podría ser el siguiente:
En este caso, el “estado de alerta en clase” no es un confuso, porque es causado por la cantidad de sueño y, por lo tanto, está en la vía causal. Las variables en la vía causal son mediadoras, no posibles confundidoras.
Confundir: Definición
Un confuso es así una tercera variable —no la exposición, y no el resultado [2] —que sesga la medida de asociación que calculamos para el par exposición/resultado particular.
Es importante destacar que desde una perspectiva de investigación, nunca queremos reportar una medida de asociación que se confunde. Imagínese si hacemos nuestro estudio transversal sobre el tamaño del pie y la capacidad de lectura, sin tener en cuenta el nivel de grado. Informaríamos el ratio de probabilidades de 28.8 según lo calculado anteriormente... ¡Uy! Hemos reportado una asociación que no es realmente cierta, solo está confundida por el nivel de grado.
Métodos de Control de Confundadores
Se puede controlar la confusión a través del diseño del estudio o técnicas analíticas. En términos de diseño de estudio, se puede
- Restringir la muestra
- Partido en el confuso
- Aleatorizar (como en, elegir un ensayo controlado aleatorizado como diseño del estudio)
Restringir la muestra significa que limitas tu estudio solo a un nivel del confuso (por ejemplo, solo estudiantes de tercer grado). Por lo tanto, la variable potencialmente confusa ya no cumple con el primer criterio de confusión, no puede distribuirse desproporcionadamente entre expuestos y no expuestos porque solo hay un nivel del confusador disponible. Así, todos los participantes expuestos están en tercer grado, al igual que todos no expuestos. Nuestro diagrama causal ahora se ve así:
Al restringir a un solo nivel de grado, eliminamos la confusión por nivel de grado: los niños tanto en grados superiores como inferiores ya no son relevantes porque si solo tenemos alumnos de tercer grado, entonces no hay niños en grados superiores o inferiores. Solo entre los estudiantes de tercer grado, esperaríamos que el tamaño del pie y la capacidad de lectura no estén correlacionados.
Variabilidad inherente
Obviamente, no todos los alumnos de tercer grado tendrán pies del mismo tamaño, ni todos los alumnos de tercer grado tendrán uniformemente la misma capacidad de lectura. Sin embargo, a nivel de grupo, los alumnos de tercer grado en general tienen pies más grandes y son mejores lectores que los de primer grado, e igualmente tienen pies más pequeños y son lectores más pobres que los de quinto grado. La epidemiología como ciencia funciona tanto por esta variación individual como por el hecho de que los grupos de personas (seleccionados en alguna característica, como el nivel de grado) son más similares entre sí que a las personas de otros grupos.
Aquí están los mismos datos con una columna agregada para el nivel de grado:
Participante # | Tamaño del pie (pulgadas) | Velocidad de lectura (wpm) | Grade |
---|---|---|---|
1 | 7.2 | 40 | 1 |
2 | 7.7 | 85 | 1 |
3 | 7.2 | 63 | 1 |
4 | 7.6 | 52 | 1 |
5 | 7.4 | 51 | 1 |
6 | 7.1 | 41 | 1 |
7 | 7.0 | 82 | 1 |
8 | 7.2 | 60 | 1 |
9 | 7.6 | 53 | 1 |
10 | 7.5 | 55 | 1 |
11 | 8.3 | 123 | 3 |
12 | 8.2 | 97 | 3 |
13 | 8.5 | 108 | 3 |
14 | 8.1 | 111 | 3 |
15 | 8.2 | 109 | 3 |
16 | 8.2 | 99 | 3 |
17 | 8.7 | 95 | 3 |
18 | 8.0 | 110 | 3 |
19 | 8.5 | 121 | 3 |
20 | 8.2 | 108 | 3 |
21 | 9.4 | 128 | 5 |
22 | 8.1 | 117 | 5 |
23 | 9.8 | 115 | 5 |
24 | 8.8 | 109 | 5 |
25 | 9.1 | 112 | 5 |
26 | 9.3 | 112 | 5 |
27 | 9.8 | 106 | 5 |
28 | 9.2 | 125 | 5 |
29 | 9.6 | 163 | 5 |
30 | 9.0 | 137 | 5 |
Limitándonos a solo tercer grado, entonces, la tabla de 2 x 2 se ve así:
Velocidad de lectura | |||
<100 | 100+ | ||
Tamaño del pie | <8.25″ | 2 | 2 |
8.25″+ | 3 | 3 |
La razón de probabilidades (OR) es de 1.0. Esta es la medida correcta de asociación para reportar. En realidad, el tamaño del pie no tiene nada que ver con la velocidad de lectura (OR 1.0). El 28.8 que calculamos antes estaba equivocado. Fue confundido por el nivel de grado, no hay asociación una vez que controlamos esta confusión restringiendo a un nivel de grado.
Aunque la restricción funciona maravillosamente en términos de controlar la confusión, muchas veces no es un enfoque realista porque limita demasiado nuestro estudio. Por ejemplo, una pregunta razonable del estudio podría ser: “¿Cuáles son los predictores de muerte por cáncer de mama entre mujeres posmenopáusicas?” Restricción por edad (p. ej., “¿Cuáles son los predictores de muerte por cáncer de mama en mujeres de 62 años?”) harían que el estudio fuera mucho menos útil porque no necesariamente seríamos capaces de generalizar los resultados a mujeres de otras edades. Por lo tanto, los epidemiólogos suelen utilizar otros enfoques para el control de los confusos
El emparejamiento se usa a menudo en estudios de casos y controles, y tiene el mismo efecto que la restricción para controlar la confusión. Por ejemplo, digamos que estamos viendo un defecto congénito particular (resultado) y el tabaquismo materno (exposición), y sospechamos que la edad materna es un posible confuso. Querríamos reclutar un control con la misma edad materna para cada caso: si el estudio fuera a inscribir un caso de 30 años, querríamos emparejarla con un control de 30 años. El confuso (edad) todavía causa el desenlace (defectos congénitos), pero al forzar que la distribución del confusor sea la misma entre casos y controles, hemos negado el criterio #2, y así negamos el posible efecto del confuso en la medida de exposición/resultado de asociación.
Aleatorizando trabajos forzando al (los) confuso (es) a fallar el criterio # 1—en este caso, asignando aleatoriamente participantes a la exposición, hemos asegurado una distribución igual del confuso entre los grupos expuestos y no expuestos. Ahora falta el vínculo entre el confuso y la exposición, como lo es con restricción. Consulte el capítulo 9 para más información sobre esto.
En términos de controlar por confusión en la fase de análisis, existen 2 opciones principales:
- Estratificar
- Regresión (que en realidad es solo un caso especial de estratificación)
Para estratificar, tomas los datos y haces una tabla diferente de 2 x 2 para cada nivel del posible confuso. Supongamos ahora que nos preocupan los datos de un estudio de casos y controles sobre el uso de la píldora anticonceptiva oral (OCP) (nunca utilizada vs. nunca utilizada) y el cáncer de ovario:
Realizamos este estudio y obtenemos los siguientes datos:
Participante # |
¿Alguna vez OCP? 0 = no, 1 = sí |
¿Cáncer de Ovario? 0 = no (control), 1 = sí (caso) |
---|---|---|
1 | 1 | 1 |
2 | 1 | 1 |
3 | 1 | 1 |
4 | 1 | 1 |
5 | 0 | 1 |
6 | 0 | 1 |
7 | 0 | 1 |
8 | 0 | 1 |
9 | 0 | 1 |
10 | 0 | 1 |
11 | 1 | 0 |
12 | 1 | 0 |
13 | 1 | 0 |
14 | 1 | 0 |
15 | 0 | 0 |
16 | 0 | 0 |
17 | 0 | 0 |
18 | 0 | 0 |
19 | 0 | 0 |
20 | 0 | 0 |
La tabla 2 x 2 sería la siguiente:
Cáncer de Ovario | |||
+ | — | ||
OCP | Ever | 4 | 4 |
Nunca | 6 | 6 |
El OR es 1.0; el uso de anticonceptivos orales no está asociado con cáncer de ovario. Durante los análisis de confusión, este valor se conoce como la medida bruta o no ajustada de asociación, lo que significa que aún no hemos contabilizado, ajustado o controlado por ningún factor de confusión. Las medidas no ajustadas solo toman en cuenta la exposición y el resultado.
Sin embargo, ¿qué pasa con el tabaquismo como confuso? Comprobemos los criterios del confusador:
- La variable debe estar asociada con la exposición.
- ¡Sí! Tanto los anticonceptivos orales como el tabaquismo aumentan el riesgo de trombosis venosa profunda, una afección potencialmente mortal. Por lo tanto, fumar se considera una contraindicación para el uso de anticonceptivos orales, iii lo que lleva a los médicos a prescribir otras formas de control de la natalidad en lugar de las mujeres que fuman. Esto lleva a una distribución desproporcionada de los fumadores (el confuso) entre las mujeres que usan y no usan anticonceptivos orales (la exposición).
- La variable debe causar el desenlace.
- Posiblemente. Si bien a menudo pensamos en fumar como causa cáncer de pulmón (lo que ciertamente hace), fumar también se ha asociado con otros cánceres con la suficiente frecuencia como para que sea razonable sospechar que también podría causar cáncer de ovario. iv
- La variable no debe estar en una vía causal.
- ¡Sí! Parece muy poco probable que tomar píldoras anticonceptivas a su vez provoque a su vez que una mujer empiece a fumar.
El tabaquismo cumple con nuestros criterios y es un posible factor de confusión en este escenario. [3] Aquí están los datos con estado de tabaquismo agregado:
Participante # | ¿Alguna vez OCP?
0 = no, 1 = sí |
¿Cáncer de Ovario?
0 = no (control), 1 = sí (caso) |
¿Fumador?
0 = no, 1 = sí |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 0 |
4 | 1 | 1 | 0 |
5 | 0 | 1 | 1 |
6 | 0 | 1 | 1 |
7 | 0 | 1 | 1 |
8 | 0 | 1 | 0 |
9 | 0 | 1 | 0 |
10 | 0 | 1 | 0 |
11 | 1 | 1 | 1 |
12 | 1 | 0 | 1 |
13 | 1 | 0 | 0 |
14 | 1 | 0 | 0 |
15 | 0 | 0 | 1 |
16 | 0 | 0 | 1 |
17 | 0 | 0 | 1 |
18 | 0 | 0 | 0 |
19 | 0 | 0 | 0 |
20 | 0 | 0 | 0 |
Ahora estratificamos por estado tabáquico. En otras palabras, hacemos 2 mesas diferentes de 2×2: una para fumadores y otra para no fumadores. Tenga en cuenta que todas las mujeres que aparecieron en la tabla 2 × 2 anterior para cáncer de ovario y uso de OCP siguen presentes, solo están en una de las dos tablas a continuación, dependiendo de si fuman o no.
Cáncer de Ovario | |||
+ | — | ||
OCP | Ever | 2 | 3 |
Nunca | 3 | 2 |
Cáncer de Ovario | |||
+ | — | ||
OCP | Ever | 2 | 3 |
Nunca | 3 | 2 |
Tenga en cuenta que las tablas 2 x 2 siguen siendo para OCP (exposición) y cáncer de ovario (desenlace) —acabamos de hacer una de esas mesas para fumadores y otra para no fumadores.
El siguiente paso en un análisis estratificado es calcular las OR a partir de estas tablas 2 x 2, por lo que tenemos un OR para fumadores y un OR para no fumadores.
Ejemplo de confusión 1: OCP/cáncer de ovario por estado tabáquico
Ejemplo\(\PageIndex{1}\)
La relación de probabilidades para los fumadores es:
Interpretación:
Las mujeres que tienen cáncer de ovario tienen 0.44 veces más probabilidades de reportar antecedentes de uso de OCP, en comparación con las mujeres sin cáncer de ovario, solo entre los fumadores.
Y la relación de probabilidades para los no fumadores es:
Interpretación:
Entre los no fumadores, las mujeres que tienen cáncer de ovario tienen 0.44 veces más probabilidades de reportar antecedentes de uso de anticonceptivos orales (OCP), en comparación con las mujeres sin cáncer de ovario.
¡Anote las adiciones (en rojo) a esas interpretaciones! Al realizar análisis estratificados, es importante decir a qué grupo se aplica tu medida de asociación. Esto puede venir ya sea al principio (como lo hace arriba para los no fumadores) o al final (como lo hace arriba para los fumadores).
Dado que nuestras relaciones de probabilidades específicas de estrato (0.44 para fumadores y 0.44 para no fumadores) son similares entre sí pero diferentes del OR crudo (que fue 1.0), decimos que fumar efectivamente está actuando como un confuso en estos datos. El OR crudo estaba equivocado; se confundió al fumar.
“Similar” y “Diferente” —por ¿Cuánto?
Cuando las medidas de asociación específicas de estrato son similares entre sí pero diferentes a la OR cruda, tenemos confusión. Pero ¿por cuánto? Existe un criterio estándar para “diferente” —si las OR crudas y ajustadas son más de 10% diferentes, la mayoría de los epidemiólogos considerarían que eso es evidencia de confusión. Para “similares”, sin embargo, realmente no hay consenso. ¿Quizás dentro del 2— 3% el uno del otro? Es importante destacar que el valor crudo no cae entre ellos.
Cuando las medidas de asociación específicas de estrato son similares entre sí pero diferentes a la OR cruda, tenemos confusión. Pero ¿por cuánto? Existe un criterio estándar para “diferente” —si las OR crudas y ajustadas son más de 10% diferentes, la mayoría de los epidemiólogos considerarían que eso es evidencia de confusión. Para “similares”, sin embargo, realmente no hay consenso. ¿Quizás dentro del 2— 3% el uno del otro? Es importante destacar que el valor crudo no cae entre ellos.
El OR “real” es 0.44: el uso de anticonceptivos orales está bastante fuertemente asociado con menos cáncer de ovario. Pero sin tener en cuenta el tabaquismo, parece que esto no es cierto (el OR crudo fue 1.0, y no controló para fumar). Debido a que hay confusión, por lo tanto querríamos reportar un quirófano que controle el tabaquismo (el confuso). La forma más común de hacerlo es calcular una medida “ajustada”. Hay muchas formas de calcular una medida ajustada de asociación [4]; una es calcular la relación de probabilidades Mantel-Haenzel:
\[\widehat{O R_{M H}}=\frac{\sum_{i=1}^{k}\left(\frac{a_{i} d_{i}}{n_{i}}\right)}{\sum_{i=1}^{k}\left(\frac{b_{i} c_{i}}{n_{i}}\right)}\]
donde\(n_{i}=a_{i}+b_{i}+c_{i}+d_{i}\)
Se puede ver en la fórmula que el OR Mantel-Haenzel es solo un promedio ponderado de los odds ratios específicos del estrato, siendo cada estrato un i. A esto lo llamamos el OR ajustado, y ha controlado por confusión por la variable sobre la que estratificamos.
Categorización de variables continuas
Mencioné en el capítulo 4 que si uno tiene una variable continua (por ejemplo, edad o altura), la mayoría de los análisis se sirven mejor manteniendo esa variable continua pero que para los fines de este libro, dicotomizaríamos todas las variables para facilitar las matemáticas. Si un posible confuso es una variable continua, debemos categorizarla (en 2 o 3 categorías, generalmente) para poder realizar un análisis estratificado a mano. Así, si la altura fuera nuestro potencial confuso, podríamos crear 3 categorías: menos de 5′2″, 5′2″—6′0″ y más alto que 6′0″. Se puede ver, sin embargo, que dentro de estas categorías, todavía hay una considerable variabilidad—5′2″ es un 10″ completo más corto que 6′. Por lo tanto, crear categorías (es decir, estratos para el análisis estratificado) a partir de una variable continua para controlar la confusión podría no funcionar perfectamente si los estratos permanecen demasiado heterogéneos. Esto produce un confundamiento residual; hemos eliminado parte de la confusión por la altura pero aún queda algo de confusión. Esta es una razón por la que los epidemiólogos en su mayoría saltan directamente a la regresión, en la que es más fácil mantener continuas variables continuas. Sin embargo, el objetivo de este libro es crear lectores conocedores de estudios epidemiológicos, no hacedores conocedores, que sustancialmente más capacitación. Por lo tanto, confío en categorizar variables continuas para que las matemáticas sean fáciles de seguir y el software estadístico sea innecesario. Si sigues las matemáticas como se presenta aquí, es bastante fácil dar el salto cognitivo a la lectura de artículos que usan regresión (la regresión es solo análisis estratificado con muchas más categorías).
La mayoría de los estudios reportados en la literatura utilizan el otro método para controlar la confusión en los análisis: la regresión, que es solo un caso especial de un análisis estratificado, específicamente, da cuenta de todos los estratos posibles. Por ejemplo, si tuviéramos datos continuos sobre el total de meses de tabaquismo a lo largo de toda la vida, un modelo de regresión “haría” una mesa de 2×2 para no fumadores, luego una para las personas había fumado durante 1 mes, luego una mesa de 2×2 para los que habían fumado durante 2 meses, y así sucesivamente, hasta que cada estrato posible tuviera su propio 2 × 2 mesa. Luego, el modelo calcula un promedio ponderado del total de estos (al igual que un mega—Mantel Haenzel), y el resultado también se conoce como la razón de probabilidades ajustada. Para estudios de cohortes o ensayos controlados aleatorios, por supuesto, calculamos la relación de riesgo ajustada o la razón de tasa ajustada (RR).
Interpretación
Para interpretar nuestros hallazgos de OCP/cáncer de ovario en palabras (la razón de probabilidades ajustada, ya sea calculada a través de Mantel-Haenzel o por regresión, es de 0.44), diríamos:
O podríamos decir:
O podríamos decir:
Observe cómo hay múltiples formas de hacerle saber al lector que fumar fue tratado como un confuso (frases en rojo). No importa cuál elija —lo importante es que deje claro que estamos presentando la medida de asociación habiendo tratado ya con lo confuso.
Elegir confundidores
Al realizar un análisis en la vida real, a menudo hay múltiples factores de confusión potenciales. El primer paso en cualquier análisis es hacer una lista de todos esos posibles factores de confusión. La forma más fácil de hacerlo es primero hacer una lista de todas las variables que puedan causar tu resultado. Luego toma esa lista y asegúrate de que las variables estén asociadas con la exposición. Finalmente, para cualquier factor de confusión que cumpla con nuestros 2 primeros criterios, asegúrese de que no estén en la vía causal (por ejemplo, que la exposición no esté causando el confuso). Como se mencionó anteriormente, hay muchos casos en los que es difícil saber cuál es la causa de cuál; en tales casos, hacemos el análisis en ambos sentidos.
El siguiente paso sería determinar cuál de los posibles factores de confusión cumple con los 3 criterios para controlar en un análisis (la regresión permite controlar para muchos confusores a la vez). Una forma sería abandonar todos los factores de confusión que no cumplan con el criterio del “10% de cambio” mencionado anteriormente. Hay matices adicionales, sin embargo, que están más allá del alcance de este libro, y destacados epidemiólogos difieren en sus opiniones sobre cómo elegir una lista de factores de confusión para controlar. v, vi, vii Por suerte, los estudiantes iniciadores de epidemiología no necesitarán realizar sus propios análisis complejos; sin embargo, poder pensar en una relación particular de exposición/enfermedad y hacer una lista de todos los posibles factores de confusión es una habilidad útil a la hora de leer la literatura. ¿Consideraron los autores todas las variables que pensaste que cumplían con los criterios de confusión? Si no, ¿especificaron explícitamente por qué no? Si falta en el análisis de un artículo en particular un obvio potencial confuso, entonces tal vez ese no sea el artículo más válido.
Resumen
Los factores de confusión son variables, no la exposición y no el resultado, que afectan los datos de manera indeseable e impredecible. Específicamente, en datos que se confunden, se calculará la medida incorrecta de asociación (y es imposible saber en qué dirección se equivoca). Esto lleva a conclusiones inexactas a menos que uno controle para ese confuso. Para ser un posible factor de confusión, la variable debe estar estadísticamente asociada con la exposición, debe causar el desenlace y no debe estar en la vía causal. Los posibles factores de confusión pueden controlarse a través del diseño del estudio (restricción, coincidencia o aleatorización) o durante el análisis de datos (estratificación o regresión, lo que lleva a una medida ajustada de asociación). En este último caso, si las estimaciones brutas y ajustadas de asociación son más de 10% diferentes, la variable debe considerarse un confuso, y se reportaría la estimación ajustada porque controla para el confusador.
Referencias
i. Última JM. Un Diccionario de Epidemiología. 4ª ed. 2001. Nueva York: Oxford University Press. (Volver)
ii. Goldstein BA, Bhavsar NA, Phelan M, Pencina MJ. Controlar el sesgo de presencia informada por el número de encuentros de salud en una historia clínica electrónica. Am J Epidemiol. 2016; 184 (11) :847-855. doi:10.1093/aje/kww112 (Regreso)
iii. Bonnema RA, McNamara MC, Spencer AL. Opciones de anticoncepción en mujeres con padecimientos médicos subyacentes. Am Fam Physician. 2010; 82 (6) :621-628. (Regreso)
iv. Estudio: El tabaquismo causa casi la mitad de las muertes por 12 tipos de cáncer. Sociedad Americana contra el Cáncer. https://www.cancer.org/latest-news/s...cer-types.html. Accedido 21 de octubre de 2018. (Regreso)
v. Groenlandia S, Pearl J, Robins JM. Diagramas causales para la investigación epidemiológica. Epidemiol Camb Mass. 1999; 10 (1) :37-48. (Regreso)
vi. Harrell FEJ. Estrategias de Modelado de Regresión con Aplicaciones a Modelos Lineales, Regresión Logística y Análisis de Supervivencia Nueva York: Springer; 2001. (Regreso)
vii. Selvin S. Análisis Estadístico de Datos Epidemiológicos. 3ª ed. Oxford: Oxford University Press; 2004. (Regreso)
- ¡Los cortes de 8.25” y 100 wpm serían una gran cosa para variar en un análisis de sensibilidad! Ver capítulo 6.
- ¡Solo un recordatorio! Cuando los epidemiólogos dicen resultado nos referimos a “resultado de salud o enfermedad en estudio”, no nos referimos a los resultados de un estudio. Esos son resultados. Ver Apéndice 1.
- Recuerde, las variables que cumplen con los criterios de confusión son posibles factores de confusión. Pueden o no producir realmente una estimación sesgada de asociación; lo resolvemos durante el análisis.
- Cualquier texto de bioestadística discutiría varios de estos métodos.