24.4: Correlación y causalidad
- Page ID
- 150531
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Cuando decimos que una cosa causa otra, ¿a qué nos referimos? Hay una larga historia en la filosofía de discusión sobre el significado de la causalidad, pero en las estadísticas una manera que comúnmente pensamos de la causalidad es en términos de control experimental. Es decir, si pensamos que el factor X causa el factor Y, entonces manipular el valor de X también debería cambiar el valor de Y.
En medicina, existe un conjunto de ideas conocidas como postulados de Koch que históricamente se han utilizado para determinar si un organismo en particular causa una enfermedad. La idea básica es que el organismo debe estar presente en las personas con la enfermedad, y no presente en quienes no la tienen —así, un tratamiento que elimine al organismo también debería eliminar la enfermedad. Además, infectar a alguien con el organismo debería hacer que contraiga la enfermedad. Un ejemplo de ello se vio en el trabajo del doctor Barry Marshall, quien tenía la hipótesis de que las úlceras estomacales eran causadas por una bacteria (Helicobacter pylori). Para demostrarlo, se infectó con la bacteria, y poco después desarrolló una severa inflamación en el estómago. Después se trató con un antibiótico, y su estómago pronto se recuperó. Posteriormente obtuvo el Premio Nobel de Medicina por esta obra.
A menudo nos gustaría probar hipótesis causales pero en realidad no podemos hacer un experimento, ya sea porque es imposible (“¿Cuál es la relación entre las emisiones humanas de carbono y el clima de la tierra?”) o poco ético (“¿Cuáles son los efectos del abuso severo en el desarrollo cerebral infantil?”). Sin embargo, aún podemos recopilar datos que puedan ser relevantes para esas preguntas. Por ejemplo, en este último ejemplo, potencialmente podemos recopilar datos de niños que han sido abusados así como de aquellos que no lo han hecho, y luego podemos preguntar si su desarrollo cerebral es diferente.
Digamos que hicimos tal análisis, y encontramos que los niños maltratados tenían un peor desarrollo cerebral que los niños no abusados. ¿Demostraría esto que el abuso causa un peor desarrollo cerebral? No. Siempre que observamos una asociación estadística entre dos variables, ciertamente es posible que una de esas dos variables cause la otra. Sin embargo, también es posible que ambas variables estén siendo influenciadas por una tercera variable; en este ejemplo, podría ser que el abuso infantil esté asociado con el estrés familiar, lo que también podría causar un peor desarrollo cerebral a través de un menor compromiso intelectual, estrés alimentario, o muchas otras posibles vías. El punto es que una correlación entre dos variables generalmente nos dice que algo probablemente esté causando otra cosa, pero no nos dice qué está causando qué.
24.4.1 Gráficas causales
Una manera útil de describir las relaciones causales entre variables es a través de una gráfica causal, que muestra las variables como círculos y las relaciones causales entre ellas como flechas. Por ejemplo, la Figura 24.4 muestra las relaciones causales entre el tiempo de estudio y dos variables que creemos que deberían verse afectadas por el mismo: las calificaciones de los exámenes y los tiempos de finalización del examen.
Sin embargo, en realidad los efectos en el tiempo de finalización y las calificaciones no se deben directamente a la cantidad de tiempo dedicado a estudiar, sino a la cantidad de conocimiento que el estudiante adquiere al estudiar. Normalmente diríamos que el conocimiento es una variable latente —es decir, no podemos medirlo directamente pero podemos verlo reflejado en variables que podemos medir (como las calificaciones y los tiempos de finalización). La Figura 24.5 muestra esto.
Aquí diríamos que el conocimiento media la relación entre el tiempo de estudio y los grados/tiempos de finalización. Eso significa que si fuéramos capaces de mantener el conocimiento constante (por ejemplo, administrando un medicamento que provoca el olvido inmediato), entonces la cantidad de tiempo de estudio ya no debería tener un efecto en las calificaciones y los tiempos de finalización.
Tenga en cuenta que si simplemente medimos las calificaciones de los exámenes y los tiempos de finalización generalmente veríamos una relación negativa entre ellos, porque las personas que terminan los exámenes más rápido en general obtienen las calificaciones más altas. Sin embargo, si tuviéramos que interpretar esta correlación como una relación causal, esto nos diría que para obtener mejores calificaciones, ¡en realidad deberíamos terminar el examen más rápido! Este ejemplo muestra lo difícil que puede ser la inferencia de causalidad a partir de datos no experimentales.
Dentro de la estadística y el aprendizaje automático, existe una comunidad de investigación muy activa que actualmente estudia la cuestión de cuándo y cómo podemos inferir relaciones causales a partir de datos no experimentales. Sin embargo, estos métodos a menudo requieren suposiciones fuertes, y generalmente deben usarse con mucha precaución.