Saltar al contenido principal
LibreTexts Español

3.6.3: Correlación vs. causalidad

  • Page ID
    151821
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Uno de los mayores errores que cometen las personas en Estadística es en la correlación confusa con la causalidad.

    Ejemplo: Películas y ahogamientos de Nicolas Cage

    Un estudio realizado por el estudiante de derecho Tyler Vigan mostró una correlación moderada a fuerte entre el número de películas que Nicolas Cage estrena en un año y el número de ahogamientos en piscinas en el mismo año. 36

    clipboard_ebb018ff0a4e0bc7640a7969f4c6c90ea.png

    La gráfica de dispersión muestra correlación positiva moderada, apoyada por un coeficiente de correlación de 0.66.

    clipboard_eec5cefc933d1034e283dbf3fc1a390bd.png

    ¿Qué significa esto? Cuando Nicolas Cage estrena una película, ¿la gente se emociona y va a saltar a la piscina? O tal vez en un año en el que hay muchos ahogamientos, ¿Nicolas Cage se inspira para lanzar una nueva película?

    Este es un ejemplo de una correlación espuria, una correlación que simplemente ocurre por casualidad.

    Ejemplo: Delitos y gastos policiales

    La gráfica de dispersión muestra datos de los 50 estados ajustados por diferencias poblacionales. El eje horizontal son los gastos policiales anuales por persona. El eje vertical representa los delitos violentos reportados por cada 100 mil personas al año.

    clipboard_e1a16b6d4a5c85556ca553afd59e87052.png

    Hay una correlación positiva moderada presente, con un coeficiente de correlación de 0.547.

    ¿Qué significa esto? Aquí están posibles explicaciones.

    1. El costo policial provoca la delincuencia. Cuanto más dinero se gasta en la policía, más crimen hay. Eliminar a la policía para reducir la delincuencia.
    2. El delito causa costo policial. Cuanto más delito haya, más policías son contratados. Los estados de alto crimen necesitan gastar más dinero en la policía.
    3. Más policías significa más delitos denunciados. Los datos muestran delitos denunciados, pero muchos delitos no se denuncian. Tener más policías significa más delitos denunciados.
    4. Los costos de la delincuencia y la policía son mayores en las ciudades. Estados como California, Texas y Florida tienen grandes ciudades donde todos los gastos son mayores y hay más delincuencia. Entonces en este ejemplo, la urbanización es la causa del incremento de ambas variables. (Este es un ejemplo de una variable de confusión).

    La verdad es que no podemos decir por qué existe una correlación entre el gasto policial y la delincuencia violenta. Como estadísticos, solo podemos decir que las variables están correlacionadas, y no podemos apoyar una relación de causa y efecto.

    En estudios observacionales como este, la correlación no equivale a causalidad.

    Variables de confusión (al acecho)

    Una variable de confusión o acecho es una variable que no es conocida por el investigador, pero que afecta los resultados del estudio.

    Las investigaciones han demostrado que existe una correlación fuerte y positiva entre los ataques de tiburones y la venta de helados. En realidad hay una tienda en Nueva York llamada Shark's Ice Cream, posiblemente inspirada en esta correlación. 37

    clipboard_e97ad008dc4e09a8bd1bf4a9826819281.png

    Una posible variable de confusión podría ser la temperatura. En los días calurosos es más probable que la gente nade en el océano y también es más probable que compre helados.

    Esta gráfica de la BBC parece apoyar esta afirmación. 38 Tanto los ataques de tiburones como las ventas de helados son las más altas en los meses de verano.

    clipboard_e0815d9726a8160a4dab127576cdcd643.png

    En la siguiente sección, discutiremos cómo diseñar experimentos que controlen las variables de confusión.

    Ojalá tomar esta clase de Estadísticas te ayude a evitar cometer el error de confundir correlación y causalidad. O, tal vez ya lo sabías, como se inspiró en este cómic de XKCD “Correlación”. 39

    clipboard_e4faed0c3c3a579219b8f3d882a2b9082.png


    This page titled 3.6.3: Correlación vs. causalidad is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.