Saltar al contenido principal
LibreTexts Español

3.1: Si algo provocara que algo más cambiara, ¿cómo sería eso?

  • Page ID
    150396
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Antes de ir por ahí determinando las causas de la felicidad, debemos prepararnos con algunas herramientas analíticas para que podamos identificar cómo es la causalidad. Si no nos preparamos para lo que podamos encontrar, entonces no sabremos interpretar nuestros propios datos. En cambio, tenemos que anticiparnos a cómo podrían ser los datos. Específicamente, necesitamos saber cómo se verían los datos cuando una cosa no causa otra cosa, y cómo se verían los datos cuando una cosa sí causa otra cosa. Este capítulo hace parte de esta preparación. Advertencia justa: nos enteraremos de algunas cosas complicadas. Por ejemplo, podemos encontrar patrones que parecen que una cosa está causando otra, incluso cuando esa cosa NO CAUSA la otra cosa. Aguanta ahí.

     

    Charlie y la fábrica de chocolate

    Imaginemos que el suministro de chocolate de una persona tiene una influencia causal en su nivel de felicidad. Imaginemos además que, como Charlie, cuanto más chocolate tengas, más feliz serás, y cuanto menos chocolate tengas, menos feliz estarás. Por último, debido a que sospechamos que la felicidad es causada por muchas otras cosas en la vida de una persona, anticipamos que la relación entre el suministro de chocolate y la felicidad no será perfecta. ¿Qué significan estas suposiciones para cómo deben verse los datos?

    Nuestro primer paso es recopilar algunos datos imaginarios de 100 personas. Caminamos y pedimos a las primeras 100 personas que conocemos que respondan dos preguntas:

    1. cuánto chocolate tienes, y
    2. qué feliz eres.

    Para mayor comodidad, ambas básculas pasarán de 0 a 100. Para la escala de chocolate, 0 significa que no hay chocolate, 100 significa suministro de chocolate de por vida. Cualquier otro número está en algún punto intermedio. Para la escala de felicidad, 0 significa no felicidad, 100 significa toda la felicidad, y en el medio significa alguna cantidad en el medio.

    Aquí hay algunos datos de muestra de los primeros 10 sujetos imaginarios.

    sujeto chocolate felicidad
    1 1 1
    2 1 1
    3 2 2
    4 2 4
    5 4 5
    6 4 5
    7 7 5
    8 8 5
    9 8 6
    10 9 6

    Le hicimos a cada sujeto dos preguntas por lo que hay dos puntuaciones para cada materia, una por su suministro de chocolate y otra por su nivel de felicidad. Es posible que ya notes algunas relaciones entre cantidad de chocolate y nivel de felicidad en la mesa. Para que esas relaciones sean aún más claras, vamos a trazar todos los datos en una gráfica.

     

    Gráficas de dispersión

    Cuando tienes dos mediciones por valor de datos, siempre puedes convertirlas en puntos y trazarlas en una gráfica de dispersión. Un diagrama de dispersión tiene un eje x horizontal y un eje y vertical. Se llega a elegir qué medida va sobre qué eje. Pongamos el suministro de chocolate en el eje x, y el nivel de felicidad en el eje y. La siguiente gráfica muestra 100 puntos para cada sujeto.

    library(ggplot2)
    subject<-1:100
    chocolate<-round(1:100*runif(100,.5,1))
    happiness<-round(1:100*runif(100,.5,1))
    the_df_CC<-data.frame(subject,chocolate,happiness)
    ggplot(the_df_CC,aes(x=chocolate,y=happiness))+
      geom_point()+
      theme_classic()
    Figura\(\PageIndex{1}\): Datos imaginarios que muestran una correlación positiva entre la cantidad de chocolate y la cantidad de felicidad.

    Quizás se esté preguntando, ¿por qué solo hay 100 puntos para los datos? No recogimos 100 medidas para el chocolate, y 100 medidas para la felicidad, ¿no debería haber 200 puntos? No. Cada punto es para una asignatura, hay 100 sujetos, por lo que hay 100 puntos.

    ¿Qué significan los puntos? Cada punto tiene dos coordenadas, una coordenada x para el chocolate y una coordenada y para la felicidad. El primer punto, todo el camino en la parte inferior izquierda es el primer sujeto de la tabla, que tenía cerca de 0 chocolate y cerca de cero felicidad. Puedes mirar cualquier punto, luego dibujar una línea recta hacia abajo hasta el eje x: eso te dirá cuánto chocolate tiene ese sujeto. Puedes dibujar una línea recta a la izquierda al eje y: eso te dirá cuánta felicidad tiene el sujeto.

    Ahora que estamos viendo el diagrama de dispersión, podemos ver muchas cosas. Los puntos están dispersos un poco, ¿no?, de ahí la gráfica de dispersión. Incluso cuando los puntos no se dispersan, todavía se les llama diagramas de dispersión, tal vez porque esos molestos puntos en la vida real tienen tanta dispersión todo el tiempo. Más importante aún, los puntos muestran una relación entre el suministro de chocolate y la felicidad. La felicidad es menor para las personas con suministros más pequeños de chocolate, y mayor para las personas con mayores suministros de chocolate. Parece que cuanto más chocolate tengas más feliz serás, y viceversa. Este tipo de relación se llama correlación positiva.

     

    Positivo, Negativo y Sin Correlación

    Viendo como estamos en el negocio de imaginar datos, imaginemos un poco más. Ya imaginamos cómo serían los datos si los suministros de chocolate más grandes aumentaran la felicidad. Lo volveremos a mostrar en un rato. Cómo imaginas que se vería el diagrama de dispersión si la relación se invirtiera, y los suministros de chocolate más grandes disminuyeran la felicidad. O bien, cómo imaginas que se vería el diagrama de dispersión si no hubiera relación, y la cantidad de chocolate que tienes no hace nada para tu felicidad. Invitamos a tu imaginación a mirar estas gráficas:

    library(ggplot2)
    subject_x<-1:100
    chocolate_x<-round(1:100*runif(100,.5,1))
    happiness_x<-round(1:100*runif(100,.5,1))
    df_positive<-data.frame(subject_x,chocolate_x,happiness_x)
    subject_x<-1:100
    chocolate_x<-round(1:100*runif(100,.5,1))
    happiness_x<-round(100:1*runif(100,.5,1))
    df_negative<-data.frame(subject_x,chocolate_x,happiness_x)
    subject_x<-1:100
    chocolate_x<-round(runif(100,0,100))
    happiness_x<-round(runif(100,0,100))
    df_random<-data.frame(subject_x,chocolate_x,happiness_x)
    all_data<-rbind(df_positive,df_negative,df_random)
    all_data<-cbind(all_data,correlation=rep(c("positive","negative","random"),each=100))
    ggplot(all_data,aes(x=chocolate_x,y=happiness_x))+
      geom_point()+
      theme_classic()+
      facet_wrap(~correlation)+
      xlab("chocolate supply")+
      ylab("happiness")
    Figura\(\PageIndex{2}\): Tres diagramas de dispersión que muestran correlación negativa, positiva y cero.

    El primer panel muestra una correlación negativa. La felicidad baja a medida que aumenta el suministro de chocolate. La correlación negativa ocurre cuando una cosa sube y la otra baja; o, cuando más de X es menos de Y, y viceversa. El segundo panel muestra una correlación positiva. La felicidad sube a medida que aumenta el chocolate a medida que aumenta el suministro La correlación positiva ocurre cuando ambas cosas suben juntas, y bajan juntas: más de X es más de Y, y viceversa. El tercer panel no muestra correlación. Aquí, no parece haber ninguna relación obvia entre el suministro de chocolate y la felicidad. Los puntos están dispersos por todo el lugar, la más verdadera de las parcelas de dispersión.

    Nota

    Estamos entrando en la idea de que las medidas de dos cosas pueden relacionarse, o correlacionarse entre sí. Es posible que las relaciones sean más complicadas que simplemente subir, o bajar. Por ejemplo, podríamos tener una relación que donde los puntos suben para la primera mitad de X, y luego bajar para la segunda mitad.

    La correlación cero ocurre cuando una cosa no está relacionada de ninguna manera con otras cosas: los cambios en X no se relacionan con ningún cambio en Y, y viceversa.


    This page titled 3.1: Si algo provocara que algo más cambiara, ¿cómo sería eso? is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.