Saltar al contenido principal
LibreTexts Español

5.4: El azar hace que algunas diferencias sean más probables que otras

  • Page ID
    150314
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Bien, hemos visto que el azar puede producir diferencias aquí. Pero, todavía no tenemos una buena idea de lo que suele hacer y no hacer el azar. Por ejemplo, si pudiéramos encontrar aquí la ventana de oportunidad, podríamos averiguar que el azar generalmente no produce diferencias de cierto tamaño grande. Si supiéramos cuál era el tamaño, entonces si ejecutamos experimento y nuestra diferencia era mayor de lo que puede hacer el azar, podríamos estar seguros de que el azar no produjo nuestra diferencia.

    Usemos la palabra diferencia un poco más, porque va a ser útil. De hecho, pensemos en nuestra medida de bolas verdes en términos de diferencia. Por ejemplo, en cada experimento contamos las bolas verdes para la mano izquierda y derecha. Lo que realmente queremos saber es si hay una diferencia entre ellos. Entonces, podemos calcular la puntuación de diferencia. Vamos a decidir esa diferencia puntuación = # de chicles verdes en la mano izquierda - # de chicles verdes en la mano derecha. Ahora, podemos volver a dibujar los gráficos de 10 barras desde arriba. Pero esta vez sólo veremos una barra por cada experimento. Esta barra mostrará la diferencia en número de chicles verdes.

    library(ggplot2)
    hand<-rep(rep(c("left","right"),each=10),10)
    experiment<-rep(1:10,each=20)
    gumball<-rbinom(20*10,1,.5)
    df<-data.frame(experiment,hand,gumball)
    sum_df<-aggregate(gumball~experiment*hand,df,sum)
    differences<-sum_df[sum_df$hand =="left",]$gumball-
      sum_df[sum_df$hand =="right",]$gumball
    dif_df<-data.frame(experiment=c(1:10),differences)
    dif_df$experiment<-as.factor(dif_df$experiment)
    ggplot(dif_df,aes(y=differences,x=experiment))+
      geom_bar(stat="identity")+
      theme_classic()+
      ylab("differences")
    Figura\(\PageIndex{1}\): Una mirada a las diferencias entre el número de cada tipo de chicle para las diferentes repeticiones. La diferencia debe ser cero, pero el error de muestreo produce diferencias distintas de cero.

    Las barras faltantes significan que hubo igual número de chicles verdes elegidas por las manecillas izquierda y derecha (la puntuación de diferencia es 0). Un valor positivo significa que más chicles verdes fueron elegidas por la mano izquierda que derecha. Un valor negativo significa que más chicles verdes fueron elegidas por la mano derecha que por la izquierda. Tenga en cuenta que si decidimos (y llegamos a decidir) calcular la diferencia en reversa (mano derecha - mano izquierda), los signos de las puntuaciones de diferencias voltearían alrededor.

    Estamos empezando a ver más de las diferencias que el azar puede producir. Los puntajes de diferencia son mayormente entre -2 y +2. Podríamos tener una impresión aún mejor ejecutando este experimento simulado 100 veces en lugar de solo 10 veces. ¿Qué tal si hacemos eso?

    library(ggplot2)
    hand<-rep(rep(c("left","right"),each=10),100)
    experiment<-rep(1:100,each=20)
    gumball<-rbinom(20*100,1,.5)
    df<-data.frame(experiment,hand,gumball)
    sum_df<-aggregate(gumball~experiment*hand,df,sum)
    differences<-sum_df[sum_df$hand =="left",]$gumball-
      sum_df[sum_df$hand =="right",]$gumball
    dif_df<-data.frame(experiment=c(1:100),differences)
    dif_df$experiment<-as.factor(dif_df$experiment)
    ggplot(dif_df,aes(y=differences,x=experiment))+
      geom_bar(stat="identity")+
      theme_classic()+
      ylab("differences")
    Figura\(\PageIndex{2}\): Replicar el muestreo 100 veces, y observar las diferencias cada vez. Hay mnay tipos de diferencias que solo el azar puede producir.

    Ooph, acabamos de ejecutar tantos experimentos simulados que el eje x es ilegible, pero va de 1 a 100. Cada barra representa la diferencia de número de bolas verdes elegidas aleatoriamente por la mano izquierda o derecha. ¿Comienzas a notar algo? Mira el eje y, esto muestra el tamaño de la diferencia. Sí, hay muchas barras de diferentes tamaños, esto nos demuestra que muchos tipos de diferencias sí ocurren por casualidad. Sin embargo, el eje y también está restringido. No pasa de -10 a +10. Las grandes diferencias mayores a 5 o -5 no ocurren muy a menudo.

    Ahora que tenemos un método para simular diferencias por casualidad, hagamos 10,000 experimentos simulados. Pero, en lugar de trazar las diferencias en un gráfico de barras para cada experimento, ¿qué tal si miramos el histograma de puntuaciones de diferencia? Esto nos dará una imagen más clara sobre qué diferencias ocurren con mayor frecuencia, y cuáles no. Esta será otra ventana al azar. La ventana de oportunidad de las diferencias.

    library(ggplot2)
    hand<-rep(rep(c("left","right"),each=10),10000)
    experiment<-rep(1:10000,each=20)
    gumball<-rbinom(20*10000,1,.5)
    df<-data.frame(experiment,hand,gumball)
    sum_df<-aggregate(gumball~experiment*hand,df,sum)
    differences<-sum_df[sum_df$hand =="left",]$gumball-
      sum_df[sum_df$hand =="right",]$gumball
    hist(differences,breaks=seq(-10,10,1))
    Figura\(\PageIndex{3}\): Histograma de las diferencias obtenidas por casualidad sobre 10,000 repeticiones. La mayor diferencia de frecuencia es 0, que es lo que esperamos por casualidad. Pero las diferencias pueden ser tan grandes como -10 o +10. Las diferencias mayores ocurren con menos frecuencia por casualidad. El azar no puede hacer todo.

    Nuestra simulación por computadora nos permite forzar al azar a operar cientos de veces, cada vez que produce una diferencia. Registramos la diferencia, luego al final de la simulación trazamos el histograma de las diferencias. El histograma comienza a mostrarnos de dónde provienen las diferencias. Recuerda la idea de que los números provienen de una distribución, y la distribución dice la frecuencia con la que ocurre cada número. Estamos viendo una de estas distribuciones. Nos está demostrando que el azar produce algunas diferencias con más frecuencia que otras. Primero, el azar suele producir 0 diferencias, esa es la barra más grande en el medio. El azar también produce mayores diferencias, pero a medida que las diferencias se hacen mayores (positivas o negativas), ocurren con menos frecuencia. La forma de este histograma es tu ventana de oportunidad, te dice lo que puede hacer el azar, te dice qué suele hacer el azar y lo que suele no hacer.

    Puedes usar esta ventana de oportunidad para ayudarte a hacer inferencias. Si te corriste en el experimento de gumball y encontraras que tu mano izquierda eligió 2 gumballs verdes más que rojas, ¿concluirías que tu mano izquierda era especial, y provocaste que eligieras más gumballs verdes? Ojalá que no. Podrías mirar la ventana de oportunidad y ver que las diferencias de talla +2 ocurren con bastante frecuencia solo por casualidad. No deberías sorprenderte si obtuviste una diferencia de +2. No obstante, ¿y si tu izquierda escogiera 5 chicles verdes más que chicles rojos? Bueno, el azar no hace esto muy a menudo, podrías pensar que algo está pasando con tu mano izquierda. Si tienes la friolera de 9 chicles verdes más que chicles rojos, realmente podrías empezar a preguntarte. Este es el tipo de cosas que podrían pasar (es posible), pero prácticamente nunca sucede por casualidad. Cuando obtienes cosas que casi nunca suceden por casualidad, puedes estar más seguro de que la diferencia refleja una fuerza causal que no es casualidad.


    This page titled 5.4: El azar hace que algunas diferencias sean más probables que otras is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.