Saltar al contenido principal
LibreTexts Español

11.2: Descripción general de la simulación

  • Page ID
    150338
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    La idea básica aquí es en realidad bastante simple. Haces algunas suposiciones sobre cuántas asignaturas habrá en tu diseño (conjunto N), haces algunas suposiciones sobre las distribuciones de las que estarás muestreando tus puntuaciones, luego usas R para fabricar datos falsos de acuerdo con los parámetros que estableces. Una vez que construyas algunos datos simulados, puedes realizar un análisis estadístico que planearías ejecutar sobre los datos reales. Entonces se puede ver lo que pasa. Más importante aún, puedes repetir el proceso anterior muchas veces. Esto es similar a realizar una replicación de tu experimento para ver si encuentras lo mismo, solo haces que la computadora replique tu simulación mil veces. De esta manera podrás ver cómo resultaría tu experimento simulado a largo plazo. Por ejemplo, podrías encontrar que el experimento que planeas ejecutar solo producirá un resultado “signficante” el 25% del tiempo, eso no es muy bueno. Tu simulación también podría decirte que si aumentas tu N por digamos 25, eso realmente podría ayudar, y tu nuevo experimento con N=25 podría tener éxito el 90% de las veces. Esa es información que vale la pena conocer.

    Antes de entrar en más detalles de simulación, vamos a ejecutar uno rápido. Haremos una\(t\) prueba independiente de muestras. Imagina que tenemos un estudio con N=10 en cada grupo. Hay dos grupos. Estamos midiendo la frecuencia cardíaca. Digamos que sabemos que la frecuencia cardíaca es en promedio de 100 latidos por minuto con una desviación estándar de 7. Vamos a medir la frecuencia cardíaca en la condición A donde no pasa nada, y vamos a medir la frecuencia cardíaca en la condición B mientras ven una película de miedo. Creemos que la película de miedo podría aumentar la frecuencia cardíaca en 5 latidos por minuto. Vamos a ejecutar una simulación de esto:

    group_A <- rnorm(10,100,7)
    group_B <- rnorm(10,105, 7)
    t.test(group_A,group_B,var.equal = TRUE)
    	Two Sample t-test
    
    data:  group_A and group_B
    t = -1.7061, df = 18, p-value = 0.1052
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
     -11.434802   1.185828
    sample estimates:
    mean of x mean of y 
     98.20342 103.32791 
    

    Se muestrearon 10 puntajes de una distribución normal para cada grupo. Cambiamos la media para group_b a 105, porque estábamos pensando que su frecuencia cardíaca sería 5 más que el grupo A. Hicimos una\(t\) prueba, y obtuvimos un resultado. Este resultado nos dice lo que sucede para esta simulación.

    Podríamos aprender más repitiendo la simulación 1000 veces, guardando los\(p\) valores -de cada replicación y luego averiguando cuántos de nuestros 1000 experimentos simulados nos dan un resultado significativo:

    save_ps<-length(1000)
    for(i in 1:1000){
      group_A <- rnorm(10,100,7)
      group_B <- rnorm(10,105, 7)
      t_results <- t.test(group_A,group_B,var.equal = TRUE)
      save_ps[i] <- t_results$p.value
    }
    prop_p<-length(save_ps[save_ps<0.05])/1000
    print(prop_p)
    [1] 0.344
    

    Ahora esto es más interesante. Se encontró que 34.4% de los experimentos simulados tuvieron un\(p\) valor -menor a 0.05. Eso no es muy bueno. Si fueras a recolectar datos en este tipo de experimento, y hicieras las suposiciones correctas sobre la media y la desviación estándar de la distribución, y hicieras la suposición correcta sobre el tamaño de la diferencia entre los grupos, estarías planeando ejecutar un experimento que no funcionaría más de la época.

    ¿Qué pasa si aumentamos el número de sujetos a 50 en cada grupo?

    save_ps<-length(1000)
    for(i in 1:1000){
      group_A <- rnorm(50,100,7)
      group_B <- rnorm(50,105, 7)
      t_results <- t.test(group_A,group_B,var.equal = TRUE)
      save_ps[i] <- t_results$p.value
    }
    prop_p<-length(save_ps[save_ps<0.05])/1000
    print(prop_p)
    [1] 0.957
    

    Ooh, mira, casi todos los experimentos son significativos ahora. Entonces, sería mejor utilizar 50 sujetos por grupo que 10 por grupo según esta simulación.

    Por supuesto, tal vez ya te estés preguntando tantos tipos diferentes de cosas. ¿Cómo podemos conocer plausiblemente los parámetros para la distribución de la que estamos muestreando? ¿No es todo esto solo conjeturas? Discutiremos algunos de estos temas a medida que avancemos en este capítulo.


    This page titled 11.2: Descripción general de la simulación is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Matthew J. C. Crump via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.