Saltar al contenido principal
LibreTexts Español

18.2: Tamaños de Efecto

  • Page ID
    150489
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    “La significación estadística es lo menos interesante de los resultados. Se deben describir los resultados en términos de medidas de magnitud —no sólo, un tratamiento afecta a las personas, sino cuánto les afecta”. Vidrio Gene (REF)

    En el último capítulo, discutimos la idea de que la significación estadística puede no necesariamente reflejar significación práctica. Para discutir la significación práctica, necesitamos una forma estándar de describir el tamaño de un efecto en términos de los datos reales, a los que nos referimos como tamaño de efecto. En esta sección presentaremos el concepto y discutiremos varias formas en que se pueden calcular los tamaños de los efectos.

    Un tamaño de efecto es una medida estandarizada que compara el tamaño de algún efecto estadístico con una cantidad de referencia, como la variabilidad de la estadística. En algunos campos de la ciencia y la ingeniería, esta idea se conoce como una “relación señal/ruido”. Hay muchas formas diferentes de cuantificar el tamaño del efecto, que dependen de la naturaleza de los datos.

    18.2.1 D de Cohen

    Una de las medidas más comunes del tamaño del efecto es la conocida como la d de Cohen, que lleva el nombre del estadístico Jacob Cohen (quien es más famoso por su trabajo de 1994 titulado “La tierra es redonda (p < .05)”). Se utiliza para cuantificar la diferencia entre dos medias, en términos de su desviación estándar:

    d=X1X2sd =\ frac {\ bar {X} _1 -\ bar {X} _2} {s}

    dondeX1\ bar {X} _1yX2\ bar {X} _2son los medios de los dos grupos, ysses la desviación estándar agrupada (que es una combinación de las desviaciones estándar para las dos muestras, ponderadas por sus tamaños de muestra):

    s=(n11)s12+(n21)s22n1+n22s =\ sqrt {\ frac {(n_1 - 1) s^2_1 + (n_2 - 1) s^2_2} {n_1 +n_2 -2}}donden1n_1yn2n_2son los tamaños de muestra ys12s^2_1ys22s^2_2son las desviaciones estándar para los dos grupos respectivamente. Tenga en cuenta que esto es muy similar en espíritu al estadístico t — la principal diferencia es que el denominador en el estadístico t se basa en el error estándar de la media, mientras que el denominador en la D de Cohen se basa en la desviación estándar de los datos. Esto significa que si bien el estadístico t crecerá a medida que el tamaño de la muestra sea mayor, el valor de D de Cohen seguirá siendo el mismo.

    Existe una escala de uso común para interpretar el tamaño de un efecto en términos de la d de Cohen:

    Cuadro 18.1: Interpetación de D de Cohen
    D Interpretación
    0.0 - 0.2 neglibible
    0.2 - 0.5 pequeño
    0.5 - 0.8 mediano
    0.8 - grande

    Puede ser útil observar algunos efectos comúnmente entendidos para ayudar a comprender estas interpretaciones. Por ejemplo, el tamaño del efecto para las diferencias de género en altura (d = 1.6) es muy grande por referencia a nuestra tabla anterior. También podemos ver esto observando las distribuciones de alturas masculinas y femeninas en nuestra muestra. La Figura 18.2 muestra que las dos distribuciones están bastante bien separadas, aunque todavía se superponen, destacando el hecho de que incluso cuando hay un tamaño de efecto muy grande para la diferencia entre dos grupos, habrá individuos de cada grupo que se parecen más al otro grupo.

    Gráficas de histograma suavizadas para alturas masculinas y femeninas en el conjunto de datos NHANES, mostrando distribuciones claramente distintas pero también claramente superpuestas.
    Figura 18.2: Gráficas de histograma suavizadas para alturas masculinas y femeninas en el conjunto de datos NHANES, mostrando distribuciones claramente distintas pero también claramente superpuestas.

    También vale la pena señalar que rara vez encontramos efectos de esta magnitud en la ciencia, en parte porque son efectos tan obvios que no necesitamos investigación científica para encontrarlos. Como veremos en el Capítulo 32 sobre reproducibilidad, los efectos reportados muy grandes en la investigación científica a menudo reflejan el uso de prácticas de investigación cuestionables en lugar de efectos verdaderamente enormes en la naturaleza. También vale la pena señalar que incluso para un efecto tan enorme, las dos distribuciones aún se superponen: habrá algunas hembras que son más altas que el macho promedio, y viceversa. Para los efectos científicos más interesantes, el grado de superposición será mucho mayor, por lo que no debemos saltar de inmediato a conclusiones fuertes sobre diferentes poblaciones basadas incluso en un tamaño de efecto grande.

    18.2.2 r de Pearson

    La r de Pearson, también conocida como coeficiente de correlación, es una medida de la fuerza de la relación lineal entre dos variables continuas. Discutiremos la correlación con mucho más detalle en el Capítulo 24, por lo que guardaremos los detalles para ese capítulo; aquí, simplemente introducimos r como una forma de cuantificar la relación entre dos variables.

    r es una medida que varía de -1 a 1, donde un valor de 1 representa una relación positiva perfecta entre las variables, 0 representa ninguna relación y -1 representa una relación negativa perfecta. La Figura 18.3 muestra ejemplos de varios niveles de correlación utilizando datos generados aleatoriamente.

    Ejemplos de diversos niveles de r.
    Figura 18.3: Ejemplos de diversos niveles de r.

    18.2.3 Relación de probabilidades

    En nuestra discusión anterior sobre la probabilidad discutimos el concepto de probabilidades, es decir, la probabilidad relativa de que algún evento suceda versus no suceda:

    oddsofA=P(A)P(¬A)cuotas\ de\ A =\ frac {P (A)} {P (\ neg A)}

    También discutimos la razón de probabilidades, que es simplemente la relación de dos probabilidades. La razón de probabilidades es una manera útil de describir los tamaños de efecto para variables binarias.

    Por ejemplo, tomemos el caso del tabaquismo y el cáncer de pulmón. Un estudio publicado en el International Journal of Cancer en 2012 (Pesch et al. 2012) combinó datos sobre la ocurrencia de cáncer de pulmón en fumadores e individuos que nunca han fumado en varios estudios diferentes. Tenga en cuenta que estos datos provienen de estudios de casos y controles, lo que significa que los participantes en los estudios fueron reclutados porque tenían o no cáncer; luego se examinó su estado de tabaquismo. Por lo tanto, estos números no representan la prevalencia de cáncer entre los fumadores de la población general, pero pueden decirnos sobre la relación entre el cáncer y el tabaquismo.

    Cuadro 18.2: Ocurrencia de cáncer por separado para fumadores actuales y aquellos que nunca han fumado
    Status NeverSmoked CorrienteFumador
    Sin Cáncer 2883 3829
    Cáncer 220 6784

    Podemos convertir estos números a odds ratios para cada uno de los grupos. Las probabilidades de que alguien tenga cáncer de pulmón que nunca haya fumado es de 0.08 mientras que las probabilidades de que un fumador actual tenga cáncer de pulmón es de 1.77. La relación de estas probabilidades nos dice sobre la probabilidad relativa de cáncer entre los dos grupos: La razón de probabilidades de 23.22 nos dice que las probabilidades de cáncer en los fumadores son aproximadamente 23 veces mayores que las de nunca fumadores.


    This page titled 18.2: Tamaños de Efecto is shared under a not declared license and was authored, remixed, and/or curated by Russell A. Poldrack via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.