Saltar al contenido principal
LibreTexts Español

19.3: Diferencia entre dos medias

  • Page ID
    152423
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    • Indicar cómo la significancia inherente de las escalas afecta al tipo de medida que se debe utilizar
    • Compute\(g\)
    • Compute\(d\)
    • Indicar el efecto de la variabilidad de los sujetos sobre el tamaño de las medidas estandarizadas

    Cuando las unidades de una escala de medida son significativas por derecho propio, entonces la diferencia entre medias es una medida buena y fácilmente interpretable del tamaño del efecto. Por ejemplo, un estudio realizado por Holbrook, Crowther, Lotter, Cheng y King en\(2000\) investigó la efectividad de la benzodiazepina para el tratamiento del insomnio. Estos investigadores encontraron que, en comparación con un placebo, este medicamento aumentó la duración total del sueño en una media de\(61.8\) minutos. Esta diferencia de medias muestra claramente el grado en que la benzodiazepina es efectiva. (Es importante tener en cuenta que en ocasiones se encontró que el medicamento tiene efectos secundarios adversos).

    Cuando la variable dependiente se mide en una escala de ratio, a menudo es informativo considerar la diferencia proporcional entre medias además de la diferencia absoluta. Por ejemplo, si en el estudio de Holbrook et al. el tiempo medio de sueño total para el grupo placebo fue de\(120\) minutos, entonces el aumento de\(61.8\) -minuto representaría un\(51\%\) aumento en el tiempo de sueño. Por otro lado, si el tiempo medio de sueño para el placebo fuera\(420\) minutos, entonces el aumento de\(61.8\) -minutos representaría un\(15\%\) aumento en el tiempo de sueño.

    Es interesante observar que si se aplica una transformación logarítmica a la variable dependiente, entonces los cambios porcentuales iguales en la escala original resultarán en cambios absolutos iguales en la escala logarítmica. Por ejemplo, supongamos que el tiempo medio\(10\%\) de sueño aumentó de\(400\) minutos a\(440\) en una condición y\(10\%\) de\(300\) a\(330\) minutos en una segunda condición. Si tomamos la base logarítmica\(10\) de estos valores, nos encontramos con que

    \[\log_{10}(440) - \log_{10}(400) = 2.643 - 2.602 = 0.041\]

    Del mismo modo,

    \[\log_{10}(330) - \log_{10}(300) = 2.518 - 2.477 = 0.041\]

    Muchas veces la variable dependiente se mide en una escala que no es inherentemente significativa. Por ejemplo, en el estudio de caso “Animal Research”, las actitudes hacia la investigación animal se midieron en una\(7\) escala de puntos. La calificación media de las mujeres sobre si la investigación animal es incorrecta fue unidades de\(1.47\) escala superior a la calificación media de los hombres. Sin embargo, no está claro si esta diferencia\(1.47\) -unidad debe considerarse un efecto grande o un efecto pequeño, ya que no está claro exactamente qué significa esta diferencia.

    Cuando la escala de una variable dependiente no es intrínsecamente significativa, es común considerar la diferencia entre medias en unidades estandarizadas. Es decir, el tamaño del efecto se mide en términos del número de desviaciones estándar en las que difieren las medias. Dos medidas de uso común son Hedges\(g\) y Cohen\(d\). Ambas medidas consisten en la diferencia entre medias divididas por la desviación estándar. Se diferencian solo en que Hedges\(g\) usa la versión de la fórmula de desviación estándar en la que divides por\(N-1\), mientras que Cohen\(d\) usa la versión en la que divides por\(N\). A continuación se dan las dos fórmulas.

    \[g = \frac{M_1-M_2}{\sqrt{MSE}}\]

    \[d = g \sqrt{\frac{N}{N-2}}\]

    donde\(M_1\) es la media del primer grupo,\(M_2\) es la media del segundo grupo,\(MSE\) es el error cuadrático medio, y\(N\) es el número total de observaciones.

    Las medidas estandarizadas como Cohen\(d\) y Hedges\(g\) tienen la ventaja de que están libres de escala. Es decir, dado que la variable dependiente está estandarizada, las unidades originales son reemplazadas por unidades estandarizadas y son interpretables aunque las unidades de escala originales no tengan un significado claro. Considere el estudio de caso Animal Research en el que se midieron actitudes en una\(7\) escala de puntos. En una calificación de si la investigación animal es incorrecta, la media para las mujeres fue\(5.353\), la media para los hombres fue\(3.882\), y\(MSE\) fue\(2.864\). Los setos se\(g\) pueden calcular para ser\(0.87\). Es más significativo decir que las medias fueron desviaciones\(0.87\) estándar separadas que unidades de\(1.47\) escala aparte, ya que las unidades de escala no están bien definidas.

    Es natural preguntarse qué constituye un gran efecto. Si bien no hay una respuesta objetiva a esta pregunta, se han adoptado ampliamente las pautas sugeridas por Cohen (\(1988\)) que establecen que un tamaño de\(0.2\) efecto\(0.5\) es un efecto pequeño, un tamaño de efecto de es un efecto medio y un tamaño de efecto de\(0.8\) es un efecto grande. Con base en estas pautas, el tamaño del efecto de\(0.87\) es un efecto grande.

    Cabe señalar, sin embargo, que estos lineamientos son algo arbitrarios y no han sido universalmente aceptados. Por ejemplo, Lenth (\(2001\)) argumentó que se ignoran otros factores importantes si se usa la definición de tamaño de efecto de Cohen para elegir un tamaño de muestra para lograr un nivel de potencia dado.

    Temas interpretacionales

    Es importante darse cuenta de que la importancia de un efecto depende del contexto. Por ejemplo, un pequeño efecto puede marcar una gran diferencia si sólo son de interés las observaciones extremas. Considerar una situación en la que se utilice una prueba para seleccionar estudiantes para un programa altamente selectivo. Supongamos que hay dos tipos de estudiantes (rojo y azul) y que la media para los estudiantes rojos es\(52\), la media para los estudiantes azules es\(50\), ambas distribuciones son normales, y la desviación estándar para cada distribución es\(10\). Por lo tanto, la diferencia de medias es solo desviaciones\(0.2\) estándar y generalmente se consideraría una pequeña diferencia. Ahora supongamos que sólo los estudiantes que obtuvieron calificaciones\(70\) o superiores serían seleccionados para el programa. ¿Habría una gran diferencia entre la proporción de estudiantes azules y rojos que podrían ser aceptados en el programa? Resulta que la proporción de estudiantes rojos que calificarían es\(0.036\) y la proporción de estudiantes azules es\(0.023\). Si bien esta diferencia es pequeña en términos absolutos, la proporción de estudiantes rojos a azules que califican es\(1.6:1\). Esto significa que si\(100\) los estudiantes fueran aceptados y si se aplicara un número igual de estudiantes rojos y azules seleccionados aleatoriamente,\(62\%\)\(38\%\) sería rojo y azul. En la mayoría de los contextos esto se consideraría una diferencia importante.

    Cuando el tamaño del efecto se mide en unidades de desviación estándar como lo es para Hedges\(g\) y Cohen\(d\), es importante reconocer que la variabilidad en los sujetos tiene una gran influencia en la medida del tamaño del efecto. Por lo tanto, si dos experimentos compararan el mismo tratamiento con un testigo pero los sujetos fueran mucho más homogéneos en\(\text{Experiment 1}\) que en\(\text{Experiment 2}\), entonces una medida estandarizada del tamaño del efecto sería mucho mayor en el primer experimento que en el segundo. Considere dos experimentos hipotéticos sobre el efecto de un programa de ejercicios sobre la presión arterial. Supongamos que el efecto medio sobre la presión arterial sistólica del programa es\(10mm\; Hg\) y que, debido a las diferencias en las poblaciones de sujetos muestreadas en los dos experimentos, la desviación estándar fue\(20\) en\(\text{Experiment 1}\) y\(30\) en\(\text{Experiment 2}\). Bajo estas condiciones, la medida estandarizada del tamaño del efecto sería\(0.50\) en\(\text{Experiment 1}\) y\(0.33\) en\(\text{Experiment 2}\). Esta diferencia estandarizada en el tamaño del efecto ocurre a pesar de que la efectividad del tratamiento es exactamente la misma en los dos experimentos.

    Referencia

    1. Cohen, J. (1988) Análisis Estadístico de Poder para las Ciencias del Comportamiento (segunda ed.). Lawrence Erlbaum Asociados.
    2. Lenth, R. V. (2001) Algunas pautas prácticas para la determinación efectiva del tamaño de la muestra. El estadístico americano, 55, 187-193.

    This page titled 19.3: Diferencia entre dos medias is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.