Saltar al contenido principal
LibreTexts Español

4.11: Prueba T emparejada

  • Page ID
    149137
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje
    • Para usar el\(t\) —test pareado cuando se tiene una variable de medida y dos variables nominales, una de las variables nominales tiene solo dos valores, y solo se tiene una observación para cada combinación de las variables nominales; en otras palabras, tiene múltiples pares de observaciones. Se prueba si la diferencia media en los pares es diferente de\(0\).

    Cuándo usarlo

    Utilice la\(t\) prueba —pareada cuando haya una variable de medición y dos variables nominales. Una de las variables nominales tiene sólo dos valores, por lo que se tienen múltiples pares de observaciones. El diseño más común es que una variable nominal representa organismos individuales, mientras que la otra es “antes” y “después” de algún tratamiento. A veces los pares son espaciales más que temporales, como izquierdo vs. derecho, extremidad lesionada vs. extremidad no lesionada, etc. Puedes usar la\(t\) prueba pareada para otros pares de observaciones; por ejemplo, podrías muestrear una variable de medición ecológica por encima y por debajo de una fuente de contaminación en varios arroyos.

    Como ejemplo, los voluntarios cuentan el número de cangrejos herradura reproductivos en playas de la bahía de Delaware cada año; aquí hay datos de 2011 y 2012. La variable de medición es el número de cangrejos herradura, una variable nominal es 2011 vs. 2012, y la otra variable nominal es el nombre de la playa. Cada playa tiene un par de observaciones de la variable de medición, una de 2011 y otra de 2012. La cuestión biológica es si el número de cangrejos herradura ha subido o bajado entre 2011 y 2012.

    Playa 2011 2012 2012−2011
    Muelle de Bennetts 35282 21814 -13468
    Piedra Grande 359350 83500 -275850
    Broadkill 45705 13290 -32415
    Cabo Henlopen 49005 30150 -18855
    Fortescue 68978 125190 56212
    Fowler 8700 4620 -4080
    Gandys 18780 88926 70146
    Higbees 13622 1205 -12417
    Highs 24936 29800 4864
    Kimbles 17620 53640 36020
    Kitts Hummock 117360 68400 -48960
    Norburys Landing 102425 74552 -27873
    Bowers del Norte 59566 36790 -22776
    Cabo Norte Mayo 32610 4350 -28260
    Pickering 137250 110550 -26700
    Pierces Punto 38003 43435 5432
    Primehook 101300 20580 -80720
    Cañas 62179 81503 19324
    Matanza 203070 53940 -149130
    Bowers del Sur 135309 87055 -48254
    CSL Sur 150656 112266 -38390
    Ted Harvey 115090 90670 -24420
    Townbank 44022 21942 -22080
    Villas 56260 32140 -24120
    Woodland 125 1260 1135

    Como cabría esperar, hay mucha variación de una playa a otra. Si la diferencia entre años es pequeña en relación con la variación dentro de los años, se necesitaría un tamaño de muestra muy grande para obtener una prueba t significativa de dos muestras comparando las medias de los dos años. Una\(t\) prueba pareada solo analiza las diferencias, por lo que si los dos conjuntos de mediciones se correlacionan entre sí, la\(t\) prueba pareada será más poderosa que una\(t\) prueba de dos muestras. Para los cangrejos herradura, el\(P\) valor para una\(t\) prueba de dos muestras es\(0.110\), mientras que la\(t\) prueba pareada da un\(P\) valor de\(0.045\).

    Solo se puede usar el\(t\) —test emparejado cuando solo hay una observación para cada combinación de los valores nominales. Si tienes más de una observación para cada combinación, tienes que usar anova bidireccional con replicación. Por ejemplo, si tuvieras múltiples recuentos de cangrejos herradura en cada playa en cada año, tendrías que hacer el anova bidireccional.

    Solo se puede usar el\(t\) —test emparejado cuando los datos están en pares. Si quisieras comparar la abundancia de cangrejo herradura en 2010, 2011 y 2012, tendrías que hacer un anova bidireccional sin replicación.

    “Pareado\(t\) —test” es solo un nombre diferente para “anova bidireccional sin replicación, donde una variable nominal tiene solo dos valores”; los resultados son matemáticamente idénticos. El diseño emparejado es común, y si todo lo que estás haciendo son diseños emparejados, deberías llamar a tu prueba la\(t\) prueba emparejada; sonará familiar para más personas. Pero si algunos de tus conjuntos de datos están en pares, y algunos están en conjuntos de tres o más, deberías llamar a todas tus pruebas anovas bidireccionales; de lo contrario, la gente pensará que estás usando dos pruebas diferentes.

    Hipótesis nula

    La hipótesis nula es que la diferencia media entre observaciones pareadas es cero. Cuando la diferencia media es cero, las medias de los dos grupos también deben ser iguales. Debido al diseño pareado de los datos, la hipótesis nula de una\(t\) prueba pareada generalmente se expresa en términos de la diferencia de medias.

    Asunción

    El\(t\) —test pareado supone que las diferencias entre pares se distribuyen normalmente; puedes usar la hoja de cálculo del histograma descrita en esa página para verificar la normalidad. Si las diferencias entre pares son severamente no normales, sería mejor usar la prueba de rango firmado de Wilcoxon. No creo que la prueba sea muy sensible a las desviaciones de la normalidad, así que a menos que la desviación de la normalidad sea realmente obvia, no debes preocuparte por ello.

    La\(t\) prueba pareada no asume que las observaciones dentro de cada grupo son normales, solo que las diferencias son normales. Y no supone que los grupos sean homoscedásticos.

    Cómo funciona la prueba

    El primer paso en una\(t\) prueba pareada es calcular la diferencia para cada par, como se muestra en la última columna anterior. Luego se usa una prueba t —de una muestra para comparar la diferencia de medias con\(0\). Entonces, la\(t\) prueba pareada es realmente solo una aplicación de la\(t\) prueba de una muestra, pero debido a que el diseño experimental emparejado es tan común, recibe un nombre separado.

    Ejemplo

    Wiebe y Bortolotti (2002) examinaron el color en las plumas de la cola de los parpadeos norteños. Algunas de las aves tenían una pluma “extraña” que era diferente en color o longitud del resto de las plumas de la cola, presumiblemente porque volvió a crecer después de haberse perdido. Midieron la amarillez de una pluma extraña en cada una de\(16\) las aves y la compararon con la amarillez de una pluma típica de la misma ave.

    Fig. 4.11.1 Parpadeo norteño, Colaptes auratus.

    Hay dos variables nominales, tipo de pluma (típica o impar) y el ave individual, y una variable de medición, amarillez. Debido a que estas aves procedían de una zona híbrida entre parpadeos de eje rojo y parpadeos de color amarillo, hubo mucha variación de color entre las aves, lo que hizo más apropiado un análisis pareado. La diferencia fue significativa (\(P=0.001\)), con las plumas impares significativamente menos amarillas que las plumas típicas (los números mayores son más amarillos).

    Índice de amarillez
    Bird
    Pluma típica

    Pluma impar
    A -0.255 -0.324
    B -0.213 -0.185
    C -0.19 -0.299
    D -0.185 -0.144
    E -0.045 -0.027
    F -0.025 -0.039
    G -0.015 -0.264
    H 0.003 -0.077
    I 0.015 -0.017
    J 0.02 -0.169
    K 0.023 -0.096
    L 0.04 -0.33
    M 0.04 -0.346
    N 0.05 -0.191
    O 0.055 -0.128
    P 0.058 -0.182

    Wilder y Rypstra (2004) probaron el efecto del excremento de mantis religiosa sobre el comportamiento de las arañas lobo. Pusieron arañas\(12\) lobo en recipientes individuales; cada recipiente tenía dos semicírculos de papel de filtro, un semicírculo que había sido untado con excremento de mantis de oración y otro sin excremento. Observaron cada araña durante una hora, y midieron su velocidad de marcha mientras estaba en cada mitad del contenedor. Hay dos variables nominales, el tipo de papel de filtro (con o sin excremento) y la araña individual, y una variable de medición (velocidad de marcha). Diferentes arañas pueden tener diferente velocidad general de marcha, por lo que un análisis pareado es apropiado para probar si la presencia de excremento de mantis religiosa cambia la velocidad de marcha de una araña. La diferencia media en la velocidad de marcha es casi, pero no del todo, significativamente diferente de\(0\) (\(t=2.11,\; 11d.f.,\; P=0.053\)).

    Graficando los resultados

    Si hay un número moderado de pares, podrías trazar cada valor individual en un gráfico de barras, o bien trazar las diferencias. Aquí hay una gráfica en cada formato para los datos de parpadeo:

    Fig. 4.11.2 Colores de las plumas de la cola en el parpadeo norte. El gráfico en la parte superior muestra el índice de amarillez para una pluma “típica” con una barra negra y una pluma “impar” con una barra gris. El gráfico de la parte inferior muestra la diferencia (típica − impar).

    Pruebas relacionadas

    La\(t\) prueba pareada es matemáticamente equivalente a una de las pruebas de hipótesis de un anova bidireccional sin replicación. La\(t\) prueba pareada es más sencilla de realizar y puede sonar familiar para más personas. Deberías usar anova bidireccional si te interesa probar ambas hipótesis nulas (igualdad de medios de los dos tratamientos e igualdad de medios de los individuos); para el ejemplo de cangrejo herradura, si quisieras ver si hubo variación entre playas en densidad de cangrejo herradura, usarías anova bidireccional y mira ambas pruebas de hipótesis. En una\(t\) prueba pareada, es tan probable que los medios de los individuos sean diferentes que no tiene sentido probarlos.

    Si tienes múltiples observaciones para cada combinación de las variables nominales (como múltiples observaciones de cangrejos herradura en cada playa en cada año), debes usar anova bidireccional con replicación.

    Si ignoraste el emparejamiento de los datos, usarías un anova unidireccional o una prueba t —test de dos muestras. Cuando la diferencia de cada par es pequeña en comparación con la variación entre pares, una\(t\) prueba pareada puede darte mucha más potencia estadística que una\(t\) prueba —de dos muestras, por lo que debes usar la prueba emparejada siempre que tus datos estén en pares.

    Un análogo no paramétrico de la prueba\(t\) pareada es la prueba de rango firmado de Wilcoxon; se debe usar si las diferencias son severamente no normales. Una prueba más simple e incluso menos poderosa es la prueba de signos, que considera solo la dirección de la diferencia entre pares de observaciones, no el tamaño de la diferencia.

    Cómo hacer la prueba

    Hoja de Cálculo

    Las hojas de cálculo tienen una función integrada para realizar\(t\) —tests emparejados. Poner los números “antes” en una columna, y los números “después” en la columna adyacente, con las observaciones antes y después de cada individuo en la misma fila. Luego ingrese =TTEST (array1, array2, colas, tipo), donde array1 es la primera columna de datos, array2 es la segunda columna de datos, colas normalmente se establece en\(2\) para una prueba de dos colas, y type se establece en\(1\) para una\(t\) —test emparejada. El resultado de esta función es el\(P\) valor de la\(t\) —test pareada.

    A pesar de que es fácil de hacer usted mismo, he escrito una hoja de cálculo para hacer una prueba t emparejada pairedttest.xls.

    Páginas web

    Hay páginas web para hacer\(t\) pruebas emparejadas aquí, aquí, aquí y aquí.

    R

    El\(R\) compañero de Salvatore Mangiafico tiene un programa R de muestra para la prueba t pareada.

    SAS

    Para hacer una\(t\) prueba —emparejada en SAS, usa PROC TTEST con la opción PAREED. Aquí hay un ejemplo usando los datos de pluma de arriba:

    Plumas DATA;
    INPUT ave $ típica impar;
    DATALINES;
    A -0.255 -0.324
    B -0.213 -0.185
    C -0.190 -0.299
    D -0.185 -0.144
    E -0.045 -0.027
    F -0.025 -0.039
    G -0.015 -0.264
    H 0.003 -0.077
    I 0.015 -0.017
    J 0.020 -0.169
    K 0.023 -0.096
    L 0.040 -0.330
    M 0.040 -0.346
    N 0.050 -0.191
    O 0.055 -0.128
    P 0.058 -0.182
    ;
    PROC TTEST DATA=Plumas; PAREJADO
    típical*impar;
    RUN;

    Los resultados incluyen los siguientes, lo que demuestra que el\(P\) valor es\(0.0010\):

    t —tests
    Diferencia DF t Valor Pr > |t|
    típico - impar 15 4.06 0.0010

    Análisis de potencia

    Para estimar los tamaños de muestra necesarios para detectar una diferencia media que es significativamente diferente de cero, se necesita lo siguiente:

    • el tamaño del efecto, o la diferencia media. En los datos de plumas utilizados anteriormente, la diferencia media entre plumas típicas e impares es unidades de\(0.137\) amarillez.
    • la desviación estándar de las diferencias. Tenga en cuenta que esta no es la desviación estándar dentro de cada grupo. Por ejemplo, en los datos de plumas, la desviación estándar de las diferencias es\(0.135\); esta no es la desviación estándar entre plumas típicas, o la desviación estándar entre plumas impares, sino la desviación estándar de las diferencias;
    • alfa, o el nivel de significancia (generalmente\(0.05\));
    • power, la probabilidad de rechazar la hipótesis nula cuando es falsa y la verdadera diferencia es igual al tamaño del efecto (\(0.80\)y\(0.90\) son valores comunes).

    A modo de ejemplo, digamos que quieres hacer un estudio comparando el enrojecimiento de las plumas típicas y extrañas de la cola en los cardenales. Lo más cercano que puedes encontrar a los datos preliminares es el papel de Weibe y Bortolotti (2002) sobre amarillez en parpadeos. Encontraron una diferencia media de unidades de\(0.137\) amarillez, con una desviación estándar de\(0.135\); tú decides arbitrariamente que quieres poder detectar una diferencia media de unidades de\(0.10\) enrojecimiento en tus cardenales. En G*Power, elija “pruebas t” en Familia de pruebas y “Medias: Diferencia entre dos medias dependientes (pares emparejados)” en Prueba estadística. Elija “A priori: Calcular el tamaño de muestra requerido” en Tipo de análisis de potencia. En Parámetros de entrada, elija el número de colas (casi siempre dos), el alfa (generalmente\(0.05\)) y la potencia (generalmente algo así como\(0.8\) o\(0.9\)). Haga clic en el botón “Determinar” e ingrese el tamaño del efecto que desee (\(0.10\)para nuestro ejemplo) y la desviación estándar de las diferencias, luego presione el botón “Calcular y transferir a la ventana principal”. El resultado para nuestro ejemplo es un tamaño de muestra total de\(22\), lo que significa que si la verdadera diferencia media es unidades de\(0.10\) enrojecimiento y la desviación estándar de las diferencias es\(0.135\), tendrías la\(90\%\) posibilidad de obtener un resultado que sea significativo en el\(P<0.05\) nivel si muestreaste plumas típicas e impares de\(22\) cardenales.

    Referencias

    1. Imagen de parpadeo norteño de Steve Nanz.
    2. Wiebe, K.L., y G.R. Bortolotti. 2002. Variación del color basado en carotenoides en parpadeos norteños en una zona híbrida. Boletín Wilson 114:393-400.
    3. Wilder, S.M., y A.L. Rypstra. 2004. Las señales químicas de un depredador introducido (Mantodea, Mantidae) reducen el movimiento y forrajeo de una araña lobo nativa (Araneae, Lycosidae) en el laboratorio. Entomología Ambiental 33:1032-1036.

    This page titled 4.11: Prueba T emparejada is shared under a not declared license and was authored, remixed, and/or curated by John H. McDonald via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.