Saltar al contenido principal
LibreTexts Español

5.4: Análisis de Covarianza

  • Page ID
    149177
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)
    Objetivos de aprendizaje
    • Para utilizar el análisis de covarianza (ancova) cuando se quiere comparar dos o más líneas de regresión entre sí; ancova le dirá si las líneas de regresión son diferentes entre sí en pendiente o intercepción.

    Cuándo usarlo

    Utilice el análisis de covarianza (ancova) cuando tenga dos variables de medición y una variable nominal. La variable nominal divide las regresiones en dos o más conjuntos.

    El propósito de la ancova es comparar dos o más líneas de regresión lineal. Es una forma de comparar la\(Y\) variable entre grupos mientras se controla estadísticamente la variación en\(Y\) causada por la variación en la\(X\) variable. Por ejemplo, Walker (1962) estudió los cantos de apareamiento de los grillos de árboles machos. Cada golpe de ala de un grillo produce un pulso de canto, y las hembras pueden usar el número de pulsos por segundo para identificar machos de la especie correcta. Walker (1962) quería saber si los chirridos de los grillos Oecanthus exclamationis y Oecanthus niveus tenían diferentes frecuencias de pulso. Midió la frecuencia del pulso de los grillos a una variedad de temperaturas:

    O. exclamationis O. niveus
    Temperatura
    (C°)
    Pulsos
    por segundo
    Temperatura
    (C°)
    Pulsos
    por segundo
    20.8 67.9 17.2 44.3
    20.8 65.1 18.3 47.2
    24.0 77.3 18.3 47.6
    24.0 78.7 18.3 49.6
    24.0 79.4 18.9 50.3
    24.0 80.4 18.9 51.8
    26.2 85.8 20.4 60.0
    26.2 86.6 21.0 58.5
    26.2 87.5 21.0 58.9
    26.2 89.1 22.1 60.7
    28.4 98.6 23.5 69.8
    29.0 100.8 24.2 70.9
    30.4 99.3 25.9 76.2
    30.4 101.7 26.5 76.1
    26.5 77.0
    26.5 77.7
    28.6 84.7
    media 85.6 media 62.4

    Si ignoras las temperaturas y solo comparas las frecuencias medias del pulso, O. exclamationis tiene una tasa mayor que O. niveus, y la diferencia es altamente significativa (prueba t de dos muestras,\(P=2\times 10^{-5}). However, you can see from the graph that pulse rate is highly associated with temperature. This confounding variable means that you'd have to worry that any difference in mean pulse rate was caused by a difference in the temperatures at which you measured pulse rate, as the average temperature for the O. exclamationis measurements was \(3.6^{\circ}C\) mayor que para O. niveus. También tendrías que preocuparte de que O. exclamationis pueda tener una tasa más alta que O. niveus a algunas temperaturas pero no a otras.

    Se puede controlar la temperatura con ancova, lo que le dirá si la línea de regresión para O. exclamationis es mayor que la línea para O. niveus; si lo es, eso significa que O. exclamationis tendría una frecuencia de pulso mayor a cualquier temperatura.

    Fig. 5.4.1 Tasa de llamadas vs. temperatura en dos especies de grillo, Oecanthus exclamationis (círculos y líneas continuas) y O. niveus (círculos abiertos y línea discontinua).

    Hipótesis nulas

    Se prueban dos hipótesis nulas en una ancova. Recuerde que la ecuación de una línea de regresión toma la forma\(\hat{Y}=a+bX\), donde\(a\) está la\(Y\) intersección y\(b\) es la pendiente. La primera hipótesis nula de ancova es que las pendientes de las líneas de regresión (\(b\)) son todas iguales; es decir, que las líneas de regresión son paralelas entre sí. Si acepta la hipótesis nula de que las líneas de regresión son paralelas, prueba la segunda hipótesis nula: que las\(Y\) intercepciones de las líneas de regresión (\(a\)) son todas iguales.

    Algunas personas definen la segunda hipótesis nula de ancova como que las medias ajustadas (también conocidas como medias de mínimos cuadrados) de los grupos son las mismas. La media ajustada para un grupo es la\(Y\) variable predicha para ese grupo, en la\(X\) variable media para todos los grupos combinados. Debido a que las líneas de regresión que utiliza para estimar la media ajustada son paralelas (tienen la misma pendiente), la diferencia en las medias ajustadas es igual a la diferencia en las\(Y\) intercepciones. Declarar la hipótesis nula en términos de\(Y\) intercepciones hace que sea más fácil entender que estás probando hipótesis nulas sobre las dos partes de las ecuaciones de regresión; declararlo en términos de medias ajustadas puede hacer que sea más fácil tener una idea del tamaño relativo de la diferencia. Para los datos de grillo, las medias ajustadas son\(78.4\) pulsos por segundo para O. exclamationis y\(68.3\) para O. niveus; estos son los valores pronosticados a la temperatura media de todas las observaciones,\(23.8^{\circ}C\). Las\(Y\) intercepciones son\(-7.2\) y\(-17.3\) pulsos por segundo, respectivamente; mientras que la diferencia es la misma (\(10.1\)más pulsos por segundo en O. exclamationis), las medias ajustadas te dan una idea de cuán grande es esta diferencia comparada con la media.

    Supuestos

    Ancova hace los mismos supuestos que la regresión lineal: normalidad y homocedasticidad de Y para cada valor de X, e independencia. No tengo idea de lo sensible que es ante las desviaciones de estos supuestos.

    Cómo funciona la prueba

    El primer paso para realizar un ancova es calcular cada línea de regresión. En el ejemplo de grillo, la línea de regresión para O. exclamationis es\(\hat{Y}=3.75X-11.0\), y la línea para O. niveus lo es\(\hat{Y}=3.52X-15.4\).

    A continuación, se ve si las pendientes son significativamente diferentes. Esto se hace porque no se puede hacer el paso final del anova, comparando las\(Y\) intercepciones, si las pendientes son significativamente diferentes entre sí. Si las pendientes de las líneas de regresión son diferentes, las líneas se cruzan entre sí en alguna parte, y un grupo tiene\(Y\) valores más altos en una parte de la gráfica y\(Y\) valores menores en otra parte de la gráfica. (Si las pendientes son diferentes, existen técnicas para probar la hipótesis nula de que las líneas de regresión tienen el mismo\(Y\) valor para un\(X\) valor en particular, pero no se usan muy a menudo y no las consideraré aquí).

    Si las pendientes no son significativamente diferentes, entonces dibuja una línea de regresión a través de cada grupo de puntos, todos con la misma pendiente. Esta pendiente común es un promedio ponderado de las pendientes de los diferentes grupos. Para los grillos, las pendientes no son significativamente diferentes (\(P=0.25\)); la pendiente común es\(3.60\), que está entre las pendientes para las líneas separadas (\(3.52\)y\(3.75\)).

    La prueba final en la ancova es probar la hipótesis nula de que todas las\(Y\) intercepciones de las líneas de regresión con pendiente común son las mismas. Debido a que las líneas son paralelas, decir que son significativamente diferentes en un punto (la\(Y\) intercepción) significa que las líneas son diferentes en cualquier punto.

    Es posible que vea “medias ajustadas”, también conocidas como “medias de mínimos cuadrados”, en la salida de un programa ancova. La media ajustada para un grupo es el valor predicho para la\(Y\) variable cuando la\(X\) variable es la media de todas las observaciones en todos los grupos, utilizando la ecuación de regresión con la pendiente común. Para los grillos, la media de todas las temperaturas (para ambas especies) es\(23.76^{\circ}C\). La ecuación de regresión para O. exclamationis (con la pendiente común) es\(\hat{Y}=3.60X-7.14\), por lo que la media ajustada para O. exclamationis se encuentra sustituyendo\(23.76\)\(X\) en la ecuación de regresión, rindiendo\(78.40\). Debido a que las líneas de regresión son paralelas, la diferencia se ajusta medias es igual a la diferencia en\(y\) -intercepciones, por lo que puede reportar cualquiera de las dos.

    Aunque el uso más común de ancova es para comparar dos líneas de regresión, es posible comparar tres o más regresiones. Si sus pendientes son todas iguales, puedes probar cada par de líneas para ver qué pares tienen\(Y\) intercepciones significativamente diferentes, usando una modificación de la prueba de Tukey-Kramer.

    Ejemplo\(\PageIndex{1}\)

    En la especie de luciérnaga Photinus ignitus, el macho transfiere un espermatóforo grande a la hembra durante el apareamiento. Rooney y Lewis (2002) querían saber si los recursos extra de este “don nupcial” permiten a la hembra producir más descendencia. Colectaron hembras\(40\) vírgenes y\(20\) aparearon de ellas a un macho y\(20\) a tres machos. Luego contaron el número de huevos que puso cada hembra. Debido a que la fecundidad varía con el tamaño de la hembra, analizaron los datos usando ancova, con el peso de la hembra (antes del apareamiento) como variable de medición independiente y el número de huevos puestos como variable de medición dependiente. Debido a que el número de machos tiene sólo dos valores (“uno” o “tres”), se trata de una variable nominal, no de medición.

    Fig. 5.4.2 Huevos puestos vs. peso femenino en la luciérnaga Photinus ignitus.. Los círculos rellenos son hembras que se han apareado con tres machos; los círculos abiertos son hembras que se han apareado con un macho.

    Las pendientes de las dos líneas de regresión (una para hembras monoapareadas y otra para hembras de triple apareamiento) no son significativamente diferentes (\(F_{1,\; 36}=1.1,\; P=0.30\)). Los\(Y\) interceptos son significativamente diferentes (\(F_{1,\; 36}=8.8, P=0.005\)); las hembras que se han apareado tres veces tienen significativamente más descendencia que las hembras apareadas una vez.

    Ejemplo\(\PageIndex{2}\)

    A los paleontólogos les gustaría poder determinar el sexo de los dinosaurios a partir de sus huesos fosilizados. Para ver si esto es factible, Prieto-Márquez et al. (2007) midieron varios caracteres que se cree que distinguen los sexos en caimanes (Alligator mississipiensis), que se encuentran entre los parientes vivos más cercanos de dinosaurios que no son aves.

    Fig. 5.4.3 Esqueleto de un cocodrilo americano.

    Uno de los caracteres fue el ancho del canal pélvico, el cual querían estandarizar utilizando la longitud del hocico y ventilación.

    Fig. 5.4.4 Ancho del canal pélvico vs. longitud hocico-ventilación en el cocodrilo americano. Los círculos azules y la línea son machos; las X rosadas y la línea son hembras.

    Las pendientes de las líneas de regresión no son significativamente diferentes (\(P=0.9101\)). Las intercepciones Y son significativamente diferentes (\(P=0.0267\)), lo que indica que los caimanes machos de una longitud dada tienen un ancho de canal pélvico significativamente mayor. No obstante, la inspección de la gráfica muestra que existe mucho solapamiento entre los sexos incluso después de estandarizar para el sexo, por lo que no sería posible determinar de manera confiable el sexo de un solo individuo con este personaje solo.

    Graficando los resultados

    Se grafica una ancova con un scattergraph, con la variable independiente en el\(X\) eje y la variable dependiente en el\(Y\) eje. Use un símbolo diferente para cada valor de la variable nominal, como en la gráfica de luciérnaga anterior, donde se utilizan círculos rellenos para las hembras tres veces apareadas y círculos abiertos para las hembras que alguna vez aparearon. Para obtener este tipo de gráfico en una hoja de cálculo, pondría todos los\(X\) valores en columna\(A\), un conjunto de\(Y\) valores en columna\(B\), el siguiente conjunto de\(Y\) valores en columna\(C\), y así sucesivamente.

    La mayoría de las personas trazan las líneas de regresión individuales para cada conjunto de puntos, como se muestra en la gráfica de luciérnaga, aunque las pendientes no sean significativamente diferentes. Esto permite a la gente ver qué tan similares o diferentes se ven las pendientes. Esto es fácil de hacer en una hoja de cálculo; simplemente haga clic en uno de los símbolos y elija “Agregar línea de tendencia” en el menú Gráfico.

    Pruebas similares

    Otra forma de estandarizar una variable de medición por otra es tomar la relación de las dos. Por ejemplo, digamos que algunos rufianes de barrio te han estado dando el dedo, y esto te inspira a comparar la longitud del dedo medio de niños contra niñas. Obviamente, los niños más altos tenderán a tener dedos medios más largos, por lo que quieres estandarizar para la altura; quieres saber si los niños y niñas de la misma altura tienen diferentes longitudes de dedo medio. Una forma sencilla de hacerlo sería dividir la longitud del dedo medio por la estatura del niño y comparar estas proporciones entre niños y niñas usando una prueba t de dos muestras.

    Fig. 5.4.5 Longitud del dedo medio vs estatura en niños.

    El uso de una relación como esta hace que las estadísticas sean más simples y fáciles de entender, pero solo debes usar ratios cuando las dos variables de medición sean isométricas. Esto significa que la relación de\(Y\) over\(X\) no cambia a medida que\(X\) aumenta; en otras palabras, la\(Y\) intercepción de la línea de regresión es\(0\). Como se puede ver en la gráfica, la longitud del dedo medio en una muestra de\(645\) niños (Snyder et al. 1977) sí se ve isométrica, por lo que se podrían analizar las proporciones. La relación promedio en el conjunto de datos de Snyder et al. (1977) es\(0.0472\) para niños y\(0.0470\) niñas, y la diferencia no es significativa (\(t\)prueba de dos muestras,\(P=0.50\)).

    Fig. 5.4.6 Ancho de boca vs altura en niños.

    Sin embargo, muchas mediciones son alométricas: la relación cambia a medida que la\(X\) variable aumenta. Por ejemplo, digamos que además de darte el dedo, los rapscallions te han estado maldiciendo, por lo que decides comparar el ancho de boca de niños y niñas. Como puede ver en la gráfica, el ancho de la boca es muy alométrico; los niños más pequeños tienen bocas más grandes como proporción de su altura. Como resultado, cualquier diferencia entre niños y niñas en la relación ancho/altura de boca podría deberse solo a una diferencia de altura entre niños y niñas. Para los datos donde las líneas de regresión no tienen una\(Y\) intercepción de cero, es necesario comparar grupos usando ancova.

    A veces las dos variables de medición son exactamente la misma variable medida en diferentes momentos o lugares. Por ejemplo, si midiste los pesos de dos grupos de individuos, ponías a algunos en una nueva dieta para bajar de peso y los demás en una dieta de control, luego los volviste a pesar un año después, podrías tratar la diferencia entre los pesos finales e iniciales como una sola variable, y comparar la pérdida de peso media para el control al grupo de pérdida de peso promedio del grupo de dieta usando un anova unidireccional. La alternativa sería tratar los pesos finales e iniciales como dos variables diferentes y analizarlos usando una ancova: compararía la línea de regresión del peso final vs peso inicial para el grupo control con la línea de regresión para el grupo de dieta. El anova unidireccional sería más sencillo, y probablemente perfectamente adecuado; el ancova podría ser mejor, particularmente si tuvieras una amplia gama de pesos iniciales, porque te permitiría ver si el cambio de peso dependía del peso inicial.

    Cómo hacer la prueba

    Hoja de cálculo y páginas web

    Richard Lowry ha hecho páginas web que permiten realizar ancova con dos, tres o cuatro grupos, y una hoja de cálculo descargable para ancova con más de cuatro grupos. Puede cortar y pegar datos de una hoja de cálculo a las páginas web. En los resultados, el\(P\) valor para “medias ajustadas” es el\(P\) valor para la diferencia en las intercepciones entre las líneas de regresión; el\(P\) valor para “entre regresiones” es el\(P\) valor para la diferencia en pendientes.

    R

    El\(R\) compañero de Salvatore Mangiafico cuenta con un programa R de muestra para el análisis de la covarianza.

    SAS

    Aquí se explica cómo hacer análisis de covarianza en SAS, utilizando los datos de cricket de Walker (1962); calculé los valores digitalizando la gráfica, por lo que los resultados pueden ser ligeramente diferentes de los que aparecen en el artículo.

    Grillos de datos; especies de
    ENTRADA $ pulso temp @@;
    DATALINES;
    ex 20.8 67.9 ex 20.8 65.1 ex 24 77.3 ex 24 78.7 ex 24 79.4
    ex 24 80.4 ex 26.2 85.8 ex 26.2 86.6 ex 26.2 87.5 ex 26.2 89.1
    ex 28.4 98.6 ex 29 100.8 ex 30.4 99.3 ex 30.4 101.7
    niv 17.2 44.3 niv 18.3 47.2 niv 18.3 47.6 niv 18.3 49.6
    niv 18.9 50.3 niv 18.9 51.8 niv 20.4 60 niv 21 58.5
    niv 21 58.9 niv 22.1 60.7 niv 23.5 69.8 niv 24.2 70.9
    niv 25.9 76.2 niv 26.5 76.1 niv 26.5 77 niv 26.5 77 niv 5 77.7
    niv 28.6 84.7
    ;
    PROC GLM data=grillos;
    CLASE especie;
    MODEL pulse=temp especie temp*species;
    PROC GLM data=grillos; especie
    CLASE;
    MODEL pulse=temp especie;
    CORRER;

    La sentencia CLASS da la variable nominal, y la sentencia MODEL tiene la\(Y\) variable a la izquierda del signo igual. La primera vez que ejecuta PROC GLM, la instrucción MODEL incluye la\(X\) variable, la variable nominal y el término de interacción (“temp*species” en el ejemplo). Esto prueba si las pendientes de las líneas de regresión son significativamente diferentes. Verás sumas de cuadrados tanto Tipo I como Tipo III; las sumas de cuadrados Tipo III son las correctas para usar:

    Fuente DF Tipo III SS Cuadrado Medio F Valor Pr > F

    temp 1 4126.440681 4126.440681 1309.61 <.0001
    especies 1 2.420117 2.420117 0.77 0.3885
    temp*species 1 4.275779 4.275779 1.36 0.2542 pendiente Valor P

    Si el\(P\) valor de las pendientes es significativo, habrías terminado. En este caso no lo es, así que se mira la salida de la segunda ejecución de PROC GLM. Esta vez, la instrucción MODEL no incluye el término de interacción, por lo que el modelo asume que las pendientes de las líneas de regresión son iguales. Este\(P\) valor te indica si las\(Y\) intercepciones son significativamente diferentes:

    Fuente DF Tipo III SS Cuadrado Medio F Valor Pr > F

    temp 1 4376.082568 4376.082568 1371.35 <.0001
    especies 1 598.003953 598.003953 187.40 <.0001 interceptar P valor

    Si quieres la pendiente común y las medias ajustadas, agrega Solución a la sentencia MODEL y otra línea con LSMEANS y la variable CLASS:

    PROC GLM data=grillos; especie
    CLASE;
    MODEL pulse=temp especies/solución; especies
    LSMEANS;

    produce esto como parte de la salida:


    Parámetro Estándar Estimación Error t Valor Pr > |t|

    Intercepción -17.27619743 B 2.19552853 -7.87 <.0001
    temp 3.60275287 0.09728809 37.03 <. 0001
    especies ex 10.06529123 B 0.73526224 13.69 <.0001
    especies niv 0.00000000 B.

    NOTA: Se ha encontrado que la\(X'X\) matriz es singular, y se utilizó una inversa generalizada para resolver las ecuaciones normales. Los términos cuyas estimaciones van seguidas de la letra B no son únicamente estimables.

    El procedimiento GLM: Mínimos cuadrados Medias

    especie pulso LSMEAN

    ex 78.4067726
    niv 68.3414814

    Bajo “Estimar”,\(3.60\) se encuentra la pendiente común. \(-17.27\)es la\(Y\) intersección para la línea de regresión para O. niveus. \(10.06\)significa que la\(Y\) intercepción para O. exclamationis es\(10.06\) mayor (\(-17.27+10.06\)). Ignorar el mensaje aterrador acerca de que la matriz es singular.

    Si tienes más de dos líneas de regresión, puedes hacer una prueba de Tukey-Kramer comparando todos los pares de\(y\) -intercepciones. Si hubiera tres especies de grillo en el ejemplo, dirías “LSMEANS Species/PDIFF ADJUST=TUKEY;”.

    Análisis de potencia

    No se puede hacer un análisis de potencia para ancova con G*Power, así que he preparado una hoja de cálculo para hacer análisis de potencia para ancova ancovapower.xls, usando el método de Borm et al. (2007). Sólo funciona para ancova con dos grupos, y asume que cada grupo tiene la misma desviación estándar y la misma\(r^2\). Para usarlo, necesitarás:

    • el tamaño del efecto, o la diferencia en\(Y\) las intercepciones que esperas detectar;
    • la desviación estándar. Esta es la desviación estándar de todos los\(Y\) valores dentro de cada grupo (sin controlar para la\(X\) variable). Por ejemplo, en los datos de cocodrilo anteriores, esta sería la desviación estándar del ancho pélvico entre los machos, o la desviación estándar del ancho pélvico entre las hembras.
    • alfa, o el nivel de significancia (generalmente\(0.05\));
    • power, la probabilidad de rechazar la hipótesis nula cuando el tamaño del efecto dado es la verdadera diferencia (\(0.80\)o\(0.90\) son valores comunes);
    • el\(r^2\) dentro de los grupos. Para los datos de cocodrilo, este sería el ancho pélvico vs. longitud\(r^2\) del hocico entre los machos, o el\(r^2\) entre las hembras.

    A modo de ejemplo, digamos que quieres hacer un estudio con un ancova sobre ancho pélvico vs. longitud hocio-ventilación en cocodrilos machos y hembras, y como no tienes ningún dato preliminar sobre cocodrilos, vas a basar tu cálculo del tamaño de la muestra en los datos de cocodrilo. Se quiere detectar una diferencia en las\(Y\) intercepciones de\(0.2 cm\). La desviación estándar del ancho pélvico en los caimanes machos es\(1.45\) y para las hembras es\(1.02\); tomando el promedio, ingrese\(1.23\) por desviación estándar. El\(r^2\) en los machos es\(0.774\) y para las hembras lo es\(0.780\), así que ingresa el promedio (\(0.777\)) para\(r^2\) en la forma. Con\(0.05\) para el alfa y\(0.80\) para el poder, el resultado es que necesitarás cocodrilos\(133\) machos y cocodrilos\(133\) hembra.

    Referencias

    1. Llamadas de rana desde Knapp, W.S. 2007. Las ranas y sapos de Georgia.
    2. Esqueleto de cocodrilo de la Universidad de Washington: Biología 453, Anatomía Comparada de Vertebrados.
    3. Borm, G.F., J. Fransen, y W.A.J.G. Lemmens. 2007. Una fórmula simple de tamaño muestral para el análisis de covarianza en ensayos clínicos aleatorizados. Revista de Epidemiología Clínica 60:1234-1238.
    4. Prieto-Márquez, A., P.M. Gignac, y S. Joshi. 2007. Evaluación neontológica de atributos esqueléticos pélvicos que supuestamente reflejan el sexo en arcosaurios no aviares extintos. Diario de Paleontología de Vertebrados 27:603-609.
    5. Rooney, J., y S.M. Lewis. 2002. Ventaja de fitness de regalos nupciales en luciérnagas femeninas. Entomología Ecolológica 27:373-377.
    6. Snyder, R. G., Schneider, L. W., Owings, C. L., Reynolds, H. M., Golomb, D. H., y Schork, M. A. 1977. Antropometría de infantes, niños y jóvenes hasta los 18 años para diseños de seguridad de productos. Warrendale, PA: Sociedad de Ingenieros Automotrices. [Datos de Snyder et al. descargados de la página de descargas de Matthew Reed]
    7. Walker T. J. 1962. La taxonomía y cantos llamativos de los grillos arbóreos de Estados Unidos (Orthoptera: Gryllidae: Oecanthinae). I. El género Neoxabea y los grupos niveus y varicornis del género Oecanthus. Anales de la Sociedad Entomológica de América 55:303-322.

    This page titled 5.4: Análisis de Covarianza is shared under a not declared license and was authored, remixed, and/or curated by John H. McDonald via source content that was edited to the style and standards of the LibreTexts platform.