Saltar al contenido principal
LibreTexts Español

4.9: Anova anidado

  • Page ID
    149130
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Objetivos de aprendizaje
    • Utilice anova anidado cuando tenga una variable de medida y más de una variable nominal, y las variables nominales estén anidadas (forme subgrupos dentro de grupos). Se prueba si existe variación significativa en las medias entre grupos, entre subgrupos dentro de grupos, etc.

    Cuándo usarlo

    Utilice un anova anidado (también conocido como anova jerárquico) cuando tenga una variable de medición y dos o más variables nominales. Las variables nominales están anidadas, lo que significa que cada valor de una variable nominal (los subgrupos) se encuentra en combinación con un solo valor de la variable nominal de nivel superior (los grupos). Todos los subagrupamientos de nivel inferior deben ser variables de efectos aleatorios (modelo II), lo que significa que son muestras aleatorias de un conjunto mayor de posibles subgrupos.

    Fig. 4.9.1 Ben.

    El análisis anidado de varianza es una extensión del anova unidireccional en el que cada grupo se divide en subgrupos. En teoría, eliges estos subgrupos aleatoriamente de un conjunto mayor de subgrupos posibles. Por ejemplo, un amigo mío estaba estudiando la captación de proteína etiquetada fluorescentemente en riñones de rata. Quería saber si sus dos técnicos, a quienes llamaré Brad y Janet, estaban realizando el procedimiento de manera consistente. Entonces Brad eligió al azar tres ratas, y Janet eligió aleatoriamente tres ratas propias, y cada técnico midió la captación de proteínas en cada rata.

    Si Brad y Janet hubieran medido la captación de proteínas solo una vez en cada rata, tendrías una variable de medición (captación de proteínas) y una variable nominal (técnico) y la analizarías con anova unidireccional. Sin embargo, las ratas son caras y las mediciones son baratas, por lo que Brad y Janet midieron la captación de proteínas en varias localizaciones aleatorias en el riñón de cada rata:

    Técnico: Brad Janet
    Rata: Arnold Ben Charlie Dave Eddy Frank
    1.119 1.045 0.9873 1.3883 1.3952 1.2574
    1.2996 1.1418 0.9873 1.104 0.9714 1.0295
    1.5407 1.2569 0.8714 1.1581 1.3972 1.1941
    1.5084 0.6191 0.9452 1.319 1.5369 1.0759
    1.6181 1.4823 1.1186 1.1803 1.3727 1.3249
    1.5962 0.8991 1.2909 0.8738 1.2909 0.9494
    1.2617 0.8365 1.1502 1.387 1.1874 1.1041
    1.2288 1.2898 1.1635 1.301 1.1374 1.1575
    1.3471 1.1821 1.151 1.3925 1.0647 1.294
    1.0206 0.9177 0.9367 1.0832 0.9486 1.4543

    Debido a que hay varias observaciones por rata, la identidad de cada rata es ahora una variable nominal. Los valores de esta variable (las identidades de las ratas) se anidan bajo los técnicos; la rata A solo se encuentra con Brad, y la rata D solo se encuentra con Janet. Analizarías estos datos con un anova anidado. En este caso, se trata de un anova anidado de dos niveles; los técnicos son grupos, y las ratas son subgrupos dentro de los grupos. Si los técnicos hubieran mirado varias ubicaciones aleatorias en cada riñón y hubieran medido la captación de proteínas varias veces en cada ubicación, tendrías un anova anidado de tres niveles, con la ubicación del riñón como subgrupos dentro de las ratas. Se pueden tener más de tres niveles de anidación, y en realidad no hace que el análisis sea mucho más complicado.

    Tenga en cuenta que si los subgrupos, subgrupos, etc. son distinciones con algún interés (efectos fijos, o modelo I, variables), en lugar de aleatorios, no se debe usar un anova anidado. Por ejemplo, Brad y Janet podrían haber observado la captación de proteínas en dos ratas macho y dos ratas hembras cada una. En este caso usarías un anova bidireccional para analizar los datos, en lugar de un anova anidado.

    Cuando haces un anova anidado, a menudo solo te interesa probar la hipótesis nula sobre las medias grupales; puede que no te importe si los subgrupos son significativamente diferentes. Por esta razón, puede tener la tentación de ignorar la subagrupación y simplemente usar todas las observaciones en un anova unidireccional, ignorando la subagrupación. Esto sería un error. Para las ratas, esto estaría tratando las\(30\) observaciones para cada técnico (\(10\)observaciones de cada una de las tres ratas) como si fueran observaciones\(30\) independientes. Al usar todas las observaciones en un anova unidireccional, se compara la diferencia en medias grupales con la cantidad de variación dentro de cada grupo, pretendiendo que tiene mediciones\(30\) independientes de captación de proteínas. Esta gran cantidad de mediciones haría que pareciera que tenías una estimación muy precisa de la absorción media de proteínas para cada técnico, por lo que la diferencia entre Brad y Janet no tendría que ser muy grande para parecer “significativa”. Habrías violado el supuesto de independencia que hace el anova unidireccional, y en su lugar tienes lo que se conoce como pseudoreplicación.

    Lo que podrías hacer con un diseño anidado, si solo te interesa la diferencia entre medias grupales, es tomar el promedio para cada subgrupo y analizarlos usando un anova unidireccional. Para los datos de ejemplo, tomarías la absorción promedio de proteínas para cada una de las tres ratas que usó Brad, y cada una de las tres ratas que usó Janet, y analizarías estos seis valores usando anova unidireccional. Si tiene un diseño equilibrado (tamaños de muestra iguales en cada subgrupo), comparar medias de grupo con un anova unidireccional de medias de subgrupo es matemáticamente idéntico a comparar medias de grupo usando un anova anidado (y esto es cierto para un anova anidado con más niveles, como subgrupos). Si no tienes un diseño equilibrado, los resultados no serán idénticos, pero serán bastante similares a menos que tu diseño esté muy desequilibrado. La ventaja de usar anova unidireccional es que será más familiar para más personas que el anova anidado; la desventaja es que no podrás comparar la variación entre subgrupos con la variación dentro de los subgrupos. Probar la variación entre subgrupos a menudo no es biológicamente interesante, pero puede ser útil en la asignación óptima de recursos, decidiendo si futuros experimentos deberían usar más ratas con menos observaciones por rata.

    Hipótesis nulas

    Un anova anidado tiene una hipótesis nula para cada nivel. En un anova anidado de dos niveles, una hipótesis nula es que los grupos tienen la misma media. Para nuestras ratas, este nulo sería que las ratas de Brad tenían la misma absorción media de proteínas que las ratas de Janet. La segunda hipótesis nula es que los subgrupos dentro de cada grupo tienen las mismas medias. Para el ejemplo, este nulo sería que todas las ratas de Brad tienen la misma media, y todas las ratas de Janet tienen la misma media (que podría ser diferente de la media para las ratas de Brad). Un anova anidado de tres niveles tendría una tercera hipótesis nula, que todas las ubicaciones dentro de cada riñón tienen la misma media (que podría ser una media diferente para cada riñón), y así sucesivamente.

    Cómo funciona la prueba

    Recuerde que en un anova unidireccional, el estadístico de prueba,\(F_s\), es la relación de dos cuadrados medios: el cuadrado medio entre grupos dividido por el cuadrado medio dentro de los grupos. Si la variación entre grupos (el cuadrado medio del grupo) es alta en relación con la variación dentro de los grupos, el estadístico de prueba es grande y por lo tanto es poco probable que ocurra por casualidad. En un anova anidado de dos niveles, hay dos\(F\) estadísticas, una para subgrupos (\(F_{subgroup}\)) y otra para grupos (\(F_{group}\)). Se encuentra el\(F\) estadístico del subgrupo dividiendo el cuadrado medio entre subgrupos,\(MS_{subgroup}\) (la varianza promedio de las medias del subgrupo dentro de cada grupo) por el cuadrado medio dentro del subgrupo,\(MS_{within}\) (la variación promedio entre las mediciones individuales dentro de cada subgrupo). Se encuentra el\(F\) estadístico de grupo dividiendo el cuadrado medio entre grupos,\(MS_{group}\) (la variación entre medias de grupo) por\(MS_{subgroup}\). Luego se calcula el\(P\) valor para el\(F\) -estadístico en cada nivel.

    Para el ejemplo de rata, el cuadrado medio dentro del subgrupo es\(0.0360\) y el cuadrado medio del subgrupo es\(0.1435\), haciendo que el\(F_{subgroup}\)\(0.1435/0.0360=3.9818\). Hay\(4\) grados de libertad en el numerador (el número total de subgrupos menos el número de grupos) y\(54\) grados de libertad en el denominador (el número de observaciones menos el número de subgrupos), por lo que el\(P\) valor es\(0.0067\). Esto significa que existe una variación significativa en la captación de proteínas entre las ratas dentro de cada técnico. El\(F_{group}\) es el cuadrado medio para grupos,\(0.0384\), dividido por el cuadrado medio para subgrupos,\(0.1435\), que es igual\(0.2677\). Hay un grado de libertad en el numerador (el número de grupos menos\(1\)) y\(4\) grados de libertad en el denominador (el número total de subgrupos menos el número de grupos), produciendo un\(P\) valor de\(0.632\). Por lo que no hay diferencia significativa en la abundancia de proteínas entre las ratas que Brad midió y las ratas Janet medidas.

    Para un anova anidado con tres o más niveles, se calcula el\(F\) -estadístico en cada nivel dividiendo el\(MS\) en ese nivel por el\(MS\) en el nivel inmediatamente por debajo de él.

    Si el\(F\) estadístico de subgrupo no es significativo, es posible calcular el\(F\) estadístico de grupo dividiendo\(MS_{group}\) por\(MS_{pooled}\), una combinación de\(MS_{subgroup}\) y\(MS_{within}\). Las condiciones bajo las cuales esto es aceptable son complicadas, y algunos estadísticos piensan que nunca se debe hacerlo; por simplicidad, sugiero usar siempre\(MS_{group}/MS_{subgroup}\) para calcular\(F_{group}\).

    Varianza de partición y asignación óptima de recursos

    Además de probar la igualdad de las medias en cada nivel, un anova anidado también divide la varianza en diferentes niveles. Esto puede ser de gran ayuda en el diseño de futuros experimentos. Para nuestro ejemplo de rata, si la mayor parte de la variación es entre ratas, con relativamente poca variación entre las mediciones dentro de cada rata, querrás hacer menos mediciones por rata y usar muchas más ratas en tu próximo experimento. Esto te daría mayor poder estadístico que tomar mediciones repetidas en un número menor de ratas. Pero si el anova anidado te dice que hay mucha variación entre las mediciones pero relativamente poca variación entre ratas, o querrías usar más observaciones por rata o intentar controlar cualquier variable que esté causando que las mediciones difieran tanto.

    Si tienes una estimación del costo relativo de diferentes partes del experimento (en tiempo o dinero), puedes usar esta fórmula para estimar el mejor número de observaciones por subgrupo, proceso conocido como asignación óptima de recursos:

    \[n=\sqrt{\frac{(C_{subgroup}\times V_{within})}{(C_{within}\times V_{subgroup})}}\]

    donde\(n\) está el número de observaciones por subgrupo,\(C_{within}\) es el costo por observación,\(C_{subgroup}\) es el costo por subgrupo (sin incluir el costo de las observaciones individuales),\(V_{subgroup}\) es el porcentaje de la variación particionada al subgrupo, y\(V_{within}\) es el porcentaje de la variación particionada dentro de grupos. Para el ejemplo de rata,\(V_{subgroup}\) es\(23.0\%\) y\(V_{within}\) es\(77\%\) (generalmente hay alguna variación particionada a los grupos, pero para estos datos, los grupos tenían\(0\%\) de la variación). Si estimamos que cada rata cuesta\(\$ 200\) aumentar, y cada medición de los costos de absorción de proteínas\(\$ 10\), entonces el número óptimo de observaciones por rata es\(\sqrt{\frac{(200\times 77)}{(10\times 23)}}\), lo que equivale a\(8\) ratas por subgrupo. El costo total por subgrupo será entonces criar\(\$ 200\) a la rata y\(8\times \$ 10=\$ 80\) para las observaciones, para un total de\(\$ 280\); con base en tu presupuesto total para tu próximo experimento, puedes usar esto para decidir cuántas ratas usar para cada grupo.

    Para un anova anidado de tres niveles, usarías la misma ecuación para asignar recursos; por ejemplo, si tuvieras varias ratas, con múltiples muestras de tejido por riñón de rata, y múltiples mediciones de captación de proteínas por muestra de tejido. Comenzarías determinando el número de observaciones por subgrupo; una vez que lo supieras, podrías calcular el costo total por subgrupo (el costo de tomar la muestra de tejido más el costo de hacer el número óptimo de observaciones). Entonces usaría la misma ecuación, con las particiones de varianza para subgrupos y subgrupos, y el costo para subgrupos y el costo total para subgrupos, y determinaría el número óptimo de subgrupos a usar para cada subgrupo. Se podría usar el mismo procedimiento para niveles más altos de anova anidado.

    Es posible que un componente de varianza sea cero; los grupos (Brad vs Janet) en nuestro ejemplo de rata tuvieron 0% de la varianza, por ejemplo. Esto solo significa que la variación entre medias grupales es menor de lo que cabría esperar, en función de la cantidad de variación entre los subgrupos. Debido a que hay variación entre ratas en la absorción media de proteínas, se esperaría que dos muestras aleatorias de tres ratas cada una tuvieran medias diferentes, y podría predecir el tamaño promedio de esa diferencia. Al ocurrir, la media de las tres ratas que Brad estudió y las tres ratas Janet estudiadas resultaron estar más cerca de lo esperado por casualidad, por lo que contribuyen\(0\%\) a la varianza general. Usar cero, o un número muy pequeño, en la ecuación para la asignación de recursos puede darte números ridículos. Si eso sucede, solo usa tu sentido común. Entonces, si\(V_{subgroup}\) en nuestro ejemplo de rata (la variación entre ratas dentro de los técnicos) hubiera resultado estar cerca\(0\%\), la ecuación te hubiera dicho que necesitarías cientos o miles de observaciones por rata; en ese caso, diseñarías tu experimento para incluir una rata por grupo, y tantas medidas por rata como podrías permitirte.

    A menudo, la razón por la que usas un anova anidado es porque los grupos de nivel superior son caros y los niveles más bajos son más baratos. Criar una rata es caro, pero mirar una muestra de tejido con un microscopio es relativamente barato, por lo que se quiere alcanzar un equilibrio óptimo de ratas caras y observaciones baratas. Si los grupos de nivel superior son muy económicos en relación con los niveles inferiores, no necesitas un diseño anidado; el diseño más potente será tomar solo una observación por grupo de nivel superior. Por ejemplo, digamos que estás estudiando la captación de proteínas en las moscas de la fruta (Drosophila melanogaster). Podrías tomar múltiples muestras de tejido por mosca y hacer múltiples observaciones por muestra de tejido, pero debido a que criar\(100\) moscas no cuesta más que criar\(10\) moscas, será mejor tomar una muestra de tejido por mosca y una observación por muestra de tejido, y usar tantas moscas como puedas afford; entonces podrás analizar los datos con anova unidireccional. La variación entre moscas en este diseño incluirá la variación entre muestras de tejido y entre observaciones, por lo que este será el diseño estadísticamente más potente. La única razón para hacer un anova anidado en este caso sería para ver si estás obteniendo mucha variación entre las muestras de tejido o entre las observaciones dentro de las muestras de tejido, lo que podría indicarte que necesitas hacer que tu técnica de laboratorio sea más consistente.

    Tamaños de muestra desiguales

    Cuando los tamaños de muestra en un anova anidado son desiguales, los\(P\) valores correspondientes a las\(F\) estadísticas pueden no ser muy buenas estimaciones de la probabilidad real. Por esta razón, debes intentar diseñar tus experimentos con un diseño “equilibrado”, es decir, tamaños de muestra iguales en cada subgrupo. (Esto solo significa números iguales en cada nivel; el ejemplo de rata, con tres subgrupos por grupo y\(10\) observaciones por subgrupo, está equilibrado). A menudo esto no es práctico; si tiene tamaños de muestra desiguales, es posible que pueda obtener una mejor estimación del\(P\) valor correcto usando cuadrados medios modificados en cada nivel, encontrados usando una fórmula de corrección llamada aproximación Satterthwaite. Bajo algunas situaciones, sin embargo, la aproximación Satterthwaite hará que los\(P\) valores sean menos precisos. Si no puedes usar la aproximación Satterthwaite, los\(P\) valores serán conservadores (es menos probable que sean significativos de lo que deberían ser), así que si nunca usas la aproximación Satterthwaite, no te estás engañando con demasiados falsos positivos. Tenga en cuenta que la aproximación Satterthwaite da como resultado grados fraccionarios de libertad, como\(2.87\); no se alarme por eso (y prepárese para explicarlo a la gente si lo usa). Si realiza un anova anidado con un diseño desequilibrado, asegúrese de especificar si usa la aproximación Satterthwaite cuando informe sus resultados.

    Supuestos

    El anova anidado, como todos los anovas, asume que las observaciones dentro de cada subgrupo normalmente se distribuyen y tienen desviaciones estándar iguales.

    Ejemplo

    Keon y Muir (2002) quisieron saber si el tipo de hábitat afectó la tasa de crecimiento del liquen Usnea longissima. Pesaron y trasplantaron\(30\) individuos a cada uno de los\(12\) sitios en Oregón. Los\(12\) sitios se agruparon en tipos de\(4\) hábitat, con\(3\) sitios en cada hábitat. Un año después, recolectaron los líquenes, los pesaron nuevamente y calcularon el cambio de peso. Existen dos variables nominales (sitio y tipo de hábitat), con sitios anidados dentro del tipo de hábitat. Se podrían analizar los datos usando dos variables de medición, peso inicial y peso final, pero debido a que los individuos de líquenes fueron elegidos para tener pesos iniciales similares, tiene más sentido usar el cambio de peso como una sola variable de medición. Los resultados de un anova anidado son que existe variación significativa entre sitios dentro de hábitats (\(F_{8,\: 200}=8.11,\; \; P=1.8\times 10^{-9}\)) y variación significativa entre hábitats (\(F_{3,\: 8}=8.29,\; \; P=0.008\)). Cuando se utiliza la aproximación Satterthwaite, la prueba del efecto del hábitat es solo ligeramente diferente (\(F_{3,\: 8.13}=8.76,\; \; P=0.006\))

    Fig. 4.9.2 Liquen de barba de anciano, Usnea longissima.

    Graficando los resultados

    La forma en que graficas los resultados de un anova anidado depende del resultado y de tu pregunta biológica. Si la variación entre subgrupos no es significativa y la variación entre grupos es significativa, en realidad solo te interesan los grupos y usaste un anova anidado para ver si estaba bien combinar subgrupos, podrías simplemente trazar las medias del grupo en un gráfico de barras, como se muestra para el anova unidireccional. Si la variación entre subgrupos es interesante, se pueden trazar las medias para cada subgrupo, con diferentes patrones o colores que indican los diferentes grupos.

    Pruebas similares

    Tanto el anova anidado como el anova bidireccional (y los anovas de nivel superior) tienen una variable de medición y más de una variable nominal. La diferencia es que en un anova bidireccional, los valores de cada variable nominal se encuentran en todas las combinaciones con la otra variable nominal; en un anova anidado, cada valor de una variable nominal (los subgrupos) se encuentra en combinación con solo un valor de la otra variable nominal (los grupos).

    Si tienes un diseño equilibrado (igual número de subgrupos en cada grupo, igual número de observaciones en cada subgrupo), puedes realizar un anova unidireccional sobre las medias del subgrupo. Para el ejemplo de rata, tomarías la absorción promedio de proteínas por cada rata. El resultado es matemáticamente idéntico a la prueba de variación entre grupos en un anova anidado. Puede ser más fácil explicar un anova unidireccional a las personas, pero perderá la información sobre cómo la variación entre subgrupos se compara con la variación entre las observaciones individuales.

    Cómo hacer la prueba

    Hoja de Cálculo

    He hecho hojas de cálculo para hacer anova anidado de dos niveles nested2.xls, con tamaños de muestra iguales o desiguales, en hasta\(50\) subgrupos con hasta\(1000\) observaciones por subgrupo. Hace pruebas de significancia y divide la varianza. La hoja de cálculo te indica si la aproximación Satterthwaite es apropiada, usando las reglas de la p. 298 de Sokal y Rohlf (1983), y te da la opción de usarla. \(F_{group}\)se calcula como\(MS_{group}/MS_{subgroup}\). La hoja de cálculo da los componentes de varianza como porcentajes del total. Si la estimación del componente de grupo sería negativa (lo que puede suceder), se establece en cero.

    También he escrito hojas de cálculo para hacer anova anidado de tres niveles nested3.xls y anova anidado de cuatro niveles nested4.xls.

    Página web

    No conozco una página web que te permita hacer anova anidado.

    R

    El\(R\) compañero de Salvatore Mangiafico tiene un programa R de muestra para anova anidado.

    SAS

    Se puede hacer un anova anidado con PROC GLM o PROC NESTED. PROC GLM manejará tanto diseños balanceados como desequilibrados, pero no particiona la varianza; PROC NESTED divide la varianza pero no calcula los valores P si tiene un diseño desequilibrado, por lo que es posible que deba usar ambos procedimientos.

    Es posible que deba ordenar su conjunto de datos con PROC SORT, y no está de más incluirlo.

    En PROC GLM, enumere todas las variables nominales en la sentencia CLASS. En la sentencia MODEL, dé el nombre de la variable de medición, luego después del signo igual, dé el nombre de la variable de grupo, luego el nombre de la variable de subgrupo seguido de la variable de grupo entre paréntesis. SS1 (con el numeral uno, no la letra el) le dice que use sumas de cuadrados tipo I. La instrucción TEST le dice que calcule el\(F\) -estadístico para grupos dividiendo el cuadrado medio del grupo por el cuadrado medio del subgrupo, en lugar del cuadrado medio dentro del grupo (\(H\)significa “hipótesis” y\(E\) significa “error”). “HTYPE=1 ETYPE=1" también le dice a SAS que use “sumas de cuadrados tipo I”; no podría decirte la diferencia entre ellos y los tipos II, III y IV, pero estoy bastante seguro de que el tipo I es apropiado para un anova anidado.

    Aquí hay un ejemplo de un anova anidado de dos niveles usando los datos de rata.

    Datos bradvsjanet;
    INPUT tech $ rata $ proteína @@;
    DATALINES;

    Janet 1 1.119 Janet 1 1.2996 Janet 1 1.5407 Janet 1 1.5084 Janet 1 1.6181

    Janet 1 1.5962 Janet 1 1.2617 Janet 1 1.2288 Janet 1 1.3471 Janet 1 1.0206

    Janet 2 1.045 Janet 2 1.1418 Janet 2 1.2569 Janet 2 0.6191 Janet 2 1.4823

    Janet 2 0.8991 Janet 2 0.8365 Janet 2 1.2898 Janet 2 1.1821 Janet 2 0.9177

    Janet 3 0.9873 Janet 3 0.9873 Janet 3 0.8714 Janet 3 0.9452 Janet 3 1.1186

    Janet 3 1.2909 Janet 3 1.1502 Janet 3 1.1635 Janet 3 1.151 Janet 3 0.9367

    Brad 5 1.3883 Brad 5 1.104 Brad 5 1.1581 Brad 5 1.319 Brad 5 1.1803

    Brad 5 0.8738 Brad 5 1.387 Brad 5 1.301 Brad 5 1.3925 Brad 5 1.0832

    Brad 6 1.3952 Brad 6 0.9714 Brad 6 1.3972 Brad 6 1.5369 Brad 6 1.3727

    Brad 6 1.2909 Brad 6 1.1874 Brad 6 1.1374 Brad 6 1.0647 Brad 6 0.9486

    Brad 7 1.2574 Brad 7 1.0295 Brad 7 1.1941 Brad 7 1.0759 Brad 7 1.3249

    Brad 7 0.9494 Brad 7 1.1041 Brad 7 1.1575 Brad 7 1.294 Brad 7 1.4543

    ;
    PROC SORT data=BRADVsJanet;
    POR rata tecnológica;
    PROC GLM data=BRADVsJanet;
    CLASE tech rat;
    MODELO proteína=tech rat (tech)/SS1;
    PRUEBA H=Tech E = rata (tech)/HTYPE=1 ETYPE=1;
    RUN;

    La salida incluye dos formas\(F_{group}\) calculadas, como\(MS_{group}/MS_{within}\) y como\(MS_{group}/MS_{subgroup}\).

    Fuente DF Tipo I SS Media Sq. F Value Pr > F

    tech 1 0.03841046 0.03841046 1.07 0.3065 MS group /MS dentro; no use esta
    rata (tech) 4 0.57397543 0.14349386 3.98 0.0067 usar esto para probar subgrupos

    Pruebas de Hipótesis Usando la MS Tipo I para rata (tech) como Término de Error

    Fuente DF Tipo I SS Media Sq. F Valor Pr > F

    tech 1 0.03841046 0.03841046 0.27 0.6322 Grupo MS /subgrupo MS; utilízalo para grupos de prueba

    Puedes hacer la prueba de Tukey-Kramer para comparar pares de medias grupales, si tienes más de dos grupos. Esto se hace con una declaración MEANS. Esto muestra cómo (aunque no harías Tukey-Kramer con solo dos grupos):

    PROC GLM data=BRADVsJanet;
    CLASE tech rat;
    MODELO proteína=tech rat (tech)/SS1;
    PRUEBA H=Tech E = rata (tech)/HTYPE=1 ETYPE=1; MEANS tech
    /LÍNEAS TUKEY;
    RUN;

    PROC GLM no divide la varianza. PROC NESTED particionará la varianza, pero solo realiza las pruebas de hipótesis para un anova anidado equilibrado, así que si tienes un diseño desequilibrado querrás ejecutar tanto PROC GLM como PROC NESTED. En PROC NESTED, el grupo se da primero en la instrucción CLASS, luego el subgrupo.

    PROC SORT data=BRADVsJanet;
    BY tech rat;
    PROC NESTED DATA=BRADVsJanet;
    CLASS tech rat; proteína
    VAR;
    RUN;

    Aquí está la salida; si el conjunto de datos estaba desequilibrado, las columnas "\(F\)Valor” y “Pr>F” estarían en blanco.

    Varianza Suma de F Error Promedio Varianza Porcentaje
    Fuente DF Cuadrados Valor Pr>F Término Cuadrado Componente del

    Total Total 59 2.558414 0.043363 0.046783 100.0000
    tech 1 0.038410 0.27 0.6322 rata 0.038410 -0.003503 0.0000
    rata 4 0.573975 3.98 0.0067 Error 0.143494 0.010746 22.9690
    Error 54 1.946028 0.036038 0.036038 77.0310

    Se configura un anova anidado con tres o más niveles de la misma manera, excepto que la instrucción MODEL tiene más términos, y se especifica una instrucción TEST para cada nivel. Así es como lo configuraría si hubiera varias ratas por técnico, con múltiples muestras de tejido por rata y múltiples mediciones de proteínas por muestra:

    PROC GLM data=BRADVsJanet;
    CLASE tech rata muestra;
    MODELO proteína=tech rat (tech) muestra (rat tech)/SS1;
    PRUEBA H=Tech E = rata (tech)/HTYPE=1 ETYPE=1;
    PRUEBA H=rata E = muestra (rat tech)/HTYPE=1 ETYPE=1;
    EJERCIR;
    PROC NESTED DATA= bradvsjanet; rata técnica de muestra
    CLASE; proteína
    VAR;
    RUN;

    Referencias

    Imagen de una rata de Posterwire.

    Imagen de liquen de la Sociedad Licenológica de Japón Galería de Fotos de Liquen

    Keon, D.B., y P.S. Muir. 2002. Crecimiento de Usnea longissima en una variedad de hábitats en la cordillera de la costa de Oregón. Bryólogo 105:233-242.


    This page titled 4.9: Anova anidado is shared under a not declared license and was authored, remixed, and/or curated by John H. McDonald via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.