Saltar al contenido principal
LibreTexts Español

2.6: G—Prueba de Independencia

  • Page ID
    149209
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)
    Objetivos de aprendizaje
    • Para usar el G —test de independencia cuando se tienen dos variables nominales y se quiere ver si las proporciones de una variable son diferentes para diferentes valores de la otra variable. Utilízala cuando el tamaño de la muestra sea grande.

    Cuándo usarlo

    Utilice la prueba G —de independencia cuando tenga dos variables nominales, cada una con dos o más valores posibles. Se quiere saber si las proporciones para una variable son diferentes entre los valores de la otra variable. Por ejemplo, Jackson et al. (2013) quisieron saber si es mejor administrar la vacuna contra la difteria, el tétanos y la tos ferina (DTaP) ya sea en el muslo o en el brazo, por lo que recopilaron datos sobre reacciones graves a esta vacuna en niños de edad\(3\) hasta\(6\) años. Una variable nominal es reacción severa vs no reacción severa; la otra variable nominal es muslo vs brazo.

    Sin reacción severa Reacción severa Porcentaje de reacción severa
    Muslo 4758 30 0.63%
    Brazo 8840 76 0.85%

    Hay una mayor proporción de reacciones graves en niños vacunados en el brazo; una prueba G de independencia te dirá si es probable que una diferencia tan grande haya ocurrido por casualidad.

    Un conjunto de datos como este a menudo se llama "\(R\times C\)tabla”, donde\(R\) está el número de filas y\(C\) es el número de columnas. Esta es una\(2\times 2\) mesa. Si los resultados se hubieran dividido en “no reacción”, “hinchazón” y “dolor”, habría sido una\(2\times 3\) tabla, o una\(3\times 2\) tabla; no importa qué variable son las columnas y cuáles son las filas.

    También es posible hacer una prueba G de independencia con más de dos variables nominales. Por ejemplo, Jackson et al. (2013) también tenían datos para niños menores\(3\), por lo que se podía hacer un análisis de viejo vs joven, muslo vs brazo, y reacción vs. no reacción, todos analizados juntos. Ese diseño experimental no ocurre muy a menudo en biología experimental y es bastante complicado de analizar e interpretar, por lo que no lo cubro aquí (a excepción del caso especial de\(2\times 2\) tablas repetidas, analizadas con la prueba Cochran-Mantel-Haenszel).

    La prueba exacta de Fisher es más precisa que la prueba G de independencia cuando los números esperados son pequeños, por lo que solo recomiendo la prueba G si el tamaño total de su muestra es mayor que\(1000\). Consulte la página web sobre tamaños de muestra pequeños para una mayor discusión sobre lo que significa ser “pequeño”.

    La prueba G de independencia es una alternativa a la prueba chi-cuadrada de independencia, y darán aproximadamente los mismos resultados. La mayor parte de la información de esta página es idéntica a la de la página chi-cuadrada. Deberías leer la sección sobre “Chi-cuadrado vs. G —test”, elige chi-cuadrado o G —test, luego quédate con esa elección por el resto de tu vida.

    Hipótesis nula

    La hipótesis nula es que las proporciones relativas de una variable son independientes de la segunda variable; en otras palabras, las proporciones en una variable son las mismas para diferentes valores de la segunda variable. En el ejemplo de vacunación, la hipótesis nula es que la proporción de niños que reciben inyecciones en el muslo que tienen reacciones graves es igual a la proporción de niños que reciben inyecciones en el brazo que tienen reacciones graves.

    Cómo funciona la prueba

    La matemática de la prueba G de independencia es la misma que para la prueba G de bondad de ajuste, solo el método de cálculo de las frecuencias esperadas es diferente. Para la prueba de bondad de ajuste, se utiliza una relación teórica para calcular las frecuencias esperadas. Para la prueba de independencia, se utilizan las frecuencias observadas para calcular lo esperado. Para el ejemplo de vacunación, hay niños\(4758+8840+30+76=13704\) totales, y\(30+76=106\) de ellos tuvieron reacciones. La hipótesis nula es, por lo tanto, que\(106/13704=0.7735\%\) de los niños que reciben inyecciones en el muslo tendrían reacciones, y\(0.7735\%\) de los niños que recibieron inyecciones en el brazo también tendrían reacciones. Hay\(4758+30=4788\) niños a los que se les administran inyecciones en el muslo, por lo que se espera\(0.007735\times 4788=37.0\) que los niños del muslo tengan reacciones, si la hipótesis nula es cierta. Podrías hacer el mismo tipo de cálculo para cada una de las celdas de esta\(2\times 2\) tabla de números.

    Una vez que tenga cada uno de los cuatro números esperados, podría compararlos con los números observados usando la prueba G, tal como lo hizo para la prueba G de bondad de ajuste. El resultado es\(G=2.14\).

    Para obtener el\(P\) valor, también se necesita el número de grados de libertad. Los grados de libertad en una prueba de independencia son iguales a\((number\; of\; rows)−1\times (number\; of\; columns)−1\). Así para una\(2\times 2\) mesa, hay\((2−1)\times (2−1)=1\) grado de libertad; para una\(4\times 3\) mesa, hay\((4−1)\times (3−1)=6\) grados de libertad. Porque\(G=2.14\) con\(1\) grado de libertad, el\(P\) valor es\(0.14\), lo cual no es significativo; no se puede concluir que los niños de\(3\)\(6\) -a- años de edad que reciben vacunas DTaP en el muslo tengan menos reacciones que los que recibieron inyecciones en el brazo. (Tenga en cuenta que solo estoy usando a los niños de\(3\)\(6\) -a- años como ejemplo; Jackson et al. [2013] también analizaron un número mucho mayor de niños menores que\(3\) y encontraron significativamente menos reacciones en niños a los que se les administró DTaP en el muslo).

    Si bien en principio, la prueba G de independencia es la misma que la prueba de bondad de ajuste, en la práctica, los cálculos para la prueba G de independencia utilizan atajos que no requieren calcular las frecuencias esperadas.

    Pruebas post-hoc

    Cuando la prueba G de una tabla mayor que\(2\times 2\) es significativa (y a veces cuando no es significativa), es deseable investigar más a fondo los datos. MacDonald y Gardner (2000) utilizan datos simulados para probar varias pruebas post-hoc para una prueba de independencia, y encontraron que las comparaciones por pares con las correcciones de Bonferroni de los valores de P funcionan bien. Para ilustrar este método, aquí hay un estudio (Klein et al. 2011) de hombres que fueron asignados aleatoriamente para tomar selenio, vitamina E, tanto selenio como vitamina E, o placebo, y luego se les dio seguimiento para ver si desarrollaron cáncer de próstata:

    Sin cáncer Cáncer de próstata Porcentaje de cáncer
    Selenio 8177 575 6.6%
    Vitamina E 8117 620 7.1%
    Selenio y E 8147 555 6.4%
    Placebo 8167 529 6.1%

    La\(4\times 2\) tabla general tiene un\(G\) -valor de\(7.73\) con\(3\) grados de libertad, dando un\(P\) valor de\(0.052\). Esto no es del todo significativo (por un poquito), pero vale la pena hacer un seguimiento para ver si hay algo interesante. Hay seis posibles comparaciones por pares, por lo que puede hacer una prueba\(2\times 2\) G para cada una y obtener los siguientes\(P\) valores:

    Valor P
    Selenio vs. vitamina E 0.17
    Selenio vs ambos 0.61
    Selenio vs placebo 0.19
    Vitamina E vs ambas 0.06
    Vitamina E vs placebo 0.007
    Ambos vs. placebo 0.42

    Debido a que hay seis comparaciones, el\(P\) valor ajustado por Bonferroni-necesario para la significación es\(0.05/6\), o\(0.008\). El\(P\) valor de la vitamina E vs. el placebo es menor que\(0.008\), por lo que se puede decir que hubo significativamente más casos de cáncer de próstata en hombres que tomaban vitamina E que en hombres que tomaban el placebo.

    Para este ejemplo, probé las seis posibles comparaciones por pares. Klein et al. (2011) decidieron antes de hacer el estudio que solo mirarían cinco comparaciones por pares (todas excepto selenio vs vitamina E), por lo que su\(P\) valor ajustado por Bonferroni-habría sido\(0.05/5\), o\(0.01\). Si hubieran decidido con anticipación simplemente comparar cada uno de los tres tratamientos con respecto al placebo, su\(P\) valor ajustado por Bonferroni-habría sido\(0.05/3\), o\(0.017\). Lo importante es decidir antes de mirar los resultados cuántas comparaciones hacer, luego ajustar el\(P\) valor en consecuencia. Si no decides con anticipación limitarte a comparaciones por pares particulares, debes ajustar el número de todos los pares posibles.

    Otro tipo de comparación post-hoc consiste en probar cada valor de una variable nominal frente a la suma de todas las demás. Se aplica el mismo principio: obtener el\(P\) valor para cada comparación, luego aplicar la corrección Bonferroni. Por ejemplo, Latta et al. (2012) recolectaron aves en hábitat ribereño remanente (áreas a lo largo de ríos en California con vegetación mayoritariamente nativa) y restauraron hábitat ribereño (una vez áreas degradadas que han tenido vegetación nativa restablecida). Observaron los siguientes números (agrupando las especies de aves menos comunes como “Poco frecuentes”):

    Remanente Restaurado
    Reyezuelo coronado rubí 677 198
    Gorrión de corona blanca 408 260
    Gorrión de Lincoln 270 187
    Gorrión coronado dorado 300 89
    Bushtit 198 91
    Gorrión Cancionero 150 50
    Towhee manchado 137 32
    Reyezuelo de Bewick 106 48
    Zorzal ermitaño 119 24
    Junco de ojos oscurecidos 34 39
    Jilguero menor 57 15
    Poco frecuentes 457 125

    La tabla general arroja un\(G\) -valor de\(146.5\) con\(11\) grados de libertad, el cual es altamente significativo (\(P=7\times 10^{-26}\)). Eso nos dice que hay una diferencia en la composición de especies entre el remanente y el hábitat restaurado, pero sería interesante ver qué especies son una proporción significativamente mayor del total en cada hábitat. Para ello, haz una\(2\times 2\) tabla para cada especie vs. todas las demás, así:

    Remanente Restaurado
    Reyezuelo coronado rubí 677 198
    Todos los demás 2236 960

    Esto da los siguientes\(P\) valores:

    Valor P
    Reyezuelo coronado rubí 0.000012
    Gorrión de corona blanca 1.5×10 −10
    Gorrión de Lincoln 1.2×10 −9
    Gorrión coronado dorado 0.009
    Bushtit 0.24
    Gorrión Cancionero 0.26
    Towhee manchado 0.0036
    Reyezuelo de Bewick 0.45
    Zorzal ermitaño 0.0009
    Junco de ojos oscurecidos 1.2×10 −9
    Jilguero menor 0.14
    Poco frecuentes 0.00004

    Debido a que existen\(12\) comparaciones, aplicar la corrección de Bonferroni significa que un\(P\) valor tiene que ser menor que\(0.05/12=0.0042\) para ser significativo en el\(P<0.05\) nivel, por lo que seis de las\(12\) especies muestran una diferencia significativa entre los hábitats.

    Cuando hay más de dos filas y más de dos columnas, es posible que desee hacer todas las comparaciones por pares posibles de filas y todas las posibles comparaciones por pares de columnas; en ese caso, simplemente use el número total de comparaciones por pares en su corrección Bonferroni del\(P\) valor. También hay varias técnicas que prueban si una celda en particular en una\(R\times C\) tabla se desvía significativamente de lo esperado; ver MacDonald y Gardner (2000) para más detalles.

    Asunción

    La prueba G de independencia, al igual que otras pruebas de independencia, asume que las observaciones individuales son independientes.

    Ejemplos

    Ejemplo 1

    Bambach et al. (2013) analizaron datos sobre todos los accidentes de bicicleta que implicaron colisiones con vehículos motorizados en Nueva Gales del Sur, Australia durante 2001-2009. Su análisis multivariable muy extenso incluye los siguientes números, que elegí tanto para usar como ejemplo de\(2\times 2\) mesa como para convencerte de que lleves tu casco de bicicleta:

    Lesión en la cabeza Otras lesiones Porcentaje de lesión en la cabeza
    Usar casco 372 4715 7.3%
    Sin casco 267 1391 16.1%

    Los resultados son\(G=101.5\),\(1\) grado de libertad\(P=7\times 10^{-24}\), lo que significa que los ciclistas que no llevaban casco tienen una mayor proporción de lesiones en la cabeza.

    Ejemplo 2

    Gardemann et al. (1998) encuestaron genotipos en un polimorfismo de inserción/deleción del péptido\(B\) señal de apolipoproteína en\(2259\) hombres. Las variables nominales son genotipo (ins/ins, ins/del, del/del) y enfermedad arterial coronaria (con o sin enfermedad). Los datos son:

    Sin enfermedad Enfermedad de las arterias coronarias Porcentaje de enfermedad
    pulgadas/ins 268 807 24.9%
    pulgadas/del 199 759 20.8%
    del/del 42 184 18.6%

    La hipótesis biológica nula es que el polimorfismo de apolipoproteína no afecta la probabilidad de contraer enfermedad arterial coronaria. La hipótesis estadística nula es que las proporciones de hombres con enfermedad arterial coronaria son las mismas para cada uno de los tres genotipos.

    El resultado de la prueba G de independencia es\(G=7.30\),\(2d.f.\),\(P=0.026\). Esto indica que el se puede rechazar la hipótesis nula; los tres genotipos tienen proporciones significativamente diferentes de hombres con enfermedad arterial coronaria.

    Graficando los resultados

    Por lo general, se deben mostrar los datos utilizados en una prueba de independencia con un gráfico de barras, con los valores de una variable en el\(X\) eje -y las proporciones de la otra variable en el\(Y\) eje -eje. Si la variable en el\(Y\) eje -solo tiene dos valores, solo es necesario trazar uno de ellos. En el siguiente ejemplo, no tendría sentido trazar tanto el porcentaje de hombres con cáncer de próstata como el porcentaje sin cáncer de próstata; una vez que sepas qué porcentaje tiene cáncer, puedes averiguar cuántos no tuvieron cáncer.

    Fig. 2.6.1 Un gráfico de barras para cuando la variable nominal tiene sólo dos valores, mostrando el porcentaje de hombres en diferentes tratamientos que desarrollaron cáncer de próstata. Las barras de error son intervalos de confianza del 95%.

    Si la variable en el\(Y\) eje -tiene más de dos valores, debe trazarlos todos. Algunas personas usan gráficos circulares para esto, como lo ilustran los datos sobre los sitios de aterrizaje de aves de la página de prueba exacta de Fisher:

    Fig. 2.6.2 Un gráfico circular para cuando la variable nominal tiene más de dos valores. Se muestra el porcentaje de aves que aterrizan en cada tipo de sitio de aterrizaje para garzas y garcetas.

    Pero por mucho que me guste el pastel, creo que los gráficos circulares dificultan ver pequeñas diferencias en las proporciones, y difícil mostrar intervalos de confianza. En esta situación, prefiero los gráficos de barras:

    Fig. 2.6.3 Un gráfico de barras para cuando la variable nominal tiene más de dos valores. Se muestra el porcentaje de aves que desembarcan en cada tipo de sitio de aterrizaje para garzas (barras grises) y garcetas (barras negras).

    Pruebas similares

    Se puede utilizar la prueba G como prueba de bondad de ajuste (comparando frecuencias de una variable nominal con expectativas teóricas) y como prueba de independencia (comparando frecuencias de una variable nominal para diferentes valores de una segunda variable nominal). La aritmética subyacente de la prueba es la misma; la única diferencia es la forma en que se calculan los valores esperados. Sin embargo, se utilizan pruebas de bondad de ajuste y pruebas de independencia para diseños experimentales bastante diferentes y prueban diferentes hipótesis nulas, así que trato la prueba G de bondad de ajuste y la prueba G de independencia como dos pruebas estadísticas distintas.

    Si los números esperados en algunas clases son pequeños, la prueba G dará resultados inexactos. En ese caso, deberías usar la prueba exacta de Fisher. Recomiendo usar la prueba G solo cuando el tamaño total de la muestra es mayor que\(1000\), y usar la prueba exacta de Fisher para todo lo más pequeño que eso. Consulte la página web sobre tamaños de muestra pequeños para mayor discusión.

    Si las muestras no son independientes, sino que son observaciones de antes y después en los mismos individuos, debe usar la prueba de McNemar.

    Prueba de Chi-cuadrado frente a G

    La prueba de chi-cuadrado da aproximadamente los mismos resultados que la prueba G. A diferencia de la prueba de\(G\) chi-cuadrado, los valores -son aditivos, lo que significa que pueden ser utilizados para diseños estadísticos más elaborados. Las pruebas G son una subclase de pruebas de relación de verosimilitud, una categoría general de pruebas que tienen muchos usos para probar el ajuste de datos a modelos matemáticos; las versiones más elaboradas de las pruebas de relación de verosimilitud no tienen pruebas equivalentes usando el estadístico chi-cuadrado de Pearson. Por lo tanto, muchos prefieren la prueba G, incluso para diseños más simples. Por otro lado, la prueba de chi-cuadrado es más familiar para más personas, y siempre es una buena idea usar estadísticas con las que tus lectores estén familiarizados cuando sea posible. Es posible que desee mirar la literatura en su campo y ver cuál es la que se usa más comúnmente.

    Cómo hacer la prueba

    Hoja de Cálculo

    He configurado una hoja de cálculo Excel gtestind.xls que realiza esta prueba para hasta\(10\) columnas y\(50\) filas. En gran parte se explica por sí mismo; solo ingresas los números observados, y la hoja de cálculo calcula el estadístico G —test, los grados de libertad y el\(P\) valor.

    Páginas web

    No estoy al tanto de ninguna página web que haga G —pruebas de independencia.

    R

    R Companion de Salvatore Mangiafico tiene un programa R de muestra para la prueba G de independencia.

    SAS

    Aquí hay un programa SAS que usa PROC FREQ para una prueba G —. Utiliza los\(B\) datos de apolipoproteína de arriba.

    DATA cad;
    INPUT genotipo $ salud $ conteo;
    DATALINES;
    ins-ins no_enfermedad 268
    ins-ins enfermedad 807
    ins-del no_enfermedad 199
    ins-del enfermedad 759
    del-del no_enfermedad 42
    del-del enfermedad 184
    ;
    PROC FREQ data=CAD; CUENTO
    PESO/ZEROS;
    TABLAS genotipo*salud/CHISQ;
    RUN;

    La salida incluye lo siguiente:

    Estadísticas para Tabla de genotipo por salud

    Estadística DF Valor Prob
    Chi-Cuadrado 2 7.2594 0.0265
    Relación de verosimilitud Chi-cuadrado 2 7.3008 0.0260
    Mantel-Haenszel Chi-Square 1 7.0231 0.0080
    Coeficiente Phi 0.0567
    Coeficiente de Contingencia 0.0566
    V de Cramer 0.0567

    El “Ratio de probabilidad Chi-cuadrado” es lo que SAS llama la prueba G; en este caso,\(G=7.3008\),\(2d.f.\),\(P=0.0260\).

    Análisis de potencia

    Si cada variable nominal tiene solo dos valores (una\(2\times 2\) tabla), utilice el análisis de potencia para la prueba exacta de Fisher. Funcionará incluso si el tamaño de la muestra que terminas necesitando es demasiado grande para una prueba exacta de Fisher.

    Si cualquiera de las variables nominales tiene más de dos valores, utilice el análisis de potencia para las pruebas de independencia de chi-cuadrado. Los resultados estarán lo suficientemente cerca de un análisis de potencia real para una prueba G.

    Referencias

    1. Bambach, M.R., R.J. Mitchell, R.H. Grzebieta, y J. Olivier. 2013. La efectividad de los cascos en colisiones de bicicletas con vehículos de motor: Un estudio caso-control. Análisis y Prevención de Accidentes 53:78-88.
    2. Gardemann, A., D. Ohly, M. Fink, N. Katz, H. Tillmanns, F.W. Hehrlein, y W. Haberbosch. 1998. Asociación del polimorfismo del gen de inserción/deleción del péptido señal de apolipoproteína B con infarto de miocardio. Aterosclerosis 141:167-175.
    3. Jackson, L.A., Peterson, D., Nelson, J.C., et al. (13 coautores). 2013. Sitio de vacunación y riesgo de reacciones locales en niños de uno a seis años de edad. Pediatría 131:283-289.
    4. Klein, E.A., I.M. Thompson, C.M. Tangen, et al. (21 coautores). 2011. La vitamina E y el riesgo de cáncer de próstata: el ensayo de prevención del cáncer de selenio y vitamina E (SELECT). Revista de la Asociación Médica Americana 306:1549-1556.
    5. Latta, S.C., C.A. Howell, M.D. Dettling, y R.L. Cormier. 2012. Uso de datos sobre demografía aviar y persistencia del sitio durante la invernada para evaluar la calidad del hábitat ribereño restaurado. Biología de la Conservación 26:482-492.
    6. MacDonald, P.L., y Gardner, R.C. 2000. Comparaciones de tasa de error tipo I de procedimientos post hoc para tablas de chi-cuadrado I×J. Mediciones Educativas y Psicológicas 60:735-754.

    This page titled 2.6: G—Prueba de Independencia is shared under a not declared license and was authored, remixed, and/or curated by John H. McDonald via source content that was edited to the style and standards of the LibreTexts platform.