Saltar al contenido principal
LibreTexts Español

12.6: La forma más típica de hacer pruebas de Chi-cuadrado en R

  • Page ID
    151259
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Al discutir cómo hacer una prueba de bondad de ajuste de chi-cuadrado (Sección 12.1.7) y la prueba de independencia de chi-cuadrado (Sección 12.2.2), le presenté dos funciones separadas en el paquete lsr. Ejecutamos nuestras pruebas de bondad de ajuste usando la función GoodnessOFfitTest (), y nuestras pruebas de independencia (o asociación) usando la función AssociationTest (). Y ambas funciones produjeron una salida bastante detallada, mostrándote las estadísticas descriptivas relevantes, imprimiendo recordatorios explícitos de cuáles son las hipótesis, y así sucesivamente. Cuando estás empezando por primera vez, puede ser muy útil que te den este tipo de orientación. No obstante, una vez que empiezas a ser un poco más competente en estadística y en R puede empezar a ponerse muy tedioso. Un verdadero estadístico apenas necesita que le digan cuáles son las hipótesis nulas y alternativas para una prueba de chi-cuadrado, y si un usuario avanzado de R quiere que se impriman las estadísticas descriptivas, ¡sabe cómo producirlas!

    Por esta razón, la función básica chisq.test () en R es mucho más concisa en su salida, y debido a que las matemáticas que sustentan la prueba de bondad de ajuste y la prueba de independencia son básicamente las mismas en cada caso, puede ejecutar cualquiera de las dos pruebas dependiendo de qué tipo de entrada se le dé. Primero, aquí está la prueba de bondad de ajuste. Supongamos que tiene la tabla de frecuencias observada que usamos anteriormente,

    observed
    ## 
    ##    clubs diamonds   hearts   spades 
    ##       35       51       64       50

    Si desea ejecutar la prueba de bondad de ajuste contra la hipótesis de que es igualmente probable que aparezcan los cuatro trajes, entonces todo lo que necesita hacer es ingresar esta tabla de frecuencias en la función chisq.test ():

    chisq.test( x = observed )
    ## 
    ##  Chi-squared test for given probabilities
    ## 
    ## data:  observed
    ## X-squared = 8.44, df = 3, p-value = 0.03774

    Observe que la salida está muy comprimida en comparación con la función GoodnessOFfitTest (). No se molesta en darte ninguna estadística descriptiva, no te dice qué hipótesis nula se está probando, y así sucesivamente. Y mientras ya entiendas la prueba, eso no es un problema. Una vez que empiece a familiarizarse con R y con las estadísticas, probablemente encontrará que prefiere esta salida simple en lugar de la salida bastante larga que produce GoodnessOFfitTest (). De todos modos, si quieres cambiar la hipótesis nula, es exactamente la misma que antes, solo especifica las probabilidades usando el argumento p. Por ejemplo:

    chisq.test( x = observed, p = c(.2, .3, .3, .2) )
    ## 
    ##  Chi-squared test for given probabilities
    ## 
    ## data:  observed
    ## X-squared = 4.7417, df = 3, p-value = 0.1917

    Nuevamente, estos son los mismos números que la función GoodnessOFfitTest () informa al final de la salida. Simplemente no ha incluido ninguno de los otros detalles.

    ¿Y una prueba de independencia? Resulta que la función chisq.test () es bastante inteligente. 180 Si ingresas una tabulación cruzada en lugar de una simple tabla de frecuencias, se da cuenta de que estás pidiendo una prueba de independencia y no una prueba de bondad de ajuste. Recordemos que ya tenemos esta tabulación cruzada almacenada como la variable ChapekFrequencies:

    chapekFrequencies
    ##         species
    ## choice   robot human
    ##   puppy     13    15
    ##   flower    30    13
    ##   data      44    65

    Para obtener la prueba de independencia, todo lo que tenemos que hacer es alimentar esta tabla de frecuencias a la función chisq.test () así:

    chisq.test( chapekFrequencies )
    ## 
    ##  Pearson's Chi-squared test
    ## 
    ## data:  chapekFrequencies
    ## X-squared = 10.722, df = 2, p-value = 0.004697

    Nuevamente, los números son los mismos que la última vez, es solo que la salida es muy concisa y realmente no explica lo que está pasando de la manera bastante tediosa que lo hace AssociationTest (). Como antes, mi intuición es que cuando recién estás comenzando es más fácil usar algo como AssociationTest () porque te muestra más detalles sobre lo que está pasando, pero más adelante probablemente encontrarás que chisq.test () es más conveniente.


    This page titled 12.6: La forma más típica de hacer pruebas de Chi-cuadrado en R is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform.