Saltar al contenido principal
Library homepage
 
LibreTexts Español

12.2: Prueba de independencia de Chi‐cuadrado

  • Page ID
    151650
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En 2014, Colorado se convirtió en el primer estado en legalizar el uso recreativo de la mariguana. Otros estados se han sumado a Colorado, mientras que algunos han despenalizado o autorizado el uso médico de la mariguana. La pregunta es si la marihuana debe ser legalizada en todos los estados. Supongamos que hicimos una encuesta a 1000 adultos estadounidenses y preguntamos “¿Debería la marihuana ser legal o no legal para uso recreativo?” y obtuvimos los siguientes resultados:

    clipboard_ea66151d907b7f88ad973cea3934fa501.png

    La interpretación de esta encuesta es que el 50% de los adultos encuestados favorecieron la legalización de la marihuana para uso recreativo, mientras que 45% se opuso a ella. El 5% restante estaban indecisos.

    En este momento, es posible que tengas preguntas y quieras explorar esta encuesta con más profundidad. Por ejemplo, ¿es más probable que los jóvenes apoyen la legalización de la mariguana? ¿Otras características demográficas como género, etnia, orientación sexual o religión afectan las opiniones de las personas sobre la legalización?

    Exploremos la posibilidad de diferencia de opinión por género. ¿Los hombres son más propensos (o menos propensos) a oponerse a la legalización de la marihuana en comparación con las mujeres?

    En el ejemplo anterior, supongamos que tenemos exactamente 500 hombres y 500 mujeres en la encuesta. ¿Qué esperaríamos ver en los datos si no hubiera diferencia de opinión entre hombres y mujeres?

    Mesas de dos vías

    Se utilizan tablas de dos vías o de contingencia para resumir dos variables categóricas, también conocidas como datos categóricos bivariados. Para crear una tabla de dos vías, el investigador debe tabular transversalmente las dos respuestas para cada pregunta categórica.

    En el ejemplo anterior, las dos variables categóricas son género y opinión sobre la legalización de la mariguana. El género tiene dos opciones (masculina o femenina) mientras que la opinión sobre la legalización de la marihuana tiene tres opciones (legal, no legal e insegura).

    En el ejemplo anterior, supongamos que tenemos exactamente 500 hombres y 500 mujeres en la encuesta. ¿Qué esperaríamos ver en los datos si no hubiera diferencia de opinión entre hombres y mujeres? Entonces podríamos simplemente aplicar los porcentajes totales a cada grupo.

    clipboard_e957101e8dc4c3c21edbea63129f8ee88.png

    Revisemos desde la probabilidad qué significa la independencia. Si dos eventos A y B son independientes, entonces las siguientes afirmaciones son verdaderas:

    \ [\ comenzar {alineado}
    P (\ texto {A dado B}) &=P (A)\\
    P (\ texto {B dado A}) &=P (B)\\
    P (\ texto {A y B}) &=P (A) P (B)
    \ final {alineado}\ nonumber\]

    Puedes escoger cualquiera de los dos eventos en la tabla anterior para verificar que Género y Opinión de Legalización de la Marihuana son eventos independientes. Por ejemplo, compare los eventos No Legal y Hombres.

    \(P\)(No Legal dado Hombres) = 225/500 = 45% igual que\(P\) (No Legal) = 45%

    \(P\)(Hombres dados No Legal) = 225/450 = 50% igual que\(P\) (Hombres) = 50%

    \(P\)(No Legal y Hombres) = 225/1000 = 22.5% igual que\(P\) (No Legal) P (Hombres) = (45%) (50%) = 22.5%

    Con base en estas reglas de probabilidad podemos calcular el valor esperado de cualquier par de eventos independientes usando la siguiente fórmula:

    Valor esperado = (Total de fila) (Total de columna)/(Total general)

    Por ejemplo, mirando los eventos No Legal y Hombres:

    Valor esperado = (450) (500)/(1000) = 225

    ¿Y si los eventos no son independientes? Revisemos la misma encuesta. ¿Qué esperaríamos ver en los datos si hubiera una diferencia de opinión entre hombres y mujeres? Digamos que las mujeres tenían más probabilidades de apoyar la legalización. En ese caso, esperaríamos que las 450 personas que apoyaron la legalización de la mariguana tengan un mayor número de mujeres (y un número menor de hombres) en comparación con la primera mesa. Tenga en cuenta que solo cambiamos las primeras seis casillas (sombreadas abajo); los totales deben seguir siendo los mismos.

    clipboard_e70a7efeb3264500995bb190468722bf2.png

    Ahora veamos los resultados reales de esta encuesta y veamos qué está pasando:

    clipboard_e2b759250f17b95c3d76fc2f9395b8a52.png

    En esta encuesta, un mayor porcentaje de hombres apoya la legalización de la marihuana para uso recreativo en comparación con las mujeres. Pregunta: ¿Es esta evidencia lo suficientemente fuerte como para apoyar la afirmación de que el género y la opinión sobre la legalización de la marihuana no son eventos independientes? Esta pregunta puede abordarse realizando una prueba de hipótesis utilizando con el modelo Chi‐cuadrado Test for Independence.

    Prueba de Chi‐cuadrado de Independencia

    Se puede usar una prueba de independencia de Chi‐cuadrado para determinar si existe una relación entre dos variables categóricas aleatorias. Si las variables categóricas están etiquetadas A y B, las hipótesis siempre se escriben de esta forma:

    \(H_o\): A y B son eventos independientes

    \(H_a\): A y B son eventos dependientes.

    Si solo se aleatoriza una variable, entonces la prueba se denomina Prueba de Homogeneidad de Chi‐cuadrado, pero la ejecución de la prueba es exactamente la misma. Si A representa la variable de respuesta aleatoria y B representa la variable explicativa manipulada, entonces las hipótesis se escriben como:

    \(H_o\): No hay diferencia en la distribución de A debido a B.

    \(H_a\): Hay una diferencia en la distribución de A debido a B.

    Prueba de Chi‐cuadrado para la independencia

    Supuestos de modelo

    • \(O_{i j}\)= Observado en la categoría\(ij\)
    • \(E_{i j}=n p_{i j}=\dfrac{(\text { ColumnTotal })(\text { RowTotal })}{\text { Grand Total }}\);\(E_{i j} \geq 5 \text { for each ij }\)

    Estadística de prueba

    • \(\chi^{2}=\sum_{i=1}^{r} \sum_{j=1}^{c} \dfrac{\left(O_{i j}-E_{i j}\right)^{2}}{E_{i j}} \quad \mathrm{df}=(r-1)(c-1)\)donde

    r = número de categorías de fila c = número de categorías de columna n = tamaño de muestra

    Ejemplo: Legalización de la mariguana

    ¿Género y Opinión sobre la legalización de la mariguana para uso recreativo son eventos independientes? Realizar una prueba de hipótesis con un nivel de significancia del 5%.

    Solución

    Hipótesis de investigación:

    \(H_o\): Género y Opinión sobre la legalización de la mariguana para uso recreativo son eventos independientes.

    \(H_a\): Género y Opinión sobre la legalización de la mariguana para uso recreativo son eventos dependientes.

    Modelo Estadístico: Prueba de Chi‐cuadrado de Independencia. Las dos variables categóricas en este ejemplo son Género y Opinión.

    Resultados:

    clipboard_ea86099b97a34a0f029c66be644451125.png

    Suposición Importante: El Valor Esperado de Cada Categoría debe ser mayor o igual a 5. En este ejemplo, el valor más bajo esperado es 225 (Hombres, no legal) por lo que se cumple la suposición.

    Estadística de prueba:\(\chi^{2}=\sum_{i=1}^{r} \sum_{j=1}^{c} \dfrac{\left(O_{i j}-E_{i j}\right)^{2}}{E_{i j}} \qquad \mathrm{df}=(3-1)(2-1)=2\)

    Regla de Decisión (Método de Valor Crítico): Rechazar\(H_o\) si\(\chi^{2}>5.991(\alpha=.05,2 \mathrm{df})\)

    \(\chi^{2}=1.600+1.600+1.778+1.778=6.756\)

    Dado que el Estadístico de Prueba excede el valor crítico, la decisión es Rechazar\(H_o\). Bajo el método\(p\) ‐value, también\(H_o\) se rechaza ya que el\(p \text {-value }=p\left(\chi^{2}>6.756\right)=0.034\), que es menor que el Nivel\(\alpha\) de Significancia del 5%.

    Conclusión:

    Género y Opinión sobre la legalización de la mariguana para uso recreativo son eventos dependientes. Los hombres son más propensos a apoyar la legalización de la marihuana para uso recreativo.


    This page titled 12.2: Prueba de independencia de Chi‐cuadrado is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.