Saltar al contenido principal

# 17.4: Tablas de Contingencia

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

Objetivos de aprendizaje

• Indicar la hipótesis nula probada respecto a las tablas de contingencia
• Compute Chi Square y$$df$$

En esta sección se muestra cómo utilizar el Chi cuadrado para probar la relación entre las variables nominales para determinar la significancia. Por ejemplo, Table$$\PageIndex{1}$$ muestra los datos del estudio de caso Dieta y Salud Mediterránea.

Tabla$$\PageIndex{1}$$: Frecuencias para Estudio de Dieta y Salud
AHA 15 24 25 239 303
Mediterránea 7 14 8 273 302
Total 22 38 33 512 605

La pregunta es si existe una relación significativa entre la dieta y el resultado. El primer paso es calcular la frecuencia esperada para cada celda en base a la suposición de que no hay relación. Estas frecuencias esperadas se calculan a partir de los totales de la siguiente manera. Comenzamos calculando la frecuencia esperada para la combinación Dieta AHA/Cánceres. Tenga en cuenta que$$22/605$$ los sujetos desarrollaron cáncer. Por lo tanto, la proporción que desarrollaron cáncer es$$0.0364$$. Si no hubiera relación entre la dieta y el resultado, entonces esperaríamos$$0.0364$$ de quienes están en la dieta AHA desarrollen cáncer. Dado que$$303$$ los sujetos estaban en la dieta AHA, esperaríamos$$(0.0364)(303) = 11.02$$ cánceres en la dieta AHA. De igual manera, esperaríamos$$(0.0364)(302) = 10.98$$ cánceres en la dieta mediterránea. En general, la frecuencia esperada para una celda en la$$i^{th}$$ fila y la$$j^{th}$$ columna es igual a

$E_{i,j} = \frac{T_iT_j}{T}$

donde$$E_{i,j}$$ está la frecuencia esperada para la celda$$i,j$$,$$T_i$$ es el total para la$$i^{th}$$ fila,$$T_j$$ es el total para la$$j^{th}$$ columna, y$$T$$ es el número total de observaciones. Para la célula AHA Dieta/Cánceres$$i = 1$$$$j = 1$$,,$$T_i = 303$$,$$T_j = 22$$, y$$T = 605$$. El cuadro$$\PageIndex{2}$$ muestra las frecuencias esperadas (entre paréntesis) para cada célula en el experimento.

Tabla$$\PageIndex{2}$$: Frecuencias observadas y esperadas para el estudio de dieta y salud
AHA 15
(11.02)
24
(19.03)
25
(16.53)
239
(256.42)
303
Mediterránea 7
(10.98)
14
(18.97)
8
(16.47)
273
(255.58)
302
Total 22 38 33 512 605

La prueba de significancia se realiza calculando Chi Square de la siguiente manera.

$\chi _{3}^{2} = \sum \frac{(E-O)^2}{E} = 16.55$

Los grados de libertad son iguales a$$(r-1)(c-1)$$, donde r es el número de filas y$$c$$ es el número de columnas. Para este ejemplo, los grados de libertad lo son$$(2-1)(4-1) = 3$$. La calculadora Chi Square se puede utilizar para determinar que el valor de probabilidad para un Chi Cuadrado de$$16.55$$ con tres grados de libertad es igual a$$0.0009$$. Por lo tanto, la hipótesis nula de no relación entre dieta y desenlace puede ser rechazada.

Una suposición clave de esta prueba de Chi Square es que cada sujeto aporta datos a una sola celda. Por lo tanto, la suma de todas las frecuencias celulares en la tabla debe ser la misma que el número de sujetos en el experimento. Consideremos un experimento en el que cada uno de$$16$$ los sujetos intentó dos problemas anagrarios. Los datos se muestran en la Tabla$$\PageIndex{3}$$.

Tabla$$\PageIndex{3}$$: Datos del problema del anagrama
Anagrama 1 Anagrama 2
Resuelto 10 4
No Resolvió 6 12

No sería válido utilizar la prueba de Chi Square sobre estos datos ya que cada sujeto aportó datos a dos celdas: una celda basada en su desempeño$$\text{Anagram 1}$$ y una celda basada en su desempeño en$$\text{Anagram 2}$$. El total de las frecuencias celulares en la tabla es$$32$$, pero el número total de sujetos es sólo$$16$$.

La fórmula para Chi Square produce una estadística que es solo aproximadamente una distribución de Chi Square. Para que la aproximación sea adecuada, el número total de asignaturas debe ser al menos$$20$$. Algunos autores afirman que la corrección de continuidad debe usarse siempre que una frecuencia celular esperada esté por debajo$$5$$. La investigación en estadística ha demostrado que esta práctica no es recomendable. Por ejemplo, ver:

Bradley, D. R., Bradley, T. D., McGrath, S. G., & Cutcomb, S. D. (1979) Tasa de error tipo I de la prueba chi cuadrada de independencia en tablas r x c que tienen frecuencias esperadas pequeñas. Boletín Psicológico, 86, 1200-1297.

La corrección por continuidad cuando se aplica a tablas$$2 \times 2$$ de contingencia se denomina corrección de Yates. Las tablas de simulación 2 x 2 permiten explorar la precisión de la aproximación y el valor de esta corrección.

This page titled 17.4: Tablas de Contingencia is shared under a Public Domain license and was authored, remixed, and/or curated by David Lane via source content that was edited to the style and standards of the LibreTexts platform.