14.1: Categorías y Tablas de Frecuencia
- Page ID
- 150956
Nuestros datos para la\(\chi^{2}\) prueba son categóricos, específicamente nominales, variables. Recordemos de la unidad 1 que las variables nominales no tienen un orden especificado y solo pueden ser descritas por sus nombres y las frecuencias con las que ocurren en el conjunto de datos. Así, a diferencia de nuestras otras variables que hemos probado, no podemos describir nuestros datos para la\(\chi^{2}\) prueba utilizando medias y desviaciones estándar. En su lugar, usaremos tablas de frecuencias.
Cat | Perro | Otros | Total | |
---|---|---|---|---|
Observado | 14 | 17 | 5 | 36 |
Esperado | 12 | 12 | 12 | 36 |
La tabla\(\PageIndex{1}\) da un ejemplo de una tabla de frecuencias utilizada para una\(\chi^{2}\) prueba. Las columnas representan las diferentes categorías dentro de nuestra variable única, que en este ejemplo es la preferencia pet. La\(\chi^{2}\) prueba puede evaluar tan solo dos categorías, y no existe un límite técnico superior sobre cuántas categorías se pueden incluir en nuestra variable, aunque, como ocurre con ANOVA, tener demasiadas categorías hace que nuestros cálculos sean largos y nuestra interpretación difícil. La columna final en la tabla es el número total de observaciones, o\(N\). La\(\chi^{2}\) prueba asume que cada observación proviene de una sola persona y que cada persona proporcionará una sola observación, por lo que nuestras observaciones totales siempre serán iguales a nuestro tamaño de muestra.
Hay dos filas en esta tabla. La primera fila da las frecuencias observadas de cada categoría de nuestro conjunto de datos; en este ejemplo, 14 personas informaron que les gusta preferir los gatos como mascotas, 17 personas informaron preferir perros y 5 personas reportaron un animal diferente. La segunda fila da valores esperados; los valores esperados son los que se encontrarían si cada categoría tuviera igual representación. El cálculo para un valor esperado es:
\[E=\dfrac{N}{C}\]
Dónde\(N\) está el número total de personas en nuestra muestra y\(C\) es el número de categorías en nuestra variable (también el número de columnas en nuestra tabla). Los valores esperados corresponden a la hipótesis nula para\(\chi^{2}\) las pruebas: representación igual de categorías. Nuestra primera de dos\(\chi^{2}\) pruebas, la prueba de bondad de ajuste, evaluará qué tan bien nuestros datos se linean con, o se desvían de, esta suposición.