Saltar al contenido principal
LibreTexts Español

14.1: Categorías y Tablas de Frecuencia

  • Page ID
    150956
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Nuestros datos para la\(\chi^{2}\) prueba son categóricos, específicamente nominales, variables. Recordemos de la unidad 1 que las variables nominales no tienen un orden especificado y solo pueden ser descritas por sus nombres y las frecuencias con las que ocurren en el conjunto de datos. Así, a diferencia de nuestras otras variables que hemos probado, no podemos describir nuestros datos para la\(\chi^{2}\) prueba utilizando medias y desviaciones estándar. En su lugar, usaremos tablas de frecuencias.

    Tabla\(\PageIndex{1}\): Preferencias de mascotas
    Cat Perro Otros Total
    Observado 14 17 5 36
    Esperado 12 12 12 36

    La tabla\(\PageIndex{1}\) da un ejemplo de una tabla de frecuencias utilizada para una\(\chi^{2}\) prueba. Las columnas representan las diferentes categorías dentro de nuestra variable única, que en este ejemplo es la preferencia pet. La\(\chi^{2}\) prueba puede evaluar tan solo dos categorías, y no existe un límite técnico superior sobre cuántas categorías se pueden incluir en nuestra variable, aunque, como ocurre con ANOVA, tener demasiadas categorías hace que nuestros cálculos sean largos y nuestra interpretación difícil. La columna final en la tabla es el número total de observaciones, o\(N\). La\(\chi^{2}\) prueba asume que cada observación proviene de una sola persona y que cada persona proporcionará una sola observación, por lo que nuestras observaciones totales siempre serán iguales a nuestro tamaño de muestra.

    Hay dos filas en esta tabla. La primera fila da las frecuencias observadas de cada categoría de nuestro conjunto de datos; en este ejemplo, 14 personas informaron que les gusta preferir los gatos como mascotas, 17 personas informaron preferir perros y 5 personas reportaron un animal diferente. La segunda fila da valores esperados; los valores esperados son los que se encontrarían si cada categoría tuviera igual representación. El cálculo para un valor esperado es:

    \[E=\dfrac{N}{C}\]

    Dónde\(N\) está el número total de personas en nuestra muestra y\(C\) es el número de categorías en nuestra variable (también el número de columnas en nuestra tabla). Los valores esperados corresponden a la hipótesis nula para\(\chi^{2}\) las pruebas: representación igual de categorías. Nuestra primera de dos\(\chi^{2}\) pruebas, la prueba de bondad de ajuste, evaluará qué tan bien nuestros datos se linean con, o se desvían de, esta suposición.


    This page titled 14.1: Categorías y Tablas de Frecuencia is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Foster et al. (University of Missouri’s Affordable and Open Access Educational Resources Initiative) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.