Saltar al contenido principal
LibreTexts Español

Una variable categórica

  • Page ID
    151249
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.

    Nota

    Nota: Estos videos están listados como referencia. Si quieres seguir adelante en tu primera lectura, entonces necesitarás ver los videos tutoriales anteriores. Estos videos también están vinculados en las asignaciones de programación.

    • Todos los videos tutoriales SAS
    • Todos los videos tutoriales de SPSS

    Tutoriales SAS relacionados

    Tutoriales relacionados con SPSS

    Distribución de una variable categórica

    Objetivos de aprendizaje

    LO 4.3: Usando medidas numéricas y/o pantallas visuales apropiadas, describir la distribución de una variable categórica en contexto.

    ¿Cuál es tu percepción de tu propio cuerpo? ¿Sientes que tienes sobrepeso, bajo peso, o casi bien?

    A una muestra aleatoria de 1,200 estudiantes universitarios estadounidenses se les hizo esta pregunta como parte de una encuesta más amplia. La siguiente tabla muestra parte de las respuestas:

    Alumno Imagen Corporal
    estudiante 25 sobrepeso
    estudiante 26 acerca de la derecha
    estudiante 27 bajo peso
    estudiante 28 acerca de la derecha
    estudiante 29 acerca de la derecha

    Aquí hay alguna información que sería interesante obtener de estos datos:

    • ¿Qué porcentaje de los alumnos muestreados entran en cada categoría?
    • ¿Cómo se dividen los estudiantes en las tres categorías de imagen corporal? ¿Están divididos por igual? Si no, ¿los porcentajes siguen algún otro tipo de patrón?

    No hay forma de que podamos responder a estas preguntas mirando los datos brutos, que están en forma de una larga lista de 1,200 respuestas, y por lo tanto no muy útiles.

    Ambas preguntas serán respondidas fácilmente una vez que resumimos y veamos la distribución de la variable Imagen Corporal (es decir, una vez que resumimos la frecuencia con la que ocurre cada una de las categorías).

    Medidas numéricas

    Para resumir la distribución de una variable categórica, primero creamos una tabla de los diferentes valores (categorías) que toma la variable, cuántas veces ocurre cada valor (conteo) y, lo que es más importante, con qué frecuencia ocurre cada valor (convirtiendo los recuentos a porcentajes).

    El resultado a menudo se denomina Distribución de Frecuencia o Tabla de Frecuencia.

    Nota

    Una Distribución de Frecuencia o Tabla de Frecuencia es el conjunto primario de medidas numéricas para una variable categórica.

    • Consta de una tabla con cada categoría junto con el conteo y porcentaje para cada categoría.
    • Proporciona un resumen de la distribución para una variable categórica.

    Aquí está la tabla para nuestro ejemplo:

    Categoría Contar Por ciento
    Acerca de la derecha 855 (855/1200) *100 = 71.3%
    Sobrepeso 235 (235/1200) *100 = 19.6%
    Insuficiencia ponderal 110 (110/1200) *100 = 9.2%
    Total n=1200 100%

    Comentarios:

    1. Si agrega los porcentajes en la tabla anterior obtendrá un total de 100.1% (en lugar del valor verdadero que es, por supuesto, 100%) .Esto puede ocurrir siempre que se haya realizado el redondeo. Debes estar al tanto de esta posibilidad al trabajar con datos reales.Si agregas las proporciones directamente como fracciones, siempre obtendrás exactamente 1 (o 100%).
    2. En general, aunque podría ser “menos confuso” si registramos los valores completos arriba (71.25% en lugar de 71.3% y así sucesivamente), preferimos no mostrar demasiados decimales ya que esto puede distraer de las conclusiones que queremos ilustrar.No queremos que quienes están leyendo nuestros resultados se vean abrumados o distraído por dígitos innecesarios.

    Visuales o Gráficas

    Para visualizar las medidas numéricas que hemos obtenido, necesitamos una visualización gráfica.

    Nota

    Hay dos pantallas gráficas simples para visualizar la distribución de una variable categórica:

    • Gráficos circulares
    • Gráficos de barras

    Gráfico circular

    Un gráfico circular de la distribución. Al ocupar el 71.3% del gráfico se encuentra la categoría “aproximadamente a la derecha”, que se etiqueta con “aproximadamente a la derecha (855, 71.3%)”. Otro 9.2% del gráfico es ocupado por la sección etiquetada como “bajo peso (110, 9.2%)”, y que ocupa 19.6% del gráfico es el área etiquetada como “sobrepeso (235, 19.6%)”. En total las tres secciones llenan todo el pastel, por lo que conforman el 100% del gráfico, lo que representa la totalidad de los datos.

    Gráfico de barras

    Dos gráficos de barras. Dado que estos gráficos de barras solo pueden mostrar un tipo de unidad en el eje vertical, se requieren dos, uno para mostrar recuentos y otro para mostrar porcentajes. El primer gráfico de barras muestra los recuentos sobre el eje vertical, de 0 a 900. El eje horizontal tiene 3 etiquetas bajo 3 barras. La barra más grande está etiquetada como “aproximadamente a la derecha” y es la más grande. Se extiende desde la marca 0 en el eje vertical hasta entre la marca 800 y 900. La segunda barra está etiquetada como “sobrepeso” y comienza en la marca 0 y termina en aproximadamente la marca 200. La tercera barra está etiquetada como “bajo peso” y comienza en la marca 0 y termina entre la marca 100 y 200. El segundo gráfico de barras es idéntico al primero, excepto que el eje vertical se ha cambiado a Unidades porcentuales, y va de 0 a 70. Las barras son las mismas que en el primer gráfico.

    Tenga en cuenta que el gráfico circular y el gráfico de barras son representaciones visuales de la información en la tabla de frecuencias.

    Estudia los gráficos de barras anteriores y luego responde la siguiente pregunta.

    Aprende haciendo: Gráficos de barras

    Ahora que hemos resumido la distribución de valores en la variable Imagen Corporal, volvamos e interpretemos los resultados en el contexto de las preguntas que planteamos. Estudie la tabla de frecuencias y las gráficas y responda las siguientes preguntas.

    Aprender haciendo: Describir la distribución de una variable categórica

    Ahora que hemos interpretado los resultados, hay algunas otras preguntas interesantes que surgen:

    • ¿Podemos generalizar de manera confiable nuestros resultados a toda la población de interés y concluir que existe una distribución similar entre todas las categorías de imagen corporal entre todos los estudiantes universitarios estadounidenses? En particular, ¿podemos hacer tal generalización a pesar de que nuestra muestra consistió en sólo 1.200 estudiantes, que es una fracción muy pequeña de toda la población?
    • Si hubiéramos separado nuestra muestra por género y miramos a machos y hembras por separado, ¿habríamos encontrado una distribución similar entre las categorías de imagen corporal?

    Estos son los tipos de preguntas que trataremos en futuras secciones del curso.

    Recordar: Las variables categóricas toman valores de categoría o etiqueta, y colocan a un individuo en uno de varios grupos. Las variables categóricas a menudo se clasifican adicionalmente como

    • Nominal, cuando no hay ordenamiento natural entre las categorías. Los ejemplos comunes serían género, color de ojos o etnia.
    • Ordinal, cuando existe un orden natural entre las categorías, tales como, escalas de clasificación o calificaciones de letras. Sin embargo, las variables ordinales son categóricas y no proporcionan mediciones precisas. Las diferencias no son precisamente significativas, por ejemplo, si un estudiante obtiene una A y otro una B en una tarea, no podemos decir con precisión la diferencia en sus puntuaciones, solo que una A es mayor que una B.

    Nota: Para las variables categóricas ordinales, los gráficos circulares rara vez se utilizan ya que la información sobre el orden se puede perder en dicha visualización. Tenga cuidado de que los gráficos de barras para las variables ordinales muestren los datos en un orden razonable dado el escenario.

    Si bien tanto el gráfico circular como el gráfico de barras nos ayudan a visualizar la distribución de una variable categórica, el gráfico circular enfatiza cómo las diferentes categorías se relacionan con el todo, y el gráfico de barras enfatiza cómo las diferentes categorías se comparan entre sí.

    Pictogramas

    Una variación en el gráfico circular y gráfico de barras que se usa muy comúnmente en los medios es el pictograma. Aquí hay dos ejemplos:

    Un gráfico de barras en el que las barras han sido sustituidas por rollos de papel higiénico desenredado. El gráfico se titula “Cómo tiramos un baño público” La primera barra está etiquetada con “Use shoe, 41% “, la segunda barra está etiquetada como “Actúa normalmente 30% “, y la última barra está etiquetada como “Toalla de papel 17%”

    Fuente: USA Today Snapshots y la encuesta Impulse Research for Northern Confidential Bathroom

    Un gráfico circular hecho de una rodaja de pepino. El pepino está en un tenedor, que a su vez está sobre una mesa de comedor. El gráfico circular se titula “Con qué frecuencia se comen las ensaladas (por semana)”. El gráfico circular muestra 4 secciones: Nunca (3%), Diario (13%), 2 o menos (37%), 3-6 veces (47%).

    Fuente: Datos del Mercado para la Asociación de Aderezos y Salsas

    Cuidado: Los pictogramas pueden ser engañosos. Considera el siguiente pictograma:

    Un gráfico en el que tres elementos están representados por el tamaño de una pluma estilográfica. El gráfico está etiquetado como “No. 1 para el Dinero con Anunciantes de Servicios al Consumidor” El bolígrafo más pequeño es US News $1,537.617. El segundo bolígrafo más pequeño es Newsweek $2,698,386. El bolígrafo más grande es el TIEMPO $4,433,879.

    Esta gráfica está dirigida a los anunciantes que decidan dónde gastar sus presupuestos, y sugiere claramente que la revista Time atrae con mucho la mayor cantidad de gasto publicitario.

    ¿Las diferencias son realmente tan dramáticas como sugiere la gráfica?

    Si miramos cuidadosamente los números por encima de las plumas, encontramos que los anunciantes gastan en Tiempo solo $4,433,879/$2,698.386 = 1.64 veces más que en Newsweek, y solo $4,433,879/$1,537.617 = 2.88 veces más que en Noticias de Estados Unidos.

    Al mirar el pictograma, sin embargo, tenemos la impresión de que el Tiempo está mucho más adelante. ¿Por qué?

    Para magnificar el cuadro sin distorsionarlo, debemos aumentar tanto su altura como su anchura. Como resultado, el área de la pluma de Time es 1.64 * 1.64 = 2.7 veces más grande que la pluma de Newsweek, y 2.88 * 2.88 = 8.3 veces mayor que la pluma de noticias de Estados Unidos. Nuestros ojos capturan el área de las plumas en lugar de solo la altura, y así nos engañan al pensar que el Tiempo es un ganador más grande de lo que realmente es.

    Aprender haciendo: Una variable categórica (Encuesta a estudiantes universitarios)

    Vamos a resumir

    La distribución de una variable categórica se resume utilizando:

    • Visualización visual: gráfico circular o gráfico de barras, complementado con
    • Medidas numéricas: tabla de frecuencias de recuentos de categorías y porcentajes.

    Una variación en los gráficos circulares y gráficos de barras es el pictograma. Los pictogramas pueden ser engañosos, así que asegúrate de usar un enfoque crítico al interpretar la información que el pictograma está tratando de transmitir.


    Una variable categórica is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.