CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.
Nota
Nota: Estos videos están listados como referencia. Si quieres seguir adelante en tu primera lectura, entonces necesitarás ver los videos tutoriales anteriores. Estos videos también están vinculados en las asignaciones de programación.
- Todos los videos tutoriales SAS
- Todos los videos tutoriales de SPSS
Tutoriales SAS relacionados
Tutoriales relacionados con SPSS
Distribución de una variable categórica
Objetivos de aprendizaje
LO 4.3: Usando medidas numéricas y/o pantallas visuales apropiadas, describir la distribución de una variable categórica en contexto.
¿Cuál es tu percepción de tu propio cuerpo? ¿Sientes que tienes sobrepeso, bajo peso, o casi bien?
A una muestra aleatoria de 1,200 estudiantes universitarios estadounidenses se les hizo esta pregunta como parte de una encuesta más amplia. La siguiente tabla muestra parte de las respuestas:
Alumno |
Imagen Corporal |
estudiante 25 |
sobrepeso |
estudiante 26 |
acerca de la derecha |
estudiante 27 |
bajo peso |
estudiante 28 |
acerca de la derecha |
estudiante 29 |
acerca de la derecha |
Aquí hay alguna información que sería interesante obtener de estos datos:
- ¿Qué porcentaje de los alumnos muestreados entran en cada categoría?
- ¿Cómo se dividen los estudiantes en las tres categorías de imagen corporal? ¿Están divididos por igual? Si no, ¿los porcentajes siguen algún otro tipo de patrón?
No hay forma de que podamos responder a estas preguntas mirando los datos brutos, que están en forma de una larga lista de 1,200 respuestas, y por lo tanto no muy útiles.
Ambas preguntas serán respondidas fácilmente una vez que resumimos y veamos la distribución de la variable Imagen Corporal (es decir, una vez que resumimos la frecuencia con la que ocurre cada una de las categorías).
Medidas numéricas
Para resumir la distribución de una variable categórica, primero creamos una tabla de los diferentes valores (categorías) que toma la variable, cuántas veces ocurre cada valor (conteo) y, lo que es más importante, con qué frecuencia ocurre cada valor (convirtiendo los recuentos a porcentajes).
El resultado a menudo se denomina Distribución de Frecuencia o Tabla de Frecuencia.
Nota
Una Distribución de Frecuencia o Tabla de Frecuencia es el conjunto primario de medidas numéricas para una variable categórica.
- Consta de una tabla con cada categoría junto con el conteo y porcentaje para cada categoría.
- Proporciona un resumen de la distribución para una variable categórica.
Aquí está la tabla para nuestro ejemplo:
Categoría |
Contar |
Por ciento |
Acerca de la derecha |
855 |
(855/1200) *100 = 71.3% |
Sobrepeso |
235 |
(235/1200) *100 = 19.6% |
Insuficiencia ponderal |
110 |
(110/1200) *100 = 9.2% |
Total |
n=1200 |
100% |
Comentarios:
- Si agrega los porcentajes en la tabla anterior obtendrá un total de 100.1% (en lugar del valor verdadero que es, por supuesto, 100%) .Esto puede ocurrir siempre que se haya realizado el redondeo. Debes estar al tanto de esta posibilidad al trabajar con datos reales.Si agregas las proporciones directamente como fracciones, siempre obtendrás exactamente 1 (o 100%).
- En general, aunque podría ser “menos confuso” si registramos los valores completos arriba (71.25% en lugar de 71.3% y así sucesivamente), preferimos no mostrar demasiados decimales ya que esto puede distraer de las conclusiones que queremos ilustrar.No queremos que quienes están leyendo nuestros resultados se vean abrumados o distraído por dígitos innecesarios.
Visuales o Gráficas
Para visualizar las medidas numéricas que hemos obtenido, necesitamos una visualización gráfica.
Nota
Hay dos pantallas gráficas simples para visualizar la distribución de una variable categórica:
- Gráficos circulares
- Gráficos de barras
Gráfico circular

Gráfico de barras

Tenga en cuenta que el gráfico circular y el gráfico de barras son representaciones visuales de la información en la tabla de frecuencias.
Estudia los gráficos de barras anteriores y luego responde la siguiente pregunta.
Aprende haciendo: Gráficos de barras
Ahora que hemos resumido la distribución de valores en la variable Imagen Corporal, volvamos e interpretemos los resultados en el contexto de las preguntas que planteamos. Estudie la tabla de frecuencias y las gráficas y responda las siguientes preguntas.
Aprender haciendo: Describir la distribución de una variable categórica
Ahora que hemos interpretado los resultados, hay algunas otras preguntas interesantes que surgen:
- ¿Podemos generalizar de manera confiable nuestros resultados a toda la población de interés y concluir que existe una distribución similar entre todas las categorías de imagen corporal entre todos los estudiantes universitarios estadounidenses? En particular, ¿podemos hacer tal generalización a pesar de que nuestra muestra consistió en sólo 1.200 estudiantes, que es una fracción muy pequeña de toda la población?
- Si hubiéramos separado nuestra muestra por género y miramos a machos y hembras por separado, ¿habríamos encontrado una distribución similar entre las categorías de imagen corporal?
Estos son los tipos de preguntas que trataremos en futuras secciones del curso.
Recordar: Las variables categóricas toman valores de categoría o etiqueta, y colocan a un individuo en uno de varios grupos. Las variables categóricas a menudo se clasifican adicionalmente como
- Nominal, cuando no hay ordenamiento natural entre las categorías. Los ejemplos comunes serían género, color de ojos o etnia.
- Ordinal, cuando existe un orden natural entre las categorías, tales como, escalas de clasificación o calificaciones de letras. Sin embargo, las variables ordinales son categóricas y no proporcionan mediciones precisas. Las diferencias no son precisamente significativas, por ejemplo, si un estudiante obtiene una A y otro una B en una tarea, no podemos decir con precisión la diferencia en sus puntuaciones, solo que una A es mayor que una B.
Nota: Para las variables categóricas ordinales, los gráficos circulares rara vez se utilizan ya que la información sobre el orden se puede perder en dicha visualización. Tenga cuidado de que los gráficos de barras para las variables ordinales muestren los datos en un orden razonable dado el escenario.
Si bien tanto el gráfico circular como el gráfico de barras nos ayudan a visualizar la distribución de una variable categórica, el gráfico circular enfatiza cómo las diferentes categorías se relacionan con el todo, y el gráfico de barras enfatiza cómo las diferentes categorías se comparan entre sí.
Pictogramas
Una variación en el gráfico circular y gráfico de barras que se usa muy comúnmente en los medios es el pictograma. Aquí hay dos ejemplos:

Fuente: USA Today Snapshots y la encuesta Impulse Research for Northern Confidential Bathroom

Fuente: Datos del Mercado para la Asociación de Aderezos y Salsas
Cuidado: Los pictogramas pueden ser engañosos. Considera el siguiente pictograma:

Esta gráfica está dirigida a los anunciantes que decidan dónde gastar sus presupuestos, y sugiere claramente que la revista Time atrae con mucho la mayor cantidad de gasto publicitario.
¿Las diferencias son realmente tan dramáticas como sugiere la gráfica?
Si miramos cuidadosamente los números por encima de las plumas, encontramos que los anunciantes gastan en Tiempo solo $4,433,879/$2,698.386 = 1.64 veces más que en Newsweek, y solo $4,433,879/$1,537.617 = 2.88 veces más que en Noticias de Estados Unidos.
Al mirar el pictograma, sin embargo, tenemos la impresión de que el Tiempo está mucho más adelante. ¿Por qué?
Para magnificar el cuadro sin distorsionarlo, debemos aumentar tanto su altura como su anchura. Como resultado, el área de la pluma de Time es 1.64 * 1.64 = 2.7 veces más grande que la pluma de Newsweek, y 2.88 * 2.88 = 8.3 veces mayor que la pluma de noticias de Estados Unidos. Nuestros ojos capturan el área de las plumas en lugar de solo la altura, y así nos engañan al pensar que el Tiempo es un ganador más grande de lo que realmente es.
Aprender haciendo: Una variable categórica (Encuesta a estudiantes universitarios)
Vamos a resumir
La distribución de una variable categórica se resume utilizando:
- Visualización visual: gráfico circular o gráfico de barras, complementado con
- Medidas numéricas: tabla de frecuencias de recuentos de categorías y porcentajes.
Una variación en los gráficos circulares y gráficos de barras es el pictograma. Los pictogramas pueden ser engañosos, así que asegúrate de usar un enfoque crítico al interpretar la información que el pictograma está tratando de transmitir.