Una variable categórica

Última actualización
Guardar como PDF

Page ID: 151249

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $

$ \newcommand{\dsum}{\displaystyle\sum\limits} $

$ \newcommand{\dint}{\displaystyle\int\limits} $

$ \newcommand{\dlim}{\displaystyle\lim\limits} $

$ \newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$

( \newcommand{\kernel}{\mathrm{null}\,}\) $ \newcommand{\range}{\mathrm{range}\,}$

$ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$

$ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$

$ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$ \newcommand{\Span}{\mathrm{span}}$

$ \newcommand{\id}{\mathrm{id}}$

$ \newcommand{\Span}{\mathrm{span}}$

$ \newcommand{\kernel}{\mathrm{null}\,}$

$ \newcommand{\range}{\mathrm{range}\,}$

$ \newcommand{\RealPart}{\mathrm{Re}}$

$ \newcommand{\ImaginaryPart}{\mathrm{Im}}$

$ \newcommand{\Argument}{\mathrm{Arg}}$

$ \newcommand{\norm}[1]{\| #1 \|}$

$ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\AA}{\unicode[.8,0]{x212B}}$

$ \newcommand{\vectorA}[1]{\vec{#1}} % arrow$

$ \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$

$ \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$ \newcommand{\vectorC}[1]{\textbf{#1}} $

$ \newcommand{\vectorD}[1]{\overrightarrow{#1}} $

$ \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} $

$ \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} $

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $

$\newcommand{\longvect}{\overrightarrow}$

$ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $

$\newcommand{\avec}{\mathbf a}$ $\newcommand{\bvec}{\mathbf b}$ $\newcommand{\cvec}{\mathbf c}$ $\newcommand{\dvec}{\mathbf d}$ $\newcommand{\dtil}{\widetilde{\mathbf d}}$ $\newcommand{\evec}{\mathbf e}$ $\newcommand{\fvec}{\mathbf f}$ $\newcommand{\nvec}{\mathbf n}$ $\newcommand{\pvec}{\mathbf p}$ $\newcommand{\qvec}{\mathbf q}$ $\newcommand{\svec}{\mathbf s}$ $\newcommand{\tvec}{\mathbf t}$ $\newcommand{\uvec}{\mathbf u}$ $\newcommand{\vvec}{\mathbf v}$ $\newcommand{\wvec}{\mathbf w}$ $\newcommand{\xvec}{\mathbf x}$ $\newcommand{\yvec}{\mathbf y}$ $\newcommand{\zvec}{\mathbf z}$ $\newcommand{\rvec}{\mathbf r}$ $\newcommand{\mvec}{\mathbf m}$ $\newcommand{\zerovec}{\mathbf 0}$ $\newcommand{\onevec}{\mathbf 1}$ $\newcommand{\real}{\mathbb R}$ $\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$ $\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$ $\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$ $\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$ $\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$ $\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$ $\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$ $\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$ $\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$ $\newcommand{\laspan}[1]{\text{Span}\{#1\}}$ $\newcommand{\bcal}{\cal B}$ $\newcommand{\ccal}{\cal C}$ $\newcommand{\scal}{\cal S}$ $\newcommand{\wcal}{\cal W}$ $\newcommand{\ecal}{\cal E}$ $\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$ $\newcommand{\gray}[1]{\color{gray}{#1}}$ $\newcommand{\lgray}[1]{\color{lightgray}{#1}}$ $\newcommand{\rank}{\operatorname{rank}}$ $\newcommand{\row}{\text{Row}}$ $\newcommand{\col}{\text{Col}}$ $\renewcommand{\row}{\text{Row}}$ $\newcommand{\nul}{\text{Nul}}$ $\newcommand{\var}{\text{Var}}$ $\newcommand{\corr}{\text{corr}}$ $\newcommand{\len}[1]{\left|#1\right|}$ $\newcommand{\bbar}{\overline{\bvec}}$ $\newcommand{\bhat}{\widehat{\bvec}}$ $\newcommand{\bperp}{\bvec^\perp}$ $\newcommand{\xhat}{\widehat{\xvec}}$ $\newcommand{\vhat}{\widehat{\vvec}}$ $\newcommand{\uhat}{\widehat{\uvec}}$ $\newcommand{\what}{\widehat{\wvec}}$ $\newcommand{\Sighat}{\widehat{\Sigma}}$ $\newcommand{\lt}{<}$ $\newcommand{\gt}{>}$ $\newcommand{\amp}{&}$ $\definecolor{fillinmathshade}{gray}{0.9}$

CO-4: Distinguir entre diferentes escalas de medición, elegir los métodos estadísticos descriptivos e inferenciales adecuados con base en estas distinciones e interpretar los resultados.

Video

Una Variable Categórica (4:57)

Nota

Nota: Estos videos están listados como referencia. Si quieres seguir adelante en tu primera lectura, entonces necesitarás ver los videos tutoriales anteriores. Estos videos también están vinculados en las asignaciones de programación.

Todos los videos tutoriales SAS
Todos los videos tutoriales de SPSS

Tutoriales SAS relacionados

4A — (3:03) Distribuciones de Frecuencia

Tutoriales relacionados con SPSS

4A — (7:00) Distribuciones de Frecuencia

Distribución de una variable categórica

Objetivos de aprendizaje

LO 4.3: Usando medidas numéricas y/o pantallas visuales apropiadas, describir la distribución de una variable categórica en contexto.

¿Cuál es tu percepción de tu propio cuerpo? ¿Sientes que tienes sobrepeso, bajo peso, o casi bien?

A una muestra aleatoria de 1,200 estudiantes universitarios estadounidenses se les hizo esta pregunta como parte de una encuesta más amplia. La siguiente tabla muestra parte de las respuestas:

Alumno	Imagen Corporal
estudiante 25	sobrepeso
estudiante 26	acerca de la derecha
estudiante 27	bajo peso
estudiante 28	acerca de la derecha
estudiante 29	acerca de la derecha

Aquí hay alguna información que sería interesante obtener de estos datos:

¿Qué porcentaje de los alumnos muestreados entran en cada categoría?

¿Cómo se dividen los estudiantes en las tres categorías de imagen corporal? ¿Están divididos por igual? Si no, ¿los porcentajes siguen algún otro tipo de patrón?

No hay forma de que podamos responder a estas preguntas mirando los datos brutos, que están en forma de una larga lista de 1,200 respuestas, y por lo tanto no muy útiles.

Ambas preguntas serán respondidas fácilmente una vez que resumimos y veamos la distribución de la variable Imagen Corporal (es decir, una vez que resumimos la frecuencia con la que ocurre cada una de las categorías).

Medidas numéricas

Para resumir la distribución de una variable categórica, primero creamos una tabla de los diferentes valores (categorías) que toma la variable, cuántas veces ocurre cada valor (conteo) y, lo que es más importante, con qué frecuencia ocurre cada valor (convirtiendo los recuentos a porcentajes).

El resultado a menudo se denomina Distribución de Frecuencia o Tabla de Frecuencia.

Nota

Una Distribución de Frecuencia o Tabla de Frecuencia es el conjunto primario de medidas numéricas para una variable categórica.

Consta de una tabla con cada categoría junto con el conteo y porcentaje para cada categoría.
Proporciona un resumen de la distribución para una variable categórica.

Aquí está la tabla para nuestro ejemplo:

Categoría	Contar	Por ciento
Acerca de la derecha	855	(855/1200) *100 = 71.3%
Sobrepeso	235	(235/1200) *100 = 19.6%
Insuficiencia ponderal	110	(110/1200) *100 = 9.2%
Total	n=1200	*100%*

Comentarios:

Si agrega los porcentajes en la tabla anterior obtendrá un total de 100.1% (en lugar del valor verdadero que es, por supuesto, 100%) .Esto puede ocurrir siempre que se haya realizado el redondeo. Debes estar al tanto de esta posibilidad al trabajar con datos reales.Si agregas las proporciones directamente como fracciones, siempre obtendrás exactamente 1 (o 100%).
En general, aunque podría ser “menos confuso” si registramos los valores completos arriba (71.25% en lugar de 71.3% y así sucesivamente), preferimos no mostrar demasiados decimales ya que esto puede distraer de las conclusiones que queremos ilustrar.No queremos que quienes están leyendo nuestros resultados se vean abrumados o distraído por dígitos innecesarios.

Visuales o Gráficas

Para visualizar las medidas numéricas que hemos obtenido, necesitamos una visualización gráfica.

Nota

Hay dos pantallas gráficas simples para visualizar la distribución de una variable categórica:

Gráficos circulares
Gráficos de barras

Gráfico circular

Gráfico de barras

Tenga en cuenta que el gráfico circular y el gráfico de barras son representaciones visuales de la información en la tabla de frecuencias.

Estudia los gráficos de barras anteriores y luego responde la siguiente pregunta.

Aprende haciendo: Gráficos de barras

Ahora que hemos resumido la distribución de valores en la variable Imagen Corporal, volvamos e interpretemos los resultados en el contexto de las preguntas que planteamos. Estudie la tabla de frecuencias y las gráficas y responda las siguientes preguntas.

Aprender haciendo: Describir la distribución de una variable categórica

Ahora que hemos interpretado los resultados, hay algunas otras preguntas interesantes que surgen:

¿Podemos generalizar de manera confiable nuestros resultados a toda la población de interés y concluir que existe una distribución similar entre todas las categorías de imagen corporal entre todos los estudiantes universitarios estadounidenses? En particular, ¿podemos hacer tal generalización a pesar de que nuestra muestra consistió en sólo 1.200 estudiantes, que es una fracción muy pequeña de toda la población?

Si hubiéramos separado nuestra muestra por género y miramos a machos y hembras por separado, ¿habríamos encontrado una distribución similar entre las categorías de imagen corporal?

Estos son los tipos de preguntas que trataremos en futuras secciones del curso.

Recordar: Las variables categóricas toman valores de categoría o etiqueta, y colocan a un individuo en uno de varios grupos. Las variables categóricas a menudo se clasifican adicionalmente como

Nominal, cuando no hay ordenamiento natural entre las categorías. Los ejemplos comunes serían género, color de ojos o etnia.

Ordinal, cuando existe un orden natural entre las categorías, tales como, escalas de clasificación o calificaciones de letras. Sin embargo, las variables ordinales son categóricas y no proporcionan mediciones precisas. Las diferencias no son precisamente significativas, por ejemplo, si un estudiante obtiene una A y otro una B en una tarea, no podemos decir con precisión la diferencia en sus puntuaciones, solo que una A es mayor que una B.

Nota: Para las variables categóricas ordinales, los gráficos circulares rara vez se utilizan ya que la información sobre el orden se puede perder en dicha visualización. Tenga cuidado de que los gráficos de barras para las variables ordinales muestren los datos en un orden razonable dado el escenario.

Si bien tanto el gráfico circular como el gráfico de barras nos ayudan a visualizar la distribución de una variable categórica, el gráfico circular enfatiza cómo las diferentes categorías se relacionan con el todo, y el gráfico de barras enfatiza cómo las diferentes categorías se comparan entre sí.

Pictogramas

Una variación en el gráfico circular y gráfico de barras que se usa muy comúnmente en los medios es el pictograma. Aquí hay dos ejemplos:

Un gráfico de barras en el que las barras han sido sustituidas por rollos de papel higiénico desenredado. El gráfico se titula “Cómo tiramos un baño público” La primera barra está etiquetada con “Use shoe, 41% “, la segunda barra está etiquetada como “Actúa normalmente 30% “, y la última barra está etiquetada como “Toalla de papel 17%”

Fuente: USA Today Snapshots y la encuesta Impulse Research for Northern Confidential Bathroom

Un gráfico circular hecho de una rodaja de pepino. El pepino está en un tenedor, que a su vez está sobre una mesa de comedor. El gráfico circular se titula “Con qué frecuencia se comen las ensaladas (por semana)”. El gráfico circular muestra 4 secciones: Nunca (3%), Diario (13%), 2 o menos (37%), 3-6 veces (47%).

Fuente: Datos del Mercado para la Asociación de Aderezos y Salsas

Cuidado: Los pictogramas pueden ser engañosos. Considera el siguiente pictograma:

Un gráfico en el que tres elementos están representados por el tamaño de una pluma estilográfica. El gráfico está etiquetado como “No. 1 para el Dinero con Anunciantes de Servicios al Consumidor” El bolígrafo más pequeño es US News $1,537.617. El segundo bolígrafo más pequeño es Newsweek $2,698,386. El bolígrafo más grande es el TIEMPO $4,433,879.

Esta gráfica está dirigida a los anunciantes que decidan dónde gastar sus presupuestos, y sugiere claramente que la revista Time atrae con mucho la mayor cantidad de gasto publicitario.

¿Las diferencias son realmente tan dramáticas como sugiere la gráfica?

Si miramos cuidadosamente los números por encima de las plumas, encontramos que los anunciantes gastan en Tiempo solo $4,433,879/$2,698.386 = 1.64 veces más que en Newsweek, y solo $4,433,879/$1,537.617 = 2.88 veces más que en Noticias de Estados Unidos.

Al mirar el pictograma, sin embargo, tenemos la impresión de que el Tiempo está mucho más adelante. ¿Por qué?

Para magnificar el cuadro sin distorsionarlo, debemos aumentar tanto su altura como su anchura. Como resultado, el área de la pluma de Time es 1.64 * 1.64 = 2.7 veces más grande que la pluma de Newsweek, y 2.88 * 2.88 = 8.3 veces mayor que la pluma de noticias de Estados Unidos. Nuestros ojos capturan el área de las plumas en lugar de solo la altura, y así nos engañan al pensar que el Tiempo es un ganador más grande de lo que realmente es.

Aprender haciendo: Una variable categórica (Encuesta a estudiantes universitarios)

Vamos a resumir

La distribución de una variable categórica se resume utilizando:

Visualización visual: gráfico circular o gráfico de barras, complementado con
Medidas numéricas: tabla de frecuencias de recuentos de categorías y porcentajes.

Una variación en los gráficos circulares y gráficos de barras es el pictograma. Los pictogramas pueden ser engañosos, así que asegúrate de usar un enfoque crítico al interpretar la información que el pictograma está tratando de transmitir.

Search

Text Color

Text Size

Margin Size

Font Type

Objetivos de aprendizaje

Nota

Nota