Saltar al contenido principal
LibreTexts Español

11.2: Presentación Gráfica de Datos Categóricos

  • Page ID
    110421
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Los datos categóricos o cualitativos son piezas de información que nos permiten clasificar los objetos investigados en diversas categorías. Por lo general, comenzamos a trabajar con datos categóricos resumiendo los datos en una tabla de frecuencias.

    Tabla de frecuencias

    Una tabla de frecuencias es una tabla con dos columnas. Una columna enumera las categorías, y otra para las frecuencias con las que ocurren los ítems en las categorías (cuántos elementos encajan en cada categoría).

    Ejemplo 1

    Una compañía de seguros determina las primas de seguro de vehículos en función de factores de riesgo conocidos. Si a una persona se le considera un riesgo mayor, sus primas serán mayores. Un factor potencial es el color de tu auto. La compañía de seguros cree que las personas con algunos autos de color tienen más probabilidades de meterse en accidentes. Para investigar esto, examinan los informes policiales para detectar colisiones recientes de pérdida total. Los datos se resumen en la tabla de frecuencias a continuación.

    \ (\ begin {array} {|l|l|}
    \ hline\ textbf {Color} &\ textbf {Frecuencia}\\
    \ hline\ text {Azul} & 25\
    \ hline\ texto {Verde} & 52\\ hline
    \ texto {Rojo} & 41\\ hline
    \ texto {Blanco} & 36\\\ hline
    \ hline\ text {Negro} & 39\\
    \ hline\ texto {Gris} & 23\\
    \ hline
    \ end {array}\)

    A veces necesitamos una forma aún más intuitiva de mostrar datos. Aquí es donde entran los cuadros y gráficos. Hay muchas, muchas formas de mostrar los datos gráficamente, pero nos concentraremos en un tipo de gráfico muy útil llamado gráfico de barras. En esta sección trabajaremos con gráficos de barras que muestren datos categóricos; la siguiente sección estará dedicada a gráficos de barras que muestren datos cuantitativos.

    Gráfico de barras

    Un gráfico de barras es un gráfico que muestra una barra para cada categoría con la longitud de cada barra indicando la frecuencia de esa categoría.

    Para construir un gráfico de barras, necesitamos dibujar un eje vertical y un eje horizontal. La dirección vertical tendrá una escala y medirá la frecuencia de cada categoría; el eje horizontal no tiene escala en esta instancia. La construcción de un gráfico de barras se describe más fácilmente mediante el uso de un ejemplo.

    Ejemplo 2

    Usando los datos de nuestro automóvil desde arriba, tenga en cuenta que la frecuencia más alta es 52, por lo que nuestro eje vertical necesita ir de 0 a 52, pero bien podríamos usar 0 a 55, para que podamos poner una marca hash cada 5 unidades:

    Este es un gráfico de barras. A lo largo del eje x enumera: azul, verde, rojo, blanco, negro y gris. El eje x está etiquetado como “Color del vehículo involucrado en una colisión de pérdida total”. El eje y está etiquetado como “frecuencia” y va de 0 a 55 con una escala de 5. Encima de cada color hay una barra correspondiente a la frecuencia. Azul 25; Verde 52; Rojo 41; Blanco 36; Negro 39; Gris 23.

    Observe que la altura de cada barra está determinada por la frecuencia del color correspondiente. Las cuadrículas horizontales son un toque agradable, pero no necesario. En la práctica, te resultará útil dibujar gráficos de barras usando papel cuadriculado, por lo que las líneas de cuadrícula ya estarán en su lugar, o usando tecnología. En lugar de líneas de cuadrícula, también podríamos enumerar las frecuencias en la parte superior de cada barra, así:

    Este es un gráfico de barras. A lo largo del eje x enumera: azul, verde, rojo, blanco, negro y gris. El eje x está etiquetado como “Color del vehículo involucrado en una colisión de pérdida total”. El eje y está etiquetado como “frecuencia” y va de 0 a 55 con una escala de 5. Encima de cada color hay una barra correspondiente a la frecuencia, con la frecuencia listada encima de la barra. Azul 25; Verde 52; Rojo 41; Blanco 36; Negro 39; Gris 23.

    En este caso, nuestro gráfico podría beneficiarse de ser reordenado de los valores de frecuencia más grandes a los más pequeños. Esta disposición puede facilitar la comparación de valores similares en el gráfico, incluso sin líneas de cuadrícula. Cuando organizamos las categorías en orden decreciente de frecuencia así, se llama gráfico de Pareto.

    Gráfico de Pareto

    Un gráfico de Pareto es un gráfico de barras ordenado de mayor a menor frecuencia

    Ejemplo 3

    Transformando nuestro gráfico de barras de antes en un gráfico de Pareto, obtenemos:

    Este es un gráfico de barras. A lo largo del eje x enumera: verde, rojo, negro, blanco, azul, gris. El eje x está etiquetado como “Color del vehículo involucrado en una colisión de pérdida total”. El eje y está etiquetado como “frecuencia” y va de 0 a 55 con una escala de 5. Encima de cada color hay una barra correspondiente a la frecuencia, con la frecuencia listada encima de la barra. Verde 52, Rojo 41, Negro 39, Blanco 36, Azul 25, Gris 23.

    Ejemplo 4

    En una encuesta [1], se les preguntó a los adultos si personalmente les preocupaba una variedad de preocupaciones ambientales. A continuación se resumen los números (de 1012 encuestados) que indicaron que les preocupaban “mucho” por algunas inquietudes seleccionadas.

    \ (\ begin {array} {|l|l|}
    \ hline\ textbf {Problema Ambiental} &\ textbf {Frecuencia}\
    \\ hline\ text {Contaminación del agua potable} & 597\
    \ hline\ text {Contaminación del suelo y agua por desechos tóxicos} & 526\
    \ hline\ text {Aire contaminación} & 455\\
    \ hline\ text {Calentamiento global} & 354\\
    \ hline
    \ end {array}\)

    Solución

    Estos datos podrían mostrarse gráficamente en un gráfico de barras:

    Este es un gráfico de barras. A lo largo del eje x enumera: Contaminación del agua, residuos tóxicos, contaminación del aire, calentamiento global.. El eje x está etiquetado como “Preocupaciones ambientales”. El eje y está etiquetado como “frecuencia” y va de 0 a 600. Por encima de cada preocupación hay una barra correspondiente a la frecuencia: Contaminación del agua 597, Residuos tóxicos 526, contaminación del aire 455, calentamiento global 354.

    Para mostrar tamaños relativos, es común usar un gráfico circular.

    Gráfico circular

    Un gráfico circular es un círculo con cuñas cortadas de diferentes tamaños marcadas como rebanadas de pastel o pizza. Los tamaños relativos de las cuñas corresponden a las frecuencias relativas de las categorías.

    Ejemplo 5

    Para nuestros datos de color de vehículos, un gráfico circular podría verse así:

    Un gráfico circular para el color del vehículo involucrado en colisiones de pérdida total. Hay rebanadas de pastel para Verde, Rojo, Negro, Blanco, Azul y Gris. Las lonchas tienen diferentes tamaños pero no están etiquetadas.

    Los gráficos circulares a menudo pueden beneficiarse al incluir frecuencias o frecuencias relativas (porcentajes) en el gráfico junto a los sectores circulares. A menudo tener los nombres de las categorías junto a los sectores circulares también hace que el gráfico sea más claro.

    Un gráfico circular para el color del vehículo involucrado en colisiones de pérdida total. Hay rebanadas de pastel para Verde, Rojo, Negro, Blanco, Azul y Gris. Cada rebanada está etiquetada con el color y la frecuencia relativa (por ciento): Verde 52%, Rojo 41%, Negro 39%, Blanco 36%, Azul 25%, Gris 23%.

    Ejemplo 6

    Un gráfico circular etiquetado como preferencias de elector. Hay tres rebanadas: una rebanada grande etiquetada con Ellison 46%, una rebanada grande etiquetada como Douglas 43% y una rebanada pequeña etiquetada con Reeves 11%El gráfico circular de la derecha muestra el porcentaje de votantes que apoyan a cada candidato que se postula para un escaño en el senado local.

    Si hay 20 mil votantes en el distrito, el gráfico circular muestra que alrededor del 11% de esos, alrededor de 2 mil 200 votantes, apoyan a Reeves.

    Los gráficos circulares se ven bien, pero son más difíciles de dibujar a mano que los gráficos de barras ya que para dibujarlos con precisión necesitaríamos calcular el ángulo que cada cuña corta del círculo, luego medir el ángulo con un prolongador. Las computadoras son mucho más adecuadas para dibujar gráficos circulares. Programas de software comunes como Microsoft Word o Excel, OpenOffice.org Write o Calc, o Google Docs son capaces de crear gráficos de barras, gráficos circulares y otros tipos de gráficos. También existen numerosas herramientas en línea que pueden crear gráficas [2].

    Pruébalo ahora 1

    Cree un gráfico de barras y un gráfico circular para ilustrar las calificaciones en un examen de historia a continuación.

    A: 12 alumnos, B: 19 alumnos, C: 14 alumnos, D: 4 alumnos, F: 5 alumnos

    Contestar

    Un gráfico de barras, titulado Grados del examen de historia. El eje horizontal se etiqueta Grado, y el vertical con la etiqueta Frecuencia. Hay cinco barras etiquetadas A, B, C, D, F, con alturas: A 12, B 19, C 14, D 4, F 5.Un gráfico circular, titulado Grados del examen de historia. Las lonchas son: A 22%, B 36%, C 26%, D 7%, F 9%.

    dd8.svg¡No te pongas elegante con las gráficas! La gente a veces agrega características a los gráficos que no ayudan a transmitir su información. Por ejemplo, los gráficos de barras tridimensionales como el que se muestra a continuación no suelen ser tan efectivos como sus contrapartes bidimensionales.

    Aquí hay otra forma en que la fantasía puede llevar a problemas. En lugar de barras lisas, es tentador sustituir imágenes significativas. Este tipo de gráfica se llama pictograma.

    Pictograma

    Un pictograma es un gráfico estadístico en el que se pretende que el tamaño de la imagen represente las frecuencias o el tamaño de los valores que se están representando.

    Ejemplo 7

    Se muestran dos bolsas de dinero. Uno es mayor etiquetado Mananger Salarios. El otro es la mitad de alto y medio ancho y los salarios de los trabajadores etiquetados. No se muestran números ni escala.Un sindicato podría producir la gráfica a la derecha para mostrar la diferencia entre el salario promedio de gerente y el salario promedio del trabajador.

    Al mirar la imagen, sería razonable adivinar que los salarios del gerente son 4 veces más grandes que los salarios de los trabajadores — el área de la bolsa se ve aproximadamente 4 veces más grande. No obstante, los salarios de los gerentes son de hecho sólo el doble que los salarios de los trabajadores, lo que se reflejó en la imagen al hacer que la bolsa de gerente sea el doble de alta.

    Otra distorsión en los gráficos de barras resulta de establecer la línea base en un valor distinto de cero. La línea base es la parte inferior del eje vertical, representando el menor número de casos que podrían haber ocurrido en una categoría. Normalmente, este número debería ser cero.

    Ejemplo 8

    Compare las dos gráficas a continuación que muestran el apoyo a los derechos de matrimonio entre personas del mismo sexo de una encuesta realizada en diciembre de 2008 [3]. La diferencia en la escala vertical en la primera gráfica sugiere una historia diferente a las verdaderas diferencias en porcentajes; la segunda gráfica hace que parezca que el doble de personas se oponen a los derechos matrimoniales que lo apoyan.

    Un gráfico de barras con una escala vertical de 0-100%; Hay una barra para soporte en aproximadamente 44% y una barra para oponerse en aproximadamente 56%.Un gráfico de barras de los mismos datos pero la escala vertical va de 40-60%; Esto magnifica la diferencia entre los grupos de apoyo y oposición.

    Pruébalo ahora 2

    Un gráfico circular, con 4 rebanadas etiquetadas: Nguyen 42%, McKee 35%, Jones 64%, Brown 52%.Se realizó una encuesta preguntando a la gente si estaban de acuerdo con las posiciones de los 4 candidatos a una oficina del condado. ¿El gráfico circular presenta una buena representación de estos datos? Explique.

    Contestar

    Si bien el gráfico circular representa con precisión el tamaño relativo de las personas que están de acuerdo con cada candidato, el gráfico es confuso, ya que generalmente los porcentajes en un gráfico circular representan el porcentaje del pastel que representa la porción.


    [1] Encuesta Gallup. Del 5 al 8 de marzo de 2009. http://www.pollingreport.com/enviro.htm

    [2] Por ejemplo: http://nces.ed.gov/nceskids/createAgraph/ o http://docs.google.com

    [3] Encuesta CNN/Corporación de Investigación de Opinión. 19-21 de diciembre de 2008, de http://www.pollingreport.com/civil.htm


    This page titled 11.2: Presentación Gráfica de Datos Categóricos is shared under a CC BY-SA 3.0 license and was authored, remixed, and/or curated by David Lippman & Jeff Eldridge (The OpenTextBookStore) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.