Saltar al contenido principal
LibreTexts Español

9.1: Presentación gráfica de datos categóricos

  • Page ID
    112898
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Los datos categóricos o cualitativos son piezas de información que nos permiten clasificar los objetos investigados en diversas categorías. Por lo general, comenzamos a trabajar con datos categóricos resumiendo los datos en una tabla de frecuencias.

    Definición: Tabla de frecuencias

    Una tabla de frecuencias es una tabla con dos columnas. Una columna enumera las categorías, y otra para las frecuencias con las que ocurren los ítems en las categorías (cuántos elementos encajan en cada categoría).

    Ejemplo\(\PageIndex{1}\)

    Una compañía de seguros determina las primas de seguro de vehículos en función de factores de riesgo conocidos. Si a una persona se le considera un riesgo mayor, sus primas serán mayores. Un factor potencial es el color de tu auto. La compañía de seguros cree que las personas con algunos autos de color tienen más probabilidades de meterse en accidentes. Para investigar esto, examinan informes policiales para detectar colisiones recientes de pérdida total. Los datos se resumen en la tabla de frecuencias a continuación.

    Color Frecuencia
    Azul 25
    Verde 52
    Rojo 41
    Blanco 36
    Negro 39
    Gris 23

    A veces necesitamos una forma aún más intuitiva de mostrar datos. Aquí es donde entran los cuadros y gráficos. Hay muchas, muchas formas de mostrar los datos gráficamente, pero nos concentraremos en un tipo de gráfico muy útil llamado gráfico de barras. En esta sección, trabajaremos con gráficos de barras que muestren datos categóricos; la siguiente sección estará dedicada a gráficas que muestren datos cuantitativos.

    Definición: Gráfico de barras

    Un gráfico de barras es un gráfico que muestra una barra para cada categoría con la longitud de cada barra indicando la frecuencia de esa categoría.

    Tenga en cuenta que un gráfico de barras solo se usa para mostrar datos categóricos.

    Para construir un gráfico de barras, necesitamos dibujar un eje vertical y un eje horizontal. La dirección vertical tendrá una escala y medirá la frecuencia de cada categoría; el eje horizontal no tiene escala en esta instancia, sino sólo los nombres de cada categoría. La construcción de un gráfico de barras se describe más fácilmente mediante el uso de un ejemplo.

    Ejemplo\(\PageIndex{2}\)

    Usando los datos de nuestro automóvil desde arriba, tenga en cuenta que la frecuencia más alta es 52, por lo que nuestro eje vertical necesita ir de 0 a 52, pero bien podríamos usar 0 a 55, para que podamos poner una marca hash cada 5 unidades:

    clipboard_e8363f47ef75b4945c49befcc9a2e2599.png

    Observe que la altura de cada barra está determinada por la frecuencia del color correspondiente. Las cuadrículas horizontales son un toque agradable, pero no necesario. En la práctica, te resultará útil dibujar gráficos de barras usando papel cuadrilátero, por lo que las líneas de cuadrícula ya estarán en su lugar, o usando tecnología. En lugar de líneas de cuadrícula, también podríamos enumerar las frecuencias en la parte superior de cada barra, así:

    clipboard_edec2a4146942bab81875b9d6692b8095.png

    En este caso, nuestro gráfico podría beneficiarse de ser reordenado de los valores de frecuencia más grandes a los más pequeños. Esta disposición puede facilitar la comparación de valores similares en el gráfico, incluso sin líneas de cuadrícula. Cuando organizamos las categorías en orden decreciente de frecuencia así, se llama gráfico de Pareto.

    Definición: Pareto Chart

    Un gráfico de Pareto es un gráfico de barras ordenado de mayor a menor frecuencia.

    Ejemplo\(\PageIndex{3}\)

    Transformando nuestro gráfico de barras de antes en un gráfico de Pareto, obtenemos:

    clipboard_efa8ecec0383a501bb684c0806214d2ec.png

    Ejemplo\(\PageIndex{4}\)

    En una encuesta [1], se les preguntó a los adultos si personalmente les preocupaba una variedad de preocupaciones ambientales. A continuación se resumen los números (de 1012 encuestados) que indicaron que les preocupaban “mucho” por algunas inquietudes seleccionadas.

    Emisión Ambiental Frecuencia
    Contaminación del agua potable 597
    Contaminación del suelo y del agua por residuos tóxicos 526
    Contaminación del aire 455
    Calentamiento global 354

    Estos datos podrían mostrarse gráficamente en un gráfico de barras:

    clipboard_eda1586dcc4db659b092a9b99c818f9fa.png

    Para mostrar tamaños relativos, es común usar un gráfico circular.

    Definición: Gráfico circular

    Un gráfico circular es un círculo con cuñas cortadas de diferentes tamaños marcadas como rebanadas de pastel o pizza. Los tamaños relativos de las cuñas corresponden a las frecuencias relativas de las categorías.

    Ejemplo\(\PageIndex{5}\)

    Para nuestros datos de color de vehículos, un gráfico circular podría verse así:

    clipboard_e9ce29b7910482f7a224b3f5f2e2ce61b.png

    Los gráficos circulares a menudo pueden beneficiarse al incluir frecuencias o frecuencias relativas (porcentajes) en el gráfico junto a los cortes circulares. A menudo, tener los nombres de las categorías junto a los cortes circulares también hace que el gráfico sea más claro.

    clipboard_ecca26ef83b2f50c6370dca13a4a64cda.png

    Ejemplo\(\PageIndex{6}\)

    El gráfico circular de la derecha muestra el porcentaje de votantes que apoyan a cada candidato que se postula para un escaño en el senado local.

    clipboard_e18ba23203b45f1b075bac099defadf44.png

    Si hay 20 mil votantes en el distrito, el gráfico circular muestra que alrededor del 11% de esos, alrededor de 2,200 votantes, apoyan a Reeves.

    Los gráficos circulares se ven bien pero son más difíciles de dibujar a mano que los gráficos de barras ya que para dibujarlos con precisión necesitaríamos calcular el ángulo que cada cuña corta del círculo, luego medir el ángulo con un prolongador. Las computadoras son mucho más adecuadas para dibujar gráficos circulares. Programas de software comunes como Microsoft Word o Excel, OpenOffice.org Write o Calc, o Google Docs son capaces de crear gráficos de barras, gráficos circulares y otros tipos de gráficos. También existen numerosas herramientas en línea que pueden crear gráficas [2].

    Pruébalo ahora 1

    Cree un gráfico de barras y un gráfico circular para ilustrar las calificaciones en un examen de historia a continuación.

    A: 12 alumnos,

    B: 19 alumnos,

    C: 14 alumnos,

    D: 4 alumnos,

    F: 5 alumnos

    ¡No te pongas elegante con las gráficas! La gente a veces agrega características a los gráficos que no ayudan a transmitir su información. Por ejemplo, los gráficos de barras tridimensionales como el que se muestra a continuación no suelen ser tan efectivos como sus contrapartes bidimensionales.

    clipboard_e701cf0f1b4d2bbdb863408deba6b3201.png

    Aquí hay otra forma en que la imaginería puede llevar a problemas. En lugar de barras lisas, es tentador sustituir imágenes significativas. Este tipo de gráfica se llama pictograma.

    Definición: Pictograma

    Un pictograma es un gráfico estadístico en el que se pretende que el tamaño de la imagen represente las frecuencias o el tamaño de los valores que se están representando.

    Ejemplo\(\PageIndex{7}\)

    Un sindicato podría producir la gráfica a la derecha para mostrar la diferencia entre el salario promedio de gerente y el salario promedio del trabajador.

    clipboard_e6e82facd345f255ded198ee2b365b4b9.png

    Al mirar la imagen, sería razonable adivinar que los salarios del gerente son 4 veces más grandes que los salarios de los trabajadores — el área de la bolsa se ve aproximadamente 4 veces más grande. No obstante, los salarios de los gerentes son de hecho sólo el doble que los salarios de los trabajadores, lo que se reflejó en la imagen al hacer que la bolsa de gerente sea el doble de alta.

    Otra distorsión en los gráficos de barras resulta de establecer la línea base en un valor distinto de cero. La línea base es la parte inferior del eje vertical, representando el menor número de casos que podrían haber ocurrido en una categoría. Normalmente, este número debería ser cero.

    Ejemplo\(\PageIndex{8}\)

    Compare las dos gráficas a continuación que muestran el apoyo a los derechos de matrimonio entre personas del mismo sexo de una encuesta realizada en diciembre de 2008 [3]. La diferencia en la escala vertical en la primera gráfica sugiere una historia diferente a las verdaderas diferencias en porcentajes; la segunda gráfica hace que parezca que el doble de personas se oponen a los derechos matrimoniales que lo apoyan.

    clipboard_ef937bcbc70eabc0f58cf2d86eefb77d0.png

    Pruébalo ahora 2

    Se realizó una encuesta preguntando a la gente si estaban de acuerdo con las posiciones de los 4 candidatos a una oficina del condado. ¿El gráfico circular presenta una buena representación de estos datos? Explique.

    clipboard_e34fa0aaad0b39e8b6fb5a1b03d33efc4.png


    This page titled 9.1: Presentación gráfica de datos categóricos is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Darlene Diaz (ASCCC Open Educational Resources Initiative) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.