Saltar al contenido principal
LibreTexts Español

2.1: Datos cualitativos

  • Page ID
    149753
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Recuerde, los datos cualitativos son palabras que describen una característica del individuo. Existen varias gráficas diferentes que se utilizan para los datos cualitativos. Estos gráficos incluyen gráficos de barras, gráficos de Pareto y gráficos circulares.

    Los gráficos circulares y gráficos de barras son las formas más comunes de mostrar datos cualitativos. Un programa de hoja de cálculo como Excel puede hacer ambos. El primer paso para cualquiera de las gráficas es hacer una tabla de frecuencias o frecuencias relativas. Una tabla de frecuencias es un resumen de los datos con recuentos de la frecuencia con la que se produce un valor (o categoría) de datos.

    Ejemplo\(\PageIndex{1}\)

    Supongamos que tienes los siguientes datos para qué tipo de auto los estudiantes en una universidad conducen?

    Ford, Chevy, Honda, Toyota, Toyota, Nissan, Kia, Nissan, Chevy, Toyota, Honda, Chevy, Toyota, Nissan, Ford, Toyota, Nissan, Mercedes, Chevy, Ford, Nissan, Toyota, Ford, Chevy, Toyota, Nissan, Honda, Porsche, Hyundai, Chevy, Chevy, Honda, Toyota, Chevy, Ford, Ford, Nissan, Toyota, Chevy, Honda, Chevy, Saturn, Toyota, Chevy, Chevy, Nissan, Honda, Toyota, Toyota, Nissan

    Solución

    Un listado de datos es demasiado difícil de mirar y analizar, por lo que hay que resumirlo. Primero hay que decidir las categorías. En este caso es relativamente fácil; solo usa el tipo de auto. No obstante, hay varios autos que solo tienen un auto en la lista. En ese caso es más fácil hacer una categoría llamada otra para las que tienen valores bajos. Ahora solo cuenta cuántos de cada tipo de autos hay. Por ejemplo, hay 5 Vados, 12 Chevys y 6 Hondas. Esto se puede poner en una distribución de frecuencia:

    Cateogría Frecuencia
    Ford 5
    Chevy 12
    Honda 6
    Toyota 12
    Nissan 10
    Otros 5
    Total 50
    Tabla\(\PageIndex{1}\): Tabla de frecuencias para datos de tipo de automóvil

    El total de la columna de frecuencia debe ser el número de observaciones en los datos.

    Dado que los números brutos no son tan útiles para decirle a otras personas es mejor crear una tercera columna que dé la frecuencia relativa de cada categoría. Esta es solo la frecuencia dividida por el total. Como ejemplo para la categoría Ford:

    frecuencia relativa\(= \dfrac{5}{50} = 0.10\)

    Esto se puede escribir como decimal, fracción o porcentaje. Ahora tiene una distribución de frecuencia relativa:

    Categoría Frecuencia Frecuencia relativa
    Ford 5 0.10
    Chevy 12 0.24
    Honda 6 0.12
    Toyota 12 0.24
    Nissan 10 0.20
    Otros 5 0.10
    Total 50 1.00
    Tabla\(\PageIndex{2}\): Tabla de frecuencias relativas para el tipo de datos de automóvil

    La columna de frecuencia relativa debe sumar 1.00. Podría estar un poco apagado debido a errores de redondeo.

    Ahora que tienes la tabla de frecuencias y frecuencias relativas, sería bueno mostrar estos datos usando una gráfica. Hay varios tipos diferentes de gráficos que se pueden usar: gráfico de barras, gráfico circular y gráficos de Pareto.

    Los gráficos de barras o tablas constan de las frecuencias en un eje y las categorías en el otro eje. Después dibujas rectángulos para cada categoría con una altura (si la frecuencia está en el eje vertical) o longitud (si la frecuencia está en el eje horizontal) que es igual a la frecuencia. Todos los rectángulos deben tener el mismo ancho, y debe haber espacios de igual ancho entre cada barra.

    Ejemplo\(\PageIndex{2}\) drawing a bar graph

    Dibuja un gráfico de barras de los datos en Ejemplo\(\PageIndex{1}\).

    Solución

    Categoría Frecuencia Frecuencia relativa
    Ford 5 0.10
    Chevy 12 0.24
    Honda 6 0.12
    Toyota 12 0.24
    Nissan 10 0.20
    Otros 5 0.10
    Total 50 1.00
    Tabla\(\PageIndex{2}\): Tabla de frecuencias relativas para el tipo de datos de automóvil

    Poner la frecuencia en el eje vertical y la categoría en el eje horizontal.

    Entonces simplemente dibuja un cuadro por encima de cada categoría cuya altura sea la frecuencia.

    Todas las gráficas se dibujan usando\(R\). El comando\(R\) para crear un gráfico de barras es:

    variable<-c (escriba porcentajes o frecuencias para cada clase con comas entre valores)

    barplot (variable, nombres.arg=c (“escriba en nombre de 1a categoría”, “escriba en nombre de 2da categoría”,..., "escriba en nombre de la última categoría”),

    ylim=c (0, number over max), xlab="type in label for x-axis”, ylab="type in label for y-axis”, ylim=c (0, number above maximum and value), main="type in title”, col="type in a color”) — crea un gráfico de barras de los datos en un color si lo desea.

    Para este ejemplo el comando sería:

    coche<-c (5, 12, 6, 12, 10, 5)

    barplot (auto, nombre.arg=c (“Ford”, “Chevy”, “Honda”, “Toyota”, “Nissan”, “Otro”), xlab="Tipo de Auto”, ylab="Frecuencia”, ylim=c (0,12), main="Tipo de Auto Conducido por Estudiantes Universitarios”, col="azul”)

    Captura (155) .png
    Figura para el tipo de datos del automóvil

    Observe por la gráfica, se puede ver que Toyota y Chevy son los autos más populares, con Nissan no muy lejos. Ford parece ser el tipo de auto que se nota que fue el que menos le gustó, aunque a los autos de la otra categoría les gustarían menos que a un Ford.

    Algunas características clave de un gráfico de barras:

    • Espaciado igual en cada eje.
    • Las barras tienen el mismo ancho.
    • Debe haber etiquetas en cada eje y un título para la gráfica.
    • Debe haber una escala en el eje de frecuencia y las categorías deben estar listadas en el eje de categorías.
    • Las barras no se tocan.

    También puede dibujar un gráfico de barras usando frecuencia relativa en el eje vertical. Esto es útil cuando se desea comparar dos muestras con diferentes tamaños de muestra. El gráfico de frecuencia relativa y el gráfico de frecuencia deben tener el mismo aspecto, excepto por el escalado en el eje de frecuencia.

    Usando R, el comando sería:

    coche<-c (0.1, 0.24, 0.12, 0.24, 0.2, 0.1)

    barplot (auto, nombre.arg=c (“Ford”, “Chevy”, “Honda”, “Toyota”, “Nissan”, “Otro”), xlab="Tipo de Auto”, yLab="Frecuencia Relativa”, main="Tipo de Auto Conducido por Estudiantes Universitarios”, col="azul”, ylim=c (0, .25))

    Captura de pantalla (156) .png
    Figura para el tipo de datos del automóvil

    Otro tipo de gráfico para datos cualitativos es un gráfico circular. Un gráfico circular es donde tienes un círculo y divides partes del círculo en formas circulares que son proporcionales al tamaño de la frecuencia relativa. Hay 360 grados en círculo completo. La frecuencia relativa es solo el porcentaje como decimal. Todo lo que tienes que hacer para encontrar el ángulo multiplicando la frecuencia relativa por 360 grados. Recuerda que 180 grados es medio círculo y 90 grados es un cuarto de círculo

    Ejemplo\(\PageIndex{3}\) drawing a pie chart

    Dibuja un gráfico circular de los datos en Ejemplo\(\PageIndex{1}\).

    Primero necesitas las frecuencias relativas.

    Categoría Frecuencia Frecuencia relativa
    Ford 5 0.10
    Chevy 12 0.24
    Honda 6 0.12
    Toyota 12 0.24
    Nissan 10 0.20
    Otros 5 0.10
    Total 50 1.00
    Tabla\(\PageIndex{2}\): Tabla de frecuencias relativas para el tipo de datos de automóvil

    Solución

    Después multiplicas cada frecuencia relativa por 360° para obtener la medida del ángulo para cada categoría.

    Categoría Frecuencia relativa Ángulo (en grados (°))
    Ford 0.10 36.0
    Chevy 0.24 86.4
    Honda 0.12 43.2
    Toyota 0.24 86.4
    Nissan 0.20 72.0
    Otros 0.10 36.0
    Total 1.00 360.0
    Tabla\(\PageIndex{3}\): Ángulos de gráfico circular para datos de tipo de automóvil

    Ahora dibuja el gráfico circular usando una brújula, un transportador y un borde recto. Se prefiere la tecnología. Si usa tecnología, no hay necesidad de las frecuencias relativas o los ángulos.

    Puede usar R para graficar el gráfico circular. En R, los comandos serían:

    pie (variable, labels=c (“type in name of 1st category”, “type in name of 2nd category”,..., "type in name of last category”), main="type in title”, col=rainbow (number of categories)) — crea un gráfico circular con un título y arco iris de colores para cada categoría.

    Para este ejemplo, los comandos serían:

    coche<-c (5, 12, 6, 12, 10, 5)

    pie (auto, etiquetas=c (“Ford, 10% “, “Chevy, 24% “, “Honda, 12% “, “Toyota, 24% “, “Nissan, 20% “, “Otro, 10% “), main="Tipo de Auto Conducido por Estudiantes Universitarios”, col=rainbow (6))

    Captura de pantalla (157) .png
    Figura\(\PageIndex{3}\): Gráfico circular para el tipo de datos de automóvil

    Como puedes ver en la gráfica, Toyota y Chevy son más populares, mientras que los autos de la otra categoría son los que menos les gustan. De los autos que puedes determinar a partir de la gráfica, a Ford le gustan menos que a los demás.

    Los gráficos circulares son útiles para comparar tamaños de categorías. Los gráficos de barras muestran información similar. Realmente no importa cuál uses. Realmente es una preferencia personal y también qué información estás tratando de abordar. Sin embargo, los gráficos circulares son mejores cuando solo se tienen unas pocas categorías y los datos se pueden expresar como un porcentaje. Los datos no tienen que ser porcentajes para dibujar el gráfico circular, pero si un valor de datos puede caber en varias categorías, no se puede usar un gráfico circular. Como ejemplo, si estás preguntando a la gente cuál es su parque nacional favorito, y dices que escojas las tres mejores opciones, entonces el número total de respuestas puede sumar más del 100% de las personas involucradas. Por lo tanto, no se puede usar un gráfico circular para mostrar el parque nacional favorito.

    Un tercer tipo de gráfico de datos cualitativos es un gráfico de Pareto, que es solo un gráfico de barras con las barras ordenadas con las frecuencias más altas a la izquierda. Aquí está la tabla de Pareto para los datos en Ejemplo\(\PageIndex{1}\).

    Captura de pantalla (158) .png
    Figura\(\PageIndex{4}\): Gráfico de Pareto para datos de tipo de automóvil

    La ventaja de los gráficos de Pareto es que se puede ver visualmente la respuesta más popular a la menos popular. Esto es especialmente útil en aplicaciones de negocios, donde quieres saber qué servicios les gustan más a tus clientes, qué procesos resultan en más lesiones, qué temas encuentran más importantes a los empleados, y otro tipo de preguntas como estas.

    Existen muchos otros tipos de gráficas que se pueden utilizar en datos cualitativos. Hay paquetes de software de hoja de cálculo que crearán la mayoría de ellos, y es mejor mirarlos para ver qué se puede hacer. Depende de tus datos en cuanto a cuáles pueden ser útiles. El siguiente ejemplo ilustra uno de estos tipos conocido como gráfico de barras múltiples.

    Ejemplo\(\PageIndex{4}\) multiple bar graph

    En el juego Wii Fit, puedes hacer cuatro tipos diferentes de ejercicios: yoga, fuerza, aeróbicos y equilibrio. El sistema Wii realiza un seguimiento de cuántos minutos pasas en cada uno de los ejercicios diarios. La siguiente gráfica son los datos de Dylan durante un periodo de tiempo de una semana. Discuta cualquier indicación que pueda inferir de la gráfica.

    Captura de pantalla (159) .png
    Figura\(\PageIndex{5}\): Gráfico de barras múltiples para datos de ajuste de Wii

    Solución

    Parece que Dylan pasa más tiempo en ejercicios de equilibrio que en cualquier otro ejercicio en un día determinado. Parece dedicar menos tiempo a ejercicios de fuerza en un día determinado. Hay varios días en los que la cantidad de ejercicio en las diferentes categorías es casi igual.

    La utilidad de un gráfico de barras múltiples es la capacidad de comparar varias categorías diferentes sobre otra variable, en Ejemplo\(\PageIndex{4}\) la variable sería tiempo. Esto permite que una persona interprete los datos con un poco más de facilidad.

    Tarea

    Ejercicio\(\PageIndex{1}\)

    1. Eyeglassomatic fabrica anteojos para diferentes minoristas. El número de lentes para diferentes actividades está en Ejemplo\(\PageIndex{4}\).
      Actividad Moler Multicoat Ensamblar Hacer marcos Recibir terminado Desconocido
      Número de lentes 18872 12105 4333 25880 26991 1508

      Tabla\(\PageIndex{4}\): Datos para Gyeglassomatic
      Grind significa que rectifican las lentes y las ponen en monturas, multicapa significa que ponen recubrimientos de tintado o resistencia al rayado en las lentes y luego las ponen en monturas, ensamblan significa que reciben monturas y lentes de otros fuentes y juntarlas, hacer monturas significa que hacen las monturas y ponen lentes de otras fuentes, reciben medios terminados que recibieron gafas de otra fuente, y desconocido significa que no saben de dónde vinieron las lentes. Hacer un gráfico de barras y un gráfico circular de estos datos. Indique cualquier hallazgo que pueda ver en las gráficas.

    2. Para analizar cómo los trabajadores de Arizona de 16 años o más viajan para trabajar, se recolectó el porcentaje de trabajadores que usan carpool, vehículo privado (solo) y transporte público. Crear un gráfico de barras y un gráfico circular de los datos en Ejemplo\(\PageIndex{5}\). Indique cualquier hallazgo que pueda ver en las gráficas.
      Tipo de transporte Porcentaje
      Carpool 11.6%
      Vehículo Privado (Solo) 75.8%
      Transporte Público 2.0%
      Otros 10.6%
      Tabla\(\PageIndex{5}\): Datos del modo de viaje para trabajadores de Arizona
    3. El número de muertes en EU por envenenamiento por monóxido de carbono (CO) por generadores de los años 1999 a 2011 se encuentra en la tabla #2 .1.6 (Hinatov, 2012). Crear un gráfico de barras y un gráfico circular de estos datos. Indique cualquier hallazgo que vea en las gráficas.
      Región Número de muertes por CO durante el uso de un generador
      Núcleo Urbano 401
      Suburbano 97
      Rural Grande 86
      Pequeño Rural/Aislado 111
      Tabla\(\PageIndex{6}\): Datos de Número de Muertes por Envenenamiento por CO
    4. En Connecticut los hogares utilizan gas, fueloil o electricidad como fuente de calefacción. Ejemplo\(\PageIndex{7}\) muestra el porcentaje de hogares que utilizan uno de estos como sus principales fuentes de calefacción (“Uso de electricidad”, 2013), (“Uso de fuelóleo”, 2013), (“Uso de gas”, 2013). Crear un gráfico de barras y un gráfico circular de estos datos. Indique cualquier hallazgo que vea en las gráficas.
      Fuente de Calefacción Porcentaje
      Electricidad 15.3%
      Fuel Oil 46.3%
      Gas 35.6%
      Otros 2.85
      Tabla\(\PageIndex{7}\): Datos de Fuentes de Calefacción Doméstica
    5. Eyeglassomatic fabrica anteojos para diferentes minoristas. Prueban para ver cuántas lentes defectuosas fabricaron durante el periodo de tiempo del 1 de enero al 31 de marzo. Ejemplo\(\PageIndex{8}\) da el defecto y el número de defectos. Crea un gráfico de Pareto de los datos y luego describe lo que esto te dice sobre qué causa la mayor cantidad de defectos.
      Tipo de defecto Número de defectos
      Rasguño 5865
      Forma derecha - pequeña 4613
      Descamado 1992
      Eje incorrecto 1838
      Chaflán incorrecto 1596
      agrietamiento, grietas 1546
      Forma incorrecta 1485
      PD incorrecto 1398
      Manchas y burbujas 1371
      Altura incorrecta 1130
      Forma derecha - grande 1105
      Perdido en laboratorio 976
      Manchas/Burbuja - pasante 976
      Tabla\(\PageIndex{8}\): Datos de Tipo de Defecto
    6. A las personas en Bangladesh se les pidió que indicaran qué tipo de método anticonceptivo utilizan. Los porcentajes se dan en Ejemplo\(\PageIndex{9}\) (“Uso anticonceptivo”, 2013). Crea un gráfico de Pareto de los datos y luego indica cualquier hallazgo que puedas a partir de la gráfica.
      Método Porcentaje
      Condón 4.50%
      Píldora 28.50%
      Abstinencia Periódica 4.90%
      Inyección 7.00%
      Esterilización Femenina 5.00%
      IUD 0.90%
      Esterilización Masculina 0.70%
      Retirada 2.90%
      Otros métodos modernos 0.70%
      Otros métodos tradicionales 0.60%
      Tabla\(\PageIndex{9}\): Datos de Tipo de Control de la Natalidad
    7. Los porcentajes de personas que usan ciertos anticonceptivos en los países centroamericanos se muestran en la Gráfica 2.1.6 (“Uso de anticonceptivos”, 2013). Indique cualquier hallazgo que pueda de la gráfica.
    Captura de pantalla (160) .png
    Figura\(\PageIndex{6}\): Gráfico de barras múltiples para los tipos de anticonceptivos
    Responder

    Ver soluciones


    This page titled 2.1: Datos cualitativos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.