Saltar al contenido principal
LibreTexts Español

2.2: Datos Cuantitativos

  • Page ID
    149764
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    La gráfica para datos cuantitativos se parece a una gráfica de barras, excepto que hay algunas diferencias importantes. Primero, en una gráfica de barras las categorías se pueden poner en cualquier orden en el eje horizontal. No hay un orden establecido para estos valores de datos. No se puede decir cómo se distribuyen los datos en función de la forma, ya que la forma puede cambiar simplemente poniendo las categorías en diferentes órdenes. Con datos cuantitativos, los datos están en órdenes específicos, ya que se está tratando con números. Con datos cuantitativos, se puede hablar de una distribución, ya que la forma solo cambia un poco dependiendo de cuántas categorías configures. A esto se le llama distribución de frecuencia.

    Esto lleva a la segunda diferencia con respecto a los gráficos de barras. En una gráfica de barras, las categorías que hiciste en la tabla de frecuencias fueron determinadas por ti. En los datos cuantitativos, las categorías son categorías numéricas, y los números están determinados por la cantidad de categorías (o lo que se llaman clases) que elija. Si dos personas tienen el mismo número de categorías, entonces tendrán la misma distribución de frecuencias. Mientras que en los datos cualitativos, puede haber muchas categorías diferentes dependiendo del punto de vista del autor.

    La tercera diferencia es que las categorías tocan con datos cuantitativos, y no habrá brechas en la gráfica. La razón por la que las gráficas de barras tienen brechas es para mostrar que las categorías no continúan, como lo hacen en los datos cuantitativos. Dado que la gráfica para datos cuantitativos es diferente de los datos cualitativos, se le da un nuevo nombre. El nombre de la gráfica es un histograma. Para crear un histograma, primero debe crear la distribución de frecuencias. La idea de una distribución de frecuencias es tomar el intervalo que abarcan los datos y dividirlo en subintervalos iguales llamados clases.

    Resumen de los pasos involucrados en la realización de una distribución de frecuencias

    1. Encontrar el rango = el valor más grande — el valor más pequeño
    2. Elige el número de clases a usar. Por lo general, el número de clases está entre cinco y veinte. Se utilizan cinco clases si hay un pequeño número de puntos de datos y veinte clases si hay un gran número de puntos de datos (más de 1000 puntos de datos). (Nota: las categorías ahora se llamarán clases a partir de ahora.)
    3. Ancho de clase = Redondea\(\dfrac{\text { range }}{\# \text { classes }}\) siempre al siguiente entero (aunque la respuesta ya sea un número entero, vaya al siguiente entero). Si no haces esto, tu última clase no contendrá tu mayor valor de datos, y tendrías que agregar otra clase solo para ello. Si redondea, entonces su mayor valor de datos caerá en la última clase, y no hay problemas.
    4. Crea las clases. Cada clase tiene límites que determinan qué valores caen en cada clase. Para encontrar los límites de clase, establezca el valor más pequeño como el límite de clase inferior para la primera clase. Luego agregue el ancho de clase al límite de clase inferior para obtener el siguiente límite de clase inferior. Repite hasta que consigas todas las clases. El límite de clase alta para una clase es uno menos que el límite inferior para la siguiente clase.
    5. Para que las clases realmente se toquen, entonces una clase necesita comenzar donde termina la anterior. Esto se conoce como el límite de clase. Para encontrar los límites de clase, reste 0.5 del límite de clase inferior y agregue 0.5 al límite de clase superior.
    6. A veces es útil encontrar el punto medio de la clase. El proceso es
      Midpoint\(=\dfrac{\text { lower limit +upper limit }}{2}\)
    7. Para averiguar el número de puntos de datos que caen en cada clase, pase por cada valor de datos y vea entre qué límites de clase se encuentra. El uso de marcas de conteo puede ser útil para contar los valores de los datos. La frecuencia para una clase es el número de valores de datos que caen en la clase.

    Nota

    La descripción anterior es para valores de datos que son números enteros. Si tu valor de datos tiene decimales, entonces el ancho de tu clase debe redondearse al valor más cercano con el mismo número de decimales que los datos originales. Además, los límites de tu clase deben tener un decimal más que los datos originales. Como ejemplo, si tus datos tienen un lugar decimal, entonces el ancho de clase tendría un lugar decimal, y los límites de clase se forman sumando y restando 0.05 de cada límite de clase.

    Ejemplo\(\PageIndex{1}\) creating a frequency table

    Ejemplo\(\PageIndex{1}\) contiene la cantidad de renta pagada cada mes para 24 alumnos de un curso de estadística. Hacer una distribución de frecuencia relativa usando 7 clases.

    1500 1350 350 1200 850 900
    1500 1150 1500 900 1400 1100
    1250 600 610 960 890 1325
    900 800 2550 495 1200 690
    Tabla\(\PageIndex{1}\): Datos de Renta Mensual

    Solución

    1. Encuentra el rango: el valor
      más grande - el valor más pequeño\(= 2550-350=2200\)
    2. Escoge el número de clases:
      Las indicaciones a decir para usar 7 clases.
    3. Encuentra la clase width:
      width\(=\dfrac{\text { range }}{7}=\dfrac{2200}{7} \approx 314.286\)
      Redondear hasta 315
      \(\color{text}{Always round up to the next integer even if the width is already an integer.}\)
    4. Encuentra los límites de clase:
      Comience por el valor más pequeño. Este es el límite de clase inferior para la primera clase. Agrega el ancho para obtener el límite inferior de la siguiente clase. Sigue sumando el ancho para obtener todos los límites inferiores.
      \(350+315=665,665+315=980,980+315=1295 \rightleftharpoons\),
      El límite superior es uno menos que el siguiente límite inferior: así que para la primera clase el límite de clase alta sería\(665-1=664\).
      Cuando tengas las 7 clases, asegúrate de que el último número, en este caso el 2550, sea al menos tan grande como el valor más grande en los datos. Si no, cometiste un error en alguna parte.
    5. Encuentra los límites de clase:
      Resta 0.5 del límite de clase inferior para obtener los límites de clase. Agrega 0.5 al límite de clase superior para el límite de la última clase.
      \(350-0.5=349.5, \quad 665-0.5=664.5,\quad 980-0.5=979.5, \quad 1295-0.5=1294.5 \rightleftharpoons\)
      Cada valor en los datos debe caer exactamente en una de las clases. Ningún valor de datos debe caer justo en el límite de dos clases.
    6. Encuentra los puntos medios de la clase:
      punto medio\(=\dfrac{\text { lower limit }+\text { upper limit }}{2}\)
      \(\dfrac{350+664}{2}=507, \dfrac{665+979}{2}=822, \rightleftharpoons\)
    7. Contar y encontrar la frecuencia de los datos:
      Ir a través de los datos y poner una marca de recuento en la clase apropiada para cada dato mirando para ver qué límites de clase se encuentra el valor de los datos entre. Rellene la frecuencia cambiando cada uno de los recuentos en un número.
    Límites de clase Límites de clase Clase Midpoint Tally Frecuencia
    350-664 349.5-664.5 507 |||| 4
    665-979 664.5-979.5 822 \(\cancel{||||}\)||| 8
    980-1294 979.5-1294.5 1137 \(\cancel{||||}\) 5
    1295-1609 1294.5-1609.5 1452 \(\cancel{||||}\)| 6
    1610-1924 1609.5-1924.5 1767   0
    1925-2239 1924.5-2239.5 2082   0
    2240-2554 2239.5-2554.5 2397 | 1
    Tabla\(\PageIndex{2}\): Distribución de Frecuencia para Renta Mensual

    Asegúrese de que el total de las frecuencias sea el mismo que el número de puntos de datos.

    Comando R para una distribución de frecuencia:

    Para crear una distribución de frecuencia:

    summary (variable) — para que puedas conocer el mínimo y el máximo.

    breaks = seq (min, número por encima de max, by = ancho de clase)

    descansos — para que puedas ver los descansos que hizo R.

    variable.cut=cut (variable, breaks, right=false) — esto cortará los datos en las clases.

    variable.freq=table (variable.cut) — esto creará la tabla de frecuencias.

    variable.freq — esto mostrará la tabla de frecuencias.

    Para los datos en Ejemplo\(\PageIndex{1}\), el comando R sería:

    renta<-c (1500, 1350, 350, 1200, 850, 900, 1500, 1150, 1500, 900, 1400, 1100, 1250, 600, 610, 960, 890, 1325, 900, 800, 2550, 495, 1200, 690) resumen (renta)

    Salida:

    \(\begin{array}{cccccc}{\text{Min} }&{1\text{st Qu.}}& {\text{Median}} & {\text{Mean}} & {3\text{rd Qu.}} & {\text{Max}} \\ {350} & {837.5} & {1030 .0} & {1082.0} & {1331.0} & {2550 .0} \end{array}\)

    rupturas=seq (350, 3000, por = 315)
    descansos

    Salida:
    [1] 350 665 980 1295 1610 1925 2240 2555 2870
    Estos son sus límites inferiores de la distribución de frecuencias. Ya puedes escribir tu propia mesa.

    rent.cut=corte (renta, descansos, derecha=Falso)
    rent.freq=tabla (rent.cut)

    Salida:
    rent.cut

    \(\begin{array}{cccccccc}{[350,665)} & {[665,980)} & {[980,1.3 e+03)} & {[1.3e+03, 1.61e+03)} & {[1.61e+03, 1.92e+03)} & {[1.92e+03, 2.24e+03)} & {[2.24e+03, 2.56e+03)} & {[2.56e+03, 2.87e+03)} \\ {4} & {8} & {5} & {6}& {0} & {0} & {1} & {0}\end{array}\)

    Es difícil determinar la forma básica de la distribución observando la distribución de frecuencias. Sería más fácil mirar una gráfica. El gráfico de una distribución de frecuencia para datos cuantitativos se denomina histograma de frecuencia o simplemente histograma para abreviar.

    Definición\(\PageIndex{1}\): Histogram

    Un histograma es una gráfica de las frecuencias en el eje vertical y los límites de clase en el eje horizontal. Para cada clase se dibujan rectángulos donde la altura es la frecuencia y el ancho es el ancho de clase.

    Ejemplo\ (\ PageIndex {2}\: Dibujar un histograma

    Dibuja un histograma para la distribución de Ejemplo\(\PageIndex{1}\).

    Solución

    Los límites de clase se trazan en el eje horizontal y las frecuencias se trazan en el eje vertical. Puede trazar los puntos medios de las clases en lugar de los límites de clase. Graph 2.2.1 se creó usando los puntos medios porque era más fácil de hacer con el software que creó la gráfica. En R, el comando es

    hist (variable, col="type en qué color quieres”, breaks, main="type the title you want”, xlab="type the label you want for the horizontal axis”,
    ylim=c (0, number above maximum frequency) — produce histograma con color especificado y usando los descansos que hiciste para la distribución de frecuencias.

    Para este ejemplo, el comando en R sería (suponiendo que haya creado una distribución de frecuencia en R como se describió anteriormente):

    hist (renta, col="blue”, breaks, derecha=Falso, main="Renta Mensual Pagada por Estudiantes”, ylim=c (0,8) xLab="Renta Mensual ($)”)

    Captura de pantalla (6) .png
    Figura\(\PageIndex{1}\): Histograma para Renta Mensual

    Si no se creó ninguna distribución de frecuencia antes del histograma, entonces el comando sería:

    hist (variable, col="type en qué color quieres”, número de clases, main="escribe el título que quieres”, xlab="escribe la etiqueta que quieres para el eje horizontal”) — produce histograma con el color especificado y el número de clases (aunque el número de clases es una estimación y R creará el número de clases cercanas este valor).

    Para este ejemplo, el comando R sin una distribución de frecuencia creada primero sería:

    hist (renta, col="blue”, 7, main="Renta Mensual Pagada por Estudiantes”, XLAB="Renta Mensual ($)”)

    Observe que la gráfica tiene los ejes etiquetados, las marcas de graduación están etiquetadas en cada eje y hay un título.

    Revisando la gráfica se puede ver que la mayoría de los estudiantes pagan alrededor de $750 mensuales por renta, siendo cerca de $1500 el otro valor común. Se puede ver en la gráfica, que la mayoría de los estudiantes pagan entre $600 y $1600 mensuales por renta. Por supuesto, estos valores son solo estimaciones de la gráfica. Existe una gran brecha entre la clase de $1500 y el valor de datos más alto. Esto parece decir que un estudiante está pagando mucho más que todos los demás. Este valor podría considerarse un valor atípico. Un valor atípico es un valor de datos que está lejos del resto de los valores. Puede ser un valor inusual o un error. Se trata de un valor de datos que se debe investigar. En este caso, el estudiante vive en una parte muy cara de la ciudad, por lo que el valor no es un error, y es simplemente muy inusual. Hay otros aspectos que se pueden discutir, pero primero hay que introducir algunos otros conceptos.

    Las frecuencias son útiles, pero también es útil comprender el tamaño relativo de cada clase con respecto al total. Para encontrar esto se puede dividir la frecuencia por el total para crear una frecuencia relativa. Si tienes las frecuencias relativas para todas las clases, entonces tienes una distribución de frecuencia relativa.

    Definición\(\PageIndex{2}\)

    Distribución de frecuencia relativa

    Una variación en una distribución de frecuencia es una distribución de frecuencia relativa. En lugar de dar las frecuencias para cada clase, se calculan las frecuencias relativas.

    Frecuencia relativa\(=\dfrac{\text { frequency }}{\# \text { of data points }}\)

    Esto te da porcentajes de datos que caen en cada clase.

    Ejemplo\(\PageIndex{3}\) creating a relative frequency table

    Encuentra la frecuencia relativa para los datos de grado.

    Solución

    De Ejemplo\(\PageIndex{1}\), la distribución de frecuencias se reproduce en Ejemplo\(\PageIndex{2}\).

    Límites de clase Límites de clase Clase Midpoint Frecuencia
    350-664 349.5-664.5 507 4
    665-979 664.5-979.5 822 8
    980-1294 979.5-1294.5 1127 5
    1295-1609 1294.5-1609.5 1452 6
    1610-1924 1609.5-1924.5 1767 0
    1925-2239 1924.5-2239.5 2082 0
    2240-2554 2239.5-2554.5 2397 1
    Tabla\(\PageIndex{2}\): Distribución de Frecuencia para Renta Mensual

    Divida cada frecuencia por el número de puntos de datos.

    \(\dfrac{4}{24}=0.17, \dfrac{8}{24}=0.33, \dfrac{5}{24}=0.21, \rightleftharpoons\)

    Límites de clase Límites de clase Clase Midpoint Frecuencia Frecuencia relativa
    350-664 349.5-664.5 507 4 0.17
    665-979 664.5-979.5 822 8 0.33
    980-1294 979.5-1294.5 1127 5 0.21
    1295-1609 1294.5-1609.5 1452 6 0.25
    1610-1924 1609.5-1924.5 1767 0 0
    1925-2239 1924.5-2239.5 2082 0 0
    2240-2554 2239.5-2554.5 2397 1 0.04
    Total     24 1
    Tabla\(\PageIndex{3}\): Distribución Relativa de Frecuencia para Renta Mensual

    Las frecuencias relativas deben sumar hasta 1 o 100%. (Esto podría estar un poco apagado debido a errores de redondeo).

    El gráfico de la frecuencia relativa se conoce como histograma de frecuencia relativa. Parece idéntico al histograma de frecuencia, pero el eje vertical es frecuencia relativa en lugar de solo frecuencias.

    Ejemplo\(\PageIndex{4}\) drawing a relative frequency histogram

    Dibuje un histograma de frecuencia relativa para la distribución de grados de Ejemplo\(\PageIndex{1}\).

    Solución

    Los límites de clase se trazan en el eje horizontal y las frecuencias relativas se trazan en el eje vertical. (Esto no es fácil de hacer en R, así que usa otra tecnología para graficar un histograma de frecuencia relativa).

    Captura de pantalla (7) .png
    Figura\(\PageIndex{2}\): Histograma de Frecuencia Relativa para Renta Mensual

    Observe que la forma es la misma que la distribución de frecuencias.

    Otra información útil es cuántos puntos de datos caen por debajo de un límite de clase particular. Como ejemplo, un maestro puede querer saber cuántos estudiantes recibieron por debajo de un 80%, un médico puede querer saber cuántos adultos tienen colesterol por debajo de 160, o un gerente puede querer saber cuántas tiendas brutan menos de $2000 por día. Esto se conoce como frecuencia acumulativa. Si quieres saber qué porcentaje de los datos cae por debajo de cierto límite de clase, entonces esta sería una frecuencia relativa acumulativa. Para frecuencias acumulativas está encontrando cuántos valores de datos caen por debajo del límite de clase alta.

    Para crear una distribución de frecuencia acumulativa, cuente el número de puntos de datos que están por debajo del límite de clase alta, comenzando por la primera clase y trabajando hasta la clase superior. El último límite de clase alta debe tener todos los puntos de datos por debajo de él. Incluya también el número de puntos de datos por debajo del límite de clase más bajo, que es cero.

    Ejemplo\(\PageIndex{5}\) creating a cumulative frequency distribution

    Cree una distribución de frecuencia acumulativa para los datos en Ejemplo\(\PageIndex{1}\).

    Solución

    La distribución de frecuencia para los datos está en Ejemplo\(\PageIndex{2}\).

    Límites de clase Límites de clase Clase Midpoint Frecuencia
    350-664 349.5-664.5 507 4
    665-979 664.5-979.5 822 8
    980-1294 979.5-1294.5 1127 5
    1295-1609 1294.5-1609.5 1452 6
    1610-1924 1609.5-1924.5 1767 0
    1925-2239 1924.5-2239.5 2082 0
    2240-2554 2239.5-2554.5 2397 1
    Tabla\(\PageIndex{2}\): Distribución de Frecuencia para Renta Mensual

    Ahora pregúntese cuántos puntos de datos caen por debajo de cada límite de clase. Por debajo de 349.5, hay 0 puntos de datos. Por debajo de 664.5 hay 4 puntos de datos, por debajo de 979.5, hay 4 + 8 = 12 puntos de datos, por debajo de 1294.5 hay 4 + 8 + 5 = 17 puntos de datos, y continuar con este proceso hasta llegar al límite de clase alta. Esto se resume en Ejemplo\(\PageIndex{4}\).

    Para producir frecuencias acumulativas en R, es necesario haber realizado los comandos para la distribución de frecuencias. Una vez que haya completado eso, entonces use variable.cumfreq=cumsum (variable.freq) — crea las frecuencias acumulativas para la variable
    cumfreq0=c (0, variable.cumfreq) — crea una tabla de frecuencias acumulativas para la variable.
    cumfreq0 — muestra la tabla de frecuencias acumulativas.

    Para este ejemplo el comando sería:
    rent.cumfreq=cumsum (rent.freq)
    cumfreq0=c (0, rent.cumfreq)
    cumfreq0

    Salida:

    \(\begin{array}{ccccccccc}{}&{[350,665)} & {[665,980)} & {[980,1.3e+03)}& {[1.3e+03, 1.61e+03)}&{[1.61e+03, 1.92e+03)}&{[1.92e+03,2.24e+03)}&{[2.24e+03, 2.56e+03)}&{[2.56e+03, 2.87e+03)} \\ {0}&{4} & {12}&{17}&{23}&{23}&{23}&{24}&{24}\end{array}\)

    Ahora escribe esto en una mesa. Ver Ejemplo\(\PageIndex{4}\).

    Límites de clase Límites de clase Clase Midpoint Frecuencia Frecuencia Acumulada
    350-664 349.5-664.5 507 4 4
    665-979 664.5-979.5 822 8 12
    980-1294 979.5-1294.5 1127 5 17
    1295-1609 1294.5-1609.5 1452 6 23
    1610-1924 1609.5-1924.5 1767 0 23
    1925-2239 1924.5-2239.5 2082 0 23
    2240-2554 2239.5-2554.5 2397 1 24
    Tabla\(\PageIndex{4}\): Distribución Acumulada para Renta Mensual

    Nuevamente, es difícil mirar los datos tal como son. Una gráfica sería útil. La gráfica para frecuencia acumulada se llama ogive (o-jive). Para crear una ogive, primero cree una escala tanto en el eje horizontal como en el vertical que se ajuste a los datos. Luego, grafica los puntos del límite de clase alta de clase versus la frecuencia acumulativa. Asegúrese de incluir el punto con el límite de clase más bajo y la frecuencia acumulada 0. Entonces solo conecta los puntos.

    Ejemplo\(\PageIndex{6}\) drawing an ogive

    Dibuja una ogive para los datos en Ejemplo\(\PageIndex{1}\).

    Solución

    En R, los comandos serían:
    plot (breaks, cumfreq0, main="title you want to use”, xlab="label you want to use”, ylab="label you want to use”, ylim=c (0, number above maximum cumulative frequency) — traza las
    líneas ogive (breaks, cumfreq0) — conecta los puntos en el ogive

    Para este ejemplo, los comandos serían:
    Plot (breaks, cumfreq0, main=” Frecuencia Acumulada para Renta Mensual”, xlab=” Renta Mensual ($)”, ylab=” Frecuencia Acumulada”, ylim=c (0,25))
    líneas (breaks, cumfreq0)

    Captura de pantalla (8) .png
    Figura\(\PageIndex{3}\): Ogive para Renta Mensual

    La utilidad de una ogive es permitir al lector conocer cuántos estudiantes pagan menos de cierto valor, y también qué cantidad de renta mensual paga un cierto número de estudiantes. Como ejemplo, supongamos que quieres saber cuántos estudiantes pagan menos de 1500 dólares mensuales en renta, entonces puedes subir desde los $1500 hasta llegar a la gráfica y luego pasar a los ejes de frecuencia acumulados para ver qué valor corresponde a este valor. Al parecer, alrededor de 20 estudiantes pagan menos de 1500 dólares. (Ver Gráfica 2.2.4.)

    Captura de pantalla (10) .png
    Figura\(\PageIndex{4}\): Ogive para Renta Mensual con Ejemplo

    Además, si quieres saber la cantidad que pagan menos 15 alumnos, entonces comienzas a las 15 en el eje vertical y luego pasas a la gráfica y bajando al eje horizontal donde la línea se cruza con la gráfica. Se puede ver que 15 alumnos pagan menos de unos 1200 dólares mensuales. (Ver Gráfica 2.2.5.)

    Captura de pantalla (12) .png
    Figura\(\PageIndex{5}\): Ogive para Renta Mensual con Ejemplo

    Si graficas la frecuencia relativa acumulativa entonces puedes averiguar qué porcentaje está por debajo de un cierto número en lugar de solo el número de personas por debajo de cierto valor.

    Formas de la distribución:

    Cuando miras una distribución, mira la forma básica. Hay algunas formas básicas que se ven en los histogramas. Sin embargo, date cuenta de que algunas distribuciones no tienen forma. Las formas comunes son simétricas, sesgadas y uniformes. Otro interés es cuántos picos puede tener una gráfica. Esto se conoce como modal.

    Simétrico significa que puedes doblar la gráfica por la mitad hacia abajo por la mitad y los dos lados se alinearán. Se puede pensar en los dos lados como imágenes especulares el uno del otro. sesgada significa que una “cola” de la gráfica es más larga que la otra. La gráfica está sesgada en la dirección de la cola más larga (hacia atrás de lo que cabría esperar). Una gráfica uniforme tiene todas las barras de la misma altura.

    Modal se refiere al número de picos. El unimodal tiene un pico y el bimodal tiene dos picos. Por lo general, si una gráfica tiene más de dos picos, la información modal ya no es de interés.

    Otras características importantes a considerar son los espacios entre barras, un patrón repetitivo, qué tan dispersos están los datos y dónde está el centro de la gráfica.

    Ejemplos de Gráficas:

    Esta gráfica es más o menos simétrica y unimodal:

    Captura de pantalla (13) .png
    Figura

    Esta gráfica es simétrica y bimodal:

    Captura de pantalla (14) .png
    Figura

    Esta gráfica está sesgada a la derecha:

    Captura de pantalla (15) .png
    Figura

    Esta gráfica está sesgada a la izquierda y tiene un hueco:

    Captura de pantalla (16) .png
    Figura

    Esta gráfica es uniforme ya que todas las barras tienen la misma altura:

    Captura de pantalla (17) .png
    Figura

    Ejemplo\(\PageIndex{7}\) creating a frequency distribution, histogram, and ogive

    Los siguientes datos representan el cambio porcentual en los niveles de matrícula en colegios públicos de cuatro años (ajustados por inflación) de 2008 a 2013 (Weissmann, 2013). Cree una distribución de frecuencia, histograma y ojivas para los datos.

    19.5% 40.8% 57.0% 15.1% 17.4% 5.2% 13.0%
    15.6% 51.5% 15.6% 14.5% 22.4% 19.5% 31.3%
    21.7% 27.0% 13.1% 26.8% 24.3% 38.0% 21.1%
    9.3% 46.7% 14.5% 78.4% 67.3% 21.1% 22.4%
    5.3% 17.3% 17.5% 36.6% 72.0% 63.2% 15.1%
    2.2% 17.5% 36.7% 2.8% 16.2% 20.5% 17.8%
    30.1% 63.6% 17.8% 23.2% 25.3% 21.4% 28.5%
    9.4%  
    Tabla\(\PageIndex{5}\): Datos de Niveles de Matrícula en Colegios Públicos de Cuatro Años

    Solución

    1. Encuentra el rango: valor
      mayor - valor más pequeño =\(78.4\)%\(-2.2\)%\(=76.2\)%
    2. Elige el número de clases:
      Dado que hay 50 puntos de datos, entonces se deben usar alrededor de 6 a 8 clases. Usemos 8.
    3. Encuentra la clase width:
      width\(=\dfrac{\text { range }}{8}=\dfrac{76.2 \%}{8} \approx 9.525 \%\)
      Dado que los datos tienen un lugar decimal, entonces el ancho de la clase debe redondearse a un decimal. Asegúrate de redondear.
      \(=9.6\)% de ancho
    4. Encuentra los límites de clase:
      \(2.2 \%+9.6 \%=11.8 \%, 11.8 \%+9.6 \%=21.4 \%, 21.4 \%+9.6 \%=31.0 \%, \leftrightharpoons\)
    5. Encuentra los límites de clase:
      Dado que los datos tienen un lugar decimal, los límites de clase deben tener dos decimales, así que resta 0.05 del límite de clase inferior para obtener los límites de clase. Agregue 0.05 al límite de clase superior para el límite de la última clase.
      \(2.2-0.05=2.15 \%, 11.8-0.05=11.75 \%, 21.4-0.05=21.35 \% \leftrightharpoons\)
      Cada valor en los datos debe caer exactamente en una de las clases. Ningún valor de datos debe caer justo en el límite de dos clases.
    6. Encuentra los puntos medios de la clase:
      punto medio\(=\dfrac{\text { lower limt }+\text { upper limit }}{2}\)
      \(\dfrac{2.2+11.7}{2}=6.95 \%, \dfrac{11.8+21.3}{2}=16.55 \%, \leftrightharpoons\)
    7. Contar y encontrar la frecuencia de los datos:
    Límites de clase Límites de clase Clase Midpoint Tally Frecuencia Frecuencia relativa Frecuencia Acumulada
    2.2-11.7 2.15-11.75 6.95 \(\cancel{||||} |\) 6 0.12 6
    11.8-21.3 11.75-21.35 16.55 \(\cancel{||||} \cancel{||||} \cancel{||||} \cancel{||||}\) 20 0.40 26
    21.4-30.9 21.35-30.95 26.15 \(\cancel{||||} \cancel{||||} |\) 11 0.22 37
    31.0-45.0 30.95-40.55 35.75 \( |||| \) 4 0.08 41
    40.6-50.1 40.55-50.15 45.35 \( || \) 2 0.04 43
    50.2-59.7 50.15-59.75 54.95 \( || \) 2 0.04 45
    59.8-69.3 59.75-69.35 64.55 \( ||| \) 3 0.06 48
    69.4-78,9 69.35-78.95 74.15 \( || \) 2 0.04 50
    Tabla\(\PageIndex{6}\): Distribución de frecuencias para los niveles de matrícula en colegios públicos de cuatro años

    Asegúrese de que el total de las frecuencias sea el mismo que el número de puntos de datos.

    Captura de pantalla (18) .png
    Figura\(\PageIndex{11}\): Histograma para Niveles de Matrícula en Colegios Públicos de Cuatro Años

    Esta gráfica está sesgada a la derecha, sin huecos. Esto dice que la mayoría de los aumentos porcentuales en la matrícula rondaron 16.55%, siendo muy pocos los estados que tuvieron un incremento porcentual mayor al 45.35%.

    Captura de pantalla (19) .png
    Figura\(\PageIndex{12}\): Ogive para Niveles de Matrícula en Colegios Públicos de Cuatro Años

    Al mirar el ogive, se puede ver que 30 estados tuvieron un cambio porcentual en los niveles de matrícula de alrededor del 25% o menos.

    Hay ocasiones en las que los límites de clase en la distribución de frecuencias están predeterminados. Ejemplo\(\PageIndex{8}\) demuestra esta situación.

    Ejemplo\(\PageIndex{8}\) creating a frequency distribution and histogram

    A continuación se indican los grados porcentuales de 25 alumnos de un curso de estadística. Hacer una distribución de frecuencias e histograma.

    62 87 81 69 87 62 45 95 76 76
    62 71 65 67 72 80 40 77 87 58
    84 73 93 64 89          
    Tabla\(\PageIndex{7}\): Datos de Grados de Prueba

    Solución

    Dado que este dato es por ciento de calificaciones, tiene más sentido hacer las clases en múltiplos de 10, ya que las calificaciones suelen ser del 90 al 100%, del 80 al 90%, y así sucesivamente. Es más fácil no usar los límites de clase, sino usar los límites de clase y pensar en que el límite de clase superior está a la altura pero no incluye el límite inferior de las clases siguientes. Como ejemplo la clase 80 — 90 significa una calificación de 80% hasta pero sin incluir un 90%. Un estudiante con un 89.9% estaría en la clase 80-90.

    Límite de Clase Clase Midpoint Tally Freqeuncy
    40-50 45 \( || \) 2
    50-60 55 \( | \) 1
    60-70 65 \( \cancel{||||} || \) 7
    70-80 75 \( \cancel{||||} | \) 6
    80-90 85 \( \cancel{||||} || \) 7
    90-100 95 \( || \) 2
    Tabla\(\PageIndex{8}\): Distribución de frecuencia para grados de prueba
    Captura de pantalla (20) .png
    Figura\(\PageIndex{13}\): Histograma para Grados de Prueba

    Al parecer, la mayoría de los estudiantes tuvieron entre 60 y 90%. Esta gráfica se ve algo simétrica y también bimodal. El mismo número de alumnos ganaba entre 60 a 70% y 80 a 90%.

    Existen otros tipos de gráficas para datos cuantitativos. Serán explorados en la siguiente sección.

    Teares

    Ejercicio\(\PageIndex{1}\)

    1. Los ingresos medios de los varones en cada estado de Estados Unidos, incluyendo el Distrito de Columbia y Puerto Rico, se dan en Ejemplo\(\PageIndex{9}\) (“Ingresos medios de,” 2013). Cree una distribución de frecuencia, distribución de frecuencia relativa y distribución de frecuencia acumulativa usando 7 clases.
      42,951$ 52,379 42,544 37,488 49,281 50,987
      60,705 50,411 66,760 $40,951 $43,902 45,494
      41,528 50,746 $45,183 $43,624 $43,993 41,612
      46,313 $43,944 56,708 60,264 50,053$ 50,580
      $40,202 $43,146 41,635$ $42,182 $41,803 $53,033
      60,568 41,037 50,388 $41,950 $44,660 46,176$
      41,420 45,976 $47,956 22,529 48,842 $41,464
      $40,285 41,309 $43,160 47,573 $44,057 52,805
      $53,046 $42,125 46,214$ 51,630    
      Tabla\(\PageIndex{9}\): Datos de ingresos medios para hombres
    2. Los ingresos medios de las mujeres en cada estado de los Estados Unidos, incluyendo el Distrito de Columbia y Puerto Rico, se dan en Ejemplo\(\PageIndex{10}\) (“Ingresos medios de,” 2013). Cree una distribución de frecuencia, distribución de frecuencia relativa y distribución de frecuencia acumulativa usando 7 clases.
      $31,862 $40,550 36,048 30,752 41,817 $40,236
      47,476 $40,500 $60,332 $33,823 $35,438 37,242
      $31,238 $39,150 $34,023 $33,745 $33,269 $32,684
      $31,844 34,599 48,748 46,185 $36,931 $40,416
      29,548 $33,865 $31,067 $33,424 35,484 41,021
      $47,155 $32,316 $42,113 $33,459 $32,462 35,746
      $31,274 36,027 37,089 $22,117 41,412 $31,330
      $31,329 33,184 35,301 $32,843 $38,177 $40,969
      $40,993 29,688 35,890 34,381    
      Tabla\(\PageIndex{10}\): Datos de ingresos medios para mujeres
    3. La densidad de personas por kilómetro cuadrado para los países africanos se encuentra en Ejemplo\(\PageIndex{11}\) (“Densidad de personas”, 2013). Cree una distribución de frecuencia, distribución de frecuencia relativa y distribución de frecuencia acumulativa usando 8 clases.
      15 16 81 3 62 367 42 123
      8 9 337 12 29 70 39 83
      26 51 79 6 157 105 42 45
      72 72 37 4 36 134 12 3
      630 563 72 29 3 13 176 341
      415 187 65 194 75 16 41 18
      69 49 103 65 143 2 18 31
      Tabla\(\PageIndex{11}\): Datos de Densidad de Personas por Kilómetro Cuadrado
    4. La Ley del Cuidado de Salud a Bajo Precio creó un mercado para que las personas compren planes de atención médica. En 2014, las primas para un niño de 27 años para el seguro médico nivel bronce se dan en Ejemplo\(\PageIndex{12}\) (“Mercado de seguros de salud”, 2013). Cree una distribución de frecuencia, distribución de frecuencia relativa y distribución de frecuencia acumulativa usando 5 clases.

       

      $114 $119 $121 $125 $132 $139
      $139 $141 $143 $145 $151 $153
      $156 $159 $162 $163 $165 $166
      $170 $170 $176 $177 $181 $185
      $185 $186 $186 $189 $190 $192
      $196 $203 $204 $219 $254 $286
      Tabla\(\PageIndex{12}\): Datos de Primas de Seguro de Salud
    5. Cree un histograma y un histograma de frecuencia relativa para los datos en Ejemplo\(\PageIndex{9}\). Describe la forma y cualquier hallazgo que puedas de la gráfica.

       

    6. Cree un histograma y un histograma de frecuencia relativa para los datos en Ejemplo\(\PageIndex{10}\). Describe la forma y cualquier hallazgo que puedas de la gráfica.

       

    7. Cree un histograma y un histograma de frecuencia relativa para los datos en Ejemplo\(\PageIndex{11}\). Describe la forma y cualquier hallazgo que puedas de la gráfica.

       

    8. Cree un histograma y un histograma de frecuencia relativa para los datos en Ejemplo\(\PageIndex{12}\). Describe la forma y cualquier hallazgo que puedas de la gráfica.

       

    9. Crear una ogive para los datos en Ejemplo\(\PageIndex{9}\). Describe cualquier hallazgo que puedas a partir de la gráfica.

       

    10. Crear una ogive para los datos en Ejemplo\(\PageIndex{10}\). Describe cualquier hallazgo que puedas a partir de la gráfica.

       

    11. Crear una ogive para los datos en Ejemplo\(\PageIndex{11}\). Describe cualquier hallazgo que puedas a partir de la gráfica.

       

    12. Crear una ogive para los datos en Ejemplo\(\PageIndex{12}\). Describe cualquier hallazgo que puedas a partir de la gráfica.

       

    13. Los alumnos de una clase de estadística tomaron su primera prueba. Los siguientes son los puntajes que obtuvieron. Cree una distribución de frecuencia y un histograma para los datos utilizando límites de clase que tengan sentido para los datos de calificaciones. Describir la forma de la distribución.

       

      80 79 89 74 73 67 79
      93 70 70 76 88 83 73
      81 79 80 85 79 80 79
      58 93 94 74      
      Tabla\(\PageIndex{13}\): Datos de los Grados de la Prueba 1
    14. Los alumnos de una clase de estadística tomaron su primera prueba. Los siguientes son los puntajes que obtuvieron. Cree una distribución de frecuencia y un histograma para los datos utilizando límites de clase que tengan sentido para los datos de calificaciones. Describir la forma de la distribución. Compare con la gráfica en la pregunta 13.

       

      Tabla\(\PageIndex{14}\): Datos de los Grados de la Prueba 1
      67 67 76 47 85 70
      87 76 80 72 84 98
      84 64 65 82 81 81
      88 74 87 83    
    Contestar

    Ver soluciones


    This page titled 2.2: Datos Cuantitativos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Kathryn Kozak via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.