Saltar al contenido principal
Library homepage
 
LibreTexts Español

2.5.3: Agrupación de datos numéricos

  • Page ID
    151664
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Otra forma de organizar los datos sin procesar es agruparlos en intervalos de clase, y luego crear una distribución de frecuencia de estos intervalos de clase.

    Existen muchos métodos para crear intervalos de clase, por lo que simplemente nos enfocaremos en crear intervalos de igual ancho.

    Cómo crear intervalos de clase de igual ancho y una distribución de frecuencia

    1. Elige cuántos intervalos quieres. Lo mejor es entre 5 y 15 intervalos.
    2. Determine el ancho del intervalo usando la fórmula y redondeando UP a un valor conveniente:

    \[\text { IW }=\text { Interval Width }=\dfrac{\text { Maximum Value - Minimum Value+ } 1}{\text { Number of Intervals }} \nonumber \]

    1. Cree los intervalos de clase comenzando con el valor mínimo:

    Mín a menos de Mín + IW,

    Mín +IW a menos de Mín +2 (IW),...

    1. Calcular la frecuencia de cada intervalo de clase contando los valores en cada intervalo de clase. Los valores que están en un punto final deben colocarse en el intervalo de clase inferior. Este resultado se denomina distribución de frecuencias.

    Ejemplo: Estudiantes navegando por la web

    Volvamos a los datos que representan cuánto tiempo pasaron 30 estudiantes en un navegador web en un periodo de 24 horas. Los datos se redondean al minuto más cercano.

    clipboard_ee582b617e2fde7745dba8dc10538b09c.png

    Primero elegimos cuántos intervalos de clase. En este ejemplo, crearemos 5 intervalos de clase.

    Siguiente Determine el Ancho del Intervalo de Clase y redondee hasta un valor conveniente.

    \[\mathrm{IW}=\frac{125-67+1}{5}=11.8 \rightarrow 12 \nonumber\]

    Ahora crea intervalos de clase de ancho 12, comenzando con el valor más bajo, 67.

    \ [\ begin {array} {lllll}
    (67\ text {a} 79) & (79\ text {a} 91) & (91\ text {a} 103) & (103\ text {a} 115) & (115\ text {a} 127)
    \ end {array}\ nonumber\]

    Ahora, crea una distribución de frecuencias, contando cuántos hay en cada intervalo. Los valores que están en un punto final deben colocarse en el intervalo de clase superior. Por ejemplo, 103 deben contarse en el intervalo (103 a 115):

    clipboard_ef04010ad66c0f87fec88dbb6dc3b99fe.png

    Como hicimos con los datos categóricos, podemos definir la Frecuencia Relativa como la proporción o porcentaje de valores en cualquier Intervalo de Clase.

    n = tamaño de la muestra ‐ El número de observaciones en el tamaño de su muestra.

    Frecuencia: el número de veces que se observa un valor particular en un intervalo de clase.

    Frecuencia relativa ‐ La proporción o porcentaje de veces que se observa un valor particular en un intervalo de clase.

    Frecuencia relativa = Frecuencia/n

    clipboard_eada6fa513afd8075e0940c492b09f5cf.png

    Tenga en cuenta que el valor para el intervalo de clase (91 a 103) se redondeó deliberadamente hacia abajo para que los totales sumaran exactamente el 100%

    De la distribución de frecuencias, podemos ver que el 30% de los estudiantes están en internet entre 103 y 115 minutos diarios, mientras que sólo el 10% de los estudiantes están en internet entre 67 y 79 minutos.

    Ejemplo: Comparando pesos de manzanas y naranjas

    Un investigador agrícola chileno recolectó una muestra de 100 manzanas Royal Gala y 100 naranjas ombligo y midió sus pesos en gramos (ver ejemplo anterior en parcelas de puntos).

    Comenzaremos con un valor de 100 y haremos que el ancho del intervalo sea igual a 30. Usando la función de conteo de Minitab, podemos crear una distribución de frecuencia para los dos frutos. Minitab usa “Recuento” para “Frecuencia” e informa “Porcentaje” para “Frecuencia relativa”

    clipboard_e4daa25973c234747ae2e04f88b42e07a.png

    El intervalo que ocurre con mayor frecuencia para las manzanas es de 220 a 250 gramos, mientras que el intervalo más frecuente para las naranjas es de 280 a 310 gramos. Observe que hay algunos intervalos con 0 observaciones, mostrando un potencial alto atípico para las manzanas y un valor atípico bajo para las naranjas.


    This page titled 2.5.3: Agrupación de datos numéricos is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.