2.5.3: Agrupación de datos numéricos
- Page ID
- 151664
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Otra forma de organizar los datos sin procesar es agruparlos en intervalos de clase, y luego crear una distribución de frecuencia de estos intervalos de clase.
Existen muchos métodos para crear intervalos de clase, por lo que simplemente nos enfocaremos en crear intervalos de igual ancho.
Cómo crear intervalos de clase de igual ancho y una distribución de frecuencia
- Elige cuántos intervalos quieres. Lo mejor es entre 5 y 15 intervalos.
- Determine el ancho del intervalo usando la fórmula y redondeando UP a un valor conveniente:
\[\text { IW }=\text { Interval Width }=\dfrac{\text { Maximum Value - Minimum Value+ } 1}{\text { Number of Intervals }} \nonumber \]
- Cree los intervalos de clase comenzando con el valor mínimo:
Mín a menos de Mín + IW,
Mín +IW a menos de Mín +2 (IW),...
- Calcular la frecuencia de cada intervalo de clase contando los valores en cada intervalo de clase. Los valores que están en un punto final deben colocarse en el intervalo de clase inferior. Este resultado se denomina distribución de frecuencias.
Ejemplo: Estudiantes navegando por la web
Volvamos a los datos que representan cuánto tiempo pasaron 30 estudiantes en un navegador web en un periodo de 24 horas. Los datos se redondean al minuto más cercano.
Primero elegimos cuántos intervalos de clase. En este ejemplo, crearemos 5 intervalos de clase.
Siguiente Determine el Ancho del Intervalo de Clase y redondee hasta un valor conveniente.
\[\mathrm{IW}=\frac{125-67+1}{5}=11.8 \rightarrow 12 \nonumber\]
Ahora crea intervalos de clase de ancho 12, comenzando con el valor más bajo, 67.
\ [\ begin {array} {lllll}
(67\ text {a} 79) & (79\ text {a} 91) & (91\ text {a} 103) & (103\ text {a} 115) & (115\ text {a} 127)
\ end {array}\ nonumber\]
Ahora, crea una distribución de frecuencias, contando cuántos hay en cada intervalo. Los valores que están en un punto final deben colocarse en el intervalo de clase superior. Por ejemplo, 103 deben contarse en el intervalo (103 a 115):
Como hicimos con los datos categóricos, podemos definir la Frecuencia Relativa como la proporción o porcentaje de valores en cualquier Intervalo de Clase.
n = tamaño de la muestra ‐ El número de observaciones en el tamaño de su muestra.
Frecuencia: el número de veces que se observa un valor particular en un intervalo de clase.
Frecuencia relativa ‐ La proporción o porcentaje de veces que se observa un valor particular en un intervalo de clase.
Frecuencia relativa = Frecuencia/n
Tenga en cuenta que el valor para el intervalo de clase (91 a 103) se redondeó deliberadamente hacia abajo para que los totales sumaran exactamente el 100%
De la distribución de frecuencias, podemos ver que el 30% de los estudiantes están en internet entre 103 y 115 minutos diarios, mientras que sólo el 10% de los estudiantes están en internet entre 67 y 79 minutos.
Ejemplo: Comparando pesos de manzanas y naranjas
Un investigador agrícola chileno recolectó una muestra de 100 manzanas Royal Gala y 100 naranjas ombligo y midió sus pesos en gramos (ver ejemplo anterior en parcelas de puntos).
Comenzaremos con un valor de 100 y haremos que el ancho del intervalo sea igual a 30. Usando la función de conteo de Minitab, podemos crear una distribución de frecuencia para los dos frutos. Minitab usa “Recuento” para “Frecuencia” e informa “Porcentaje” para “Frecuencia relativa”
El intervalo que ocurre con mayor frecuencia para las manzanas es de 220 a 250 gramos, mientras que el intervalo más frecuente para las naranjas es de 280 a 310 gramos. Observe que hay algunos intervalos con 0 observaciones, mostrando un potencial alto atípico para las manzanas y un valor atípico bajo para las naranjas.