11.3: Presentación gráfica de datos cuantitativos
- Page ID
- 110420
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Los datos cuantitativos o numéricos también se pueden resumir en tablas de frecuencias.
Un profesor registra puntuaciones en un cuestionario de 20 puntos para los 30 alumnos de su clase. Los puntajes son:
19 20 18 18 17 18 19 17 20 18 20 16 20 15 17 12 18 19 18 19 17 20 18 16 15 18 20 5 0 0
Estas puntuaciones podrían resumirse en una tabla de frecuencias agrupando valores similares:
\ (\ begin {array} {|c|c|}
\ hline\ textbf {Puntuación} &\ textbf {Frecuencia}\\
\ hline 0 & 2\
\ hline 5 & 1\\
\ hline 12 & 1\\
\ hline 15 & 2\
\ hline 16 & 2\\
\ hline 17 & 4\\ hline
\ hline 18 & 8\\
\ hline 19 & 4\\
\ hline 20 & 6\\
\ hline
\ end {array}\)
Usando esta tabla, sería posible crear un gráfico de barras estándar a partir de este resumen, como hicimos para los datos categóricos:
Sin embargo, dado que las puntuaciones son valores numéricos, este gráfico realmente no tiene sentido; las barras primera y segunda están separadas por cinco valores, mientras que las barras posteriores están separadas solo con un valor. Sería más correcto tratar el eje horizontal como una recta numérica. Este tipo de gráfica se denomina histograma.
Un histograma es como un gráfico de barras, pero donde el eje horizontal es una recta numérica
Para los valores anteriores, un histograma se vería así:
Observe que en el histograma, una barra representa valores en el eje horizontal desde el del lado izquierdo de la barra hasta, pero sin incluir, el valor en el lado derecho de la barra. Algunas personas optan por que las barras comiencen en ½ valores para evitar esta ambigüedad.
Desafortunadamente, no muchos paquetes de software comunes pueden graficar correctamente un histograma. Acerca de lo mejor que puedes hacer en Excel o Word es un gráfico de barras sin hueco entre las barras y espaciado agregado para simular un eje horizontal numérico.
Si tenemos un gran número de valores de datos ampliamente variables, crear una tabla de frecuencias que enumera todos los valores posibles como categoría conduciría a una tabla de frecuencias excepcionalmente larga, y probablemente no revelaría ningún patrón. Por esta razón, es común con los datos cuantitativos agrupar los datos en intervalos de clase.
Los intervalos de clase son agrupaciones de los datos. En general, definimos intervalos de clase de manera que:
- Cada intervalo es igual en tamaño. Por ejemplo, si la primera clase contiene valores de 120-129, la segunda clase debe incluir valores de 130-139.
- Tenemos entre 5 y 20 clases, normalmente, dependiendo de la cantidad de datos con los que estamos trabajando.
Supongamos que hemos recolectado pesos de 100 sujetos masculinos como parte de un estudio de nutrición. Para nuestros datos de peso, tenemos valores que van desde un mínimo de 121 libras hasta un máximo de 263 libras, dando un lapso total de 263-121 = 142. Podríamos crear 7 intervalos con un ancho de alrededor de 20, 14 intervalos con un ancho de alrededor de 10, o algún punto intermedio. Muchas veces tenemos que experimentar con algunas posibilidades para encontrar algo que represente bien los datos. Intentemos usar un ancho de intervalo de 15. Podríamos comenzar en 121, o en 120 ya que es un bonito número redondo.
\ (\ begin {array} {|c|c|}
\ hline\ textbf {Intervalo} &\ textbf {Frecuencia}\
\\ hline 120-134 & 4\
\\ hline 135-149 & 14\
\\ hline 150-164 & 16\
\ hline 165-179 & 28\\
\ hline 180-194 & 12\\
\ hline 195-209 & 8\\
\ hline 210-224 & 7\\
\ hline 225-239 & 6\\
\ hline 240-254 & 2\\
\ hline 255-269 & 3\\
\ hline
\ end {array}\)
Un histograma de estos datos se vería así:
En muchos paquetes de software, puede crear una gráfica similar a un histograma poniendo los intervalos de clase como etiquetas en un gráfico de barras.
Otros tipos de gráficos, como los gráficos circulares, son posibles para los datos cuantitativos. La utilidad de los diferentes tipos de gráficos variará dependiendo del número de intervalos y del tipo de datos que se representen. Por ejemplo, un gráfico circular de nuestros datos de peso es difícil de leer debido a la cantidad de intervalos que usamos.
El costo total de los libros de texto para el término se recolectó de 36 estudiantes. Crear un histograma para estos datos.
$140 $160 $160 $165 $180 $220 $235 $240 $250 $260 $280 $285
$285 $290 $300 $300 $305 $310 $310 $315 $315 $320 $320
$330 $340 $345 $350 $355 $360 $360 $380 $395 $420 $460 $460
- Contestar
-
Usando intervalos de clase de tamaño 55, podemos agrupar nuestros datos en seis intervalos:
\ (\ begin {array} {|l|r|}
\ hline\ textbf {intervalo de costo} &\ textbf {Frecuencia}\
\\ hline\ $ 140-194 & 5\\
\ hline\ $ 195-249 & 3\\
\ hline\ $ 250-304 & 9\\
\ hline\ $ 305-359 & 12\\
\ hline\ $ 360-414 & 4\\
\ hline\ $ 415-469 & 3\\
\ hline
\ end {array}\)Podemos usar la distribución de frecuencias para generar el histograma.
Al recolectar datos para comparar dos grupos, es deseable crear una gráfica que compare cantidades.
Los datos a continuación provinieron de una tarea en la que el objetivo es mover un mouse de computadora a un objetivo en la pantalla lo más rápido posible. En 20 de los ensayos, el objetivo era un rectángulo pequeño; en los otros 20, el objetivo era un rectángulo grande. En cada ensayo se registró el tiempo para alcanzar el objetivo.
\ (\ begin {array} {|c|c|c|}
\ hline\ begin {array} {c}
\ textbf {Intervalo}\
\\ textbf {(milisegundos)}
\ end {array} &\ begin {array} {c}
\ textbf {Frecuencia}\
\ textbf {objetivo pequeño}
\ end {array} &\ begin {array} {c}
\ textbf {Frecuencia}\\
\ textbf {objetivo grande}
\ end {array}\
\ hline 300-399 & 0 & 0\\
\ hline 400-499 & 1 & 5\\
\ hline 500-599 & 3 & 10\
\ hline 600-699 & 6 & amp; 5\
\ hline 700-799 & 5 & 0\\
\ hline 800-899 & 4 & 0\\
\ hline 900-999 & 0 & 0\
\\ hline 1000-1099 & 1 & 0\
\ hline 1100-1199 & 0 & 0\
\ hline
\ end {array} \)
Una opción para representar estos datos sería un histograma comparativo o gráfico de barras, en el que las barras para el grupo objetivo pequeño y el grupo objetivo grande se colocan una al lado de la otra.
Una representación alternativa es un polígono de frecuencia. Un polígono de frecuencia comienza como un histograma, pero en lugar de dibujar una barra, se coloca un punto en el punto medio de cada intervalo a una altura igual a la frecuencia. Normalmente los puntos están conectados con líneas rectas para enfatizar la distribución de los datos.
Esta gráfica hace que sea más fácil ver que los tiempos de reacción fueron generalmente más cortos para el objetivo más grande, y que los tiempos de reacción para el objetivo más pequeño estaban más dispersos.