3.1: Visualizar los datos
- Page ID
- 149884
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
El primer paso en este proceso de modelado de un factor es determinar si parece o no que exista una relación lineal entre el predictor y el valor de salida. Desde nuestra comprensión del diseño de sistemas informáticos, es decir, a partir de nuestro conocimiento específico del dominio, sabemos que la frecuencia del reloj influye fuertemente en el rendimiento de un sistema informático. En consecuencia, debemos buscar una relación más o menos lineal entre el rendimiento del procesador y su frecuencia de reloj. Afortunadamente, R proporciona funciones de trazado potentes y flexibles que nos permiten visualizar este tipo de relación con bastante facilidad.
Esta llamada a la función R:
> plot(int00.dat[,"clock"],int00.dat[,"perf"], main="Int2000", xlab="Clock", ylab="Performance")
genera la gráfica mostrada en la Figura 3.1. El primer parámetro en esta llamada a la función es el valor que trazaremos en el eje x. En este caso, trazaremos los valores de reloj del marco de datos int00.dat como la variable independiente
Figura 3.1: Gráfica de dispersión del rendimiento de los procesadores que se probaron utilizando el benchmark Int2000 frente a la frecuencia de reloj.
en el eje x. La variable dependiente es la columna perf de int00.dat
, que trazamos en el eje y. El argumento de función main="int2000"
proporciona un título para la trama, mientras que xlab="Clock”
y ylab="Performance”
proporcionan etiquetas para los ejes x e y, respectivamente.
Esta cifra muestra que el rendimiento tiende a aumentar a medida que aumenta la frecuencia del reloj, como esperábamos. Si superponemos una línea recta sobre este gráfico de dispersión, vemos que la relación entre el predictor (la frecuencia del reloj) y la salida (el rendimiento) es más o menos lineal. No es perfectamente lineal, sin embargo. A medida que aumenta la frecuencia del reloj, vemos una mayor dispersión en los valores de rendimiento. Nuestro siguiente paso es desarrollar un modelo de regresión que nos ayude a cuantificar el grado de linealidad en la relación entre la salida y el predictor.