3.1: Visualizar los datos

Última actualización
Guardar como PDF

Page ID: 149884

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

El primer paso en este proceso de modelado de un factor es determinar si parece o no que exista una relación lineal entre el predictor y el valor de salida. Desde nuestra comprensión del diseño de sistemas informáticos, es decir, a partir de nuestro conocimiento específico del dominio, sabemos que la frecuencia del reloj influye fuertemente en el rendimiento de un sistema informático. En consecuencia, debemos buscar una relación más o menos lineal entre el rendimiento del procesador y su frecuencia de reloj. Afortunadamente, R proporciona funciones de trazado potentes y flexibles que nos permiten visualizar este tipo de relación con bastante facilidad.

Esta llamada a la función R:

> plot(int00.dat[,"clock"],int00.dat[,"perf"], main="Int2000", xlab="Clock", ylab="Performance")

genera la gráfica mostrada en la Figura 3.1. El primer parámetro en esta llamada a la función es el valor que trazaremos en el eje x. En este caso, trazaremos los valores de reloj del marco de datos int00.dat como la variable independiente

Screen Shot 2020-01-08 at 11.14.46 AM.png

Figura 3.1: Gráfica de dispersión del rendimiento de los procesadores que se probaron utilizando el benchmark Int2000 frente a la frecuencia de reloj.

en el eje x. La variable dependiente es la columna perf de int00.dat, que trazamos en el eje y. El argumento de función main="int2000" proporciona un título para la trama, mientras que xlab="Clock” y ylab="Performance” proporcionan etiquetas para los ejes x e y, respectivamente.

Esta cifra muestra que el rendimiento tiende a aumentar a medida que aumenta la frecuencia del reloj, como esperábamos. Si superponemos una línea recta sobre este gráfico de dispersión, vemos que la relación entre el predictor (la frecuencia del reloj) y la salida (el rendimiento) es más o menos lineal. No es perfectamente lineal, sin embargo. A medida que aumenta la frecuencia del reloj, vemos una mayor dispersión en los valores de rendimiento. Nuestro siguiente paso es desarrollar un modelo de regresión que nos ayude a cuantificar el grado de linealidad en la relación entre la salida y el predictor.