Saltar al contenido principal
LibreTexts Español

8: Algunas cosas para probar Siguiente

  • Page ID
    149871
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    AQUÍ hay algunos ejercicios sugeridos para ayudarlo a aprender más sobre el modelado de regresión usando R.

    1. Muestra cómo limpiarías el conjunto de datos para uno de los resultados de referencia seleccionados (Int1992, Int1995, etc.). Por ejemplo, para cada columna del marco de datos, podría:

      • Compute el promedio, varianza, mínimo y máximo.

      • Ordene los datos de la columna para buscar valores atípicos o patrones inusuales.

      • Determinar la fracción de valores de NA para cada columna.

      ¿De qué otra manera podría verificar que los datos se vean razonables?

    2. Trazar el rendimiento del procesador frente a la frecuencia de reloj para cada uno de los resultados del benchmark, similar a la Figura 3.1.

    3. Desarrollar un modelo de regresión lineal de un factor para todos los resultados de referencia. ¿Qué factor de entrada debes usar como predictor?

    4. Superponga sus modelos de un factor en las gráficas de dispersión correspondientes de los datos (ver Figura 3.2).

    5. Evaluar la calidad de los modelos de un factor discutiendo los residuales, los valores p de los coeficientes, los errores estándar residuales, los valores R2, el estadístico F y realizando el análisis residual apropiado.

    6. Generar una gráfica de comparación por pares para cada uno de los resultados del benchmark, similar a la Figura 4.1.

    7. Desarrollar un modelo de regresión lineal multifactorial para cada uno de los resultados de referencia. ¿Qué predictores son los mismos y cuáles son diferentes entre estos modelos? ¿Qué otras similitudes y diferencias ve entre estos modelos?

    8. Evaluar la calidad de los modelos multifactoriales discutiendo los residuos, los valores p de los coeficientes, los errores estándar residuales, los valores R2, el estadístico F y realizando el análisis residual apropiado.

    9. Utilice los modelos de regresión que ha desarrollado para completar las tablas de seguimiento, mostrando qué tan bien los modelos de cada fila predicen los resultados de referencia en cada columna. Específicamente, rellene los valores x e y para que x sea la media de los valores delta para las predicciones e y sea el ancho del 95 por ciento de confianza en- terval correspondiente. Solo necesitas predecir hacia adelante en el tiempo. Por ejemplo, es razonable utilizar el modelo desarrollado con datos de Int1992 para predecir los resultados de Int2006, pero no tiene sentido utilizar un modelo desarrollado con datos Int2006 para predecir los resultados de Int1992.

       

      Int1992

      Int1995

      Int2000

      Int2006

      Int1992

      Int1995

      Int2000

      Int2006

      Fp1992

      Fp1995

      Fp2000

      Fp2006

      x (±y)

       

       

       

      x (±y)

       

      x (±y)

      x (±y)

       

       

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

       

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

       

      Fp1992

      Fp1995

      Fp2000

      Fp2006

      Int1992

      Int1995

      Int2000

      Int2006

      Fp1992

      Fp1995

      Fp2000

      Fp2006

      x (±y)

       

       

       

      x (±y)

      x (±y)

      x (±y)

       

       

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

       

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

      x (±y)

    10. ¿Qué se puede decir sobre las capacidades predictivas de estos modelos, a partir de los resultados del problema anterior? Por ejemplo, ¿qué tan bien un modelo desarrollado para los puntos de referencia enteros predice el desempeño en el mismo año de los puntos de referencia de punto flotante? ¿Qué pasa con las predicciones entre generaciones de referencia?

    11. En la discusión sobre la división de datos, definimos el valor f como la fracción del conjunto de datos completo utilizado en el conjunto de entrenamiento. Para el conjunto de datos Fp2000, graficar un intervalo de confianza del 95 por ciento para la media de delta para f = [0.1, 0.2,..., 0.9]. ¿Qué valor de f da el mejor resultado (es decir, el intervalo de confianza más pequeño)? Repita esta prueba n = 5 veces para ver cómo cambia el mejor valor de f.

    12. Repita el problema anterior, variando f para todos los demás conjuntos de datos.


      This page titled 8: Algunas cosas para probar Siguiente is shared under a CC BY-NC 4.0 license and was authored, remixed, and/or curated by David Lilja (University of Minnesota Libraries Publishing) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.