Saltar al contenido principal
LibreTexts Español

1.2: ¿Qué es un Modelo de Regresión Lineal?

  • Page ID
    149857
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Supongamos que hemos medido el rendimiento de varios sistemas informáticos diferentes utilizando algún programa estándar de referencia. Podemos organizar estas mediciones en una tabla, como los datos de ejemplo que se muestran en la Tabla 1.1. Los detalles de cada sistema se registran en una sola fila. Dado que medimos el rendimiento de n sistemas diferentes, necesitamos n filas en la tabla.

    Cuadro 1.1: Un ejemplo de datos de rendimiento del sistema informático.

    Sistema   Entradas   Salida
      Reloj (MHz) Caché (kB) Transistores (M) Rendimiento
    1 1500 64 2 98
    2 2000 128 2.5 134
    ... ... ... ... ...
    i ... ... ... ...
    n 1750 32 4.5 113

    La primera columna de esta tabla es el número de índice (o nombre) de 1 a n que hemos asignado arbitrariamente a cada uno de los diferentes sistemas medidos. Las columnas 2-4 son los parámetros de entrada. Estas se llaman las variables independientes para el sistema que vamos a modelar. Los valores específicos de la

    los parámetros de entrada fueron establecidos por el experimentador cuando se midió el sistema, o fueron determinados por la configuración del sistema. En cualquier caso, sabemos cuáles son los valores y queremos medir el rendimiento obtenido para estos valores de entrada. Por ejemplo, en el primer sistema, el reloj del procesador era de 1500 MHz, el tamaño de caché era de 64 kbytes, y el procesador contenía 2 millones de transistores. La última columna es el desempeño que se midió para este sistema cuando ejecutó un programa estándar de referencia. Nos referimos a este valor como la salida del sistema. Más técnicamente, esto se conoce como la variable dependiente del sistema o la respuesta del sistema.

    El objetivo del modelado de regresión es utilizar estas n mediciones independientes para determinar una función matemática, f (), que describe la relación entre los parámetros de entrada y la salida, tales como:

    performance = f (Reloj, Caché, Transistores)

    Esta función, que es solo una ecuación matemática ordinaria, es el modelo de regresión. Un modelo de regresión puede tomar cualquier forma. Sin embargo, nos limitaremos a una función que sea una combinación lineal de los parámetros de entrada. Explicaremos más adelante que, si bien la función es una combinación lineal de los parámetros de entrada, los parámetros en sí mismos no necesitan ser lineales. Esta combinación lineal se usa comúnmente en el modelado de regresión y es lo suficientemente potente como para modelar la mayoría de los sistemas que probablemente encontraremos.

    En el proceso de desarrollo de este modelo, descubriremos cuán importante es cada una de estas entradas para determinar el valor de salida. Por ejemplo, podríamos encontrar que el rendimiento depende en gran medida de la frecuencia del reloj, mientras que el tamaño de la caché y el número de transistores pueden ser mucho menos importantes. Incluso podemos encontrar que algunas de las entradas esencialmente no tienen impacto en la salida, lo que hace que sea completamente innecesario incluirlas en el modelo. También podremos utilizar el modelo que desarrollemos para predecir el rendimiento que esperaríamos ver en un sistema que tenga valores de entrada que no existían en ninguno de los sistemas que realmente medimos. Por ejemplo, el Cuadro 1.2 muestra tres nuevos sistemas que no formaban parte del conjunto de sistemas que previamente medimos. Podemos usar nuestro modelo de regresión para predecir el desempeño de cada uno de estos tres sistemas para reemplazar los signos de interrogación en la tabla.

    Cuadro 1.2: Un ejemplo en el que queremos predecir el desempeño de los nuevos sistemas n + 1, n + 2 y n + 3 utilizando los resultados previamente medidos de los otros n sistemas.

    Sistema   Entradas   Salida
      Reloj (MHz) Caché (kB) Transistores (M) Rendimiento
    1 1500 64 2 98
    2 2000 128 2.5 134
    ... ... ... ... ...
    i ... ... ... ...
    ... ... ... ... ...
    n 1750 32 4.5 113
    n + 1 2500 256 2.8 ?
    n + 2 1560 128 1.8 ?
    n + 3 900 64 1.5 ?

    Como punto final, tenga en cuenta que, dado que el modelo de regresión es una combinación lineal de los valores de entrada, los valores de los parámetros del modelo se escalarán automáticamente a medida que desarrollemos el modelo. Como resultado, las unidades utilizadas para las entradas y la salida son arbitrarias. De hecho, podemos reescalar los valores de las entradas y la salida antes de comenzar el proceso de modelado y aún así producir un modelo válido.


    This page titled 1.2: ¿Qué es un Modelo de Regresión Lineal? is shared under a CC BY-NC 4.0 license and was authored, remixed, and/or curated by David Lilja (University of Minnesota Libraries Publishing) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.