Saltar al contenido principal
LibreTexts Español

1.1: Preludio a Regresión Lineal

  • Page ID
    149843
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    La minería de datos es una frase que se ha utilizado popularmente para sugerir el proceso de búsqueda de información útil dentro de una gran colección de datos. Me gusta pensar que la minería de datos abarca una amplia gama de técnicas y herramientas estadísticas que se pueden utilizar para extraer diferentes tipos de información de sus datos. Qué técnica o herramienta en particular usar depende de tus objetivos específicos.

    Una de las más fundamentales de la amplia gama de técnicas de minería de datos que se han desarrollado es el modelado de regresión. El modelado de regresión consiste simplemente en generar un modelo matemático a partir de datos medidos. Se dice que este modelo explica un valor de salida dado un nuevo conjunto de valores de entrada. El modelado de regresión lineal es una forma específica de modelado de regresión que asume que la salida se puede explicar usando una combinación lineal de los valores de entrada.

    Un objetivo común para desarrollar un modelo de regresión es predecir cuál debe ser el valor de salida de un sistema para un nuevo conjunto de valores de entrada, dado que se tiene una colección de datos sobre sistemas similares. Por ejemplo, a medida que ganas experiencia manejando un automóvil, comenzaste a desarrollar un sentido intuitivo de cuánto tiempo te podría llevar conducir a algún lado si conoces el tipo de automóvil, el clima, una estimación del tráfico, la distancia, el estado de las carreteras, etc. Lo que realmente has hecho para hacer esta estimación del tiempo de conducción es construir un modelo de regresión multifactorial en tu mente. Las entradas a tu modelo son el tipo de auto, el clima, etc. La salida es cuánto tiempo te llevará conducir de un punto a otro. Cuando cambias alguna de las entradas, como un aumento repentino en el tráfico, automáticamente reestimas cuánto tiempo tardarás en llegar al destino.

    Este tipo de construcción y estimación de modelos es precisamente lo que vamos a aprender a hacer de manera más formal en este tutorial. Como ejemplo concreto, utilizaremos datos reales de rendimiento obtenidos de miles de mediciones de sistemas informáticos para desarrollar un modelo de regresión utilizando el paquete de software estadístico R. Aprenderás a desarrollar el modelo y a evaluar qué tan bien se ajusta a los datos. También aprenderás a usarlo para predecir el rendimiento de otros sistemas informáticos.

    Al pasar por este tutorial, recuerda que lo que estás desarrollando es solo un modelo. Esperemos que sea útil para entender el sistema y predecir resultados futuros. Sin embargo, no confundas un modelo con el sistema real. El sistema real siempre producirá los resultados correctos, independientemente de lo que el modelo pueda decir que deben ser los resultados.


    This page titled 1.1: Preludio a Regresión Lineal is shared under a CC BY-NC 4.0 license and was authored, remixed, and/or curated by David Lilja (University of Minnesota Libraries Publishing) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.