Saltar al contenido principal
Library homepage
 
LibreTexts Español

12: Regresión lineal y correlación

  • Page ID
    153189
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El análisis de regresión es un proceso estadístico para estimar las relaciones entre variables e incluye muchas técnicas para modelar y analizar varias variables. Cuando el foco está en la relación entre una variable dependiente y una o más variables independientes.

    • 12.1: Preludio a Regresión Lineal y Correlación
      En este capítulo, estarás estudiando la forma más simple de regresión, la “regresión lineal” con una variable independiente (x). Esto implica datos que se ajustan a una línea en dos dimensiones. También estudiarás la correlación que mide qué tan fuerte es la relación.
    • 12.2: Ecuaciones lineales
      La regresión lineal para dos variables se basa en una ecuación lineal con una variable independiente. La ecuación tiene la forma: y=a+bx donde a y b son números constantes. La variable x es la variable independiente, e y es la variable dependiente. Normalmente, elige un valor para sustituir la variable independiente y luego resolver por la variable dependiente.
    • 12.3: Gráficas de dispersión
      Un diagrama de dispersión muestra la dirección de una relación entre las variables. Una dirección clara ocurre cuando hay: Valores altos de una variable que ocurren con valores altos de la otra variable o valores bajos de una variable que ocurren con valores bajos de la otra variable. Los valores altos de una variable ocurren con valores bajos de la otra variable.
    • 12.4: La ecuación de regresión
      Una línea de regresión, o una línea de mejor ajuste, puede dibujarse en un gráfico de dispersión y usarse para predecir resultados para las variables x e y en un conjunto de datos o datos de muestra dados. Hay varias formas de encontrar una línea de regresión, pero generalmente se usa la línea de regresión de mínimos cuadrados porque crea una línea uniforme. Los residuos miden la distancia desde el valor real de y y el valor estimado de y. La Suma de Errores Cuadrados, cuando se establece en su mínimo, calcula los puntos en la línea de mejor ajuste.
    • 12.5: Prueba de la significancia del coeficiente de correlación
      El coeficiente de correlación nos dice sobre la fuerza y dirección de la relación lineal entre x e y, sin embargo, la confiabilidad del modelo lineal también depende de cuántos puntos de datos observados haya en la muestra. Necesitamos observar tanto el valor del coeficiente de correlación r como el tamaño de muestra n, y realizar una prueba de hipótesis de la “significancia del coeficiente de correlación” para decidir si la relación lineal en los datos de muestra es lo suficientemente fuerte como para usarla en el modelo lineal.
    • 12.6: Predicción
      Después de determinar la presencia de un coeficiente de correlación fuerte y calcular la línea de mejor ajuste, puede usar la línea de regresión de mínimos cuadrados para hacer predicciones sobre sus datos. El proceso de predicción dentro de los valores x observados en los datos se denomina interpolación. El proceso de predicción fuera de los valores x observados en los datos se denomina extrapolación.
    • 12.7: Valores atípicos
      En algunos conjuntos de datos, hay valores (puntos de datos observados) llamados valores atípicos. Los valores atípicos son puntos de datos observados que están lejos de la línea de mínimos cuadrados. Tienen grandes “errores”, donde el “error” o residual es la distancia vertical de la línea al punto.
    • 12.8: Regresión - Distancia a la Escuela (Hoja de trabajo)
      Una hoja de trabajo de estadística: El alumno calculará y construirá la línea de mejor ajuste entre dos variables. El alumno evaluará la relación entre dos variables para determinar si esa relación es significativa.
    • 12.9: Regresión - Costo del libro de texto (Hoja de trabajo)
      Una hoja de trabajo de estadística: El alumno calculará y construirá la línea de mejor ajuste entre dos variables. El alumno evaluará la relación entre dos variables para determinar si esa relación es significativa.
    • 12.10: Regresión - Eficiencia de combustible (Hoja de trabajo)
      Una hoja de trabajo de estadística: El alumno calculará y construirá la línea de mejor ajuste entre dos variables. El alumno evaluará la relación entre dos variables para determinar si esa relación es significativa.
    • 12.E: Regresión lineal y correlación (Ejercicios)
      Estos son ejercicios de tarea para acompañar el Textmap creado para “Estadísticas Introductorias” por OpenStax.


    This page titled 12: Regresión lineal y correlación is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.