Saltar al contenido principal
LibreTexts Español

14.9: Análisis Residual

  • Page ID
    151889
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En regresión, asumimos que el modelo es lineal y que los errores residuales (\(Y-\hat{Y}\)para cada par) son aleatorios y normalmente distribuidos. Podemos analizar los residuos para ver si estos supuestos son válidos y si existen posibles valores atípicos. En particular:

    • Los residuos deben representar un modelo lineal.
    • El error estándar (desviación estándar de los residuos) no debe cambiar cuando el valor de\(X\) los cambios.
    • Los residuos deben seguir una distribución normal.
    • Busque cualquier valor extremo potencial de\(X\).
    • Busque cualquier error residual extremo.
    Ejemplo: Modelo A

    El modelo A es un ejemplo de un modelo de regresión lineal apropiado. Haremos tres gráficas para probar el residuo; una gráfica de dispersión con la línea de regresión, una gráfica de los residuos y un histograma de los residuos

    clipboard_e0f3484553d040945184d83fa04d44f05.png

    Aquí podemos ver el que los residuos parecen ser aleatorios, el ajuste es lineal, y el histograma tiene aproximadamente forma de campana. Además, no hay valores atípicos extremos\(X\) ni residuos atípicos.

    Ejemplo: Modelo B

    clipboard_e87a69dabce40ad311faf08fbe6246ef8.png

    El modelo B parece un ajuste fuerte, pero los residuales están mostrando un patrón de ser positivo para valores bajos y altos de\(X\) y negativos para valores medios de\(X\). Esto indica que el modelo no es lineal y debe ajustarse con un modelo de regresión no lineal (por ejemplo, la tercera gráfica muestra un modelo cuadrático).

    Ejemplo: Modelo C

    clipboard_efa74f1e3ecad651b7dc5bbef6fdce56b.png

    El modelo C tiene un ajuste lineal, pero los residuales están mostrando un patrón de ser más pequeños para valores bajos de\(X\) y mayores para valores grandes de\(X\). Esto viola la suposición de que el error estándar no debe cambiar cuando el valor de\(X\) los cambios. Este fenómeno se denomina heterocedasticidad y requiere una transformación de datos para encontrar un modelo más apropiado.

    Ejemplo: Modelo D

    clipboard_edaf2db1427c45603e2407e28d153fea5.png

    El modelo D parece tener un ajuste lineal, pero los residuales están mostrando un patrón de ser más grandes cuando son positivos y más pequeños cuando son negativos. Esto viola el supuesto de que los residuos deben seguir una distribución normal, como puede verse en el histograma.

    Ejemplo: Modelo E

    clipboard_ebd0eda7b597cd9ccabdbed640fd76364.png

    El modelo E parece tener un ajuste lineal, y los residuos parecen aleatorios y normales. Sin embargo, el valor (16,51) es un valor atípico extremo de\(X\) y puede tener una influencia indebida en la elección de la línea de regresión.

    Ejemplo: Modelo F

    clipboard_edd5471367664661d17c822772af70ede.png

    El modelo F parece tener un ajuste lineal, y los residuales parecen aleatorios y normales, excepto por un valor atípico en el valor (7,40). Este valor atípico es diferente al valor atípico extremo en el Modelo E, pero seguirá teniendo una influencia indebida en la elección de la línea de regresión.

     


    This page titled 14.9: Análisis Residual is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Maurice A. Geraghty via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.