Saltar al contenido principal
LibreTexts Español

11.4: Regresión lineal multivariada

  • Page ID
    69324
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En el Capítulo 11.2 se utilizó un análisis de conglomerados de los espectros para 24 muestras medidas a 16 longitudes de onda para mostrar que se podían dividir las muestras en tres grupos distintos, especulando que las muestras contenían tres analitos y que en cada grupo uno de los analitos estaba presente a una concentración mayor que esa de los otros dos analitos. En el Capítulo 11.3 se utilizó un análisis de componentes principales del mismo conjunto de muestras para sugerir que los tres analitos son Cu 2 +, Cr 3 + y Co 2 +. En esta sección utilizaremos un análisis de regresión lineal multivariante para determinar la concentración de estos analitos en cada una de las 24 muestras.

    ¿Cómo Funciona una Calibración Usando Regresión Multivariada?

    En un análisis de regresión lineal simple, como se describe en el Capítulo 8, modelamos la relación entre una sola variable dependiente, y, y una única variable dependiente, x, usando la ecuación

    \[y = \beta_0 + \beta_1 x \nonumber \]

    donde y es un vector de respuestas medidas para la variable dependiente, donde x es un vector de valores para la variable independiente, donde\(\beta_0\) está la intercepción y esperada, y dónde\(\beta_1\) está la pendiente esperada. Por ejemplo, para completar una curva de calibración de la ley de Beer para un solo analito, donde A es la absorbancia y C es la concentración del analito

    \[ A = \epsilon b C \nonumber \]

    preparamos un conjunto de n soluciones estándar, cada una con una concentración conocida del analito y medimos la absorbancia para cada una de las soluciones estándar a una sola longitud de onda. Un análisis de regresión lineal devuelve valores para\(\epsilon b\), lo que nos permite determinar la concentración de analito en una muestra midiendo su absorbancia. Consulte el Capítulo 8 para una revisión de cómo completar un análisis de regresión lineal utilizando R.

    En una regresión lineal multivariada tenemos j variables dependientes, Y, y k variables independientes, X, y medimos la variable dependiente para cada uno de los n valores para las variables independientes; podemos representar esto usando notación matricial como

    \[ [ Y ]_{n \times j} = [X]_{n \times k} \times [\beta_1]_{k \times j} \nonumber \]

    En este caso, para completar una curva de calibración de la ley de Beer preparamos un conjunto de n soluciones estándar, cada una de las cuales contiene concentraciones conocidas de los k analitos, y medimos la absorbancia de cada patrón en cada una de las j longitudes de onda

    \[ [ A ]_{n \times j} = [C]_{n \times k} \times [\epsilon b]_{k \times j} \nonumber \]

    donde [A] es una matriz de valores de absorbancia, [C] es una matriz de concentraciones y [\(\epsilon b\)] es una matriz de\(\epsilon b\) valores para cada analito en cada longitud de onda.

    Debido a que el álgebra matricial no permite la división, resolvemos para [\(\epsilon b\)] primero multiplicando ambos lados de la ecuación por la transposición de la matriz de concentraciones

    \[ [C]_{k \times n}^{\text{T}} \times [ A ]_{n \times j} = [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \times [\epsilon b]_{k \times j} \nonumber \]

    y luego premultiplicar ambos lados de la ecuación por\( \left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)^{-1} \) para dar

    \[ \left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)^{-1} \times [C]_{k \times n}^{\text{T}} \times [ A ]_{n \times j} = \left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)^{-1} \times [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \times [\epsilon b]_{k \times j} \nonumber \]

    Multiplicar\(\left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)^{-1}\) por\(\left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)\) equivale a multiplicar un valor por su inverso, que es igual a 1; así, tenemos

    \[ \left( [C]_{k \times n}^{\text{T}} \times [C]_{n \times k} \right)^{-1} \times [C]_{k \times n}^{\text{T}} \times [ A ]_{n \times j} = [\epsilon b]_{k \times j} \nonumber \]

    Con la\(\epsilon b\) matriz en mano, podemos determinar la concentración de los analitos en un conjunto de muestras utilizando el mismo enfoque general, como se muestra aquí

    \[ [ A ]_{n \times j} = [C]_{n \times k} \times [\epsilon b]_{k \times j} \nonumber \]

    \[ [ A ]_{n \times j} \times [\epsilon b]_{j \times k}^{\text{T}} = [C]_{n \times k} \times [\epsilon b]_{k \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \nonumber \]

    \[ [ A ]_{n \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \times \left( [\epsilon b]_{k \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \right)^{-1} = [C]_{n \times k} \times [\epsilon b]_{k \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \times \left( [\epsilon b]_{k \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \right)^{-1} \nonumber \]

    \[ [ A ]_{n \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \times \left( [\epsilon b]_{k \times j} \times [\epsilon b]_{j \times k}^{\text{T}} \right)^{-1} = [C]_{n \times k} \nonumber \]

    Nota

    Completar estos cálculos a mano es una tarea; consulte el Capítulo 11.7 para ver cómo puede completar una regresión lineal multivariada usando R.

    ¿Cómo Evaluamos los Resultados de una Calibración Utilizando una Regresión Lineal Multivariada?

    Una forma de evaluar los resultados de una calibración basada en una regresión lineal multivariada es utilizarla para examinar los valores de cada analito a partir de la calibración y compararlos con los espectros de los analitos individuales; la forma de las dos gráficas debe ser similar.\(\epsilon b\) Otra forma de evaluar una calibración basada en una calibración de regresión multivariada es utilizarla para analizar un conjunto de muestras con concentraciones conocidas de los analitos.


    11.4: Regresión lineal multivariada is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.