Saltar al contenido principal
LibreTexts Español

7.2: Formas cuadráticas

  • Page ID
    115689
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Con nuestra comprensión de las matrices simétricas y la varianza en la mano, ahora exploraremos cómo determinar las direcciones en las que la varianza de un conjunto de datos es lo más grande posible y dónde es lo más pequeña posible. Esto es parte de una historia mucho más amplia que involucra un tipo de función, llamada forma cuadrática, que presentaremos aquí.

    Vista previa Actividad 7.2.1.

    Empecemos por mirar un ejemplo. Supongamos que tenemos tres puntos de datos que forman la matriz de datos degradada

    \ begin {ecuación*} A =\ begin {bmatrix} 2 & 1 & -3\\ 1 & 2 & -3\\ end {bmatrix}\ end {ecuación*}
    1. Trazar los puntos de datos degradados en la Figura 7.2.1. ¿En qué dirección la varianza parece ser mayor y en cuál parece ser la más pequeña?
    Figura 7.2.1. Utilice esta cuadrícula de coordenadas para trazar los puntos de datos degradados.
  • Construir la matriz de covarianza\(C\) y determinar la varianza en la dirección de\(\twovec11\) y la varianza en la dirección de\(\twovec{-1}1\text{.}\)
  • ¿Cuál es la varianza total de este conjunto de datos?
  • En términos generales, si\(C\) es la matriz de covarianza de un conjunto de datos y\(\mathbf u\) es un vector propio de\(C\) tener longitud unitaria y con valor propio asociado\(\lambda\text{,}\) lo que es\(V_{\mathbf u}\text{?}\)
  • Formas cuadráticas

    Dada una matriz\(A\) de puntos de\(N\) datos degradados, la matriz de covarianza simétrica\(C=\frac1N AA^T\) determina la varianza en una dirección particular

    \ begin {ecuación*} V_ {\ mathbf u} =\ mathbf u\ cdot (C\ mathbf u),\ end {ecuación*}

    donde\(\mathbf u\) es un vector unitario que define la dirección.

    De manera más general, una\(m\times m\) matriz simétrica\(A\) define una función\(q:\mathbb R^m \to \mathbb R\) mediante

    \ begin {ecuación*} q (\ mathbf x) =\ mathbf x\ cdot (A\ mathbf x). \ end {ecuación*}

    Observe que esta expresión es similar a la que usamos para encontrar la varianza\(V_{\mathbf u}\) en términos de la matriz de covarianza\(C\text{.}\) La única diferencia es que\(\mathbf x\) permitimos ser cualquier vector en lugar de requerir que sea un vector unitario.

    Ejemplo 7.2.2

    Supongamos que\(A=\begin{bmatrix} 1 & 2\\ 2 & 1 \end{bmatrix} \text{.}\) si escribimos\(\mathbf x=\twovec{x_1}{x_2}\text{,}\) entonces tenemos

    \ begin {alinear*} q\ left (\ twovec {x_1} {x_2}\ derecha) & =\ twovec {x_1} {x_2}\ cdot\ izquierda (\ begin {bmatrix} 1 & 2\\ 2 & 1\ end {bmatrix}\ twovec {x_1} {x_2}\ derecha)\\ & =\ dos c {x_1} {x_2}\ cdot\ dovec {x_1 + 2x_2} {2x_1 + x_2}\\ & = x_1^2 + 2x_1x_2 + 2x_1x_2 + x_2^2\\ & = x_1^2 + 4x_1x_2 + x _2^2. \ end {align*}

    Podemos evaluar la forma cuadrática usando algunos vectores de entrada:

    \ begin {ecuation*} q\ left (\ twovec 10\ right) = 1,\ hspace {24pt} q\ left (\ twovec 11\ right) = 6,\ hspace {24pt} q\ left (\ twovec 24\ right) = 52. \ end {ecuación*}

    Observe que el valor de la forma cuadrática es un escalar.

    Definición 7.2.3

    Si\(A\) es una\(m\times m\) matriz simétrica, la forma cuadrática definida por\(A\) es la función\(q_A(\mathbf x) = \mathbf x\cdot(A\mathbf x)\text{.}\)

    Actividad 7.2.2.

    Veamos algunos ejemplos más de formas cuadráticas.

    1. Considerar la matriz simétrica\(D = \begin{bmatrix} 3 & 0 \\ 0 & -1 \\ \end{bmatrix} \text{.}\) Escribe la forma cuadrática\(q_D(\mathbf x)\) definida por\(D\) en términos de los componentes de\(\mathbf x=\twovec{x_1}{x_2}\text{.}\) Cuál es el valor de\(q_D\left(\twovec2{-4}\right)\text{?}\)
    2. Dada la matriz simétrica\(A=\begin{bmatrix} 2 & 5 \\ 5 & -3 \end{bmatrix} \text{,}\) escribir la forma cuadrática\(q_A(\mathbf x)\) definida por\(A\) y evaluar\(q_A\left(\twovec{2}{-1}\right)\text{.}\)
    3. Supongamos que\(q\left(\twovec{x_1}{x_2}\right) = 3x_1^2 - 4x_1x_2 + 4x_2^2\text{.}\) Encontrar una matriz simétrica\(A\) tal que\(q\) es la forma cuadrática definida por\(A\text{.}\)
    4. Supongamos que\(q\) es una forma cuadrática y que\(q(\mathbf x) = 3\text{.}\) ¿Qué es\(q(2\mathbf x)\text{?}\)\(q(-\mathbf x)\text{?}\)\(q(10\mathbf x)\text{?}\)
    5. Supongamos que\(A\) es una matriz simétrica y\(q_A(\mathbf x)\) es la forma cuadrática definida por\(A\text{.}\) Supongamos que\(\mathbf x\) es un vector propio de\(A\) con valor propio asociado -4 y con longitud 7. Qué es\(q_A(\mathbf x)\text{?}\)

    El álgebra lineal se trata principalmente de cosas que son lineales. Sin embargo, las formas cuadráticas, como su nombre lo indica, tienen un carácter claramente no lineal. Primero, si\(A=\begin{bmatrix} a & b \\ b & c \end{bmatrix}\text{,}\) es una matriz simétrica, entonces la forma cuadrática asociada es

    \ begin {ecuación*} Q_a\ left (\ twovec {x_1} {x_2}\ right) = ax_1^2 + 2bx_1x_2 + cx_2^2. \ end {ecuación*}

    Observe cómo las incógnitas\(x_1\) y\(x_2\) se multiplican juntas, lo que nos dice que esta no es una función lineal.

    Esta expresión asume una forma especialmente simple cuando\(D\) es una matriz diagonal. En particular, si\(D = \begin{bmatrix} a & 0 \\ 0 & c \\ \end{bmatrix} \text{,}\) entonces\(q_D\left(\twovec{x_1}{x_2}\right) = ax_1^2 + cx_2^2\text{.}\) Esto es especial porque no hay intertérmino que implique\(x_1x_2\text{.}\)

    Recuerde que las transformaciones matriciales tienen la propiedad de que las formas\(T(s\mathbf x) = sT(\mathbf x)\text{.}\) cuadráticas se comportan de

    \ begin {ecuación*} Q_a (s\ mathbf x) = (s\ mathbf x)\ cdot (A (s\ mathbf x)) = s^2\ mathbf x\ cdot (A\ mathbf x) = s^2q_a (\ mathbf x). \ end {ecuación*}

    Por ejemplo, cuando multiplicamos\(\mathbf x\) por el escalar 2, entonces\(q_A(2\mathbf x) = 4q_A(\mathbf x)\text{.}\) también, notamos que\(q_A(-\mathbf x) = q_A(\mathbf x)\) ya que el escalar está al cuadrado.

    Finalmente, evaluar una forma cuadrática sobre un vector propio tiene una forma particularmente simple. Supongamos que\(\mathbf x\) es un vector propio de\(A\) con autovalor asociado\(\lambda\text{.}\) Tenemos entonces

    \ begin {ecuación*} q_a (\ mathbf x) =\ mathbf x\ cdot (A\ mathbf x) =\ lambda\ mathbf x\ cdot\ mathbf x =\ lambda\ len {\ mathbf x} ^2. \ end {ecuación*}

    Volvamos ahora a nuestra pregunta motivadora: en qué dirección\(\mathbf u\) está la varianza\(V_{\mathbf u}=\mathbf u\cdot(C\mathbf u)\) de un conjunto de datos lo más grande posible y en cuál es lo más pequeña posible. Recordando que el vector\(\mathbf u\) es un vector unitario, ahora podemos exponer una forma más general de esta pregunta: ¿Si\(q_A(\mathbf x)\) es una forma cuadrática, para qué vectores unitarios\(\mathbf u\) es lo más grande\(q_A(\mathbf u)=\mathbf u\cdot(A\mathbf u)\) posible y para cuál es lo más pequeña posible? Dado que un vector unitario especifica una dirección, a menudo pediremos las direcciones en las que la forma cuadrática\(q(\mathbf x)\) está en su valor máximo o mínimo.

    Actividad 7.2.3.

    Podemos obtener cierta intuición sobre este problema graficando la forma cuadrática y prestando especial atención a los vectores unitarios.

    1. Evaluando la siguiente celda define la matriz\(D = \begin{bmatrix} 3 & 0 \\ 0 & -1 \end{bmatrix}\) y muestra la gráfica de la forma cuadrática asociada\(q_D(\mathbf x)\text{.}\) Además, los puntos correspondientes a vectores\(\mathbf u\) con longitud unitaria se muestran como una curva.
      Observe que la matriz\(D\) es diagonal. ¿En qué direcciones tiene la forma cuadrática sus valores máximo y mínimo?
    2. Escribe la forma cuadrática\(q_D\) asociada a\(D\text{.}\) Cuál es el valor de\(q_D\left(\twovec10\right)\text{?}\) Cuál es el valor de\(q_D\left(\twovec01\right)\text{?}\)
    3. Consideremos un vector unitario\(\mathbf u=\twovec{u_1}{u_2}\) para que\(u_1^2+u_2^2 = 1\text{,}\) una expresión podamos reescribir como\(u_1^2 = 1-u_2^2\text{.}\) Escribe la forma cuadrática\(q_D(\mathbf u)\) y reemplazarla\(u_1^2\) por\(1-u_2^2\text{.}\) Ahora explica por qué el máximo de\(q_D(\mathbf u)\) es 3. ¿En qué dirección ocurre el máximo? ¿Esto concuerda con lo que observaste en la gráfica anterior?
    4. Escribe la forma cuadrática\(q_D(\mathbf u)\) y reemplaza\(u_2^2\) por\(1-u_1^2\text{.}\) ¿Cuál es el valor mínimo de\(q_D(\mathbf u)\) y en qué dirección ocurre el mínimo?
    5. Usa la celda Sage anterior para cambiar la matriz a\(A=\begin{bmatrix} 1 & 2 \\ 2 & 1 \end{bmatrix}\) y mostrar la gráfica de la forma cuadrática\(q_A(\mathbf x) = \mathbf x\cdot(A\mathbf x)\text{.}\) Determinar las direcciones en las que ocurren el máximo y el mínimo?
    6. Recuerde que\(A=\begin{bmatrix} 1 & 2 \\ 2 & 1 \end{bmatrix}\) es simétrico de manera que\(A=QDQ^T\) donde\(D\) está la matriz diagonal arriba y\(Q\) es la matriz ortogonal que gira vectores por\(45^\circ\text{.}\) Observe que
      \ begin {ecuación*} Q_a (\ mathbf u) =\ mathbf u\ cdot (A\ mathbf u) =\ mathbf u\ cdot (QDQ^T\ mathbf u) = (Q^T\ mathbf u)\ cdot (DQ^T\ mathbf u) = Q_d (\ mathbf v)\ end {ecuación*}

      donde es\(\mathbf v=Q^T\mathbf u\text{.}\) decir, tenemos\(q_A(\mathbf u) = q_D(\mathbf v)\text{.}\)

      Explicar por qué también\(\mathbf v = Q^T\mathbf u\) es un vector unitario; es decir, explicar por qué

      \ begin {ecuación*} |\ mathbf v|^2 = |Q^T\ mathbf u|^2 = (Q^T\ mathbf u)\ cdot (Q^T\ mathbf u) = 1. \ end {ecuación*}
    7. Utilizando el hecho de que\(q_A(\mathbf u) = q_D(\mathbf v)\text{,}\) explicar cómo ahora conocemos el valor máximo de\(q_A(\mathbf u)\) es 3 y determinar la dirección en la que se produce. También, determinar el valor mínimo de\(q_A(\mathbf u)\) y determinar la dirección en la que se produce.

    Esta actividad demuestra cómo los valores propios de\(A\) determinar los valores máximo y mínimo de la forma cuadrática\(q_A(\mathbf u)\) cuando se evalúan en vectores unitarios y cómo los vectores propios asociados determinan las direcciones en las que ocurren los valores máximo y mínimo. Veamos otro ejemplo para que esta conexión sea clara.

    Ejemplo 7.2.4

    Considera la matriz simétrica\(A=\begin{bmatrix} -7 & -6 \\ -6 & 2 \\ \end{bmatrix}\text{.}\) Porque\(A\) es simétrica, sabemos que puede ser ortogonalmente diagonalizada. De hecho, tenemos\(A=QDQ^T\) donde

    \ begin {ecuation*} D =\ begin {bmatrix} 5 & 0\\ 0 & -10\\\ end {bmatrix},\ hspace {24pt} Q =\ begin {bmatrix} 1/\ sqrt {5} & 2/\ sqrt {5}\\ -2/\ sqrt {5} & 1/\ sqrt {5}\\ end {bmatrix}\ text {}. \ end {ecuación*}

    A partir de esta diagonalización, sabemos que\(\lambda_1=5\) es el valor propio más grande de\(A\) con el vector propio asociado\(\mathbf u_1 = \twovec{1/\sqrt{5}}{-2/\sqrt{5}}\) y que\(\lambda_2 = -10\) es el valor propio más pequeño con el vector propio asociado\(\mathbf u_2 = \twovec{2/\sqrt{5}}{1/\sqrt{5}}\text{.}\)

    Primero estudiemos la forma cuadrática\(q_D(\mathbf u) = 5u_1^2 - 10u_2^2\) porque la ausencia del término cruzado la hace comparativamente simple. Recordando que\(\mathbf u\) es un vector unitario, tenemos lo\(u_1^2+u_2^2=1\text{,}\) que significa que\(u_1^2 = 1-u_2^2\text{.}\) Por lo tanto,

    \ begin {ecuación*} Q_d (\ mathbf u) = 5u_1^2 - 10u_2^2 = 5 (1-u_2^2) -10u_2^2 = 5 - 15u_2^2\ texto {.} \ end {ecuación*}

    Esto nos dice que\(q_D(\mathbf u)\) tiene un valor máximo del\(5\text{,}\) cual ocurre cuando\(u_2=0\) o en la dirección\(\twovec10\text{.}\)

    De la misma manera, la reescritura nos\(u_2^2 = 1-u_1^2\) permite concluir que el valor mínimo de\(q_D(\mathbf u)\) es el\(-10\text{,}\) que ocurre en la dirección\(\twovec01\text{.}\)

    Volvamos ahora a la matriz\(A\) cuya forma cuadrática\(q_A\) está relacionada\(q_D\) porque\(A = QDQ^T\text{.}\) En particular, tenemos

    \ begin {ecuación*} Q_a (\ mathbf u) =\ mathbf u\ cdot (A\ mathbf u) =\ mathbf u\ cdot (QDQ^T\ mathbf u) = (Q^T\ mathbf u)\ cdot (DQ^T\ mathbf u) =\ mathbf v\ cdot (D\ mathbf v) = Q_d (\ mathbf v)\ texto {.} \ end {ecuación*}

    Es decir, tenemos\(q_A(\mathbf u) = q_D(\mathbf v)\) donde\(\mathbf v=Q^T\mathbf u\text{.}\) Esto es bastante útil porque nos permite relacionar los valores de\(q_A\) con aquellos de los\(q_D\text{,}\) que ya entendemos bastante bien.

    Ahora resulta que también\(\mathbf v\) es un vector unitario porque

    \ begin {ecuación*} |\ mathbf v|^2 =\ mathbf v\ cdot\ mathbf v = (Q^T\ mathbf u)\ cdot (Q^T\ mathbf u) =\ mathbf u\ cdot (QQ^T\ mathbf u) =\ mathbf u\ cdot\ mathbf u = |\ mathbf u|^2 = 1\ texto. \ end {ecuación*}

    Por lo tanto, el valor máximo de\(q_A(\mathbf u)\) es el mismo\(q_D(\mathbf v)\text{,}\) que sabemos ser\(5\) y que ocurre en la dirección\(\mathbf v=\twovec10\text{.}\) Esto quiere decir que el valor máximo de\(q_A(\mathbf u)\) es también\(5\) y que esto ocurre en la dirección Ahora\(\mathbf u = Q\mathbf v = Q\twovec10 = \twovec{1/\sqrt{5}}{-2/\sqrt{5}}\text{.}\) sabemos que el valor máximo de \(q_A(\mathbf u)\)es el valor propio más grande\(\lambda_1=5\) y que este valor máximo se produce en la dirección de un autovector asociado.

    De la misma manera, vemos que el valor mínimo de\(q_A(\mathbf u)\) es el valor propio más pequeño\(\lambda_2=-10\) y que este mínimo ocurre en la dirección de\(\mathbf u=Q\twovec01 = \twovec{2/\sqrt{5}}{1/\sqrt{5}}\text{,}\) un vector propio asociado.

    De manera más general, tenemos

    Proposición 7.2.5.

    Supongamos que\(A\) es una matriz simétrica, que enumeramos sus valores propios en orden decreciente\(\lambda_1 \geq \lambda_2 \ldots \geq \lambda_m\text{,}\) y que\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_m\) es una base de vectores propios asociados. El valor máximo de\(q_A(\mathbf u)\) entre todos los vectores unitarios\(\mathbf u\) es el\(\lambda_1\text{,}\) que ocurre en las direcciones\(\mathbf u_1\text{.}\) Del mismo modo, el valor mínimo de\(q_A(\mathbf u)\) es el\(\lambda_m\text{,}\) que ocurre en las direcciones\(\mathbf u_m\text{.}\)

    Ejemplo 7.2.6

    Supongamos que\(A\) es la matriz simétrica\(A=\begin{bmatrix} 0 & 6 & 3 \\ 6 & 3 & 6 \\ 0 & 6 & 6 \\ \end{bmatrix}\text{,}\) que puede estar ortogonalmente diagonalizada como\(A=QDQ^T\) donde

    \ begin {ecuation*} D =\ begin {bmatrix} 12 & 0 & 0\\ 0 & 3 & 0\\ 0 & 0 & 0 & -6\\\ end {bmatrix},\ hspace {24pt} Q =\ begin {bmatrix} 1/3 & 2/3 & 2/3\\ 2/3 & 1/3 & -2/3 & -2/3 & -2/3 & 1/3\\ end {bmatrix}\ text {.} \ end {ecuación*}

    Vemos que el valor máximo de\(q_A(\mathbf u)\) es 12, que ocurre en la dirección\(\threevec{1/3}{2/3}{2/3}\text{,}\) y el valor mínimo es -6, que ocurre en la dirección\(\threevec{2/3}{-2/3}{1/3}\text{.}\)

    Ejemplo 7.2.7

    Supongamos que tenemos la matriz de puntos de datos degradados\(A = \begin{bmatrix} 2 & 1 & -3 \\ 1 & 2 & -3 \\ \end{bmatrix}\) que consideramos en Vista previa Actividad 7.2.1. Los puntos de datos se muestran en la Figura 7.2.8.

    Figura 7.2.8. El conjunto de puntos de datos degradados de la Actividad Previa 7.2.1.

    Consructing la matriz de covarianza\(C=\frac13~AA^T\) da\(C=\begin{bmatrix} 14/3 & 13/3 \\ 13/3 & 14/3 \end{bmatrix}\text{,}\) que tiene valores propios\(\lambda_1 = 9\text{,}\) con autovector asociado\(\twovec{1/\sqrt{2}}{1/\sqrt{2}}\text{,}\) y\(\lambda_2=1/3\text{,}\) con vector propio asociado\(\twovec{-1/\sqrt{2}}{1/\sqrt{2}}\text{.}\)

    Recuerde que la varianza en una dirección\(\mathbf u\) es\(V_{\mathbf u} = \mathbf u\cdot(C\mathbf u) = q_C(\mathbf u)\text{.}\) Por lo tanto, la varianza alcanza un valor máximo de 9 en la dirección\(\twovec{1/\sqrt{2}}{1/\sqrt{2}}\) y un valor mínimo de 1/3 en la dirección\(\twovec{-1/\sqrt{2}}{1/\sqrt{2}}\text{.}\) La Figura 7.2.9 muestra los datos proyectados sobre las líneas definidas por estos vectores.

    Figura 7.2.9. Los datos degradados de Preview Activity 7.2.1 se muestran proyectados sobre las líneas de varianza máxima y mínima.

    Recuerde que la varianza es aditiva, como se indica en la Proposición 7.1.16, la cual nos dice que la varianza total es\(V = 9 + 1/3 = 28/3\text{.}\)

    Nos hemos centrado en encontrar las direcciones en las que una forma cuadrática alcanza sus valores máximos y mínimos, pero hay otra observación importante que hacer después de esta actividad. Recordemos cómo usamos el hecho de que una matriz simétrica es ortogonalmente diagonalizable: si\(A=QDQ^T\text{,}\) entonces\(q_A(\mathbf u) = q_D(\mathbf v)\) donde\(\mathbf v = Q^T\mathbf u\text{.}\)

    De manera más general, si\(\yvec = Q^T\mathbf x\text{,}\) definimos tenemos

    \ begin {ecuación*} Q_a (\ mathbf x) =\ mathbf x\ cdot (A\ mathbf x) =\ mathbf x\ cdot (QDQ^T\ mathbf x) = (Q^T\ mathbf x)\ cdot (DQ^T\ mathbf x) =\ yvec\ cdot (D\ yvec) = Q_d (\ yvec)\ end {ecuación*}

    Recordando que la forma cuadrática asociada a una forma diagonal no tiene términos cruzados, obtenemos

    \ begin {ecuación*} Q_a (\ mathbf x) = Q_d (\ yvec) =\ lambda_1y_1^2 +\ lambda_2y_2^2 +\ ldots +\ lambda_mi_m^2. \ end {ecuación*}

    Es decir, después de un cambio de coordenadas, la forma cuadrática se\(q_A\) puede escribir sin términos cruzados. Esto se conoce como el Teorema de los Ejes Principales.

    Pondremos esto en uso en la siguiente sección.

    Matrices simétricas definidas

    Si bien nuestras preguntas sobre la varianza proporcionan cierta motivación para explorar formas cuadráticas, estas funciones aparecen en una variedad de otros contextos por lo que vale la pena pasar un poco más de tiempo con ellas. Por ejemplo, las formas cuadráticas aparecen en el cálculo multivariable al describir el comportamiento de una función de varias variables cerca de un punto crítico y en la física al describir la energía cinética de un cuerpo rígido.

    La siguiente definición será importante en esta sección.

    Definición 7.2.11

    Una matriz simétrica\(A\) se llama definitiva positiva si su forma cuadrática asociada satisface\(q_A(\mathbf x) \gt 0\) para cualquier vector distinto de cero\(\mathbf x\text{.}\) Si\(q_A(\mathbf x) \geq 0\) para vectores distintos de cero\(\mathbf x\text{,}\) decimos que\(A\) es semidefinito positivo.

    Así mismo, decimos que\(A\) es negativo definido si\(q_A(\mathbf x) \lt 0\) para cualquier vector distinto de cero\(\mathbf x\text{.}\)

    Por último,\(A\) se llama indefinido si\(q_A(\mathbf x) \gt 0\) para unos\(\mathbf x\) y\(q_A(\mathbf x) \lt 0\) para otros.

    Actividad 7.2.4.

    Esta actividad explora la relación entre los valores propios de una matriz simétrica y su definición.

    1. Considera la matriz diagonal\(D=\begin{bmatrix} 4 & 0 \\ 0 & 2 \\ \end{bmatrix}\) y escribe su forma cuadrática\(q_D(\mathbf x)\) en términos de los componentes de\(\mathbf x=\twovec{x_1}{x_2}\text{.}\) ¿Cómo te ayuda esto a decidir si\(D\) es positivo definido o no?
    2. Ahora considera\(D=\begin{bmatrix} 4 & 0 \\ 0 & 0 \\ \end{bmatrix}\) y escribe su forma cuadrática\(q_D(\mathbf x)\) en términos de\(x_1\) y\(x_2\text{.}\) ¿Qué puedes decir sobre la definición de\(D\text{?}\)
    3. Si\(D\) es una matriz diagonal, qué condición en las entradas diagonales garantizan que\(D\) es
      1. ¿definitiva positiva?
      2. semidefinito positivo?
      3. negativo definido?
      4. semidefinito negativo?
      5. indefinido?
    4. Supongamos que\(A\) es una matriz simétrica con valores propios 4 y 2 para que\(A=QDQ^T\) donde\(D=\begin{bmatrix}4 & 0 \\ 0 & 2 \end{bmatrix}\text{.}\) Si\(\yvec = Q^T\mathbf x\text{,}\) entonces tenemos\(q_A(\mathbf x) = q_D(\yvec)\text{.}\) Explicar por qué esto nos dice que\(A\) es positivo definido.
    5. Supongamos que\(A\) es una matriz simétrica con valores propios 4 y 0. ¿Qué se puede decir sobre la definición de\(A\) en este caso?
    6. ¿Qué condición sobre los valores propios de una matriz simétrica\(A\) garantiza que\(A\) es
      1. ¿definitiva positiva?
      2. semidefinito positivo?
      3. negativo definido?
      4. semidefinito negativo?
      5. indefinido?

    Como se ve en esta actividad, es sencillo determinar la definición de una matriz diagonal. Por ejemplo, si\(D=\begin{bmatrix} 7 & 0 \\ 0 & 5 \end{bmatrix}\text{,}\) entonces

    \ begin {ecuación*} Q_d (\ mathbf x) = 7x_1^2 + 5x_2^2. \ end {ecuación*}

    Esto demuestra que\(q_D(\mathbf x) \gt 0\) cuando cualquiera\(x_1\) o no\(x_2\) es cero por lo que concluimos que\(D\) es positivo definitivo. De la misma manera, vemos que\(D\) es semidefinito positivo si todas las entradas diagonales son no negativas.

    Comprender este comportamiento para matrices diagonales nos permite comprender matrices simétricas más generales. Como vimos anteriormente, la forma cuadrática para una matriz simétrica\(A=QDQ^T\) concuerda con la forma cuadrática para la matriz diagonal\(D\) después de un cambio de coordenadas. En particular,

    \ begin {ecuación*} Q_a (\ mathbf x) = Q_d (\ yvec)\ end {ecuación*}

    donde\(\yvec=Q^T\mathbf x\text{.}\) Ahora las entradas diagonales de\(D\) son los valores propios\(A\) de los cuales concluimos que\(q_A(\mathbf x) \gt 0\) si todos los valores propios de\(A\) son positivos. Asimismo,\(q_A(\mathbf x)\geq 0\) si todos los valores propios son no negativos.

    Proposición 7.2.12.

    Una matriz simétrica es positiva definida si todos sus valores propios son positivos. Es semidefinito positivo si todos sus valores propios son no negativos.

    Asimismo, una matriz simétrica es indefinida si algunos valores propios son positivos y otros negativos.

    Ahora aplicaremos lo que hemos aprendido sobre las formas cuadráticas para estudiar la naturaleza de los puntos críticos en el cálculo multivariable. El resto de esta sección asume que el lector está familiarizado con ideas del cálculo multivariable y puede ser omitido por otros.

    Primero, supongamos que\(f(x,y)\) es una función diferenciable. Utilizaremos\(f_x\) y\(f_y\) para denotar las derivadas parciales de\(f\) con respecto a\(x\) y\(y\text{.}\) Similarmente,\(f_{xx}\text{,}\)\(f_{xy}\text{,}\)\(f_{yx}\) y\(f_{yy}\) denotar las segundas derivadas parciales. Puede recordar que los parciales mixtos,\(f_{xy}\) y\(f_{yx}\) son iguales bajo una suposición leve sobre la función\(f\text{.}\) Una pregunta típica en el cálculo es determinar dónde esta función tiene sus valores máximo y mínimo.

    Cualquier máximo o mínimo local de\(f\) aparece en un punto crítico\((x_0,y_0)\) donde

    \ begin {ecuación*} f_x (x_0, y_0) = 0,\ hspace {24pt} f_y (x_0, y_0) = 0. \ end {ecuación*}

    Cerca de un punto crítico, la aproximación cuadrática de nos\(f\) dice que

    \ begin {align*} f (x, y)\ approx f (x_0, y_0) & +\ frac12 f_ {xx} (x_0, y_0) (x-x_0) ^2\\ & + f_ {xy} (x_0, y_0) (x-x_0) (y-y_0) +\ frac12 f_ {yy} (x_0, y_0) (y-y_0) ^2. \ end {align*}

    Actividad 7.2.5.

    Exploremos cómo nuestra comprensión de las formas cuadráticas nos ayuda a determinar el comportamiento de una función\(f\) cerca de un punto crítico.

    1. Considere la función\(f(x,y) = 2x^3 - 6xy + 3y^2\text{.}\) Buscar las derivadas parciales\(f_{x}\)\(f_y\) y utilizar estas expresiones para determinar los puntos críticos de\(f\text{.}\)
    2. Evaluar las segundas derivadas parciales\(f_{xx}\text{,}\)\(f_{xy}\text{,}\) y\(f_{yy}\text{.}\)
    3. Primero consideremos el punto crítico\((1,1)\text{.}\) Use la aproximación cuadrática como se escribió anteriormente para encontrar una expresión que se aproxime\(f\) cerca del punto crítico.
    4. Usando el vector\(\mathbf w = \twovec{x-1}{y-1}\text{,}\) reescribe tu aproximación como
      \ comenzar {ecuación*} f (x, y)\ f aprox (1,1) + Q_a (\ mathbf w)\ final {ecuación*}

      para alguna matriz\(A\text{.}\) ¿Cuál es la matriz\(A\) en este caso?

    5. Encuentra los valores propios de\(A\text{.}\) ¿Qué puedes concluir sobre la definición de\(A\text{?}\)
    6. Recordemos que\((x_0,y_0)\) es un mínimo local para\(f\) si\(f(x,y) \gt f(x_0,y_0)\) para puntos cercanos\((x,y)\text{.}\) Explique por qué nuestra comprensión de los valores propios de\(A\) espectáculos que\((1,1)\) es un mínimo local para\(f\text{.}\)

    Cerca de un punto crítico\((x_0,y_0)\) de una función\(f(x,y)\text{,}\) podemos escribir

    \ comenzar {ecuación*} f (x, y)\ f aprox (x_0, y_0) + Q_a (\ mathbf w)\ final {ecuación*}

    donde\(\mathbf w = \twovec{x-x_0}{y-y_0}\) y\(A = \frac12 \begin{bmatrix} f_{xx}(x_0,y_0) & f_{xy}(x_0,y_0) \\ f_{yx}(x_0,y_0) & f_{yy}(x_0,y_0) \end{bmatrix}\text{.}\) Si\(A\) es positivo definitivo, entonces\(q_A(\mathbf w) \gt 0\text{,}\) lo que nos dice que

    \ begin {ecuación*} f (x, y)\ f aprox (x_0, y_0) + Q_a (\ mathbf w)\ gt f (x_0, y_0)\ end {ecuación*}

    y que el punto crítico\((x_0,y_0)\) es, por tanto, un mínimo local.

    La matriz

    \ begin {ecuación*} H =\ begin {bmatrix} f_ {xx} (x_0, y_0) & f_ {xy} (x_0, y_0)\\ f_ {yx} (x_0, y_0) & f_ {yy} (x_0, y_0)\ end {bmatrix}\ end {ecuación*}

    se llama el hessiano de\(f\text{,}\) y vemos ahora que los valores propios de esta matriz simétrica determinan la naturaleza del punto crítico\((x_0,y_0)\text{.}\) En particular, si los valores propios son ambos positivos, entonces\(q_H\) es positivo definido, y el punto crítico es un mínimo local.

    Esta observación conduce a la Segunda Prueba Derivada para funciones multivariables.

    Proposición 7.2.13. Segunda Prueba Derivada.

    La naturaleza de un punto crítico de una función multivariable está determinada por el hessian\(H\) de la función en el punto crítico. Si

    • \(H\)tiene todos los valores propios positivos, el punto crítico es un mínimo local.
    • \(H\)tiene todos los valores propios negativos, el punto crítico es un máximo local.
    • \(H\)tiene valores propios tanto positivos como negativos, el punto crítico no es ni un máximo local ni mínimo.

    La mayoría de los textos de cálculo multivariables asumen que el lector no está familiarizado con el álgebra lineal y así escribir la segunda prueba derivada para funciones de dos variables en términos de\(D=\det(H)\text{.}\) If

    • \(D \gt 0\)y\(f_{xx}(x_0,y_0)) \gt 0\text{,}\) luego\((x_0, y_0)\) es un mínimo local.
    • \(D \gt 0\)y\(f_{xx}(x_0,y_0)) \lt 0\text{,}\) luego\((x_0, y_0)\) es un máximo local.
    • \(D \lt 0\text{,}\)entonces no\((x_0,y_0)\) es ni un máximo local ni mínimo.

    Las condiciones en esta versión de la segunda prueba derivada son simplemente criterios algebraicos que nos hablan de la definición de la matriz de Hessian\(H\text{.}\)

    Resumen

    En esta sección se exploraron formas cuadráticas, funciones que son definidas por matrices simétricas.

    • Si\(A\) es una matriz simétrica, entonces la forma cuadrática definida por\(A\) es la función\(q_A(\mathbf x) = \mathbf x\cdot(A\mathbf x)\text{.}\)

      Las formas cuadráticas aparecen al estudiar la varianza de un conjunto de datos. Si\(C\) es la matriz de covarianza, entonces la varianza en la dirección definida por un vector unitario\(\mathbf u\) es\(q_C(\mathbf u) = \mathbf u\cdot(C\mathbf u)=V_{\mathbf u}\text{.}\)

      De igual manera, las formas cuadráticas aparecen en el cálculo multivariable al analizar el comportamiento de una función de varias variables cercanas a un punto crítico.

    • Si\(\lambda_1\) es el valor propio más grande de una matriz simétrica\(A\) y\(\lambda_m\) el más pequeño, entonces el valor máximo de\(q_A(\mathbf u)\) entre vectores unitarios\(\mathbf u\text{,}\) es\(\lambda_1\text{,}\) y este valor máximo ocurre en la dirección de\(\mathbf u_1\text{,}\) un vector propio unitario asociado a\(\lambda_1\text{.}\)

      Del mismo modo, el valor mínimo de\(q_A(\mathbf u)\) es el\(\lambda_m\text{,}\) que aparece en la dirección de\(\mathbf u_m\text{,}\) un vector propio asociado a\(\lambda_m\text{.}\)

    • Una matriz simétrica es positiva definida si sus valores propios son todos positivos, semidefinita positiva si sus valores propios son todos no negativos, e indefinida si tiene valores propios positivos y negativos.
    • Si el hessian\(H\) de una función multivariable\(f\) es positivo definido en un punto crítico, entonces el punto crítico es un mínimo local. De igual manera, si el hessiano es negativo definido, el punto crítico es un máximo local.

    Ejercicios 7.2.4Ejercicios

    1

    Supongamos que\(A = \begin{bmatrix} 4 & 2 \\ 2 & 7 \end{bmatrix}\text{.}\)

    1. Encuentra una diagonalización ortogonal de\(A\text{.}\)
    2. Evaluar la forma cuadrática\(q_A\left(\twovec11\right)\text{.}\)
    3. Encuentra el vector de unidad\(\mathbf u\) para el cual\(q_A(\mathbf u)\) es lo más grande posible. ¿Cuál es el valor de\(q_A(\mathbf u)\) en esta dirección?
    4. Encuentra el vector de unidad\(\mathbf u\) para el cual\(q_A(\mathbf u)\) es lo más pequeño posible. ¿Cuál es el valor de\(q_A(\mathbf u)\) en esta dirección?
    2

    Considera la forma cuadrática

    \ begin {ecuación*} q\ izquierda (\ twovec {x_1} {x_2}\ derecha) = 3x_1^2 - 4x_1x_2 + 6x_2^2. \ end {ecuación*}
    1. Encuentra una matriz\(A\) tal que\(q(\mathbf x) = \mathbf x^TA\mathbf x\text{.}\)
    2. Encuentra los valores máximo y mínimo de\(q(\mathbf u)\) entre todos los vectores unitarios\(\mathbf u\) y describe las direcciones en las que ocurren.
    3

    Supongamos que\(A\) es una matriz de datos degradada:

    \ begin {ecuación*} A =\ begin {bmatrix} 1 & -2 & 0 & 1\\ 1 & -1 & -1 & 1\\\ end {bmatrix}. \ end {ecuación*}
    1. Encuentra la matriz de covarianza\(C\text{.}\)
    2. Cuál es la varianza de los datos proyectados sobre la línea definida por\(\mathbf u=\twovec{1/\sqrt{2}}{1/\sqrt{2}}\text{.}\)
    3. ¿Cuál es la varianza total?
    4. ¿En qué dirección es mayor la varianza y cuál es la varianza en esta dirección?
    4

    Considerar la matriz\(A = \begin{bmatrix} 4 & -3 & -3 \\ -3 & 4 & -3 \\ -3 & -3 & 4 \\ \end{bmatrix} \text{.}\)

    1. Encontrar\(Q\) y\(D\) tal que\(A=QDQ^T\text{.}\)
    2. Encuentra los valores máximo y mínimo de\(q(\mathbf u) = \mathbf x^TA\mathbf x\) entre todos los vectores unitarios\(\mathbf u\text{.}\)
    3. Describir la dirección en la que se produce el valor mínimo. ¿Qué se puede decir sobre la dirección en la que ocurre el máximo?
    5

    Considerar la matriz\(B = \begin{bmatrix} -2 & 1 \\ 4 & -2 \\ 2 & -1 \\ \end{bmatrix}\text{.}\)

    1. Encuentra la matriz\(A\) para que\(q\left(\twovec{x_1}{x_2}\right) = \len{B\mathbf x}^2=q_A(\mathbf x)\text{.}\)
    2. Encuentra los valores máximo y mínimo de\(q(\mathbf u)\) entre todos los vectores unitarios\(\mathbf u\) y describe las direcciones en las que ocurren.
    3. ¿Qué\(q(\mathbf u)\) le dice el valor mínimo de la matriz?\(B\text{?}\)
    6

    Considera la forma cuadrática

    \ begin {ecuación*} q\ izquierda (\ tresevec {x_1} {x_2} {x_3}\ derecha) = 7x_1^2 + 4x_2^2 + 7x_3^2 - 2x_1x_2 -4x_1x_3-2x_2x_3. \ end {ecuación*}
    1. ¿Qué se puede decir sobre la definición de la matriz\(A\) que define la forma cuadrática?
    2. Encuentra una matriz\(Q\) para que el cambio de coordenadas\(\yvec = Q^T\mathbf x\) transforme la forma cuadrática en una que no tenga términos cruzados. Escribe la forma cuadrática en términos de\(\yvec\text{.}\)
    3. ¿Cuáles son los valores máximo y mínimo de\(q(\mathbf u)\) entre todos los vectores unitarios?\(\mathbf u\text{?}\)
    7

    Explique por qué son ciertas las siguientes afirmaciones.

    1. Dada cualquier matriz,\(B\text{,}\) la matriz\(B^TB\) es una matriz semidefinita simétrica positiva.
    2. Si ambos\(A\) y\(B\) son simétricos, matrices definitivas positivas, explique por qué\(A+B\) es una matriz definida simétrica, positiva.
    3. Si\(A\) es una matriz definida simétrica, invertible, positiva, entonces también\(A^{-1}\) lo es.
    8

    Determina si las siguientes afirmaciones son verdaderas o falsas y explica tu razonamiento.

    1. Si\(A\) es una matriz indefinida, no podemos saber si es positiva definitiva o no.
    2. Si el valor propio más pequeño de\(A\) es 3, entonces\(A\) es positivo definido.
    3. Si\(C\) es la matriz de covarianza asociada a un conjunto de datos, entonces\(C\) es semidefinita positiva.
    4. Si\(A\) es una\(2\times2\) matriz simétrica y los valores máximo y mínimo de\(q_A(\mathbf u)\) ocurren en\(\twovec10\) y\(\twovec01\text{,}\) luego\(A\) es diagonal.
    5. Si\(A\) es negativo definido y\(Q\) es una matriz ortogonal con\(B = QAQ^T\text{,}\) entonces\(B\) es negativo definido.
    9

    Determinar los puntos críticos para cada una de las siguientes funciones. En cada punto crítico, determinar el hessiano\(H\text{,}\) describir la definición de\(H\text{,}\) y determinar si el punto crítico es un máximo o mínimo local.

    1. \(f(x,y) = xy + \frac2x + \frac2y\text{.}\)
    2. \(f(x,y) = x^4 + y^4 - 4xy\text{.}\)
    10

    Considere la función\(f(x,y,z) = x^4 + y^4 +z^4 - 4xyz\text{.}\)

    1. Demostrar que\(f\) tiene un punto crítico en\((-1,1,-1)\) y construir el hessian\(H\) en ese punto.
    2. Encuentra los valores propios de\(H\text{.}\) ¿Es esta una matriz definida de algún tipo?
    3. ¿Qué implica esto sobre si\((-1,1,-1)\) es un máximo local de mínimo?

    This page titled 7.2: Formas cuadráticas is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by David Austin via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.