Saltar al contenido principal
LibreTexts Español

6.3: Bases ortogonales y proyecciones

  • Page ID
    115709
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Sabemos que un sistema lineal\(A\mathbf x=\mathbf b\) es inconsistente cuando no\(\mathbf b\) está en\(\col(A)\text{,}\) el espacio de columnas de\(A\text{.}\) En la Sección 6.5, desarrollaremos una estrategia para tratar con sistemas inconsistentes encontrando\(\bhat\text{,}\) el vector en el\(\col(A)\) que está más cerca de\(\mathbf b\text{.}\) La ecuación \(A\mathbf x=\bhat\)es entonces consistente y su conjunto de soluciones puede proporcionarnos información útil sobre el sistema original.

    En esta sección y en la siguiente, desarrollaremos algunas técnicas que nos permitan encontrar\(\bhat\text{,}\) el vector en un subespacio dado\(W\) que está más cerca de un vector dado\(\mathbf b\text{.}\)

    Vista previa Actividad 6.3.1.

    Para esta actividad, será útil recordar la propiedad distributiva de los productos punto:

    \ begin {ecuación*}\ mathbf v\ cdot (c_1\ mathbf w_1+c_2\ mathbf w_2) = c_1\ mathbf v\ cdot\ mathbf w_1 + c_2\ mathbf v\ cdot\ mathbf w_2\ texto {.} \ end {ecuación*}

    Trabajaremos con la base de\(\mathbb R^2\) formado por los vectores

    \ begin {ecuación*}\ mathbf w_1=\ twovec12,\ hspace {24pt}\ mathbf w_2=\ twovec {-2} 1\ text {.} \ end {ecuación*}
    1. Verificar que los vectores\(\mathbf w_1\) y\(\mathbf w_2\) son ortogonales.
    2. Supongamos que\(\mathbf b =\twovec74\) y encontrar los productos punto\(\mathbf w_1\cdot\mathbf b\) y\(\mathbf w_2\cdot\mathbf b\text{.}\)
    3. Nos gustaría expresar\(\mathbf b\) como una combinación lineal de\(\mathbf w_1\) y\(\mathbf w_2\text{,}\) lo que significa que necesitamos encontrar pesos\(c_1\) y\(c_2\) tal que
      \ begin {ecuación*}\ mathbf b = c_1\ mathbf w_1 + c_2\ mathbf w_2\ texto {.} \ end {ecuación*}

      Para encontrar el\(c_1\text{,}\) punto de peso ambos lados de esta expresión con\(\mathbf w_1\text{:}\)

      \ begin {ecuación*}\ mathbf b\ cdot\ mathbf w_1 = (c_1\ mathbf w_1 + c_2\ mathbf w_2)\ cdot\ mathbf w_1\ text {,}\ end {ecuación*}

      y aplicar la propiedad distributiva.

    4. De manera similar, encuentra el peso\(c_2\text{.}\)
    5. Verifica que\(\mathbf b = c_1\mathbf w_1+c_2\mathbf w_2\) usando los pesos que has encontrado.

    Frecuentemente pedimos escribir un vector dado como una combinación lineal de vectores de base dados. En el pasado, lo hemos hecho resolviendo un sistema lineal. La actividad de vista previa ilustra cómo se puede simplificar esta tarea cuando los vectores base son ortogonales entre sí. Exploraremos este y otros usos de las bases ortogonales en esta sección.

    Conjuntos ortogonales

    La actividad de previsualización trató de una base de\(\mathbb R^2\) formada por dos vectores ortogonales. Consideraremos de manera más general un conjunto de vectores ortogonales, como se describe en la siguiente definición.

    Definición 6.3.1

    Por un conjunto ortogonal de vectores, nos referimos a un conjunto de vectores distintos de cero, cada uno de los cuales es ortogonal a los demás.

    Ejemplo 6.3.2

    Los vectores tridimensionales

    \ begin {ecuación*}\ mathbf w_1 =\ tresevec1 {-1} 1,\ hspace {24pt}\ mathbf w_2 =\ threevec1 {1} 0,\ hspace {24pt}\ mathbf w_3 =\ tresevec1 {-1} {-2}. \ end {ecuación*}

    formar un conjunto ortogonal, que puede ser verificado por computación

    \ begin {ecuación*}\ begin {array} {rcl}\ mathbf w_1\ cdot\ mathbf w_2 & {} = {} & 0\\\ mathbf w_1\ cdot\ mathbf w_3 & {} = {} & 0\\ mathbf w_2\ cdot\ mathbf w_3 & {} = {} & 0\ text {.}\\ end {array}\ end {ecuación*}

    Observe que este conjunto de vectores forma una base para\(\mathbb R^3\text{.}\)

    Ejemplo 6.3.3

    Los vectores

    \ begin {ecuación*}\ mathbf w_1 =\ fourvec1111,\ hspace {24pt}\ mathbf w_2 =\ fourvec11 {-1} {-1},\ hspace {24pt}\ mathbf w_3 =\ fourvec1 {-1} 1 {-1}\ end {ecuación*}

    formar un conjunto ortogonal de vectores de 4 dimensiones. Dado que solo hay tres vectores, este conjunto no forma una base para\(\mathbb R^4\text{.}\) que, sin embargo, forme una base para un subespacio tridimensional\(W\) de\(\mathbb R^4\text{.}\)

    Supongamos que un vector\(\mathbf b\) es una combinación lineal de un conjunto ortogonal de vectores es\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\text{;}\) decir, supongamos que

    \ begin {ecuación*} c_1\ mathbf w_1 + c_2\ mathbf w_2 +\ ldots + c_n\ mathbf w_n =\ mathbf b.\ end {ecuación*}

    Al igual que en la actividad de vista previa, podemos encontrar el peso\(c_1\) punteando ambos lados\(\mathbf w_1\) y aplicando la propiedad distributiva de los productos punto:

    \ begin {alinear*} (c_1\ mathbf w_1 + c_2\ mathbf w_2 +\ ldots + c_n\ mathbf w_n)\ cdot\ mathbf w_1 & =\ mathbf b\ cdot\ mathbf w_1\\ c_1\ mathbf w_1\ cdot\ mathbf w_1 + c_2\ mathbf w_2\ cdot\ mathbf w_1 +\ ldots + c_n\ mathbf w_n\ cdot\ mathbf w_1 & =\ mathbf b\ cdot\ mathbf w_1\\ c_1\ mathbf w_1\ cdot\ mathbf w_1 & =\ mathbf b\ cdot\ mathbf w_1\\ c_1 & =\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1}\ texto {.} \ end {alinear*}

    Observe cómo la presencia de un conjunto ortogonal hace que la mayoría de los términos de la suma desaparezcan. De la misma manera, encontramos que

    \ begin {ecuación*} c_i =\ frac {\ mathbf b\ cdot\ mathbf w_i} {\ mathbf w_i\ cdot\ mathbf w_i}\ end {ecuación*}

    para que

    \ begin {ecuación*}\ mathbf b =\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1}\ mathbf w_1 +\ frac {\ mathbf b\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_2}\ mathbf w_2 +\ puntos +\ frac {\ mathbf b\ cdot\ mathbf w_n} {\ mathbf w_n\ cdot\ mathbf w_n}\ mathbf w_n\ text {.} \ end {ecuación*}

    Registraremos este hecho en la siguiente proposición.

    Proposición 6.3.4.

    Si un vector\(\mathbf b\) es una combinación lineal de un conjunto ortogonal de vectores\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\text{,}\) entonces

    \ begin {ecuación*}\ mathbf b =\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1}\ mathbf w_1 +\ frac {\ mathbf b\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_2}\ mathbf w_2 +\ puntos +\ frac {\ mathbf b\ cdot\ mathbf w_n} {\ mathbf w_n\ cdot\ mathbf w_n}\ mathbf w_n\ text {.} \ end {ecuación*}

    Usando esta proposición, podemos ver que un conjunto ortogonal de vectores debe ser linealmente independiente. Supongamos, por ejemplo, que\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) es un conjunto de vectores ortogonales distintos de cero y que uno de los vectores es una combinación lineal de los otros, digamos,

    \ begin {ecuación*}\ mathbf w_3 = c_1\ mathbf w_1 + c_2\ mathbf w_2\ texto {.} \ end {ecuación*}

    Por lo tanto, sabemos que

    \ begin {ecuación*}\ mathbf w_3 =\ frac {\ mathbf w_3\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1}\ mathbf w_1 +\ frac {\ mathbf w_3\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_1} mathbf w_2 =\ zerovec\ texto {,}\ final {ecuación*}

    lo que no puede suceder ya que sabemos que\(\mathbf w_3\) es distinto de cero. Esto nos dice que

    Proposición 6.3.5.

    Un conjunto ortogonal de vectores\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) es linealmente independiente.

    Si los vectores en un conjunto ortogonal\(m\text{,}\) tienen dimensión, forman un conjunto linealmente independiente\(\mathbb R^m\) y, por lo tanto, son una base para el subespacio.\(W=\laspan{\mathbf v_1,\mathbf v_2,\ldots,\mathbf v_n}\text{.}\) Si hay\(m\) vectores en el conjunto ortogonal, forman una base para\(\mathbb R^m\text{.}\)

    Actividad 6.3.2.

    Considerar los vectores

    \ begin {ecuación*}\ mathbf w_1 =\ tresevec1 {-1} 1,\ hspace {24pt}\ mathbf w_2 =\ threevec1 {1} 0,\ hspace {24pt}\ mathbf w_3 =\ tresevec1 {-1} {-2}. \ end {ecuación*}
    1. Verifique que este conjunto forme un conjunto ortogonal de vectores\(3\) -dimensionales.
    2. Explique por qué ahora sabemos que este conjunto de vectores forma una base para\(\mathbb R^3\text{.}\)
    3. Supongamos que\(\mathbf b=\threevec24{-4}\text{.}\) Encuentra los pesos\(c_1\text{,}\)\(c_2\text{,}\) y\(c_3\) que\(\mathbf b\) se expresan como una combinación lineal\(\mathbf b=c_1\mathbf w_1 + c_2\mathbf w_2 + c_3\mathbf w_3\) usando la Proposición 6.3.4.
    4. Si multiplicamos un vector\(\mathbf v\) por un escalar positivo\(s\text{,}\) la longitud de también\(\mathbf v\) se multiplica por es\(s\text{;}\) decir,\(\len{s\mathbf v} = s\len{\mathbf v}\text{.}\)

      Usando esta observación, encuentre un vector\(\mathbf u_1\) que sea paralelo\(\mathbf w_1\) y tenga longitud 1. Dichos vectores se denominan vectores unitarios.

    5. Del mismo modo, encuentre un vector unitario\(\mathbf u_2\) que sea paralelo\(\mathbf w_2\) y un vector unitario\(\mathbf u_3\) que sea paralelo a\(\mathbf w_3\text{.}\)
    6. Construye la matriz\(Q=\begin{bmatrix} \mathbf u_1 & \mathbf u_2 & \mathbf u_3 \end{bmatrix}\) y encuentra el producto\(Q^TQ\text{.}\) Usa la Proposición 6.2.8 para explicar tu resultado.

    Esta actividad introduce una forma importante de modificar un conjunto ortogonal para que los vectores en el conjunto tengan longitud unitaria. Recordemos que podemos multiplicar cualquier vector distinto de cero\(\mathbf w\) por un escalar para que el nuevo vector tenga longitud 1. Por ejemplo, sabemos que, si\(s\) es un escalar positivo, entonces\(\len{s\mathbf w} = s\len{\mathbf w}\text{.}\) Para obtener un vector\(\mathbf u\) que tenga longitud unitaria, queremos

    \ begin {ecuación*}\ len {\ mathbf u} =\ len {s\ mathbf w} = s\ len {\ mathbf w} = 1\ end {ecuación*}

    de manera que\(s=1/\len{\mathbf w}\text{.}\) por lo tanto,

    \ begin {ecuación*}\ mathbf u =\ frac {1} {\ len {\ mathbf w}}\ mathbf w\ end {ecuación*}

    se convierte en un vector unitario paralelo a\(\mathbf w\text{.}\)

    Los conjuntos ortogonales en los que los vectores tienen longitud unitaria se denominan ortonormales y son especialmente convenientes.

    Definición 6.3.6

    Un conjunto ortonormal es un conjunto ortogonal de vectores cada uno de los cuales tiene longitud unitaria.

    Ejemplo 6.3.7

    Los vectores

    \ begin {ecuación*}\ mathbf u_1=\ twovec {1/\ sqrt {2}} {1/\ sqrt {2}},\ hspace {24pt}\ mathbf u_2=\ twovec {-1/\ sqrt {2}} {1/\ sqrt {2}}\ end {ecuación*}

    son un conjunto ortonormal de vectores en\(\mathbb R^2\) y forman una base ortonormal para\(\mathbb R^2\text{.}\)

    Si formamos la matriz

    \ begin {ecuation*} Q=\ begin {bmatrix}\ mathbf u_1 &\ mathbf u_2\ end {bmatrix} =\ begin {bmatrix} 1/\ sqrt {2} & -1/\ sqrt {2}\\ 1/\ sqrt {2} & 1/\ sqrt {2}\\ sqrt {2}\\ end {bmatrix}\ text {,}\ end {ecuación*}

    encontramos que\(Q^TQ = I\) desde la Proposición 6.2.8 nos dice que

    \ begin {ecuación*} Q^TQ =\ begin {bmatrix}\ mathbf u_1\ cdot\ mathbf u_1 &\ mathbf u_1\ cdot\ mathbf u_2\\\ mathbf u_2\ cdot\ mathbf u_1 &\ mathbf u_2\ cdot\ mathbf u_2\\ end {bmatrix} =\ begin {bmatrix} & 0\\ 0 & 1\\\ end {bmatrix}\ end {ecuación*}

    La actividad anterior y el ejemplo ilustran la proposición siguiente.

    Proposición 6.3.8.

    Si las columnas de la\(m\times n\) matriz\(Q\) forman un conjunto ortonormal, entonces\(Q^TQ = I_n\text{,}\) la matriz de\(n\times n\) identidad.

    Proyecciones ortgonales

    Pasamos ahora a un problema importante que aparecerá de muchas formas en el resto de nuestras investigaciones. Supongamos, como se muestra en la Figura 6.3.9, que tenemos un subespacio\(W\) de\(\mathbb R^m\) y un vector\(\mathbf b\) que no está en ese subespacio. Nos gustaría encontrar el vector\(\bhat\) en el\(W\) que está más cerca\(\mathbf b\text{.}\)

    Figura 6.3.9. Dado un plano en\(\mathbb R^3\) y un vector\(\mathbf b\) no en el plano, deseamos encontrar el vector\(\bhat\) en el plano más cercano a\(\mathbf b\text{.}\)

    Para comenzar, consideremos un problema más simple donde tenemos una línea\(L\)\(\mathbb R^2\text{,}\) definida por el vector\(\mathbf w\text{,}\) y otro vector\(\mathbf b\) que no está en la línea, como se muestra a la izquierda de la Figura 6.3.10. Deseamos encontrar\(\bhat\text{,}\) el vector en la línea más cercana\(\mathbf b\text{,}\) como se ilustra a la derecha de la Figura 6.3.10.

    Figura 6.3.10. Dada una línea\(L\) y un vector\(\mathbf b\text{,}\) buscamos el vector\(\bhat\) en el\(L\) que está más cerca\(\mathbf b\text{.}\)

    Para encontrar\(\bhat\text{,}\) requerimos que\(\mathbf b-\bhat\) sea ortogonal a\(L\text{.}\) Por ejemplo, si\(\yvec\) hay otro vector en la línea, como se muestra en la Figura 6.3.11, entonces el teorema de Pitágoras implica que

    \ begin {ecuación*}\ len {\ mathbf b-\ yvec} ^2 = |\ mathbf b-\ bhat|^2 + |\ bhat-\ yvec|^2\ end {ecuación*}

    lo que significa que\(\len{\mathbf b-\yvec}\geq|\mathbf b-\bhat|\text{.}\) Por lo tanto,\(\bhat\) está más cerca\(\mathbf b\) que cualquier otro vector en la línea\(L\text{.}\)

    Figura 6.3.11. El vector\(\bhat\) está más cerca\(\mathbf b\) que\(\yvec\) porque\(\mathbf b-\bhat\) es ortogonal a\(L\text{.}\)
    Definición 6.3.12

    Dado un vector\(\mathbf b\) en\(\mathbb R^m\) y un subespacio\(W\) de\(\mathbb R^m\text{,}\) la proyección ortogonal de\(\mathbf b\) sobre\(W\) es el vector\(\bhat\) en el\(W\) que está más cercano a\(\mathbf b\text{.}\) Se caracteriza por la propiedad que\(\mathbf b-\bhat\) es ortogonal a\(W\text{.}\)

    Actividad 6.3.3.

    Esta actividad demuestra cómo determinar la proyección ortogonal de un vector sobre un subespacio de\(\mathbb R^m\text{.}\)

    1. Comencemos considerando una línea\(L\text{,}\) definida por el vector\(\mathbf w=\twovec21\text{,}\) y un vector\(\mathbf b=\twovec24\) no encendido\(L\text{,}\) como se ilustra en la Figura 6.3.13.
      Figura 6.3.13. Encontrar la proyección ortogonal de\(\mathbf b\) sobre la línea definida por\(\mathbf w\text{.}\)
      1. Para encontrar\(\bhat\text{,}\) primer aviso que\(\bhat = s\mathbf w\) para algún escalar\(s\text{.}\) Ya que\(\mathbf b-\bhat = \mathbf b - s\mathbf w\) es ortogonal a\(\mathbf w\text{,}\) lo que sabemos del producto punto
        \ begin {ecuación*} (\ mathbf b-s\ mathbf w)\ cdot\ mathbf w\ texto {?} \ end {ecuación*}
      2. Aplicar la propiedad distributiva de los productos de punto para encontrar el escalar\(s\text{.}\) ¿Cuál es el vector\(\mathbf b\) sobre\(\bhat\text{,}\) el que se proyecta ortogonal?\(L\text{?}\)
      3. De manera más general, explicar por qué la proyección ortogonal de\(\mathbf b\) sobre la línea definida por\(\mathbf w\) es
        \ begin {ecuación*}\ bhat=\ frac {\ mathbf b\ cdot\ mathbf w} {\ mathbf w\ cdot\ mathbf w} ~\ mathbf w\ text {.} \ end {ecuación*}
    2. Las mismas ideas se aplican de manera más general. Supongamos que tenemos un conjunto ortogonal de vectores\(\mathbf w_1=\threevec22{-1}\) y\(\mathbf w_2=\threevec102\) que definen un plano\(W\) en\(\mathbb R^3\text{.}\) Si\(\mathbf b=\threevec396\) otro vector en\(\mathbb R^3\text{,}\) buscamos el vector\(\bhat\) en el plano\(W\) más cercano a\(\mathbf b\text{.}\) As before, el vector\(\mathbf b-\bhat\) será ortogonal a\(W\text{,}\) como se ilustra en la Figura 6.3.14.
      Figura 6.3.14. Dado un plano\(W\) definido por los vectores ortogonales\(\mathbf w_1\)\(\mathbf w_2\) y otro vector\(\mathbf b\text{,}\) buscamos\(\bhat\) el vector\(W\) más cercano a\(\mathbf b\text{.}\)
      1. El vector\(\mathbf b-\bhat\) es ortogonal a\(W\text{.}\) Qué dice esto sobre los productos de punto:\((\mathbf b-\bhat)\cdot\mathbf w_1\) y\((\mathbf b-\bhat)\cdot\mathbf w_2\text{?}\)
      2. Ya que\(\bhat\) está en el plano\(W\text{,}\) podemos escribirlo como una combinación lineal\(\bhat = c_1\mathbf w_1 + c_2\mathbf w_2\text{.}\) Entonces
        \ begin {ecuación*}\ mathbf b-\ bhat =\ mathbf b - (c_1\ mathbf w_1+c_2\ mathbf w_2)\ text {.} \ end {ecuación*}

        Encuentra el peso\(c_1\)\(\mathbf b-\bhat\) punteando\(\mathbf w_1\) y aplicando la propiedad distributiva de los productos dot. Del mismo modo, encuentra el peso\(c_2\text{.}\)

      3. ¿Cuál es el vector\(\bhat\text{,}\) de la proyección ortogonal\(\mathbf w\) sobre el plano\(W\text{?}\)
    3. Supongamos que\(W\) es un subespacio de\(\mathbb R^m\) con base ortogonal\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) y que\(\mathbf b\) es un vector en\(\mathbb R^m\text{.}\) Explicar por qué la proyección ortogonal de\(\mathbf b\) onto\(W\) es el vector
      \ begin {ecuación*}\ bhat =\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1} ~\ mathbf w_1 +\ frac {\ mathbf b\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_2} ~\ mathbf w_2 +\ ldots +\ frac {\ mathbf b\ cdot\ mathbf w_n} {\ mathbf w_n\ cdot\ mathbf w_n} ~\ mathbf w_n\ text {.} \ end {ecuación*}
    4. Supongamos que\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_n\) es una base ortonormal para\(W\text{;}\) esto es, los vectores son ortogonales entre sí y tienen longitud unitaria. Explicar por qué la proyección ortogonal es
      \ begin {ecuación*}\ bhat= (\ mathbf b\ cdot\ mathbf u_1) ~\ mathbf u_1 + (\ mathbf b\ cdot\ mathbf u_2) ~\ mathbf u_2 +\ ldots + (\ mathbf b\ cdot\ mathbf u_n) ~\ mathbf u_n\ texto {.} \ end {ecuación*}
    5. Si\(Q=\begin{bmatrix} \mathbf u_1 & \mathbf u_2 & \ldots & \mathbf u_n \end{bmatrix}\) es la matriz cuyas columnas son una base ortonormal de\(W\text{,}\) uso Proposición 6.2.8 para explicar por qué\(\bhat = QQ^T\mathbf b\text{.}\)

    En todos los casos considerados en la actividad, estamos buscando\(\bhat\text{,}\) el vector en un subespacio\(W\) más cercano a un vector el\(\mathbf b\text{,}\) cual se encuentra requiriendo que\(\mathbf b-\bhat\) sea ortogonal a\(W\text{.}\) Esto significa que\((\mathbf b-\bhat)\cdot\mathbf w = 0\) para cualquier vector\(\mathbf w\) en\(W\text{.}\)

    Si tenemos una base ortogonal\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) para\(W\text{,}\) entonces\(\bhat = c_1\mathbf w_1+c_w\mathbf w_2+\ldots c_n\mathbf w_n\text{.}\) Por lo tanto,

    \ begin {alinear*} (\ mathbf b-\ bhat)\ cdot\ mathbf w_i & = 0\\\ mathbf b\ cdot\ mathbf w_i & =\ bhat\ cdot\ mathbf w_i\\ mathbf b\ cdot\ mathbf w_i & = (c_1\ mathbf w_1+c_2\ mathbf w_2+\ puntos + c_n\ mathbf w_n)\ cdot\ mathbf w_i\\\ mathbf b\ cdot\ mathbf w_i & = c_i\ mathbf w_i\ cdot\ mathbf w_i\\ c_i & =\ frac {\ mathbf b\ cdot\ mathbf w_i} {\ mathbf w_i\ cdot\ mathbf w_i}. \ end {alinear*}

    Esto lleva a la fórmula de proyección:

    Proposición 6.3.15. Fórmula de proyección.

    Si\(W\) es un subespacio de\(\mathbb R^m\) tener una base ortogonal\(\mathbf w_1,\mathbf w_2,\ldots, \mathbf w_n\) y\(\mathbf b\) es un vector en\(\mathbb R^m\text{,}\) entonces la proyección ortogonal de\(\mathbf b\) sobre\(W\) es

    \ begin {ecuación*}\ bhat=\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1} ~\ mathbf w_1 +\ frac {\ mathbf b\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_2} ~\ mathbf w_2 +\ ldots +\ frac {\ mathbf b\ cdot\ mathbf w_n} {\ mathbf w_n\ cdot\ mathbf w_n} ~\ mathbf w_n\ text {.} \ end {ecuación*}

    Precaución.

    Recuerde que la fórmula de proyección dada en la Proposición 6.3.15 sólo se aplica cuando la base\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) de\(W\) es ortogonal.

    Si tenemos una base ortonormal\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_n\) para\(W\text{,}\) la fórmula de proyección se simplifica a

    \ begin {ecuación*}\ bhat= (\ mathbf b\ cdot\ mathbf u_1) ~\ mathbf u_1 + (\ mathbf b\ cdot\ mathbf u_2) ~\ mathbf u_2 +\ ldots + (\ mathbf b\ cdot\ mathbf u_n) ~\ mathbf u_n\ texto {.} \ end {ecuación*}

    Si entonces formamos la matriz

    \ begin {ecuación*} Q =\ begin {bmatrix}\ mathbf u_1 &\ mathbf u_2 &\ ldots &\ mathbf u_n\ end {bmatrix}\ text {,}\ end {ecuación*}

    esta expresión puede ser escrita sucintamente

    \ begin {align*}\ bhat & {} = {} (\ mathbf b\ cdot\ mathbf u_1) ~\ mathbf u_1 + (\ mathbf b\ cdot\ mathbf u_2) ~\ mathbf u_2 +\ ldots + (\ mathbf b\ cdot\ mathbf u_n) ~\ mathbf u_n\\ & {} = {} begin {bmatrix}\ mathbf u_1&\ mathbf u_2&\ ldots&\ mathbf u_n\ end {bmatrix}\ begin {bmatrix}\ mathbf u_1\ cdot\ mathbf b\\\ mathbf u_2\ cdot\ mathbf b\\\ vdots\\\ mathbf u_n\ cdot\ mathbf b\\ final {bmatrix}\\ & {} = {} QQ^T\ mathbf b\ end {alinear*}

    Esto lleva a la siguiente proposición.

    Proposición 6.3.16.

    Si\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_n\) es una base ortonormal para un subespacio\(W\) de\(\mathbb R^m\text{,}\) entonces la transformación matricial que proyecta vectores en\(\mathbb R^m\) ortogonalmente sobre\(W\) es representada por la matriz\(QQ^T\) donde

    \ begin {ecuación*} Q =\ begin {bmatrix}\ mathbf u_1 &\ mathbf u_2 &\ ldots &\ mathbf u_n\\\ end {bmatrix}\ text {.} \ end {ecuación*}
    Ejemplo 6.3.17

    En la actividad anterior, observamos el plano\(W\) definido por los dos vectores ortogonales

    \[ \mathbf w_1=\threevec22{-1},\hspace{24pt} \mathbf w_2=\threevec102\text{.} \]

    Podemos formar una base ortonormal multiplicando escalar estos vectores para tener longitud unitaria:

    \[ \mathbf u_1=\frac13\threevec22{-1} = \threevec{2/3}{2/3}{-1/3},\hspace{24pt} \mathbf u_2=\frac1{\sqrt{5}}\threevec102 = \threevec{1/\sqrt{5}}0{2/\sqrt{5}}\text{.} \]

    Usando estos vectores, formamos la matriz

    \[Q = \begin{bmatrix} 2/3 & 1/\sqrt{5} \\ 2/3 & 0 \\ -1/3 & 2/\sqrt{5} \\ \end{bmatrix}\text{.} \]

    La proyección sobre el plano\(W\) es dada entonces por la matriz

    \[ QQ^T = \begin{bmatrix} 2/3 & 1/\sqrt{5} \\ 2/3 & 0 \\ -1/3 & 2/\sqrt{5} \\ \end{bmatrix} \begin{bmatrix} 2/3 & 2/3 & -1/3 \\ 1/\sqrt{5} & 0 & 2/\sqrt{5} \\ \end{bmatrix} = \begin{bmatrix} {29}/{45} & {4}/{9} & {8}/{45} \\ {4}/{9} & {4}/{9} & -{2}/{9} \\ {8}/{45} & -{2}/{9} & {41}/{45} \end{bmatrix}\text{.}\]

    Comprobemos que esto funciona considerando el vector\(\mathbf b=\threevec100\) y encontrando\(\bhat\text{,}\) su proyección ortogonal sobre el plano\(W\text{.}\) En términos de la base original\(\mathbf w_1\) y\(\mathbf w_2\text{,}\) la fórmula de proyección de la Proposición 6.3.15 nos dice que

    \[ \bhat=\frac{\mathbf b\cdot\mathbf w_1} {\mathbf w_1\cdot\mathbf w_1}~\mathbf w_1 + \frac{\mathbf b\cdot\mathbf w_2} {\mathbf w_2\cdot\mathbf w_2}~\mathbf w_2 = \threevec

    ParseError: EOF expected (click for details)
    Callstack:
        at (Matematicas/Algebra_lineal/Comprensión_del_álgebra_lineal_(Austin)/06:_Ortogonalidad_y_mínimos_cuadrados/6.03:_Bases_ortogonales_y_proyecciones), /content/body/div[3]/div[3]/section[2]/div/p[10]/span/span, line 1, column 3
    
    {4/9}{8/{45}} \\ \]

    Alternativamente, usamos la matriz\(QQ^T\text{,}\) como en la Proposición 6.3.16, para encontrar que

    \[\bhat = QQ^T\mathbf b = \begin{bmatrix} {29}/{45} & {4}/{9} & {8}/{45} \\ {4}/{9} & {4}/{9} & -{2}/{9} \\ {8}/{45} & -{2}/{9} & {41}/{45} \end{bmatrix}\threevec100 = \threevec

    ParseError: EOF expected (click for details)
    Callstack:
        at (Matematicas/Algebra_lineal/Comprensión_del_álgebra_lineal_(Austin)/06:_Ortogonalidad_y_mínimos_cuadrados/6.03:_Bases_ortogonales_y_proyecciones), /content/body/div[3]/div[3]/section[2]/div/p[12]/span/span, line 1, column 3
    
    {4/9}{8/{45}}\text{.}\]

    Actividad 6.3.4.

    1. Supongamos que\(L\) es la línea en\(\mathbb R^3\) definida por el vector\(\mathbf w=\threevec{1}{2}{-2}\text{.}\)
      1. Encuentre una base ortonormal\(\mathbf u\) para\(L\text{.}\)
      2. Construir la matriz\(Q = \begin{bmatrix}\mathbf u\end{bmatrix}\) y utilizarla para construir la matriz\(P\) que proyecta vectores ortogonalmente sobre\(L\text{.}\)
      3. Usa tu matriz para encontrar\(\bhat\text{,}\) la proyección ortogonal de\(\mathbf b=\threevec111\)\(L\text{.}\)
      4. Encontrar\(\rank(P)\) y explicar su significación geométrica.
    2. Los vectores
      \ begin {ecuación*}\ mathbf w_1 =\ fourvec1111,\ hspace {24pt}\ mathbf w_2 =\ fourvec011 {-2}\ end {ecuación*}

      forman una base ortogonal de\(W\text{,}\) un subespacio bidimensional de\(\mathbb R^4\text{.}\)

      1. Utilice la fórmula de proyección de la Proposición 6.3.15 para encontrar\(\bhat\text{,}\) la proyección ortogonal de\(\mathbf b=\fourvec92{-2}3\)\(W\text{.}\)
      2. Encuentra una base ortonormal\(\mathbf u_1\) y\(\mathbf u_2\) para\(W\) y úsala para construir la matriz\(P\) que proyecta vectores ortogonalmente en\(W\text{.}\) Comprobar que\(P\mathbf b = \bhat\text{,}\) la proyección ortogonal que encontraste en la parte anterior de esta actividad.
      3. Encontrar\(\rank(P)\) y explicar su significación geométrica.
      4. Encuentre una base para\(W^\perp\text{.}\)
      5. Encuentra un vector de\(W^\perp\) tal\(\mathbf b^\perp\) manera que
        \ begin {ecuación*}\ mathbf b =\ bhat +\ mathbf b^\ perp. \ end {ecuación*}
      6. Encuentra el producto\(Q^TQ\) y explica tu resultado.

    Esta actividad demuestra un tema de nota. Encontramos\(\bhat\text{,}\) la proyección ortogonal de\(\mathbf b\) sobre\(W\text{,}\) al requerir que\(\mathbf b-\bhat\) sea ortogonal a\(W\text{.}\) En otras palabras,\(\mathbf b-\bhat\) es un vector en el complemento ortogonal\(W^\perp\text{,}\) que podemos denotar\(\mathbf b^\perp\text{.}\) Esto explica la siguiente proposición, que se ilustra en la Figura 6.3.19

    Proposición 6.3.18.
    Si\(W\) es un subespacio\(\mathbb R^n\) con complemento ortogonal\(W^\perp\text{,}\), entonces cualquier vector\(n\) -dimensional\(\mathbf b\) puede escribirse de manera única como
    \ begin {ecuación*}\ mathbf b =\ bhat +\ mathbf b^\ perp\ end {ecuación*}
    donde\(\bhat\) está en\(W\) y\(\mathbf b^\perp\) está en\(W^\perp\text{.}\) El vector\(\bhat\) es la proyección ortogonal de\(\mathbf b\) sobre\(W\) y\(\mathbf b^\perp\) es la proyección ortogonal de\(\mathbf b\) sobre\(W^\perp\text{.}\)
    Figura 6.3.19. Un vector\(\mathbf b\) junto con\(\bhat\text{,}\) su proyección ortogonal sobre la línea\(L\text{,}\) y\(\mathbf b^\perp\text{,}\) su proyección ortogonal sobre el complemento ortogonal\(L^\perp\text{.}\)

    Resumamos lo que hemos encontrado. Si\(Q\) es una matriz cuyas columnas\(\mathbf u_1, \mathbf u_2,\ldots,\mathbf u_n\) forman un conjunto ortonormal en\(\mathbb R^m\text{,}\) entonces

    • \(Q^TQ = I_n\text{,}\)la matriz de\(n\times n\) identidad, ya que este producto computa los productos de punto entre las columnas de\(Q\text{.}\)
    • \(QQ^T\)es la matriz que proyecta los vectores ortogonalmente sobre\(W\text{,}\) el subespacio de\(\mathbb R^m\)\(\mathbf u_1,\ldots,\mathbf u_n\text{.}\)

    Como hemos dicho antes, la multiplicación matricial depende del orden en que multipliquemos las matrices, y esto lo vemos claramente aquí.

    Porque\(Q^TQ=I\text{,}\) hay una tentación de decir que\(Q\) es invertible. Este no suele ser el caso, sin embargo. Recuerda que una matriz invertible debe ser una matriz cuadrada, y la matriz solo\(Q\) será cuadrada si\(n=m\text{.}\) En este caso, hay\(m\) vectores en el conjunto ortonormal por lo que el subespacio\(W\) abarcado por los vectores\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_m\) es\(\mathbb R^m\text{.}\) Si\(\mathbf b\) es un vector en\(\mathbb R^m\text{,}\) entonces \(\bhat=QQ^T\mathbf b\)es la proyección ortogonal de\(\mathbf b\) sobre\(\mathbb R^m\text{.}\) En otras palabras,\(QQ^T\mathbf b\) es el vector más cercano\(\mathbb R^m\) a\(\mathbf b\text{,}\) y este vector más cercano debe ser\(\mathbf b\) él mismo. Por lo tanto, lo\(QQ^T\mathbf b = \mathbf b\text{,}\) que significa que\(QQ^T=I\text{.}\) En este caso,\(Q\) es una matriz invertible.

    Ejemplo 6.3.20

    Considerar el conjunto ortonormal de vectores

    \ begin {ecuación*}\ mathbf u_1=\ threevec {1/\ sqrt {3}} {-1/\ sqrt {3}} {1/\ sqrt {3}},\ hspace {24pt}\ mathbf u_2=\ threevec {1/\ sqrt {2}} {1/\ sqrt {2}} 0\ end {ecuación*}

    y la matriz que definen

    \ begin {ecuación*} Q =\ begin {bmatrix} 1/\ sqrt {3} & 1/\ sqrt {2}\\ -1/\ sqrt {3} & 1/\ sqrt {2}\\ 1/\ sqrt {3} & 0\\\ end {bmatrix}\ text {.} \ end {ecuación*}

    En este caso,\(\mathbf u_1\) y\(\mathbf u_2\) abarcan un plano, un subespacio bidimensional de\(\mathbb R^3\text{.}\) Sabemos que\(Q^TQ = I_2\) y\(QQ^T\) proyecta vectores ortogonalmente sobre el plano. Sin embargo, no\(Q\) es una matriz cuadrada por lo que no puede ser invertible.

    Ejemplo 6.3.21

    Consideremos ahora el conjunto ortonormal de vectores

    \ begin {ecuación*}\ mathbf u_1=\ threevec {1/\ sqrt {3}} {-1/\ sqrt {3}} {1/\ sqrt {3}},\ hspace {24pt}\ mathbf u_2=\ threevec {1/\ sqrt {2}} {1/\ sqrt {2}} 0,\ hspace {24pt}\ mathbf u_3=\ tresevec {1/\ sqrt {6}} {-1/\ sqrt {6}} {-2/\ sqrt {6}}\ end {ecuación*}

    y la matriz que definen

    \ begin {ecuación*} Q =\ begin {bmatrix} 1/\ sqrt {3} & 1/\ sqrt {2} & 1/\ sqrt {6}\\ -1/\ sqrt {3} & 1/\ sqrt {2} & -1/\ sqrt {6}\\ 1/\ sqrt {3} & 0 & -2/\ sqrt {6}\\ end {bmatrix}\ texto {.} \ end {ecuación*}

    Aquí,\(\mathbf u_1\text{,}\)\(\mathbf u_2\text{,}\) y\(\mathbf u_3\) formar una base para que\(\mathbb R^3\) tanto\(Q^TQ=I_3\) y\(QQ^T=I_3\text{.}\) por lo tanto,\(Q\) sea una matriz cuadrada y sea invertible.

    Además, ya que\(Q^TQ = I\text{,}\) vemos que\(Q^{-1} = Q^T\) así encontrar lo inverso de\(Q\) es tan sencillo como escribir su transposición. Las matrices con esta propiedad son muy especiales y jugarán un papel importante en nuestro próximo trabajo. Por lo tanto, les daremos un nombre especial.

    Definición 6.3.22

    Una\(m\times m\) matriz cuadrada\(Q\) cuyas columnas forman una base ortonormal para\(\mathbb R^m\) se llama ortogonal.

    Esta terminología puede resultar un poco confusa. Llamamos a una base ortogonal si los vectores base son ortogonales entre sí. Sin embargo, una matriz es ortogonal si las columnas son ortogonales entre sí y tienen longitud unitaria. Se debe tener esto en cuenta a la hora de leer declaraciones sobre bases ortogonales y matrices ortogonales. Mientras tanto, registramos la siguiente proposición.

    Proposición 6.3.23.

    Una matriz ortogonal\(Q\) es invertible y su inversa\(Q^{-1} = Q^T\text{.}\)

    Resumen

    Esta sección introdujo conjuntos ortogonales y la fórmula de proyección que nos permite proyectar vectores ortogonalmente sobre un subespacio.

    • Dado un conjunto ortogonal\(\mathbf w_1,\mathbf w_2,\ldots,\mathbf w_n\) que abarca un subespacio\(n\) -dimensional\(W\) de\(\mathbb R^m\text{,}\) la proyección ortogonal de\(\mathbf b\) sobre\(W\) es el vector\(W\) más cercano a\(\mathbf b\) y puede escribirse como
      \ begin {ecuación*}\ bhat =\ frac {\ mathbf b\ cdot\ mathbf w_1} {\ mathbf w_1\ cdot\ mathbf w_1} ~\ mathbf w_1 +\ frac {\ mathbf b\ cdot\ mathbf w_2} {\ mathbf w_2\ cdot\ mathbf w_2} ~\ mathbf w_2 +\ ldots +\ frac {\ mathbf b\ cdot\ mathbf w_n} {\ mathbf w_n\ cdot\ mathbf w_n} ~\ mathbf w_n\ text {.} \ end {ecuación*}
    • Si\(\mathbf u_1,\mathbf u_2,\ldots,\mathbf u_n\) es una base ortonormal de\(W\) y\(Q\) es la matriz cuyas columnas son\(\mathbf u_i\text{,}\) entonces la matriz\(P=QQ^T\) proyecta vectores ortogonalmente\(W\text{.}\)
    • Si las columnas\(Q\) forman una base ortonormal para un subespacio\(n\) -dimensional de\(\mathbb R^m\text{,}\) entonces\(Q^TQ=I_n\text{.}\)
    • Una matriz ortogonal\(Q\) es una matriz cuadrada cuyas columnas forman una base ortonormal. En este caso,\(QQ^T=Q^TQ = I\) para que\(Q^{-1} = Q^T\text{.}\)

    Ejercicios 6.3.4Ejercicios

    1

    Supongamos que

    \ begin {ecuación*}\ mathbf w_1=\ tresvec111,\ hspace {24pt}\ mathbf w_2=\ tresvec1 {-2} 1. \ end {ecuación*}
    1. \(\mathbf w_1\)Verifíquelo y\(\mathbf w_2\) forme una base ortogonal para un plano\(W\) en\(\mathbb R^3\text{.}\)
    2. Utilice la Proposición 6.3.15 para encontrar\(\bhat\text{,}\) la proyección ortogonal de\(\mathbf b=\threevec21{-1}\)\(W\text{.}\)
    3. Encuentre una base ortonormal\(\mathbf u_1\text{,}\)\(\mathbf u_2\) para\(W\text{.}\)
    4. Encuentre la matriz\(P\) que representa la transformación de matriz que proyecta vectores en\(\mathbb R^3\) ortogonalmente en\(W\text{.}\) Verify that\(\bhat = P\mathbf b\text{.}\)
    5. Determinar\(\rank(P)\) y explicar su significación geométrica.
    2

    Considerar los vectores

    \ begin {ecuación*}\ mathbf w_1=\ tresvec111,\ hspace {24pt}\ mathbf w_2=\ threevec {-1} 01,\ hspace {24pt}\ mathbf w_3=\ tresevec1 {-2} 1. \ end {ecuación*}
    1. Explicar por qué estos vectores forman una base ortogonal para\(\mathbb R^3\text{.}\)
    2. Supongamos eso\(A=\begin{bmatrix} \mathbf w_1 & \mathbf w_2 & \mathbf w_3 \end{bmatrix}\) y evalúe el producto\(A^TA\text{.}\) ¿Por qué este producto es una matriz diagonal y cuál es la significación de las entradas diagonales?
    3. Expresar el vector\(\mathbf b=\threevec{-3}{-6}3\) como una combinación lineal de\(\mathbf w_1\text{,}\)\(\mathbf w_2\text{,}\) y\(\mathbf w_3\text{.}\)
    4. Multiplique los vectores\(\mathbf w_1\text{,}\)\(\mathbf w_2\text{,}\)\(\mathbf w_3\) por escalares apropiados para encontrar una base ortonormal\(\mathbf u_1\text{,}\)\(\mathbf u_2\text{,}\)\(\mathbf u_3\) de\(\mathbb R^3\text{.}\)
    5. Si\(Q=\begin{bmatrix} \mathbf u_1 & \mathbf u_2 & \mathbf u_3 \end{bmatrix}\text{,}\) encuentra el producto de la matriz\(QQ^T\) y explica el resultado.
    3

    Supongamos que

    \ begin {ecuación*}\ mathbf w_1=\ fourvec110 {-1},\ hspace {24pt}\ mathbf w_2=\ fourvec1011\ end {ecuación*}

    formar una base ortogonal para un subespacio\(W\) de\(\mathbb R^4\text{.}\)

    1. Encuentra\(\bhat\text{,}\) la proyección ortogonal de\(\mathbf b=\fourvec{2}{-1}{-6}{7}\)\(W\text{.}\)
    2. Encuentra el vector de\(W^\perp\) tal\(\mathbf b^\perp\) manera que\(\mathbf b = \bhat + \mathbf b^\perp\text{.}\)
    3. Encontrar una base para\(W^\perp\text{.}\) y expresar\(\mathbf b^\perp\) como una combinación lineal de los vectores base.
    4

    Considerar los vectores

    \ begin {ecuación*}\ mathbf w_1=\ fourvec1100,\ hspace {24pt}\ mathbf w_2=\ fourvec0011,\ hspace {24pt}\ mathbf b=\ fourvec2 {-4} 13. \ end {ecuación*}
    1. Si\(L\) es la línea definida por el vector\(\mathbf w_1\text{,}\) encuentra el vector\(L\) más cercano a\(\mathbf b\text{.}\) Llamar a este vector\(\bhat_1\text{.}\)
    2. Si\(W\) es el subespacio abarcado por\(\mathbf w_1\) y\(\mathbf w_2\text{,}\) encuentra el vector\(W\) más cercano a\(\mathbf b\text{.}\) Llamar a este vector\(\bhat_2\text{.}\)
    3. Determinar si\(\bhat_1\) o\(\bhat_2\) está más cerca\(\mathbf b\) y explica por qué.
    5

    Supongamos que\(\mathbf w=\threevec2{-1}2\) define una línea\(L\) en\(\mathbb R^3\text{.}\)

    1. Encuentra las proyecciones ortogonales de los vectores\(\threevec100\text{,}\)\(\threevec010\text{,}\)\(\threevec001\) en\(L\text{.}\)
    2. Encuentra la matriz\(P = \frac{1}{\len{\mathbf w}^2} \mathbf w \mathbf w^T\text{.}\)
    3. Usa la Proposición 2.5.4 para explicar por qué las columnas de\(P\) están relacionadas con las proyecciones ortogonales que encontraste en la primera parte de esta exericse.
    6

    Supongamos que

    \ begin {ecuación*}\ mathbf v_1=\ tresvec103,\ hspace {24pt}\ mathbf v_2=\ tresvec222\ end {ecuación*}

    formar la base de un avión\(W\) en\(\mathbb R^3\text{.}\)

    1. Encuentra una base para la línea que es el complemento ortogonal\(W^\perp\text{.}\)
    2. Dado el vector\(\mathbf b=\threevec6{-6}2\text{,}\) encontrar\(\yvec\text{,}\) la proyección ortogonal de\(\mathbf b\) sobre la línea\(W^\perp\text{.}\)
    3. Explicar por qué el vector\(\zvec = \mathbf b-\yvec\) debe estar en\(W\) y escribir\(\zvec\) como una combinación lineal de\(\mathbf v_1\) y\(\mathbf v_2\text{.}\)
    7

    Determina si las siguientes afirmaciones son verdaderas o falsas y explica tu pensamiento.

    1. Si las columnas\(Q\) forman una base ortonormal para un subespacio\(W\) y\(\mathbf w\) es un vector en\(W\text{,}\) entonces\(QQ^T\mathbf w = \mathbf w\text{.}\)
    2. Un conjunto ortogonal de vectores en no\(\mathbb R^8\) puede tener más de 8 vectores.
    3. Si\(Q\) es una\(7\times5\) matriz cuyas columnas son ortonormales, entonces\(QQ^T = I_7\text{.}\)
    4. Si\(Q\) es una\(7\times5\) matriz cuyas columnas son ortonormales, entonces\(Q^TQ = I_5\text{.}\)
    5. Supongamos que la proyección ortogonal de\(\mathbf b\) sobre un subespacio\(W\) satisface\(\bhat = \zerovec\text{.}\) Entonces\(\mathbf b\) está en\(W^\perp\text{.}\)
    8

    Supongamos que\(Q\) es una matriz ortogonal.

    1. Recordando que\(\mathbf v\cdot\mathbf w=\mathbf v^T\mathbf w\text{,}\) explican por qué
      \ begin {ecuación*} Q\ mathbf x\ cdot (Q\ yvec) =\ mathbf x\ cdot\ yvec. \ end {ecuación*}
    2. Explicar por qué\(\len{Q\mathbf x} = \len{\mathbf x}\text{.}\)

      Esto significa que la longitud de un vector no se modifica después de multiplicarse por una matriz ortogonal.

    3. Si\(\lambda\) es un verdadero valor propio de\(Q\text{,}\) explicar por qué\(\lambda=\pm1\text{.}\)
    9

    Explique por qué son ciertas las siguientes afirmaciones.

    1. Si\(Q\) es una matriz ortogonal, entonces\(\det Q = \pm 1\text{.}\)
    2. Si\(Q\) es una\(8\times 4\) matriz cuyas columnas son ortonormales, entonces\(QQ^T\) es una\(8\times8\) matriz cuyo rango es 4.
    3. Si\(\bhat\) es la proyección ortogonal de\(\mathbf b\) sobre un subespacio\(W\text{,}\) entonces\(\mathbf b-\bhat\) es la proyección ortogonal de\(\mathbf b\) sobre\(W^\perp\text{.}\)
    10

    Este ejercicio trata sobre matrices\(2\times2\) ortogonales.

    1. En la Sección 2.6, vimos que la matriz\(\begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}\) representa una rotación por un ángulo\(\theta\text{.}\) Explica por qué esta matriz es una matriz ortogonal.
    2. También vimos que la matriz\(\begin{bmatrix} \cos\theta & \sin\theta \\ \sin\theta & -\cos\theta \end{bmatrix}\) representa un reflejo en una línea. Explique por qué esta matriz es una matriz ortogonal.
    3. Supongamos que\(\mathbf u_1=\twovec{\cos\theta}{\sin\theta}\) es un vector unitario bidimensional. Use un boceto para indicar todos los vectores posibles de\(\mathbf u_2\) tal manera que\(\mathbf u_1\) y\(\mathbf u_2\) formen una base ortonormal de\(\mathbb R^2\text{.}\)
    4. Explique por qué cada matriz\(2\times2\) ortogonal es ya sea una rotación o una reflexión.

    This page titled 6.3: Bases ortogonales y proyecciones is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by David Austin via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.