5.3: Perturabciones medidas en la norma Frobenius

Última actualización
Guardar como PDF

Page ID: 85754

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Ahora demostraremos que, para los casos de perturbación multiplicativa y aditiva donde minimizamos la norma 2 inducida, también minimizamos la norma Frobenius.

Vamos\(A \in C^{m \times n}\), y vamos\(rank(A) = r\).

\[\|A\|_{F} \triangleq\left(\sum_{j=1}^{n} \sum_{i=1}^{m}\left|a_{i j}\right|^{2}\right)^{\frac{1}{2}} \ \tag{5.8}\]

\[=\left(\operatorname{trace}\left(A^{\prime} A\right)\right)^{\frac{1}{2}} \ \tag{5.9}\]

\[=(\Sigma_{i=1}^{r} \sigma_{i}^{2})^{\frac{1}{2}} (\text{the trace of a matrix is the sum of its eigenvalues}) \ \tag{5.10}\]

\[\geq \sigma_{1}(A) \ \tag{5.11}\]

Por lo tanto,

\[\|A\|_{F} \geq\|A\|_{2} \ \tag{5.12}\]

que es una desigualdad útil.

Tanto en los problemas de perturbación que consideramos anteriormente, encontramos una solución de rango uno, o díada, para\(\Delta\):

\[\Delta=\alpha u v^{\prime} \ \tag{5.13}\]

donde\(\alpha \in \mathbb{C}\),\(u \in \mathbb{C}^{n}\),\(v \in \mathbb{C}^{n}\) tal que\(\|u\|_{2}=\|v\|_{2}=1\). Es fácil demostrar que la norma Frobenius y la norma 2 inducida son iguales para las matrices de rango uno de la forma en la Ecuación (5.13). De esto se deduce que la\(\Delta\) que minimiza la norma 2 inducida también minimiza la norma Frobenius, para los casos de perturbación aditiva y multiplicativa que hemos examinado. En general, sin embargo, minimizar la norma 2 inducida de una matriz no implica que se minimice la norma Frobenius (o viceversa).

Ejemplo 5.1

Este ejemplo pretende ilustrar el uso de la descomposición de valores singulares y las normas de Frobenius en la solución de un problema de distancia mínima.

Solución

Supongamos que tenemos una matriz\(A \in \mathbb{C}^{n \times n}\), y estamos interesados en encontrar la matriz más cercana a\(A\) de la forma\(cW\) donde\(c\) es un número complejo y\(W\) es una matriz unitaria. La distancia se va a medir por la norma Frobenius. Este problema puede formularse como

\[\min _{c \in \mathbb{C}, W \in \mathbb{C}^{n \times n}}\|A-c W\|_{F}\nonumber\]

donde\(W^{\prime}W = I\). Podemos escribir

\ [\ begin {aligned}
\ |a-C W\ |_ {F} ^ {2} &=\ nombreoperador {Tr}\ left ((A-c W) ^ {\ prime} (A-c W)\ right)\\
&=\ nombreoperador {Tr}\ left (A^ {\ prime} A\ right) -c^ {\ prime}\ nombreoperador {Tr}\ left (W^ {\ prime} A\ derecha) -c\ nombreoperador {Tr}\ izquierda (A^ {\ prime} W\ derecha) +|c|^ {2}\ nombreoperador {Tr}\ izquierda (W^ {\ prime} W\ derecha)
\ final {alineado}\ nonumber\]

Tenga en cuenta que\(\operatorname{Tr}(W^{\prime}W) = \operatorname{Tr}(I) = n\). Por lo tanto, tenemos

\[\|A-c W\|_{F}^{2}=\|A\|_{F}^{2}-2 \operatorname{Re}\left(c^{\prime} \operatorname{Tr}\left(W^{\prime} A\right)\right)+n|c|^{2} \ \tag{5.14}\]

y tomando

\[c=\frac{1}{n} \operatorname{Tr}\left(W^{\prime} A\right)\nonumber\]

se minimizará el lado derecho de la Ecuación (5.14). Por lo tanto tenemos que

\[\|A-c W\|_{F}^{2} \geq\|A\|_{F}^{2}-\frac{1}{n}\left|\operatorname{Tr}\left(W^{\prime} A\right)\right|^{2}\nonumber\]

Ahora debemos minimizar el lado derecho con respecto a\(W\), lo que equivale a maximizar\(\left|\operatorname{Tr}\left(W^{\prime} A\right)\right|\). Para lograr esto empleamos el valor singular descomposición de\(A\) as\(U \Sigma V^{\prime}\), lo que da

\ [\ begin {alineado}
\ izquierda|\ nombreoperador {Tr}\ izquierda (W^ {\ prime} A\ derecha)\ derecha|^ {2} &=\ izquierda|\ nombreoperador {Tr}\ izquierda (W^ {\ prime} U\ Sigma V^ {\ prime}\ derecha)\ derecha|^ {2}\
&=\ izquierda|\ nombreoperador {Tr}\ izquierda (V^ {\ prime} W^ {\ prime} U\ Sigma\ derecha)\ derecha|^ {2}
\ end {alineado}\ nonumber\]

La matriz\(Z = V^{\prime} W^{\prime} U\) satisface

\ [\ begin {alineado}
Z Z^ {\ prime} &=V^ {\ prime} W^ {\ prime} U ^ {\ prime} W V\\
&=I
\ end {alineado}\ nonumber\]

Por lo tanto,

\[|\operatorname{Tr}(Z \Sigma)|^{2}=\left|\sum_{i=1}^{n} \sigma_{i} z_{i i}\right|^{2} \leq\left(\sum_{i=1}^{n} \sigma_{i}\right)^{2}\nonumber\]

implica que

\[\min _{c, W}\|A-c W\|_{F}^{2} \geq\|A\|_{F}^{2}-\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}\right)^{2} \ \tag{5.15}\]

Para completar este ejemplo mostramos que el límite inferior en la Ecuación (5.15) realmente se puede lograr con una elección específica de\(W\). Observe que

\[\operatorname{Tr}\left(W^{\prime} U \Sigma V^{\prime}\right)=\operatorname{Tr}\left(W^{\prime} U V^{\prime} \Sigma\right)\nonumber\]

y al dejar que\(W^{\prime}= V U^{\prime}\) obtengamos

\[\operatorname{Tr}\left(W^{\prime} A\right)=\operatorname{Tr}(\Sigma)=\sum_{i=1}^{n} \sigma_{i}\nonumber\]

\[c=\frac{1}{n} \sum_{i=1}^{n} \sigma_{i}\nonumber\]

Juntando todas las piezas, lo conseguimos

\[\min _{c, W}\|A-c W\|_{F}^{2}=\sum_{i=1}^{n} \sigma_{i}^{2}-\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}^{2}\right)^{2}\nonumber\]

y la matriz unitaria minimizadora viene dada por

\[c W=\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}\right) U V^{\prime}\nonumber\]

Es claro también que, para que una matriz se represente exactamente como un múltiplo complejo de una matriz unitaria, todos sus valores singulares deben ser iguales.