5.3: Perturabciones medidas en la norma Frobenius
- Page ID
- 85754
Ahora demostraremos que, para los casos de perturbación multiplicativa y aditiva donde minimizamos la norma 2 inducida, también minimizamos la norma Frobenius.
Vamos\(A \in C^{m \times n}\), y vamos\(rank(A) = r\).
\[\|A\|_{F} \triangleq\left(\sum_{j=1}^{n} \sum_{i=1}^{m}\left|a_{i j}\right|^{2}\right)^{\frac{1}{2}} \ \tag{5.8}\]
\[=\left(\operatorname{trace}\left(A^{\prime} A\right)\right)^{\frac{1}{2}} \ \tag{5.9}\]
\[=(\Sigma_{i=1}^{r} \sigma_{i}^{2})^{\frac{1}{2}} (\text{the trace of a matrix is the sum of its eigenvalues}) \ \tag{5.10}\]
\[\geq \sigma_{1}(A) \ \tag{5.11}\]
Por lo tanto,
\[\|A\|_{F} \geq\|A\|_{2} \ \tag{5.12}\]
que es una desigualdad útil.
Tanto en los problemas de perturbación que consideramos anteriormente, encontramos una solución de rango uno, o díada, para\(\Delta\):
\[\Delta=\alpha u v^{\prime} \ \tag{5.13}\]
donde\(\alpha \in \mathbb{C}\),\(u \in \mathbb{C}^{n}\),\(v \in \mathbb{C}^{n}\) tal que\(\|u\|_{2}=\|v\|_{2}=1\). Es fácil demostrar que la norma Frobenius y la norma 2 inducida son iguales para las matrices de rango uno de la forma en la Ecuación (5.13). De esto se deduce que la\(\Delta\) que minimiza la norma 2 inducida también minimiza la norma Frobenius, para los casos de perturbación aditiva y multiplicativa que hemos examinado. En general, sin embargo, minimizar la norma 2 inducida de una matriz no implica que se minimice la norma Frobenius (o viceversa).
Ejemplo 5.1
Este ejemplo pretende ilustrar el uso de la descomposición de valores singulares y las normas de Frobenius en la solución de un problema de distancia mínima.
Solución
Supongamos que tenemos una matriz\(A \in \mathbb{C}^{n \times n}\), y estamos interesados en encontrar la matriz más cercana a\(A\) de la forma\(cW\) donde\(c\) es un número complejo y\(W\) es una matriz unitaria. La distancia se va a medir por la norma Frobenius. Este problema puede formularse como
\[\min _{c \in \mathbb{C}, W \in \mathbb{C}^{n \times n}}\|A-c W\|_{F}\nonumber\]
donde\(W^{\prime}W = I\). Podemos escribir
\ [\ begin {aligned}
\ |a-C W\ |_ {F} ^ {2} &=\ nombreoperador {Tr}\ left ((A-c W) ^ {\ prime} (A-c W)\ right)\\
&=\ nombreoperador {Tr}\ left (A^ {\ prime} A\ right) -c^ {\ prime}\ nombreoperador {Tr}\ left (W^ {\ prime} A\ derecha) -c\ nombreoperador {Tr}\ izquierda (A^ {\ prime} W\ derecha) +|c|^ {2}\ nombreoperador {Tr}\ izquierda (W^ {\ prime} W\ derecha)
\ final {alineado}\ nonumber\]
Tenga en cuenta que\(\operatorname{Tr}(W^{\prime}W) = \operatorname{Tr}(I) = n\). Por lo tanto, tenemos
\[\|A-c W\|_{F}^{2}=\|A\|_{F}^{2}-2 \operatorname{Re}\left(c^{\prime} \operatorname{Tr}\left(W^{\prime} A\right)\right)+n|c|^{2} \ \tag{5.14}\]
y tomando
\[c=\frac{1}{n} \operatorname{Tr}\left(W^{\prime} A\right)\nonumber\]
se minimizará el lado derecho de la Ecuación (5.14). Por lo tanto tenemos que
\[\|A-c W\|_{F}^{2} \geq\|A\|_{F}^{2}-\frac{1}{n}\left|\operatorname{Tr}\left(W^{\prime} A\right)\right|^{2}\nonumber\]
Ahora debemos minimizar el lado derecho con respecto a\(W\), lo que equivale a maximizar\(\left|\operatorname{Tr}\left(W^{\prime} A\right)\right|\). Para lograr esto empleamos el valor singular descomposición de\(A\) as\(U \Sigma V^{\prime}\), lo que da
\ [\ begin {alineado}
\ izquierda|\ nombreoperador {Tr}\ izquierda (W^ {\ prime} A\ derecha)\ derecha|^ {2} &=\ izquierda|\ nombreoperador {Tr}\ izquierda (W^ {\ prime} U\ Sigma V^ {\ prime}\ derecha)\ derecha|^ {2}\
&=\ izquierda|\ nombreoperador {Tr}\ izquierda (V^ {\ prime} W^ {\ prime} U\ Sigma\ derecha)\ derecha|^ {2}
\ end {alineado}\ nonumber\]
La matriz\(Z = V^{\prime} W^{\prime} U\) satisface
\ [\ begin {alineado}
Z Z^ {\ prime} &=V^ {\ prime} W^ {\ prime} U ^ {\ prime} W V\\
&=I
\ end {alineado}\ nonumber\]
Por lo tanto,
\[|\operatorname{Tr}(Z \Sigma)|^{2}=\left|\sum_{i=1}^{n} \sigma_{i} z_{i i}\right|^{2} \leq\left(\sum_{i=1}^{n} \sigma_{i}\right)^{2}\nonumber\]
implica que
\[\min _{c, W}\|A-c W\|_{F}^{2} \geq\|A\|_{F}^{2}-\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}\right)^{2} \ \tag{5.15}\]
Para completar este ejemplo mostramos que el límite inferior en la Ecuación (5.15) realmente se puede lograr con una elección específica de\(W\). Observe que
\[\operatorname{Tr}\left(W^{\prime} U \Sigma V^{\prime}\right)=\operatorname{Tr}\left(W^{\prime} U V^{\prime} \Sigma\right)\nonumber\]
y al dejar que\(W^{\prime}= V U^{\prime}\) obtengamos
\[\operatorname{Tr}\left(W^{\prime} A\right)=\operatorname{Tr}(\Sigma)=\sum_{i=1}^{n} \sigma_{i}\nonumber\]
y
\[c=\frac{1}{n} \sum_{i=1}^{n} \sigma_{i}\nonumber\]
Juntando todas las piezas, lo conseguimos
\[\min _{c, W}\|A-c W\|_{F}^{2}=\sum_{i=1}^{n} \sigma_{i}^{2}-\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}^{2}\right)^{2}\nonumber\]
y la matriz unitaria minimizadora viene dada por
\[c W=\frac{1}{n}\left(\sum_{i=1}^{n} \sigma_{i}\right) U V^{\prime}\nonumber\]
Es claro también que, para que una matriz se represente exactamente como un múltiplo complejo de una matriz unitaria, todos sus valores singulares deben ser iguales.