Saltar al contenido principal
LibreTexts Español

15.6: Desigualdad de Cauchy-Schwarz

  • Page ID
    86582
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Introducción

    Cualquier tratamiento del álgebra lineal relacionado con el procesamiento de señales no estaría completo sin una discusión sobre la desigualdad Cauchy-Schwarz, una relación que permite una amplia gama de aplicaciones de procesamiento de señales relacionadas con la coincidencia de patrones a través de un método llamado filtro coincidente. Recordemos que en el espacio euclidiano estándar, el ángulo\(\theta\) entre dos vectores\(x,y\) viene dado por

    \[\cos (\theta)=\frac{\langle x, y\rangle}{\|x\|\|y\|}. \nonumber \]

    Ya que\(\cos (\theta) \leq 1\), de ello se deduce que

    \[|\langle x, y\rangle|^{2} \leq\langle x, x\rangle\langle y, y\rangle. \nonumber \]

    Además, la igualdad se mantiene si y solo si\(\cos(\theta)=0\), lo que implica que

    \[|\langle x, y\rangle|^{2}=\langle x, x\rangle\langle y, y\rangle \nonumber \]

    si y sólo si\(y=ax\) para algunos reales\(a\). Esta relación se puede extender a todos los espacios internos del producto sobre un campo real o complejo y se conoce como la desigualdad Cauchy-Schwarz, que es de gran importancia para el estudio de las señales.

    La desigualdad de Cauchy-Schwarz

    Declaración de la Desigualdad Cauchy-Schwarz

    El enunciado general de la desigualdad Cauchy-Schwarz refleja la intuición para el espacio euclídeo estándar. Dejar\(V\) ser un espacio interior del producto sobre el campo de números complejos\(\mathbb{C}\) con producto interno\(\langle\cdot, \cdot\rangle\). Por cada par de vectores\(x, y \in V\) la desigualdad

    \[|\langle x, y\rangle|^{2} \leq\langle x, x\rangle\langle y, y\rangle \nonumber \]

    sostiene. Además, la igualdad

    \[|\langle x, y\rangle|^{2}=\langle x, x\rangle\langle y, y\rangle \nonumber \]

    sostiene si y sólo si\(y=ax\) para algunos\(a \in \mathbb{C}\). Es decir, la igualdad se mantiene si y sólo si\(x\) y\(y\) son linealmente dependientes.

    Prueba de la desigualdad Cauchy-Schwarz

    Dejar\(V\) ser un espacio vectorial sobre el campo real o complejo\(F\), y dejar que\(x,y \in V\) se le dé. Para probar la desigualdad Cauchy-Schwarz, primero se probará que\(|\langle x, y\rangle|^{2}=\langle x, x\rangle\langle y, y\rangle\) si\(y=ax\) para algunos\(a \in F\). Entonces se demostrará que\(|\langle x, y\rangle|^{2}<\langle x, x\rangle\langle y, y\rangle\) si es\(y \neq a x\) por todos\(a \in F\).

    Consideremos el caso en el que\(y=ax\) para algunos\(a \in F\). A partir de las propiedades de los productos internos, queda claro que

    \ [\ begin {align}
    |\ langle x, y\ rangle|^ {2} &=|\ langle x, a x\ rangle|^ {2}\ nonumber\\
    &=|\ bar {a}\ langle x, x\ rangle|^ {2}
    \ end {align}. \ nonumber\]

    De ahí que se deduce que

    \ [\ begin {align}
    |\ langle x, y\ rangle|^ {2} &=|\ bar {a} |^ {2} |\ langle x, x\ rangle|^ {2}\ nonumber\\
    &=|a|a|^ {2}\ langle x, x\ rangle^ {2}
    \ end {align}. \ nonumber\]

    Del mismo modo, es claro que

    \ [\ begin {align}
    \ langle x, x\ rangle\ langle y, y\ rangle &=\ langle x, x\ rangle\ langle\ langle a x, a x\ rangle\ nonumber\
    &=\ langle x, x\ rangle a\ bar {a}\ langle x, x\ rangle\ nonumber\\
    &=|a|^ {2}\ langle x, x\ rangle^ {2}
    \ end {align}\ nonumber\]

    Así, está comprobado que\(|\langle x, y\rangle|^{2}=\langle x, x\rangle\langle y, y\rangle\) si\(x=ay\) para algunos\(a \in F\).

    A continuación, considere el caso en el que\(y \neq a x\) para todos\(a \in F\), lo que implica que\(y \neq 0\) así\(\langle y, y\rangle \neq 0\). Así, se desprende de las propiedades de los productos internos que, para todos\(a \in F\),\(\langle x-a y, x-a y\rangle>0\). Esto se puede expandir usando las propiedades de los productos internos a la expresión

    \ [\ begin {align}
    \ langle x-a y, x-a y\ rangle &=\ langle x, x-a y\ rangle-a\ langle y, x-a y\ rangle\ nOnumber\\
    &=\ langle x, x\ rangle-\ bar {a}\ langle x, y\ rangle-a\ langle y, x\ rangle+|a|^ {}\ langle y, y\ rangle
    \ end {align}\ nonumber\]

    Eligiendo\(a=\frac{\langle x, y\rangle}{\langle y, y\rangle}\),

    \ [\ begin {align}
    \ langle x-a y, x-a y\ rangle &=\ langle x, x\ rangle-\ frac {\ langle y, x\ rangle} {\ langle y, y\ rangle}\ langle x, y\ rangle-\ frac {\ langle x, y\ rangle} {\ langle y,\ y rangle}\ y, x\ alcance+\ frac {\ langle x, y\ rangle\ langle y, x\ rangle} {\ langle y, y\ rangle^ {2}}\ langle y, y\ rangle\ nonumber\\
    &=\ langle x, x\ rangle-\ frac {\ langle x, y\ rangle\ langle y, x\ rangle} {\ langle y, y\ rangle}
    \ end {align}\ nonumber\]

    De ahí que de ello se deduce\(\langle x, x\rangle-\frac{\langle x, y\rangle\langle y, x\rangle}{\langle y, y\rangle}>0\). En consecuencia,\(\langle x, x\rangle\langle y, y\rangle-\langle x, y\rangle \overline{\langle x, y}\rangle>0\). Así, se puede concluir que\(|\langle x, y\rangle|^{2}<\langle x, x\rangle\langle y, y\rangle\) si es\(y \neq a x\) para todos\(a \in F\).

    Por lo tanto, la desigualdad

    \[|\langle x, y\rangle|^{2} \leq\langle x, x\rangle\langle y, y\rangle \nonumber \]

    sostiene para todos\(x,y \in V\), y la igualdad

    \[|\langle x, y\rangle|^{2}=\langle x, x\rangle\langle y, y\rangle \nonumber \]

    sostiene si y sólo si\(y=ax\) para algunos\(a \in F\).

    Implicaciones matemáticas adicionales

    Considera la maximización de\(\left|\left\langle\frac{x}{\| x||}, \frac{y}{\|y\|}\right\rangle\right|\) donde la norma\(\|\cdot\|=\langle\cdot , \cdot\rangle\) es inducida por el producto interno. Por la desigualdad Cauchy-Schwarz, sabemos eso\(\left|\left\langle\frac{x}{|| x||}, \frac{y}{\|y\|}\right\rangle\right|^{2} \leq 1\) y eso\(\left|\left\langle\frac{x}{|| x||}, \frac{y}{\|y\|}\right\rangle\right|^{2}=1\) si y sólo si\(\frac{y}{\|y\|}=a \frac{x}{\|x\|}\) para algunos\(a \in \mathbb{C}\). De ahí,\(\left|\left\langle\frac{x}{\| x||}, \frac{y}{\|y\|}\right\rangle\right|\) alcanza un máximo donde\(\frac{y}{\|y\|}=a \frac{x}{\|x\|}\) para algunos\(a \in \mathbb{C}\). Así, recogiendo las variables escalares,\(\left|\left\langle\frac{x}{\| x||}, \frac{y}{\|y\|}\right\rangle\right|\) alcanza un máximo donde\(y=ax\). Este resultado será particularmente útil en el desarrollo de las técnicas de detección de filtro coincidentes.

    Detector de filtro emparejado

    Conceptos de fondo

    Muchas aplicaciones en el procesamiento de señales, procesamiento de imágenes y más allá implican determinar la presencia y ubicación de una señal objetivo dentro de alguna otra señal. Un sistema de radar, por ejemplo, busca copias de un pulso de radar transmitido para determinar la presencia y distancia a objetos reflectantes como edificios o aeronaves. Un sistema de comunicación busca copias de formas de onda que representan 0s y 1s digitales para recibir un mensaje.

    Como ya se ha mostrado, la expresión\(\left|\left\langle\frac{x}{\|x\|}, \frac{y}{\|y\|}\right\rangle\right|\) alcanza su límite superior, que es 1, cuando\(y=ax\) para algún escalar\(a\) en un campo real o complejo. El límite inferior, que es 0, se alcanza cuando\(x\) y\(y\) son ortogonales. En la intuición informal, esto significa que la expresión se maximiza cuando los vectores\(x\) y\(y\) tienen la misma forma o patrón y minimizada cuando\(x\) y\(y\) son muy diferentes. Un par de vectores con formas o patrones similares pero desiguales producirán un valor relativamente grande de la expresión menor que 1, y un par de vectores con formas o patrones muy diferentes pero no ortogonales producirán valores relativamente pequeños de la expresión mayores que 0. Así, la expresión anterior lleva consigo una noción del grado en que dos señales son “iguales”, la magnitud de la correlación normalizada entre las señales en el caso de los productos internos estándar.

    Este concepto puede ser sumamente útil. Por ejemplo, consideremos una situación en la que deseamos determinar qué señal, si la hay, de un conjunto\(X\) de señales se parece más a una señal particular\(y\). Para lograr esto, podríamos evaluar la expresión anterior para cada señal\(x \in X\), eligiendo la que dé como resultado máximos siempre que esos máximos estén por encima de algún umbral de “semejanza”. Esta es la idea detrás del detector de filtro emparejado, que compara un conjunto de señales contra una señal objetivo usando la expresión anterior para determinar cuáles de ellas se parecen más a la señal objetivo. Para un tratamiento detallado de las aplicaciones del detector de filtro emparejado ver el módulo gustado.

    Comparación de señales

    La variante más simple del esquema de detector de filtro emparejado sería encontrar la señal miembro en un conjunto\(X\) de señales que coincidan más estrechamente con una señal objetivo\(y\). Por lo tanto, para cada uno que\(x \in X\) deseamos evaluar

    \[m(x, y)=\left|\left\langle\frac{x}{\|x\|}, \frac{y}{\|y\|}\right\rangle\right| \nonumber \]

    con el fin de comparar cada miembro\(X\) de con la señal objetivo\(y\). Dado que se desea el miembro del\(X\) que más\(y\) se aproxime a la señal objetivo, en última instancia deseamos evaluar

    \[x_{m}=\operatorname{argmax}_{x \in X}\left|\left\langle\frac{x}{\|x\|}, \frac{y}{\|y\|}\right\rangle\right|. \nonumber \]

    Tenga en cuenta que la señal objetivo no necesita normalizarse técnicamente para producir un máximo, sino que da la propiedad deseable a la que\(m(x,y)\) se limita\([0,1]\).

    El elemento\(x_m \in X\) que produce el valor máximo de no\(m(x,y)\) es necesariamente único, por lo que puede haber más de una señal coincidente en\(X\). Adicionalmente, la señal\(x_m \in X\) que produce el valor máximo de\(m(x,y)\) puede no producir un valor muy grande de\(m(x,y)\) y, por lo tanto, no ser muy parecida a la señal objetivo\(y\). Por lo tanto, otro esquema de filtro coincidente podría identificar el argumento que produce el máximo pero solo por encima de un cierto umbral, no devolviendo señales coincidentes\(X\) si el máximo está por debajo del umbral. También puede haber una señal\(x \in X\) que produzca un gran valor de\(m(x,y)\) y por lo tanto tenga un alto grado de “semejanza” a yy pero no produzca el valor máximo de\(m(x,y)\). Por lo tanto, otro esquema de filtro coincidente podría identificar todas las señales en la\(X\) producción de máximos locales que están por encima de un cierto umbral.

    Ejemplo\(\PageIndex{1}\)

    Por ejemplo, considere la señal objetivo dada en la Figura\(\PageIndex{1}\) y el conjunto de dos señales dadas en la Figura\(\PageIndex{2}\). Por inspección, es claro que la señal\(g_2\) se parece más a la señal objetivo\(f\). Sin embargo, para llegar a esa conclusión matemáticamente, utilizamos el detector de filtro emparejado con el producto\(L_2\) interno. Si realmente tuviéramos que hacer los cálculos necesarios, primero normalizaríamos cada señal y luego calcularíamos los productos internos necesarios para comparar las señales\(X\) con la señal objetivo\(f\). Notaríamos que el valor absoluto del producto interno para\(g_2\) con\(f\) cuando se normaliza es mayor que el valor absoluto del producto interno de\(g_1\) con\(f\) cuando se normaliza, expresado matemáticamente como

    \[g_{2}=\operatorname{argmax}_{x \in\left\{g_{1} , g_{2}\right\}}\left|\left\langle\frac{x}{\| x||}, \frac{f}{\|f\|}\right\rangle\right| \nonumber \]

    Señal de plantilla
    Figura\(\PageIndex{1}\): Deseamos encontrar una coincidencia para esta señal objetivo en el conjunto de señales a continuación.

    Señales de Candidatos

    Figura\(\PageIndex{2}\): Deseamos encontrar una coincidencia para la señal objetivo anterior en este conjunto de señales.

    Detección de Patrones

    Un esquema de detector de filtro emparejado algo más involucrado implicaría intentar hacer coincidir una señal\(y=f\) de tiempo limitado objetivo con un conjunto de versiones con desplazamiento de tiempo y en ventana de una única señal\(X=\left\{w S_{t} g \mid t \in \mathbb{R}\right\}\) indexada por\(\mathbb{R}\). La función de ventana viene dada por\(w(t)=u(t−t_1)−u(t−t_2)\) donde\([t_1,t_2]\) está el intervalo al que\(f\) está limitado en el tiempo. Este esquema podría usarse para encontrar porciones de\(g\) que tengan la misma forma que\(f\). Si el valor absoluto del producto interno de las versiones normalizadas de\(f\) y\(wS_t g\) es grande, que es el valor absoluto de la correlación normalizada para los productos internos estándar, entonces gg tiene un alto grado de “semejanza” a\(f\) en el intervalo al cual\(f\) está limitado en el tiempo pero desplazado a la izquierda por\(t\). Por supuesto, si no\(f\) está limitado en el tiempo, significa que toda la señal tiene un alto grado de “semejanza” a la\(f\) izquierda desplazada por\(t\).

    Por lo tanto, para determinar las ubicaciones más probables de una señal con la misma forma que la señal objetivo\(f\) en una señal\(g\) deseamos calcular

    \[t_{m}=\operatorname{argmax}_{t \in \mathbb{R}}\left|\left\langle\frac{f}{\|f\|}, \frac{w S_{t} g}{\left\|w S_{t} g\right\|}\right\rangle\right| \nonumber \]

    para proporcionar el turno deseado. Suponiendo que el espacio interno del producto examinado es\(L_2\)\(\mathbb{R}\) ((resultados similares se mantienen para\(L_2 (\mathbb{R}[a,b)\))\(l_2(\mathbb{Z})\), y\(l_2(\mathbb{Z}[a,b))\)), esto produce

    \[t_{m}=\operatorname{argmax}_{t \in \mathbb{R}} \mid \frac{1}{\|f\|\left\|w S_{t} g\right\|} \int_{-\infty}^{\infty} f(\tau) w(\tau) \overline{g(\tau-t)} d \tau \nonumber \]

    Desde\(f\) y\(w\) están limitados en el tiempo al mismo intervalo

    \[t_{m}=\operatorname{argmax}_{t \in \mathbb{R}}\left|\frac{1}{\|f\|\left\|w S_{t} g\right\|} \int_{t_{1}}^{t_{2}} f(\tau) \overline{g(\tau-t)} d \tau\right| \nonumber \]

    Haciendo la sustitución\(h(t)=\overline{g(-t)}\),

    \[t_{m}=\operatorname{argmax}_{t \in \mathbb{R}}\left|\frac{1}{\|f\|\left\|w S_{t} g\right\|} \int_{t_{1}}^{t_{2}} f(\tau) h(t-\tau) d \tau\right| \nonumber \]

    Observando que esta expresión contiene una operación de convolución

    \[t_{m}=\operatorname{argmax}_{t \in \mathbb{R}}\left|\frac{(f * h)(t)}{\|f\|\left\|w S_{t} g\right\|}\right|. \nonumber \]

    donde\(h\) es el conjugado de la versión de tiempo invertido de\(g\) definido por\(h(t)=\overline{g(-t)}\).

    En el caso especial en el que la señal objetivo no\(f\) esté limitada en el tiempo,\(w\) tiene valor unitario en toda la línea real. Así, la norma puede ser evaluada como\(\left\|w S_{t} g\right\|=\left\|S_{t} g\right\|=\|g\|=\|h\|\). Por lo tanto, la función se reduce a\(t_{m}=\operatorname{argmax}_{t \in \mathbb{R}} \frac{\left(f^{*} h\right)(t)}{\|f\|\|h\|}\) donde\(h(t)=\overline{g(-t)}\). La función\(f \text { ☆ } g=\frac{\left(f^{*} h\right)(t)}{\|f\|\|h\|}\) se conoce como la correlación cruzada normalizada de\(f\) y\(g\).

    Por lo tanto, este esquema de filtro coincidente se puede implementar como una convolución. Por lo tanto, puede ser conveniente implementarlo en el dominio de la frecuencia. Resultados similares se mantienen para los\(L_2(\mathbb{R}[a,b))\),\(l_2(\mathbb{Z})\), y\(l_2(\mathbb{Z}[a,b])\) espacios. Es especialmente útil implementar\(l_2(\mathbb{Z}[a,b])\) los casos en el dominio de la frecuencia ya que la potencia del algoritmo de Transformada Rápida de Fourier se puede aprovechar para realizar rápidamente los cálculos en un programa de computadora. En los\(l_2(\mathbb{Z}[a,b])\) casos\(L_2(\mathbb{R}[a,b))\) y, se debe tener cuidado de poner a cero la señal si no se desean efectos envolventes. Resultados similares también se mantienen para espacios en intervalos dimensionales más altos con los mismos productos internos.

    Por supuesto, no hay necesariamente exactamente una instancia de una señal objetivo en una señal dada. Podría haber una instancia, más de una instancia, o ninguna instancia de una señal objetivo. Por lo tanto, a menudo es más práctico identificar todos los turnos correspondientes a máximos locales que estén por encima de un cierto umbral.

    Ejemplo\(\PageIndex{2}\)

    La señal en la Figura\(\PageIndex{4}\) contiene una instancia de la señal de plantilla vista en la Figura\(\PageIndex{3}\) comenzando en el tiempo\(t=s_1\) como se muestra en la gráfica de la Figura\(\PageIndex{5}\). Por lo tanto,

    \[s_{1}=\operatorname{argmax}_{t \in \mathbb{R}}\left|\left\langle\frac{f}{\|f\|}, \frac{w S_{t} g}{\left\|w S_{t} g\right\|}\right\rangle\right| \nonumber \]

    Señal de patrón
    Figura\(\PageIndex{3}\): Esta función muestra el patrón que estamos buscando en la señal de abajo, que ocurre en el momento\(t=s_1\).
    Señal más larga
    Figura\(\PageIndex{4}\): Esta señal contiene una instancia de la señal anterior comenzando en el tiempo\(t=s_1\).
    Valor Absoluto de Salida
    Figura\(\PageIndex{5}\): Esta señal muestra un boceto del valor absoluto de la salida del filtro coincidente para el intervalo mostrado. Tenga en cuenta que esto fue solo un boceto de “aproximación del globo ocular”. Observe el pico pronunciado en el momento\(t=s_1\).

    Videoconferencia sobre la desigualdad de Cauchy-Schwarz

    Prueba de la desigualdad Cauchy-Schwarz
    Figura\(\PageIndex{6}\): Videoconferencia sobre la prueba de la desigualdad Cauchy-Schwarz de Khan Academy. Sólo se demuestra una parte del teorema.

    Resumen de desigualdad de Cauchy-Schwarz

    Como puede verse, la desigualdad Cauchy-Schwarz es una propiedad de los espacios internos de producto sobre campos reales o complejos que es de particular importancia para el estudio de las señales. Específicamente, la implicación de que el valor absoluto de un producto interno se maximiza sobre los vectores normales cuando los dos argumentos son linealmente dependientes es clave para la justificación del detector de filtro coincidente. Por lo tanto, permite el uso de filtros coincidentes para aplicaciones de coincidencia de patrones tales como detección de imágenes, demodulación de comunicaciones y análisis de señales de radar.


    This page titled 15.6: Desigualdad de Cauchy-Schwarz is shared under a CC BY license and was authored, remixed, and/or curated by Richard Baraniuk et al..