6.1: Derivadas direccionales y parciales
- Page ID
- 113751
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En el Capítulo 5 consideramos funciones\(f : E^{1} \rightarrow E\) de una variable real.
Ahora retomamos funciones\(f : E^{\prime} \rightarrow E\) donde ambos\(E^{\prime}\) y\(E\) son espacios normados.
El campo escalar de ambos siempre se asume igual:\(E^{1}\) o\(C\) (el campo complejo). Aquí\(E=E^{*}\) se excluye el caso; así todo se asume finito.
Utilizamos mayormente letras con flecha\(\vec{p}, \vec{q}, \ldots, \vec{x}, \vec{y}, \vec{z}\) para vectores en el espacio de dominio\(E^{\prime},\) y letras sin flecha para aquellos en\(E\) y para escalares.
Como antes, adoptamos la convención que\(f\) se define en todos\(E^{\prime},\) con\(f(\vec{x})=0\) si no se define de otra manera.
Tenga en cuenta que, si\(\vec{p} \in E^{\prime},\) uno puede expresar algún punto\(\vec{x} \in E^{\prime}\) como
\[\vec{x}=\vec{p}+t \vec{u},\]
con\(t \in E^{1}\) y\(\vec{u}\) un vector unitario. Para si se\(\vec{x} \neq \vec{p},\) establece
\[t=|\vec{x}-\vec{p}| \text { and } \vec{u}=\frac{1}{t}(\vec{x}-\vec{p});\]
y si\(\vec{x}=\vec{p},\) se establece\(t=0,\) y cualquiera\(\vec{u}\) servirá. A menudo usamos la notación
\[\vec{t}=\Delta \vec{x}=\vec{x}-\vec{p}=t \vec{u} \quad\left(t \in E^{1}, \vec{t}, \vec{u} \in E^{\prime}\right).\]
En primer lugar, generalizamos la Definición 1 en el Capítulo 5, §1.
Dado\(f : E^{\prime} \rightarrow E\) y\(\vec{p}, \vec{u} \in E^{\prime}(\vec{u} \neq \overrightarrow{0}),\) definimos la derivada direccional de\(f\) along\(\vec{u}\) (o\(\vec{u}\) -direct derivada de\(f )\) at\(\vec{p}\) by
\[D_{\vec{u}} f(\vec{p})=\lim _{t \rightarrow 0} \frac{1}{t}[f(\vec{p}+t \vec{u})-f(\vec{p})],\]
si este límite existe en\(E\) (finito).
También definimos la función derivada\(\vec{u}\) -dirigida,
\[D_{\vec{u}} f : E^{\prime} \rightarrow E,\]
como se indica a continuación. Para cualquier\(\vec{p} \in E^{\prime}\),
\[D_{\vec{u} f(\vec{p})}=\left\{\begin{array}{ll}{\lim _{t \rightarrow 0} \frac{1}{t}[f(\vec{p}+t \vec{u})-f(\vec{p})]} & {\text { if this limit exists, }} \\ {0} & {\text { otherwise. }}\end{array}\right.\]
Así siempre\(D_{\vec{u}} f\) se define, pero el nombre derivado se usa sólo si el límite (1) existe (finito). Si existe para cada uno\(\vec{p}\) en un conjunto\(B \subseteq E^{\prime},\) llamamos\(D_{\vec{u}} f\) (en notación clásica\(\partial f / \partial \vec{u} )\) la derivada\(\vec{u}\) -dirigida de\(f\) on\(B\).
Tenga en cuenta que, como\(t \rightarrow 0, \vec{x}\) tiende a\(\vec{p}\) sobre la línea\(\vec{x}=\vec{p}+t \vec{u}.\) Así se\(D_{\vec{u}} f(\vec{p})\) puede tratar como un límite relativo sobre esa línea. Observe que depende tanto de la dirección como de la longitud de\(\vec{u}.\) Indeed, tenemos el siguiente resultado.
Dado\(f : E^{\prime} \rightarrow E, \vec{u} \neq \overrightarrow{0},\) y un escalar\(s \neq 0,\) tenemos
\[D_{s \vec{u}} f=s D_{\vec{u}} f.\]
Por otra parte,\(D_{s \vec{u}} f(\vec{p})\) es un derivado genuino iff\(D_{\vec{u}} f(\vec{p})\) es.
- Prueba
-
Establecer\(t=s \theta\) en (1) para obtener
\[s D_{\vec{u}} f(\vec{p})=\lim _{\theta \rightarrow 0} \frac{1}{\theta}[f(\vec{p}+\theta s \vec{u})-f(\vec{p})]=D_{s \vec{u}} f(\vec{p}). \quad \square\]
En particular, tomando\(s=1 /|\vec{u}|,\) tenemos
\[|s \vec{u}|=\frac{|\vec{u}|}{|\vec{u}|}=1 \text { and } D_{\vec{u}} f=\frac{1}{s} D_{s \vec{u}} f.\]
Así todo se reduce al caso\(D_{\vec{v}} f,\) donde\(\vec{v}=s \vec{u}\) se encuentra un vector unitario. Este dispositivo, llamado normalización, es de uso frecuente, pero en realidad no simplifica las cosas.
Si\(E^{\prime}=E^{n}\left(C^{n}\right),\) entonces\(f\) es una función de variables\(n\) escalares\(x_{k}(k=1, \ldots, n)\) y\(E^{\prime}\) tiene los vectores unitarios\(n\) básicos\(\vec{e}_{k}.\) Este ejemplo nos lleva a la siguiente definición.
Si en la fórmula (1),\(E^{\prime}=E^{n}\left(C^{n}\right)\) y\(\vec{u}=\vec{e}_{k}\) para un fijo\(k \leq n,\) llamamos a\(D_{\vec{u}} f\) la función parcialmente derivada para\(f,\) con respecto a\(x_{k},\) denotado
\[D_{k} f \text { or } \frac{\partial f}{\partial x_{k}},\]
y el límite (1) se llama la derivada parcial de\(f\) at\(\vec{p},\) con respecto a\(x_{k},\) denotado
\[D_{k} f(\vec{p}), \text { or } \frac{\partial}{\partial x_{k}} f(\vec{p}), \text { or }\left.\frac{\partial f}{\partial x_{k}}\right|_{\vec{x}=\vec{p}}.\]
Si existe para todos\(\vec{p} \in B,\) llamamos\(D_{k} f\) la derivada parcial (brevemente, parcial) de\(f\) on\(B,\) con respecto a\(x_{k}\).
En cualquier caso, las funciones derivadas siempre\(D_{k} f(k=1, \ldots, n)\) se definen en todos\(E^{n}\left(C^{n}\right).\)
Si\(E^{\prime}=E^{3}\left(C^{3}\right),\) escribimos a menudo\(x, y, z\) para\(x_{1}, x_{2}, x_{3},\) y
\[\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}, \frac{\partial f}{\partial z} \text { for } D_{k} f \quad(k=1,2,3).\]
Nota 1. Si los\(E^{\prime}=E^{1},\) escalares son también “vectores”, y\(D_{1} f\) coincide con\(f^{\prime}\) lo definido en el Capítulo 5, §1 (excepto donde\(f^{\prime}=\pm \infty\)). ¡Explique!
Nota 2. Como hemos observado, la derivada\(\vec{u}\) -dirigida (1) se obtiene manteniendo\(\vec{x}\) en la línea\(\vec{x}=\vec{p}+t \vec{u}.\)
Si\(\vec{u}=\vec{e}_{k},\) la línea es paralela al eje\(k\) th; así todas las coordenadas de\(\vec{x},\) excepto\(x_{k},\) permanecen fijas\(\left(x_{i}=p_{i}, i \neq k\right),\) y\(f\) se comporta como una función de una variable,\(x_{k}.\) así podemos computar\(D_{k} f\) por las reglas habituales de diferenciación, tratando a todos\(x_{i}(i \neq k)\) como constantes y\(x_{k}\) como única variable.
Por ejemplo, let\(f(x, y)=x^{2} y.\) Entonces
\[\frac{\partial f}{\partial x}=D_{1} f(x, y)=2 x y \text { and } \frac{\partial f}{\partial y}=D_{2} f(x, y)=x^{2}.\]
Nota 3. De manera más general, dado\(\vec{p}\) y\(\vec{u} \neq \overrightarrow{0},\) establecido
\[h(t)=f(\vec{p}+t \vec{u}), \quad t \in E^{1}.\]
Entonces\(h(0)=f(\vec{p});\) así
\[\begin{aligned} D_{\vec{u}} f(\vec{p}) &=\lim _{t \rightarrow 0} \frac{1}{t}[f(\vec{p}+t \vec{u})-f(\vec{p})] \\ &=\lim _{t \rightarrow 0} \frac{h(t)-h(0)}{t-0} \\ &=h^{\prime}(0) \end{aligned}\]
si existe el límite. Así todo se reduce a una función\(h\) de una variable real.
Para las funciones\(f : E^{1} \rightarrow E,\) la existencia de una derivada finita (“diferenciabilidad”) en\(p\) implica continuidad en\(p\) (Teorema 1 del Capítulo 5, §1). Pero en el caso general,\(f : E^{\prime} \rightarrow E,\) esto puede fallar aunque\(D_{\vec{u}} f(\vec{p})\) exista para todos\(\vec{u} \neq \overrightarrow{0}\).
a) Definir\(f : E^{2} \rightarrow E^{1}\) por
\[f(x, y)=\frac{x^{2} y}{x^{4}+y^{2}}, \quad f(0,0)=0.\]
Arreglar un vector de unidad\(\vec{u}=\left(u_{1}, u_{2}\right)\) en\(E^{2}.\) Let\(\vec{p}=(0,0).\) To find\(D_{\vec{u}} f(p),\) use the\(h\) of Nota 3:
\[h(t)=f(\vec{p}+t \vec{u})=f(t \vec{u})=f\left(t u_{1}, t u_{2}\right)=\frac{t u_{1}^{2} u_{2}}{t^{2} u_{1}^{4}+u_{2}^{2}} \text { if } u_{2} \neq 0,\]
y\(h=0\) si\(u_{2}=0.\) De ahí
\[D_{\vec{u}} f(\vec{p})=h^{\prime}(0)=\frac{u_{1}^{2}}{u_{2}} \text { if } u_{2} \neq 0,\]
y\(h^{\prime}(0)=0\) si\(u_{2}=0.\) Así\(D_{\vec{u}}(\overrightarrow{0})\) existe para todos\(\vec{u}.\) Sin embargo\(f\) es discontinuo en\(\overrightarrow{0}\) (ver Problema 9 en el Capítulo 4, §3).
b) Dejar
\[f(x, y)=\left\{\begin{array}{ll}{x+y} & {\text { if } x y=0,} \\ {1} & {\text { otherwise.}}\end{array}\right.\]
Entonces\(f(x, y)=x\) en el\(x\) eje -; entonces\(D_{1} f(0,0)=1\).
Sin embargo,\(f\) es discontinuo en\(\overrightarrow{0}\) (incluso relativamente) sobre cualquier línea\(y=a x\)\((a \neq 0).\) Para en esa línea,\(f(x, y)=1\) si es\((x, y) \neq(0,0);\) así\(f(x, y) \rightarrow 1\) pero\(f(0,0)=0+0=0\).
Así la continuidad en\(\overrightarrow{0}\) falla. (¡Pero vea el Teorema 1 a continuación!)
De ahí que, para que la diferenciabilidad implique continuidad, ésta debe definirse de manera más fuerte. Lo hacemos en §3. Por ahora, demostramos sólo algunos teoremas sobre derivados parciales y direccionales, basados en los del Capítulo 5.
Si\(f : E^{\prime} \rightarrow E\) tiene una derivada\(\vec{u}\) -dirigida en\(\vec{p} \in E^{\prime},\) entonces\(f\) es relativamente continua en\(\vec{p}\) sobre la línea
\[\vec{x}=\vec{p}+t \vec{u} \quad\left(\overrightarrow{0} \neq \vec{u} \in E^{\prime}\right).\]
- Prueba
-
Set\(h(t)=f(\vec{p}+t \vec{u}), t \in E^{1}\).
Por Nota 3, nuestra suposición implica que\(h\) (una función en\(E^{1}\)) es diferenciable en\(0.\)
Por Teorema 1 en el Capítulo 5, §1, entonces,\(h\) es continuo en\(0;\) tan
\[\lim _{t \rightarrow 0} h(t)=h(0)=f(\vec{p}),\]
es decir,
\[\lim _{t \rightarrow 0} f(\vec{p}+t \vec{u})=f(\vec{p}).\]
Pero esto significa que\(f(\vec{x}) \rightarrow f(\vec{p})\) como\(\vec{x} \rightarrow \vec{p}\) sobre la línea\(\vec{x}=\vec{p}+t \vec{u},\) para, en esa línea,\(\vec{x}=\vec{p}+t \vec{u}.\)
Así, en efecto,\(f\) es relativamente continuo en\(\vec{p},\) como se afirma. \(\quad \square\)
Tenga en cuenta que en realidad usamos la sustitución\(\vec{x}=\vec{p}+t \vec{u}.\) Esto es admisible ya que la dependencia entre\(x\) y\(t\) es de uno a tono (Corolario 2 (iii) del Capítulo 4, §2). ¿Por qué?
Vamos\(E^{\prime} \ni \vec{u}=\vec{q}-\vec{p}, \vec{u} \neq \overrightarrow{0}\).
Si\(f : E^{\prime} \rightarrow E\) es relativamente continuo en el segmento\(I=L[\vec{p}, \vec{q}]\) y tiene una derivada\(\vec{u}\) -dirigida en\(I-Q\) (\(Q\)contable), entonces
\[|f(\vec{q})-f(\vec{p})| \leq \sup \left|D_{\vec{u}} f(\vec{x})\right|, \quad \vec{x} \in I-Q.\]
- Prueba
-
Establecer de nuevo\(h(t)=f(\vec{p}+t \vec{u})\) y\(g(t)=\vec{p}+t \vec{u}\).
Entonces\(h=f \circ g,\) y\(g\) es continuo en\(E^{1}.\) (¿Por qué?)
Como\(f\) es relativamente continuo en\(I=L[\vec{p}, \vec{q}],\) así es\(h=f \circ g\) en el intervalo\(J=[0,1] \subset E^{1}\) (cf. Capítulo 4, §8, Ejemplo (1)).
Ahora arregla\(t_{0} \in J.\) Si\(\vec{x}_{0}=\vec{p}+t_{0} \vec{u} \in I-Q,\) nuestras suposiciones implican la existencia de
\[\begin{aligned} D_{\vec{u}} f\left(\vec{x}_{0}\right) &=\lim _{t \rightarrow 0} \frac{1}{t}\left[f\left(\vec{x}_{0}+t \vec{u}\right)-f\left(\vec{x}_{0}\right)\right] \\ &=\lim _{t \rightarrow 0} \frac{1}{t}\left[f\left(\vec{p}+t_{0} \vec{u}+t \vec{u}\right)-f\left(\vec{p}+t_{0} \vec{u}\right)\right] \\ &=\lim _{t \rightarrow 0} \frac{1}{t}\left[h\left(t_{0}+t\right)-h\left(t_{0}\right)\right] \\ &=h^{\prime}\left(t_{0}\right) . \quad \text {(Explain!)} \end{aligned}\]
Esto puede fallar durante como máximo un conjunto\(Q^{\prime}\) de puntos contables\(t_{0} \in J\) (aquellos para los cuales\(\vec{x}_{0} \in Q).\)
Así\(h\) es diferenciable\(J-Q^{\prime};\) y así, por el Corolario 1 en el Capítulo 5, §4,
\[|h(1)-h(0)| \leq \sup _{t \in J-Q^{\prime}}\left|h^{\prime}(t)\right|=\sup _{\vec{x} \in I-Q}\left|D_{\vec{u}} f(\vec{x})\right|.\]
Ahora como\(h(1)=f(\vec{p}+\vec{u})=f(\vec{q})\) y la\(h(\overrightarrow{0})=f(\vec{p}),\) fórmula (2) sigue. \(\quad \square\)
Si en el Teorema 2,\(E=E^{1}\) y si\(f\) tiene una derivada\(\vec{u}\) -dirigida al menos en el segmento de línea abierta\(L(\vec{p}, \vec{q}),\) entonces
\[f(\vec{q})-f(\vec{p})=D_{\vec{u}} f\left(\vec{x}_{0}\right)\]
para algunos\(\vec{x}_{0} \in L(\vec{p}, \vec{q})\).
- Prueba
-
La prueba es como en el Teorema 2, basado en el Corolario 3 en el Capítulo 5, §2 (en lugar del Corolario 1 en el Capítulo 5, §4).
Los teoremas 2 y 3 se utilizan a menudo en forma “normalizada”, de la siguiente manera.
Si en los Teoremas 2 y 3, establecemos
\[r=|\vec{u}|=|\vec{q}-\vec{p}| \neq 0 \text { and } \vec{v}=\frac{1}{r} \vec{u},\]
entonces las fórmulas (2) y (3) se pueden escribir como
\[|f(\vec{q})-f(\vec{p})| \leq|\vec{q}-\vec{p}| \sup \left|D_{\vec{v}} f(\vec{x})\right|, \quad \vec{x} \in I-Q,\]
y
\[f(\vec{q})-f(\vec{p})=|\vec{q}-\vec{p}| D_{\vec{v}} f\left(\vec{x}_{0}\right)\]
para algunos\(\vec{x}_{0} \in L(\vec{p}, \vec{q})\).
Para por Corolario 1,
\[D_{\vec{u}} f=r D_{\vec{v}} f=|\vec{q}-\vec{p}| D_{\vec{v}} f;\]
así que (2') y (3') siguen.