Saltar al contenido principal
LibreTexts Español

2.4: Derivadas direccionales y el gradiente

  • Page ID
    111351
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Para una función\(z = f (x, y)\), aprendimos que las derivadas parciales\(\dfrac{∂f}{∂x}\text{ and} \dfrac{∂f}{∂y}\) representan la tasa de cambio (instantánea) de\(f\) en las\(y\) direcciones positiva\(x\) y, respectivamente. ¿Qué pasa con otras direcciones? Resulta que podemos encontrar la tasa de cambio en cualquier dirección usando un tipo de derivado más general llamado derivado direccional.

    Definición 2.5: derivado direccional

    Dejar\(f (x, y)\) ser una función de valor real con dominio\(D\) adentro\(\mathbb{R}^2\), y dejar\((a,b)\) ser un punto adentro\(D\). Dejar\(\textbf{v}\) ser un vector de unidad en\(\mathbb{R}^2\). Entonces la derivada direccional de\(\textbf{f}\) at\(\mathbf{(a,b)}\) en la dirección de\(\mathbf{v}\), denotada por\(D_v f(a,b)\), se define como

    \[D_v f(a,b)=\lim \limits_{h \to 0}\dfrac{f((a,b)+h\textbf{v})-f(a,b)}{h}\label{Eq2.8}\]

    Observe en la definición que parece que estamos tratando el punto\((a,b)\) como un vector, ya que le estamos agregando\(h\textbf{v}\) el vector. Pero esta es solo la idea habitual de identificar vectores con sus puntos terminales, a los que ya debería estar acostumbrado el lector. Si tuviéramos que escribir el vector\(\textbf{v}\) como\(\textbf{v} = (v_1 ,v_2)\), entonces

    \[D_v f (a,b)=\lim \limits_{h \to 0}\dfrac{f (a+ hv_1 ,b + hv_2)− f (a,b)}{h}\label{Eq2.9}\]

    De esto podemos reconocer de inmediato que las derivadas parciales\(\dfrac{∂f}{∂x}\text{ and} \dfrac{∂f}{∂y}\) son casos especiales de la derivada direccional con\(\textbf{v} = \textbf{i} = (1,0)\text{ and } \textbf{v} = \textbf{j} = (0,1)\), respectivamente. Es decir,\(\dfrac{∂f}{∂x} = D_i f\text{ and } \dfrac{∂f}{∂y} = D_j f\). Dado que hay muchos vectores con la misma dirección, utilizamos un vector unitario en la definición, ya que representa un vector “estándar” para una dirección dada.

    Si\(f (x, y)\) tiene derivadas parciales continuas\(\dfrac{∂f}{∂x}\text{ and }\dfrac{∂f}{∂y}\) (que siempre será el caso en este texto), entonces hay una fórmula simple para la derivada direccional:

    Teorema 2.2

    Dejar\(f (x, y)\) ser una función de valor real con dominio\(D\) en\(\mathbb{R}^2\) tal que las derivadas parciales\(\dfrac{∂f}{∂x}\text{ and }\dfrac{∂f}{∂y}\) existan y sean continuas en\(D\). Dejar\((a,b)\) ser un punto adentro\(D\), y dejar\(\textbf{v} = (v_1 ,v_2)\) ser un vector de unidad adentro\(\mathbb{R}^2\). Entonces

    \[D_v f (a,b) = v_1 \dfrac{∂f}{∂x} (a,b)+ v_2 \dfrac{∂f}{∂y} (a,b)\label{Eq2.10}\]

    Prueba: Obsérvese que si\(\textbf{v} = \textbf{i}\) = (1,0) entonces la fórmula anterior se reduce a\(D_v f (a,b) = \dfrac{∂f}{∂x} (a,b)\), lo que sabemos es cierto ya que\(D_i f = \dfrac{∂f}{∂x}\), como señalamos anteriormente. De igual manera, para\(\textbf{v} = \textbf{j} = (0,1)\) la fórmula se reduce a\(D_v f (a,b) = \dfrac{∂f}{∂y} (a,b)\), lo cual es cierto ya que\(D_j f = \dfrac{∂f}{∂y}\). Entonces, dado que\(\textbf{i} = (1,0)\text{ and }\textbf{j} = (0,1)\) son los únicos vectores unitarios\(\mathbb{R}^2\) con un componente cero, entonces solo necesitamos mostrar las retenciones de fórmula para vectores unitarios\(\textbf{v} = (v_1 ,v_2)\text{ with }v_1 \neq 0 \text{ and }v_2 \neq 0\). Así que arregla tal vector\(\textbf{v}\) y arregla un número\(h \neq 0\).

    Entonces

    \[ f (a+ hv_1 ,b + hv_2)− f (a,b) = f (a+ hv_1 ,b + hv_2)− f (a+ hv_1 ,b)+ f (a+ hv_1 ,b)− f (a,b)\label{Eq2.11}\]

    Desde\(h \neq 0 \text{ and }v_2 \neq 0\), entonces\(hv_2 \neq 0\) y así cualquier número\(c\) entre se\(b \text{ and }b + hv_2\) puede escribir como\(c = b+\alpha hv_2\) para algún número\(0 < \alpha < 1\). Entonces, dado que la función\(f (a+hv_1 , y)\) es una función realvaluada de\(y\) (ya que\(a + hv_1\) es un número fijo), entonces el Teorema del Valor Medio del cálculo de una sola variable se puede aplicar a la función\(g(y) = f (a + hv_1 , y)\) en el intervalo\([b,b + hv_2]\) (o\([b + hv_2 ,b]\) si uno de\(h \text{ or }v_2\) es negativo) para encontrar un número \(0 < \alpha < 1\)de tal manera que

    \[\nonumber \dfrac{∂f}{∂y} (a+ hv_1 ,b +\alpha hv_2) = g ′ (b +\alpha hv_2)=\dfrac{g(b + hv_2)− g(b)}{b + hv_2 − b}=\dfrac{f (a+ hv_1 ,b + hv_2)− f (a+ hv_1 ,b)}{hv_2}\]

    y así

    \[\nonumber f (a+ hv_1 ,b + hv_2)− f (a+ hv_1 ,b) = hv_2 \dfrac{∂f}{∂y} (a+ hv_1 ,b +\alpha hv_2) .\]

    Por un argumento similar, existe un número\(0 < \beta < 1\) tal que

    \[\nonumber f (a+ hv_1 ,b)− f (a,b) = hv_1 \dfrac{∂f}{∂x} (a+\beta hv_1 ,b) .\]

    Así, por Ecuación\ ref {Eq2.11}, tenemos

    \[\nonumber \begin{align} \dfrac{f (a+ hv_1 ,b + hv_2)− f (a,b)}{h}&=\dfrac{hv_2 \dfrac{∂f}{∂y} (a+ hv_1 ,b +\alpha hv_2)+ hv_1 \dfrac{∂f}{∂x} (a+\beta hv_1 ,b)}{h} \\[4pt] \nonumber &=v_2 \dfrac{∂f}{∂y} (a+ hv_1 ,b +\alpha hv_2)+ v_1 \dfrac{∂f}{∂x} (a+\beta hv_1 ,b)\end{align}\]

    así que por Ecuación\ ref {Eq2.9} tenemos

    \[ \nonumber \begin{align} D_v f (a,b)&=\lim \limits_{h \to 0}\dfrac{f (a+ hv_1 ,b + hv_2)− f (a,b)}{h} \\[4pt] \nonumber &=\lim \limits_{h \to 0}\left [v_2 \dfrac{∂f}{∂y} (a+ hv_1 ,b +\alpha hv_2)+ v_1 \dfrac{∂f}{∂x} (a+\beta hv_1 ,b)\right ] \\[4pt] \nonumber &= v_2 \dfrac{∂f}{∂y} (a,b)+ v_1 \dfrac{∂f}{∂x} (a,b) \text{ by the continuity of } \dfrac{∂f}{∂x} \text{ and } \dfrac{∂f}{∂y}\text{, so} \\[4pt] \nonumber D_v f (a,b) &= v_1 \dfrac{∂f}{∂x} (a,b)+ v_2 \dfrac{∂f}{∂y} (a,b) \end{align}\]

    \[\nonumber \text{after reversing the order of summation.}\tag{\(\textbf{QED}\)}\]

    Tenga en cuenta que\(D_v f (a,b) = v \cdot \left (\dfrac{∂f}{∂x} (a,b), \dfrac{∂f}{∂y} (a,b) \right )\). El segundo vector tiene un nombre especial:

    Definición 2.6

    Para una función de valor real\(f (x, y)\), el gradiente de\(f\), denotado por\(\nabla f\), es el vector

    \[\nabla f =\left ( \dfrac{∂f}{∂x} , \dfrac{∂f}{∂y} \right ) \label{Eq2.12}\]

    en\(\mathbb{R}^2\). Para una función de valor real\(f (x, y, z)\), el gradiente es el vector

    \[\nabla f = \left ( \dfrac{∂f}{∂x} , \dfrac{∂f}{∂y} , \dfrac{∂f}{∂z}\right ) \label{Eq2.13}\]

    en\(\mathbb{R}^ 3\). El símbolo\(\nabla\) se pronuncia “del”.

    Corolario 2.3

    \[\nonumber D_v f = \textbf{v} \cdot \nabla f\]

    Ejemplo 2.15

    Encuentra la derivada direccional de\(f (x, y) = x y^2 + x^3 y\) en el punto (1,2) en la dirección de\(\textbf{v} = \left ( \dfrac{1}{\sqrt{2}},\dfrac{1}{\sqrt{2}}\right )\).

    Solución

    Vemos eso\(\nabla f = (y^2 +3x^2 y,2x y+ x^3 )\), entonces

    \[\nonumber D_v f (1,2) = \textbf{v}\cdot \nabla f (1,2) = \left ( \dfrac{1}{\sqrt{2}},\dfrac{1}{\sqrt{2}}\right ) \cdot (2^2 +3(1)^2 (2),2(1)(2)+1^3 ) = \dfrac{15}{\sqrt{2}}\]

    Una función de valor real\(z = f (x, y)\) cuyas derivadas parciales\(\dfrac{∂f}{∂x}\text{ and }\dfrac{∂f}{∂y}\) existen y son continuas se denomina continuamente diferenciable. Supongamos que\(f (x, y)\) es tal función y esa\(\nabla f \neq \textbf{0}\). Dejar\(c\) ser un número real en el rango de\(f\) y dejar\(\textbf{v}\) ser un vector unitario en el\(\mathbb{R}^2\) que es tangente a la curva de nivel\(f (x, y) = c\) (ver Figura 2.4.1).

    alt
    Figura 2.4.1

    El valor de\(f (x, y)\) es constante a lo largo de una curva de nivel, por lo que dado que\(\textbf{v}\) es un vector tangente a esta curva, entonces la tasa de cambio de\(f\) en la dirección de\(\textbf{v}\) es 0, i.e\(D_v f = 0\). Pero eso lo sabemos\(D_v f = \textbf{v} \cdot \nabla f = \left\lVert \textbf{v} \right\rVert \left\lVert \nabla f \right\rVert \cos \theta \), ¿dónde\(\theta\) está el ángulo entre ellos\(\textbf{v} \text{ and }\nabla f\)? Entonces desde\(\left\lVert \textbf{v} \right\rVert = 1 \text{ then }D_v f = \left\lVert \nabla f \right\rVert \cos \theta \). Entonces desde\(\nabla f \neq \textbf{0}\text{ then }D_v f = 0 ⇒ \cos \theta = 0 ⇒ \theta = 90^\circ\). En otras palabras,\(\nabla f \perp \textbf{v}\), lo que significa que\(\nabla f\) es normal a la curva de nivel.

    En general, para cualquier vector unitario\(\textbf{v}\) en\(\mathbb{R}^2\), todavía tenemos\(D_v f = \left\lVert \nabla f \right\rVert \cos \theta \text{, where }\theta\) es el ángulo entre\(\textbf{v} \text{ and }\nabla f\). En un punto fijo\((x, y)\) la longitud\(\left\lVert \nabla f \right\rVert\) es fija, y el valor de\(D_v f\) entonces varía según\(\theta\) varía. El valor más grande que\(D_v f\) puede tomar es cuándo\(\cos \theta = 1 (\theta = 0^\circ )\), mientras que el valor más pequeño ocurre cuándo\(\cos \theta = −1 (\theta = 180^\circ )\). En otras palabras, el valor de la función\(f\) aumenta más rápido en la dirección de\(\nabla f\) (ya que\(\theta = 0^\circ\) en ese caso), y el valor de\(f\) disminuye el más rápido en la dirección de\(−\nabla f\) (ya que\(\theta = 180^\circ\) en ese caso). Así, hemos demostrado el siguiente teorema:

    Teorema 2.4

    Dejar\(f (x, y)\) ser una función de valor real continuamente diferenciable, con\(\nabla f \neq 0\). Entonces:

    1. El gradiente\(\nabla f\) es normal a cualquier curva de nivel\(f (x, y) = c\).
    2. El valor de\(f (x, y)\) aumenta el más rápido en la dirección de\(\nabla f\).
    3. El valor de\(f (x, y)\) disminuye el más rápido en la dirección de\(−\nabla f\).

    Ejemplo 2.16

    ¿En qué dirección\(f (x, y) = x y^2 + x^3 y\) aumenta la función más rápido desde el punto (1,2)? ¿En qué dirección disminuye más rápido?

    Solución

    Desde\(\nabla f = (y^2 + 3x^2 y,2xy + x^3 )\) entonces\(\nabla f (1,2) = (10,5) \neq \textbf{0}\). Un vector unitario en esa dirección es\(\textbf{v} = \dfrac{\nabla f}{\left\lVert \nabla f \right\rVert} = \left (\dfrac{2}{\sqrt{5}} ,\dfrac{1}{\sqrt{5}}\right )\). Así,\(f\) aumenta el más rápido en la dirección de\(\left (\dfrac{2}{\sqrt{5}} ,\dfrac{1}{\sqrt{5}}\right )\) y disminuye el más rápido en la dirección de\(\left (\dfrac{−2}{\sqrt{5}},\dfrac{−1}{\sqrt{5}}\right )\).

    Aunque probamos el Teorema 2.4 para funciones de dos variables, se puede usar un argumento similar para mostrar que también se aplica a funciones de tres o más variables. Asimismo, la derivada direccional en el caso tridimensional también se puede definir por la fórmula\(D_v f = \textbf{v}\cdot \nabla f\).

    Ejemplo 2.17

    La temperatura\(T\) de un sólido viene dada por la función\(T(x, y, z) = e^−x + e^{−2y} + e^{4z}\text{, where }x, y, z\) son coordenadas espaciales relativas al centro del sólido. ¿En qué dirección desde el punto (1,1,1) disminuirá más rápidamente la temperatura?

    Solución

    Ya que\(\nabla f = (−e^{−x} ,−2e^{−2y} ,4e^{4z} )\), entonces la temperatura disminuirá más rápido en la dirección de\(−\nabla f (1,1,1) = (e^{−1} ,2e^{−2} ,−4e^4 )\).

    Colaboradores y Atribuciones


    This page titled 2.4: Derivadas direccionales y el gradiente is shared under a GNU Free Documentation License 1.3 license and was authored, remixed, and/or curated by Michael Corral.