Saltar al contenido principal
LibreTexts Español

6.9: Extrema Local. Maxima y Minima

  • Page ID
    113755
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Decimos que\(f : E^{\prime} \rightarrow E^{1}\) tiene un máximo local (mínimo) en\(\vec{p} \in E^{\prime}\) iff\(f(\vec{p})\) es el valor más grande (mínimo) de\(f\) en algún globo\(G\) sobre\(\vec{p};\) más precisamente, iff

    \[(\forall \vec{x} \in G) \quad \Delta f=f(\vec{x})-f(\vec{p})<0(>0).\]

    Hablamos de un extremo impropio si solo tenemos\(\Delta f \leq 0( \geq 0)\) encendido\(G.\) En todo caso, todo depende de la señal de\(\Delta f.\)

    Del Problema 6 en §1, recuerde la siguiente condición necesaria.

    Teorema\(\PageIndex{1}\)

    Si\(f : E^{\prime} \rightarrow E^{1}\) tiene un extremo local en\(\vec{p}\) entonces\(D_{\vec{u}} f(\vec{p})=0\) para todos\(\vec{u} \neq \overrightarrow{0}\) en\(E^{\prime}.\)

    En el caso\(E^{\prime}=E^{n}\left(C^{n}\right),\) esto significa que\(d^{1} f(\vec{p} ; \cdot)=0\) en\(E^{\prime}\).

    (Recordemos que\(d^{1} f(\vec{p} ; \vec{t})=\sum_{k=1}^{n} D_{k} f(\vec{p}) t_{k}.\) Se desvanece si el\(D_{k} f(\vec{p})\) do.

    Nota 1. Esta condición sólo es necesaria, no suficiente. Por ejemplo, si\(f(x, y)=x y,\) entonces\(d^{1} f(\overrightarrow{0} ; \cdot)=0 ;\) todavía no\(f\) tiene extremo en\(\overrightarrow{0}.\) (¡Verifica!)

    Se dieron condiciones suficientes en el Teorema 2 de §5,\(E^{\prime}=E^{1}.\) porque ahora retomamos\(E^{\prime}=E^{2}.\)

    Teorema\(\PageIndex{2}\)

    Dejar\(f : E^{2} \rightarrow E^{1}\) ser de clase\(C D^{2}\) en un globo\(G=G_{\vec{p}}(\delta).\) Supongamos\(d^{1} f(\vec{p} ; \cdot)=0\) en\(E^{2}.\) Set\(A=D_{11} f(\vec{p}), B=D_{12} f(\vec{p}),\) y\(C=D_{22} f(\vec{p})\).

    Entonces son ciertas las siguientes afirmaciones.

    (i) Si\(A C>B^{2},\) tiene un máximo o mínimo en\(\vec{p},\) función de si

    \(A<0\)o\(A>0.\)

    (ii) Si no\(A C<B^{2}, f\) tiene extremo en\(\vec{p}\).

    El caso\(A C=B\) está sin resolver.

    Prueba

    Dejar\(\vec{x} \in G\) y\(\vec{u}=\vec{x}-\vec{p} \neq \overrightarrow{0}\).

    Como\(d^{1} f(\vec{p} ; \cdot)=0,\) Teorema 2 en §5, rinde

    \[\Delta f=f(\vec{x})-f(\vec{p})=R_{1}=\frac{1}{2} d^{2} f(\vec{s} ; \vec{u}),\]

    con\(\vec{s} \in L(\vec{p}, \vec{x}) \subseteq G\) (ver Corolario 1 de §5). Como\(f \in C D^{2},\) tenemos\(D_{12} f=D_{21} f\) en\(G\) (Teorema 1 en §5). Así, por la fórmula (4) en §5

    \[\Delta f=\frac{1}{2} d^{2} f(\vec{s} ; \vec{u})=\frac{1}{2}\left[D_{11} f(\vec{s}) u_{1}^{2}+2 D_{12} f(\vec{s}) u_{1} u_{2}+D_{22} f(\vec{s}) u_{2}^{2}\right].\]

    Ahora, como los parciales involucrados son continuos, podemos elegir\(G=G_{\vec{p}}(\delta)\) tan pequeños que el signo de expresión (1) no cambiará si\(\vec{s}\) es reemplazado por\(\vec{p}\). Entonces el signo crucial de\(\Delta f\) on\(G\) coincide con el de

    \[D=A u_{1}^{2}+2 B u_{1} u_{2}+C u_{2}^{2}\]

    (con\(A, B,\) y\(C\) como se indica en el teorema).

    De (2) obtenemos, por álgebra elemental,

    \[\begin{aligned} A D &=\left(A u_{1}+B u_{2}\right)^{2}+\left(A C-B^{2}\right) u_{2}^{2}, \\ C D &=\left(C u_{1}+B u_{2}\right)^{2}+\left(A C-B^{2}\right) u_{2}^{2}. \end{aligned}\]

    Claramente, si\(A C>B^{2},\) la expresión del lado derecho en (3) es\(>0;\) así\(A D>0\), es decir,\(D\) tiene el mismo signo que\(A.\)

    De ahí\(A<0,\) que si también tenemos\(\Delta f<0\) encendido\(G,\) y\(f\) tiene un máximo en\(\vec{p}.\) Si\(A>0,\) entonces\(\Delta f>0,\) y\(f\) tiene un mínimo en\(\vec{p}\).

    Ahora vamos\(A C<B^{2}\). Afirmamos que no importa cuán pequeños se firmen\(G=G_{\vec{p}}(\delta), \Delta f\) los cambios como\(\vec{x}\) varía en\(G,\) y así no\(f\) tiene extremo en\(\vec{p}\).

    En efecto, tenemos\(\vec{x}=\vec{p}+\vec{u}, \vec{u}=\left(u_{1}, u_{2}\right) \neq \overrightarrow{0}.\) Si\(u_{2}=0,\) (3) muestra eso\(D\) y\(\Delta f\) tenemos el mismo signo que\(A(A \neq 0).\)

    Pero si\(u_{2} \neq 0\) y\(u_{1}=-B u_{2} / A\) (asumiendo\(A \neq 0),\) entonces\(D\) y\(\Delta f\) tener el signo opuesto al de\(A;\) y sigue en\(G\) si\(\vec{x}\)\(u_{2}\) es lo suficientemente pequeño (¿qué tan pequeño?).

    Se procede de manera similar si\(C \neq 0\) (intercambio\(A\)\(C,\) y y uso (3').

    Por último, si\(A=C=0,\) entonces por (2),\(D=2 B u_{1} u_{2}\) y\(B \neq 0\) (desde\(A C<B^{2})\). De nuevo\(D\) y\(\Delta f\) cambiar de signo como lo\(u_{1} u_{2}\) hace; así no\(f\) tiene extremum en\(\vec{p}.\) Así todo está demostrado. \(\quad \square\)

    Brevemente, la prueba utiliza el hecho de que el trinomio (2) cambia de signo si su discriminante\(B^{2}-A C\) es positivo, es decir,\(\left|\begin{array}{cc}{A} & {B} \\ {B} & {C}\end{array}\right|<0\).

    Nota 2. Las funciones\(f : C \rightarrow E^{1}\) (de una variable compleja) son igualmente cubiertas por el Teorema 2 si se las trata como funciones sobre\(E^{2}\) (de dos variables reales).

    Funciones de n variables. Aquí debemos apoyarnos en la teoría algebraica de las llamadas formas cuadráticas simétricas, es decir, polinomios\(P : E^{n} \rightarrow E^{1}\) de la forma

    \[P(\vec{u})=\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} u_{i} u_{j},\]

    dónde\(\vec{u}=\left(u_{i}, \ldots, u_{n}\right) \in E^{n}\) y\(a_{i j}=a_{j i} \in E^{1}\).

    Damos por sentado un teorema debido a J. J. Sylvester (ver S. Perlis, Theory of Matrices, 1952, p. 197), que puede afirmarse de la siguiente manera.

    Dejar\(P : E^{n} \rightarrow E^{1}\) ser una forma cuadrática simétrica,

    \[P(\vec{u})=\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} u_{i} u_{j}.\]

    i)\(P>0\) en todos los\(E^{n}-\{\overrightarrow{0}\}\) casos los siguientes\(n\) determinantes\(A_{k}\) son positivos:

    \[A_{k}=\left|\begin{array}{cccc}{a_{11}} & {a_{12}} & {\dots} & {a_{1 k}} \\ {a_{21}} & {a_{22}} & {\dots} & {a_{2 k}} \\ {\ldots} & {\ldots \ldots \ldots} & {\ldots} & {a_{2 k}} \\ {a_{k 1}} & {a_{k 2}} & {\dots} & {a_{k k}}\end{array}\right|, \quad k=1,2, \ldots, n.\]

    (ii) Tenemos\(P<0\) en\(E^{n}-\{\overrightarrow{0}\}\) iff\((-1)^{k} A_{k}>0\) para\(k=1,2, \ldots, n\).

    Ahora podemos extender el Teorema 2 al caso\(f : E^{n} \rightarrow E^{1}\). (Esto también cubrirá\(f : C^{n} \rightarrow E^{1},\) tratado como\(f : E^{2 n} \rightarrow E^{1}.)\) La prueba se asemeja a la del Teorema 2.

    Teorema\(\PageIndex{3}\)

    Dejar\(f : E^{n} \rightarrow E^{1}\) ser de clase\(C D^{2}\) en algunos\(G=G_{\vec{p}}(\delta).\) Supongamos\(d f(\vec{p} ; \cdot)=0\) en\(E^{n}.\) Definir el\(A_{k}\) as en (4), con\(a_{i j}=D_{i j} f(\vec{p}), i, j, k \leq n\) Entonces se mantienen las siguientes declaraciones.

    (i)\(f\) tiene un mínimo local en\(\vec{p}\) si\(A_{k}>0\) para\(k=1,2, \ldots, n\).

    (ii)\(f\) tiene un máximo local en\((-1)^{k} A_{k}>0\) su\(\vec{p}\) caso\(k=1, \ldots, n\).

    (iii) no\(f\) tiene extremo en\(\vec{p}\) si la expresión

    \[P(\vec{u})=\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} u_{i} u_{j}\]

    es\(>0\) para algunos\(\vec{u} \in E^{n}\) y\(<0\) para otros (es decir,\(P\) cambios de inicio de sesión\(E^{n})\).

    Prueba

    Volvamos a usar\(\vec{x} \in G, \vec{u}=\vec{x}-\vec{p} \neq \overrightarrow{0},\) y usar el teorema de Taylor para obtener

    \[\Delta f=f(\vec{x})-f(\vec{p})=R_{1}=\frac{1}{2} d^{2} f(\vec{s} ; \vec{u})=\sum_{j=1}^{n} \sum_{i=1}^{n} D_{i j} f(\vec{s}) u_{i} u_{j},\]

    con\(\vec{s} \in L(\vec{x}, \vec{p})\).

    Como\(f \in C D^{2},\) los parciales\(D_{i j} f\) son continuos en\(G.\) Así podemos hacer\(G\) tan pequeños que el signo de la última suma doble no cambia si\(\vec{s}\) es reemplazado por\(\vec{p}\). De ahí que el signo de\(\Delta f\) encendido\(G\) sea el mismo que el de\(P(\vec{u})=\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} u_{i} u_{j}\), con el\(a_{i j}\) como se afirma en el teorema.

    La forma cuadrática\(P\) es simétrica ya que\(a_{i j}=a_{j i}\) por el Teorema 1 en §5. Así, por el teorema de Sylvester expuesto anteriormente, se obtienen fácilmente nuestras aseveraciones (i) y (ii). En efecto, son inmediatos de las cláusulas (i) y (ii) de ese teorema.

    Ahora, para (iii), supongamos\(P(\vec{u})>0>P(\vec{v}),\) i.e.

    \[\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} u_{i} u_{j}>0>\sum_{j=1}^{n} \sum_{i=1}^{n} a_{i j} v_{i} v_{j} \quad \text { for some } \vec{u}, \vec{v} \in E^{n}-\{\overrightarrow{0}\}.\]

    Si aquí\(\vec{u}\) y\(\vec{v}\) son reemplazados por\(t \vec{u}\) y\(t \vec{v}(t \neq 0),\) luego\(u_{i} u_{j}\) y se\(v_{i} v_{j}\) convierten en\(t^{2} u_{i} u_{j}\) y\(t^{2} v_{i} v_{j},\) respectivamente. De ahí

    \[P(t \vec{u})=t^{2} P(\vec{u})>0>t^{2} P(\vec{v})=P(t \vec{v}).\]

    Ahora, para cualquiera\(t \in(0, \delta /|\vec{u}|),\) el punto\(\vec{x}=\vec{p}+t \vec{u}\) se encuentra en la línea\(\vec{u}\) -dirigida por\(\vec{p},\) dentro\(G=G_{\vec{p}}(\delta).\) (¿Por qué?) Del mismo modo para el punto\(\vec{x}^{\prime}=\vec{p}+t \vec{v}.\)

    De ahí que para tal\(\vec{x}\) y el teorema de\(\vec{x}^{\prime},\) Taylor vuelve a producir fórmulas análogas a (5) para algunos\(\vec{s} \in L(\vec{p}, \vec{x})\) y que se\(\vec{s}^{\prime} \in L\left(\vec{p}, \vec{x}^{\prime}\right)\) encuentran en las mismas dos líneas. De nuevo se deduce que para los pequeños\(\delta\),

    \[f(\vec{x})-f(\vec{p})>0>f\left(\vec{x}^{\prime}\right)-f(\vec{p}),\]

    al igual que\(P(\vec{u})>0>P(\vec{v})\).

    Así se demuestra el signo de\(\Delta f\) cambios\(G_{\vec{p}}(\delta),\) y (iii). \(\quad \square\)

    Nota 3. Aún no se resuelven los casos en los que se\(P(\vec{u})\) desvanece para algunos\(\vec{u} \neq \overrightarrow{0},\) sin cambiar su signo; e.g.,\(P(\vec{u})=\left(u_{1}+u_{2}+u_{3}\right)^{2}=0\) para\(\vec{u}=(1,1,-2)\). Entonces la respuesta depende de términos de orden superior de la fórmula de Taylor. En particular, si\(d^{1} f(\vec{p} ; \cdot)=d^{2} f(\vec{p} ; \cdot)=0\) en\(E^{n},\) entonces\(\Delta f=R_{2}=\frac{1}{6} d^{3} f(\vec{p} ; \vec{s}),\) etc.

    Nota 4. El valor más grande o menor de\(f\) en un conjunto\(A\) (a veces llamado el máximo o mínimo absoluto) puede ocurrir en algún punto interior (por ejemplo, límite)\(\vec{p} \in A,\) y luego no se encuentra entre los extremos locales (donde, por definición,\(G_{\vec{p}} \subseteq A\) se presupone un globo terráqueo). Así, para encontrar los extremos absolutos, también se debe explorar el comportamiento de\(f\) en puntos no interiores de\(A.\)

    Por el Teorema 1, los extremos locales solo pueden ocurrir en los llamados puntos críticos\(\vec{p}\), es decir, aquellos en los que todas las derivadas direccionales desaparecen (o no existen, en cuyo caso\(D_{\vec{u}} f(\vec{p})=0\) por convención).

    En la práctica, para encontrar tales puntos en\(E^{n}\left(C^{n}\right),\) uno\(D_{k} f\)\((k \leq n)\) equipara los parciales a\(0.\) Entonces uno usa los teoremas 2 y 3 u otras consideraciones para determinar si realmente existe un extremo.

    Ejemplos

    (A) Encontrar el mayor valor de

    \[f(x, y)=\sin x+\sin y-\sin (x+y)\]

    en el set\(A \subseteq E^{2}\) delimitado por las líneas\(x=0, y=0\) y\(x+y=2 \pi\).

    Tenemos

    \[D_{1} f(x, y)=\cos x-\cos (x+y) \text { and } D_{2} f(x, y)=\cos y-\cos (x+y).\]

    Dentro del triángulo\(A,\) ambos parciales desaparecen sólo en el punto en el que\(\left(\frac{2 \pi}{3}, \frac{2 \pi}{3}\right)\)\(f=\frac{3}{2} \sqrt{3}.\) En el límite de\(A\) (es decir, en las líneas\(x=0, y=0\) y\(x+y=2 \pi ), f=0.\) Así incluso sin utilizar el Teorema 2, es evidente que\(f\) alcanza su mayor valor,

    \[f\left(\frac{2 \pi}{3}, \frac{2 \pi}{3}\right)=\frac{3}{2} \sqrt{3},\]

    en este punto crítico único.

    (B) Encontrar el mayor y el menor valor de

    \[f(x, y, z)=a^{2} x^{2}+b^{2} y^{2}+c^{2} z^{2}-\left(a x^{2}+b y^{2}+c z^{2}\right)^{2},\]

    con la condición de que\(x^{2}+y^{2}+z^{2}=1\) y\(a>b>c>0\).

    Como\(z^{2}=1-x^{2}-y^{2},\) podemos\(z\) eliminar\(f(x, y, z)\) y reemplazar\(f\) por\(F : E^{2} \rightarrow E^{1}:\)

    \[F(x, y)=\left(a^{2}-c^{2}\right) x^{2}+\left(b^{2}-c^{2}\right) y^{2}+c^{2}-\left[(a-c) x^{2}+(b-c) y^{2}+c\right]^{2}.\]

    (¡Explique!) Porque\(F,\) buscamos los extremos en el disco\(\overline{G}=\overline{G}_{0}(1) \subset E^{2},\) donde\(x^{2}+y^{2} \leq 1\) (para no violar la condición\(x^{2}+y^{2}+z^{2}=1)\).

    Equiparando a 0 los dos parciales

    \[\begin{array}{l}{D_{1} F(x, y)=2 x(a-c)\left\{(a+c)-2\left[(a-c) x^{2}+(b-c) y^{2}+c\right]^{2}\right\}=0}, \\ {D_{2} F(x, y)=2 y(b-c)\left\{(b+c)-2\left[(a-c) x^{2}+(b-c) y^{2}+c\right]^{2}\right\}=0}\end{array}\]

    y resolviendo este sistema de ecuaciones, encontramos estos puntos críticos dentro\(G:\)

    (1)\(x=y=0\) (\(F=0)\);

    (2)\(x=0, y=\pm 2^{-\frac{1}{2}}\left(F=\frac{1}{4}(b-c)^{2}\right);\) y

    (3)\(x=\pm 2^{-\frac{1}{2}}, y=0\left(F=\frac{1}{4}(a-c)^{2}\right)\).

    (¡Verifica!)

    Ahora bien, para el límite de\(\overline{G},\) i.e., el círculo\(x^{2}+y^{2}=1,\) repite este proceso: sustituya\(y^{2}=1-x^{2}\) en la fórmula para\(F(x, y),\) reducirlo así a

    \[h(x)=\left(a^{2}-b^{2}\right) x^{2}+b^{2}+\left[(a-b) x^{2}+b\right]^{2}, \quad h : E^{1} \rightarrow E^{1},\]

    en el intervalo\([-1,1] \subset E^{1}.\) En\((-1,1)\) la derivada

    \[h^{\prime}(x)=2(a-b) x\left(1-2 x^{2}\right)\]

    desaparece sólo cuando

    (4)\(x=0\) (\(h=0),\)y

    (5)\(x=\pm 2^{-\frac{1}{2}}\left(h=\frac{1}{4}(a-b)^{2}\right)\).

    Por último, en los puntos finales de\([-1,1],\) tenemos

    (6)\(x=\pm 1\) (\(h=0)\).

    Comparando los valores de función resultantes en los seis casos, concluimos que el menor de ellos es\(0,\) mientras que el más grande es\(\frac{1}{4}(a-c)^{2}.\) Estos son los valores más pequeños y mayores deseados de\(f,\) sujeto a las condiciones establecidas. Se logran, respectivamente, en los puntos

    \[(0,0, \pm 1),(0, \pm 1,0),( \pm 1,0,0), \text { and }\left( \pm 2^{-\frac{1}{2}}, 0, \pm 2^{-\frac{1}{2}}\right).\]

    Nuevamente, el uso de los Teoremas 2 y 3 fue redundante. Sin embargo, sugerimos como ejercicio que el lector pruebe los puntos críticos de\(F\) usando el Teorema 2.

    Precaución. Los teoremas del 1 al 3 se aplican únicamente a funciones de variables independientes. En el Ejemplo (B),\(x, y, z\) se hicieron interdependientes por la ecuación impuesta

    \[x^{2}+y^{2}+z^{2}=1\]

    (que limita geométricamente todo a la superficie de\(G_{\overrightarrow{0}}(1)\) adentro\(E^{3}),\) para que uno de ellos,\(z,\) pueda ser eliminado. Sólo entonces se pueden utilizar los Teoremas del 1 al 3.


    This page titled 6.9: Extrema Local. Maxima y Minima is shared under a CC BY 3.0 license and was authored, remixed, and/or curated by Elias Zakon (The Trilla Group (support by Saylor Foundation)) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.