6.9: Extrema Local. Maxima y Minima
( \newcommand{\kernel}{\mathrm{null}\,}\)
Decimos quef:E′→E1 tiene un máximo local (mínimo) en→p∈E′ ifff(→p) es el valor más grande (mínimo) def en algún globoG sobre→p; más precisamente, iff
(∀→x∈G)Δf=f(→x)−f(→p)<0(>0).
Hablamos de un extremo impropio si solo tenemosΔf≤0(≥0) encendidoG. En todo caso, todo depende de la señal deΔf.
Del Problema 6 en §1, recuerde la siguiente condición necesaria.
Sif:E′→E1 tiene un extremo local en→p entoncesD→uf(→p)=0 para todos→u≠→0 enE′.
En el casoE′=En(Cn), esto significa qued1f(→p;⋅)=0 enE′.
(Recordemos qued1f(→p;→t)=∑nk=1Dkf(→p)tk. Se desvanece si elDkf(→p) do.
Nota 1. Esta condición sólo es necesaria, no suficiente. Por ejemplo, sif(x,y)=xy, entoncesd1f(→0;⋅)=0; todavía nof tiene extremo en→0. (¡Verifica!)
Se dieron condiciones suficientes en el Teorema 2 de §5,E′=E1. porque ahora retomamosE′=E2.
Dejarf:E2→E1 ser de claseCD2 en un globoG=G→p(δ). Supongamosd1f(→p;⋅)=0 enE2. SetA=D11f(→p),B=D12f(→p), yC=D22f(→p).
Entonces son ciertas las siguientes afirmaciones.
(i) SiAC>B2, tiene un máximo o mínimo en→p, función de si
A<0oA>0.
(ii) Si noAC<B2,f tiene extremo en→p.
El casoAC=B está sin resolver.
- Prueba
-
Dejar→x∈G y→u=→x−→p≠→0.
Comod1f(→p;⋅)=0, Teorema 2 en §5, rinde
Δf=f(→x)−f(→p)=R1=12d2f(→s;→u),
con→s∈L(→p,→x)⊆G (ver Corolario 1 de §5). Comof∈CD2, tenemosD12f=D21f enG (Teorema 1 en §5). Así, por la fórmula (4) en §5
Δf=12d2f(→s;→u)=12[D11f(→s)u21+2D12f(→s)u1u2+D22f(→s)u22].
Ahora, como los parciales involucrados son continuos, podemos elegirG=G→p(δ) tan pequeños que el signo de expresión (1) no cambiará si→s es reemplazado por→p. Entonces el signo crucial deΔf onG coincide con el de
D=Au21+2Bu1u2+Cu22
(conA,B, yC como se indica en el teorema).
De (2) obtenemos, por álgebra elemental,
AD=(Au1+Bu2)2+(AC−B2)u22,CD=(Cu1+Bu2)2+(AC−B2)u22.
Claramente, siAC>B2, la expresión del lado derecho en (3) es>0; asíAD>0, es decir,D tiene el mismo signo queA.
De ahíA<0, que si también tenemosΔf<0 encendidoG, yf tiene un máximo en→p. SiA>0, entoncesΔf>0, yf tiene un mínimo en→p.
Ahora vamosAC<B2. Afirmamos que no importa cuán pequeños se firmenG=G→p(δ),Δf los cambios como→x varía enG, y así nof tiene extremo en→p.
En efecto, tenemos→x=→p+→u,→u=(u1,u2)≠→0. Siu2=0, (3) muestra esoD yΔf tenemos el mismo signo queA(A≠0).
Pero siu2≠0 yu1=−Bu2/A (asumiendoA≠0), entoncesD yΔf tener el signo opuesto al deA; y sigue enG si→xu2 es lo suficientemente pequeño (¿qué tan pequeño?).
Se procede de manera similar siC≠0 (intercambioAC, y y uso (3').
Por último, siA=C=0, entonces por (2),D=2Bu1u2 yB≠0 (desdeAC<B2). De nuevoD yΔf cambiar de signo como lou1u2 hace; así nof tiene extremum en→p. Así todo está demostrado. ◻
Brevemente, la prueba utiliza el hecho de que el trinomio (2) cambia de signo si su discriminanteB2−AC es positivo, es decir,|ABBC|<0.
Nota 2. Las funcionesf:C→E1 (de una variable compleja) son igualmente cubiertas por el Teorema 2 si se las trata como funciones sobreE2 (de dos variables reales).
Funciones de n variables. Aquí debemos apoyarnos en la teoría algebraica de las llamadas formas cuadráticas simétricas, es decir, polinomiosP:En→E1 de la forma
P(→u)=n∑j=1n∑i=1aijuiuj,
dónde→u=(ui,…,un)∈En yaij=aji∈E1.
Damos por sentado un teorema debido a J. J. Sylvester (ver S. Perlis, Theory of Matrices, 1952, p. 197), que puede afirmarse de la siguiente manera.
DejarP:En→E1 ser una forma cuadrática simétrica,
P(→u)=n∑j=1n∑i=1aijuiuj.
i)P>0 en todos losEn−{→0} casos los siguientesn determinantesAk son positivos:
Ak=|a11a12…a1ka21a22…a2k……………a2kak1ak2…akk|,k=1,2,…,n.
(ii) TenemosP<0 enEn−{→0} iff(−1)kAk>0 parak=1,2,…,n.
Ahora podemos extender el Teorema 2 al casof:En→E1. (Esto también cubriráf:Cn→E1, tratado comof:E2n→E1.) La prueba se asemeja a la del Teorema 2.
Dejarf:En→E1 ser de claseCD2 en algunosG=G→p(δ). Supongamosdf(→p;⋅)=0 enEn. Definir elAk as en (4), conaij=Dijf(→p),i,j,k≤n Entonces se mantienen las siguientes declaraciones.
(i)f tiene un mínimo local en→p siAk>0 parak=1,2,…,n.
(ii)f tiene un máximo local en(−1)kAk>0 su→p casok=1,…,n.
(iii) nof tiene extremo en→p si la expresión
P(→u)=n∑j=1n∑i=1aijuiuj
es>0 para algunos→u∈En y<0 para otros (es decir,P cambios de inicio de sesiónEn).
- Prueba
-
Volvamos a usar→x∈G,→u=→x−→p≠→0, y usar el teorema de Taylor para obtener
Δf=f(→x)−f(→p)=R1=12d2f(→s;→u)=n∑j=1n∑i=1Dijf(→s)uiuj,
con→s∈L(→x,→p).
Comof∈CD2, los parcialesDijf son continuos enG. Así podemos hacerG tan pequeños que el signo de la última suma doble no cambia si→s es reemplazado por→p. De ahí que el signo deΔf encendidoG sea el mismo que el deP(→u)=∑nj=1∑ni=1aijuiuj, con elaij como se afirma en el teorema.
La forma cuadráticaP es simétrica ya queaij=aji por el Teorema 1 en §5. Así, por el teorema de Sylvester expuesto anteriormente, se obtienen fácilmente nuestras aseveraciones (i) y (ii). En efecto, son inmediatos de las cláusulas (i) y (ii) de ese teorema.
Ahora, para (iii), supongamosP(→u)>0>P(→v), i.e.
n∑j=1n∑i=1aijuiuj>0>n∑j=1n∑i=1aijvivj for some →u,→v∈En−{→0}.
Si aquí→u y→v son reemplazados port→u yt→v(t≠0), luegouiuj y sevivj convierten ent2uiuj yt2vivj, respectivamente. De ahí
P(t→u)=t2P(→u)>0>t2P(→v)=P(t→v).
Ahora, para cualquierat∈(0,δ/|→u|), el punto→x=→p+t→u se encuentra en la línea→u -dirigida por→p, dentroG=G→p(δ). (¿Por qué?) Del mismo modo para el punto→x′=→p+t→v.
De ahí que para tal→x y el teorema de→x′, Taylor vuelve a producir fórmulas análogas a (5) para algunos→s∈L(→p,→x) y que se→s′∈L(→p,→x′) encuentran en las mismas dos líneas. De nuevo se deduce que para los pequeñosδ,
f(→x)−f(→p)>0>f(→x′)−f(→p),
al igual queP(→u)>0>P(→v).
Así se demuestra el signo deΔf cambiosG→p(δ), y (iii). ◻
Nota 3. Aún no se resuelven los casos en los que seP(→u) desvanece para algunos→u≠→0, sin cambiar su signo; e.g.,P(→u)=(u1+u2+u3)2=0 para→u=(1,1,−2). Entonces la respuesta depende de términos de orden superior de la fórmula de Taylor. En particular, sid1f(→p;⋅)=d2f(→p;⋅)=0 enEn, entoncesΔf=R2=16d3f(→p;→s), etc.
Nota 4. El valor más grande o menor def en un conjuntoA (a veces llamado el máximo o mínimo absoluto) puede ocurrir en algún punto interior (por ejemplo, límite)→p∈A, y luego no se encuentra entre los extremos locales (donde, por definición,G→p⊆A se presupone un globo terráqueo). Así, para encontrar los extremos absolutos, también se debe explorar el comportamiento def en puntos no interiores deA.
Por el Teorema 1, los extremos locales solo pueden ocurrir en los llamados puntos críticos→p, es decir, aquellos en los que todas las derivadas direccionales desaparecen (o no existen, en cuyo casoD→uf(→p)=0 por convención).
En la práctica, para encontrar tales puntos enEn(Cn), unoDkf(k≤n) equipara los parciales a0. Entonces uno usa los teoremas 2 y 3 u otras consideraciones para determinar si realmente existe un extremo.
(A) Encontrar el mayor valor de
f(x,y)=sinx+siny−sin(x+y)
en el setA⊆E2 delimitado por las líneasx=0,y=0 yx+y=2π.
Tenemos
D1f(x,y)=cosx−cos(x+y) and D2f(x,y)=cosy−cos(x+y).
Dentro del triánguloA, ambos parciales desaparecen sólo en el punto en el que(2π3,2π3)f=32√3. En el límite deA (es decir, en las líneasx=0,y=0 yx+y=2π),f=0. Así incluso sin utilizar el Teorema 2, es evidente quef alcanza su mayor valor,
f(2π3,2π3)=32√3,
en este punto crítico único.
(B) Encontrar el mayor y el menor valor de
f(x,y,z)=a2x2+b2y2+c2z2−(ax2+by2+cz2)2,
con la condición de quex2+y2+z2=1 ya>b>c>0.
Comoz2=1−x2−y2, podemosz eliminarf(x,y,z) y reemplazarf porF:E2→E1:
F(x,y)=(a2−c2)x2+(b2−c2)y2+c2−[(a−c)x2+(b−c)y2+c]2.
(¡Explique!) PorqueF, buscamos los extremos en el disco¯G=¯G0(1)⊂E2, dondex2+y2≤1 (para no violar la condiciónx2+y2+z2=1).
Equiparando a 0 los dos parciales
D1F(x,y)=2x(a−c){(a+c)−2[(a−c)x2+(b−c)y2+c]2}=0,D2F(x,y)=2y(b−c){(b+c)−2[(a−c)x2+(b−c)y2+c]2}=0
y resolviendo este sistema de ecuaciones, encontramos estos puntos críticos dentroG:
(1)x=y=0 (F=0);
(2)x=0,y=±2−12(F=14(b−c)2); y
(3)x=±2−12,y=0(F=14(a−c)2).
(¡Verifica!)
Ahora bien, para el límite de¯G, i.e., el círculox2+y2=1, repite este proceso: sustituyay2=1−x2 en la fórmula paraF(x,y), reducirlo así a
h(x)=(a2−b2)x2+b2+[(a−b)x2+b]2,h:E1→E1,
en el intervalo[−1,1]⊂E1. En(−1,1) la derivada
h′(x)=2(a−b)x(1−2x2)
desaparece sólo cuando
(4)x=0 (h=0),y
(5)x=±2−12(h=14(a−b)2).
Por último, en los puntos finales de[−1,1], tenemos
(6)x=±1 (h=0).
Comparando los valores de función resultantes en los seis casos, concluimos que el menor de ellos es0, mientras que el más grande es14(a−c)2. Estos son los valores más pequeños y mayores deseados def, sujeto a las condiciones establecidas. Se logran, respectivamente, en los puntos
(0,0,±1),(0,±1,0),(±1,0,0), and (±2−12,0,±2−12).
Nuevamente, el uso de los Teoremas 2 y 3 fue redundante. Sin embargo, sugerimos como ejercicio que el lector pruebe los puntos críticos deF usando el Teorema 2.
Precaución. Los teoremas del 1 al 3 se aplican únicamente a funciones de variables independientes. En el Ejemplo (B),x,y,z se hicieron interdependientes por la ecuación impuesta
x2+y2+z2=1
(que limita geométricamente todo a la superficie deG→0(1) adentroE3), para que uno de ellos,z, pueda ser eliminado. Sólo entonces se pueden utilizar los Teoremas del 1 al 3.