Saltar al contenido principal
9.5: Función inversa e implícita Teorema Teorema
- Última actualización
-
-
Guardar como PDF
de función
inversa e implícita
Nota: Conferencias FIXME
Para probar el teorema de función inversa utilizamos el principio de mapeo de contracción que hemos visto en FIXME y que hemos utilizado para probar Teorema de Picard. Recordemos que un mapeo\(f \colon X \to X'\) entre dos espacios métricos\((X,d)\) y\((X',d')\) se llama contracción si existe\(k < 1\) tal que\[d'\bigl(f(x),f(y)\bigr) \leq k d(x,y) \ \ \ \ \text{for all } x,y \in X.\] El principio de mapeo de contracción dice que si\(f \colon X \to X\) es una contracción y\(X\) es un espacio métrico completo, entonces existe un fijo punto, es decir, existe\(x \in X\) tal que\(f(x) = x\).
Intuitivamente si una función es diferenciable, entonces localmente “se comporta como” la derivada (que es una función lineal). La idea del teorema de la función inversa es que si una función es diferenciable y la derivada es invertible, la función es (localmente) invertible.
Dejar\(U \subset {\mathbb{R}}^n\) ser un conjunto y dejar\(f \colon U \to {\mathbb{R}}^n\) ser una función continuamente diferenciable. También supongamos\(x_0 \in U\)\(f(x_0) = y_0\),, y\(f'(x_0)\) es invertible (es decir,\(J_f(x_0) \not=0\)). Entonces existen conjuntos abiertos de\(V, W \subset {\mathbb{R}}^n\) tal manera que\(x_0 \in V \subset U\),\(f(V) = W\) y\(f|_V\) es uno a uno y sobre. Además, la inversa\(g(y) = (f|_V)^{-1}(y)\) es continuamente diferenciable y\[g'(y) = {\bigl(f'(x)\bigr)}^{-1}, \qquad \text{ for all $x \in V$, $y = f(x)$.}\]
Write\(A = f'(x_0)\). Como\(f'\) es continuo, existe una bola abierta\(V\) alrededor de\(x_0\) tal manera que\[\left\lVert {A-f'(x)} \right\rVert < \frac{1}{2\left\lVert {A^{-1}} \right\rVert} \qquad \text{for all $x \in V$.}\] Note que\(f'(x)\) es invertible para todos\(x \in V\).
Dado\(y \in {\mathbb{R}}^n\) definimos\(\varphi_y \colon C \to {\mathbb{R}}^n\)\[\varphi_y (x) = x + A^{-1}\bigl(y-f(x)\bigr) .\] Como\(A^{-1}\) es uno-a-uno, entonces\(\varphi_y(x) = x\) (\(x\)es un punto fijo) si sólo si\(y-f(x) = 0\), o en otras palabras\(f(x)=y\). Usando regla de cadena obtenemos\[\varphi_y'(x) = I - A^{-1} f'(x) = A^{-1} \bigl( A-f'(x) \bigr) .\] Así que para\(x \in V\) tenemos\[\left\lVert {\varphi_y'(x)} \right\rVert \leq \left\lVert {A^{-1}} \right\rVert \left\lVert {A-f'(x)} \right\rVert < \nicefrac{1}{2} .\] Como\(V\) es una bola es convexa, y de ahí\[\left\lVert {\varphi_y(x_1)-\varphi_y(x_2)} \right\rVert \leq \frac{1}{2} \left\lVert {x_1-x_2} \right\rVert \qquad \text{for all $x_1,x_2 \in V$}.\] en otras palabras\(\varphi_y\) es una contracción definida sobre\(V\), aunque hasta ahora no sabemos cuál es el rango de\(\varphi_y\). No podemos aplicar el teorema de punto fijo, pero podemos decir que\(\varphi_y\) tiene como máximo un punto fijo (nota prueba de unicidad en el principio de mapeo de contracción). Es decir, existe a lo sumo uno\(x \in V\) tal que\(f(x) = y\), y así lo\(f|_V\) es uno a uno.
Vamos\(W = f(V)\). Tenemos que demostrar que\(W\) está abierto. Toma una\(y_1 \in W\), entonces hay una única\(x_1 \in V\) tal que\(f(x_1) = y_1\). Dejar\(r > 0\) ser lo suficientemente pequeña como para que la bola cerrada\(C(x_1,r) \subset V\) (tal\(r > 0\) existe como\(V\) está abierta).
Supongamos que\(y\) es tal que\[\left\lVert {y-y_1} \right\rVert < \frac{r}{2\left\lVert {A^{-1}} \right\rVert} .\] si podemos demostrar eso\(y \in W\), entonces hemos demostrado que\(W\) está abierto. Definir\(\varphi_y(x) = x+A^{-1}\bigl(y-f(x)\bigr)\) como antes. Si\(x \in C(x_1,r)\),\[\begin{split} \left\lVert {\varphi_y(x)-x_1} \right\rVert & \leq \left\lVert {\varphi_y(x)-\varphi_y(x_1)} \right\rVert + \left\lVert {\varphi_y(x_1)-x_1} \right\rVert \\ & \leq \frac{1}{2}\left\lVert {x-x_1} \right\rVert + \left\lVert {A^{-1}(y-y_1)} \right\rVert \\ & \leq \frac{1}{2}r + \left\lVert {A^{-1}} \right\rVert\left\lVert {y-y_1} \right\rVert \\ & < \frac{1}{2}r + \left\lVert {A^{-1}} \right\rVert \frac{r}{2\left\lVert {A^{-1}} \right\rVert} = r . \end{split}\] entonces So\(\varphi_y\) toma\(C(x_1,r)\) en\(B(x_1,r) \subset C(x_1,r)\). Es una contracción\(C(x_1,r)\) y\(C(x_1,r)\) es completa (subconjunto cerrado de\({\mathbb{R}}^n\) es completo). Aplicar el principio de mapeo de contracción para obtener un punto fijo\(x\), i.e\(\varphi_y(x) = x\). Eso es\(f(x) = y\). Entonces\(y \in f\bigl(C(x_1,r)\bigr) \subset f(V) = W\). Por lo tanto\(W\) está abierto.
A continuación tenemos que demostrar que\(g\) es continuamente diferenciable y computar su derivada. Primero demostremos que es diferenciable. Dejar\(y \in W\) y\(k \in {\mathbb{R}}^n\),\(k\not= 0\), tal que\(y+k \in W\). Luego hay únicos\(x \in V\) y\(h \in {\mathbb{R}}^n\),\(h \not= 0\) y\(x+h \in V\), tal que\(f(x) = y\) y\(f(x+h) = y+k\) como\(f|_V\) es un uno-a-uno y en mapeo de\(V\) sobre\(W\). En otras palabras,\(g(y) = x\) y\(g(y+k) = x+h\). Todavía podemos exprimir alguna información del hecho de que\(\varphi_y\) es una contracción. \[\varphi_y(x+h)-\varphi_y(x) = h + A^{-1} \bigl( f(x)-f(x+h) \bigr) = h - A^{-1} k .\]Entonces\[\left\lVert {h-A^{-1}k} \right\rVert = \left\lVert {\varphi_y(x+h)-\varphi_y(x)} \right\rVert \leq \frac{1}{2}\left\lVert {x+h-x} \right\rVert = \frac{\left\lVert {h} \right\rVert}{2}.\] Por el triángulo inverso la desigualdad\(\left\lVert {h} \right\rVert - \left\lVert {A^{-1}k} \right\rVert \leq \frac{1}{2}\left\lVert {h} \right\rVert\) así\[\left\lVert {h} \right\rVert \leq 2 \left\lVert {A^{-1}k} \right\rVert \leq 2 \left\lVert {A^{-1}} \right\rVert \left\lVert {k} \right\rVert.\] En particular como\(k\) va a 0, también lo hace\(h\).
Como\(x \in V\), entonces\(f'(x)\) es invertible. Vamos\(B = \bigl(f'(x)\bigr)^{-1}\), que es lo que pensamos que\(y\) es el derivado de\(g\) at. Entonces\[\begin{split} \frac{\left\lVert {g(y+k)-g(y)-Bk} \right\rVert}{\left\lVert {k} \right\rVert} & = \frac{\left\lVert {h-Bk} \right\rVert}{\left\lVert {k} \right\rVert} \\ & = \frac{\left\lVert {h-B\bigl(f(x+h)-f(x)\bigr)} \right\rVert}{\left\lVert {k} \right\rVert} \\ & = \frac{\left\lVert {B\bigl(f(x+h)-f(x)-f'(x)h\bigr)} \right\rVert}{\left\lVert {k} \right\rVert} \\ & \leq \left\lVert {B} \right\rVert \frac{\left\lVert {h} \right\rVert}{\left\lVert {k} \right\rVert}\, \frac{\left\lVert {f(x+h)-f(x)-f'(x)h} \right\rVert}{\left\lVert {h} \right\rVert} \\ & \leq 2\left\lVert {B} \right\rVert\left\lVert {A^{-1}} \right\rVert \frac{\left\lVert {f(x+h)-f(x)-f'(x)h} \right\rVert}{\left\lVert {h} \right\rVert} . \end{split}\] Como\(k\) va a 0, también lo hace\(h\). Entonces el lado derecho va a 0 como\(f\) es diferenciable, y de ahí el lado izquierdo también va a 0. Y\(B\) es precisamente lo que\(g'(y)\) queríamos ser.
Tenemos\(g\) es diferenciable, demostremos que es\(C^1(W)\). Ahora,\(g \colon W \to V\) es continuo (es diferenciable),\(f'\) es una función continua de\(V\) a\(L({\mathbb{R}}^n)\), y\(X \to X^{-1}\) es una función continua. \(g'(y) = {\bigl( f'\bigl(g(y)\bigr)\bigr)}^{-1}\)es la composición de estas tres funciones continuas y por lo tanto es continua.
Supongamos que\(U \subset {\mathbb{R}}^n\)\(f \colon U \to {\mathbb{R}}^n\) es abierto y es un mapeo continuamente diferenciable tal que\(f'(x)\) es invertible para todos\(x \in U\). Entonces dado cualquier conjunto abierto\(V \subset U\),\(f(V)\) está abierto. (\(f\)es un mapeo abierto).
Sin pérdida de generalidad, supongamos\(U=V\). Para cada punto\(y \in f(V)\), elegimos\(x \in f^{-1}(y)\) (podría haber más de uno de esos puntos), luego por el teorema de la función inversa hay un vecindario de\(x\) en\(V\) ese mapas sobre un vecindario de\(y\). De ahí\(f(V)\) que esté abierto.
El teorema, y el corolario, no es cierto si no\(f'(x)\) es invertible para algunos\(x\). Por ejemplo, el mapa\(f(x,y) = (x,xy)\),\({\mathbb{R}}^2\) se mapea al conjunto\({\mathbb{R}}^2 \setminus \{ (0,y) : y \neq 0 \}\), que no está ni abierto ni cerrado. De hecho\(f^{-1}(0,0) = \{ (0,y) : y \in {\mathbb{R}}\}\). Tenga en cuenta que este mal comportamiento solo ocurre en el\(y\) eje -, en cualquier otro lugar la función es localmente invertible. De hecho si evitamos el\(y\) -eje es incluso uno a uno.
También tenga en cuenta que solo porque\(f'(x)\) sea invertible en todas partes no significa que\(f\) sea uno a uno a nivel global. Es “localmente” uno a uno pero quizás no “globalmente”. Por ejemplo, tomemos el mapa\(f \colon {\mathbb{R}}^2 \setminus \{ 0 \} \to {\mathbb{R}}^2\) definido por\(f(x,y) = (x^2-y^2,2xy)\). Se deja al estudiante demostrar que\(f\) es diferenciable y la derivada es invertible
Por otro lado, el mapeo es de 2 a 1 a nivel global. Por cada\((a,b)\) que no es el origen, hay exactamente dos soluciones a\(x^2-y^2=a\) y\(2xy=b\). Dejamos que el alumno demuestre que hay al menos una solución, para luego notar que reemplazando\(x\) y\(y\) con\(-x\) y\(-y\) obtenemos otra solución.
También tenga en cuenta que la invertibilidad de la derivada no es una condición necesaria, solo suficiente para tener una inversa continua y ser un mapeo abierto. Por ejemplo, la función\(f(x) = x^3\) es un mapeo abierto de\({\mathbb{R}}\) a\({\mathbb{R}}\) y es globalmente uno a uno con una inversa continua.
Teorema de la función implícita
El teorema de la función inversa es realmente un caso especial del teorema de la función implícita que probamos a continuación. Aunque algo irónicamente probamos el teorema de la función implícita usando el teorema de la función inversa. Lo que estábamos mostrando en el teorema de la función inversa era que la ecuación\(x-f(y) = 0\) era solucionable\(y\) en términos de\(x\) si la derivada en términos de\(y\) era invertible, es decir, si\(f'(y)\) era invertible. Es decir, había localmente una función\(g\) tal que\(x-f\bigl(g(x)\bigr) = 0\).
Bien, entonces, ¿qué tal si miramos la ecuación\(f(x,y) = 0\)? Obviamente esto no es solucionable\(y\) en términos de\(x\) en todos los casos. Por ejemplo, cuando en realidad\(f(x,y)\) no depende de\(y\). Para un ejemplo un poco más complicado, note que\(x^2+y^2-1 = 0\) define el círculo unitario, y podemos resolver localmente para\(y\) en términos de\(x\) cuando 1) estamos cerca de un punto que se encuentra en el círculo unitario y 2) cuando no estamos en un punto donde el círculo tiene una tangencia vertical, o en otras palabras donde\(\frac{\partial f}{\partial y} = 0\).
Para hacer las cosas simples arreglamos alguna notación. Dejamos\((x,y) \in {\mathbb{R}}^{n+m}\) denotar las coordenadas\((x^1,\ldots,x^n,y^1,\ldots,y^m)\). Una transformación lineal\(A \in L({\mathbb{R}}^{n+m},{\mathbb{R}}^m)\) puede entonces siempre escribirse de\(A = [ A_x ~ A_y ]\) manera que\(A(x,y) = A_x x + A_y y\), dónde\(A_x \in L({\mathbb{R}}^n,{\mathbb{R}}^m)\) y\(A_y \in L({\mathbb{R}}^m)\).
Vamos\(A = [A_x~A_y] \in L({\mathbb{R}}^{n+m},{\mathbb{R}}^m)\) y supongamos que\(A_y\) es invertible, entonces vamos\(B = - {(A_y)}^{-1} A_x\) y anote que\[0 = A ( x, Bx) = A_x x + A_y Bx .\]
La prueba es obvia. Simplemente resolvemos y obtenemos\(y = Bx\). Demostremos, pues, que se puede hacer lo mismo para\(C^1\) las funciones.
[thm:implicit] Dejar\(U \subset {\mathbb{R}}^{n+m}\) ser un conjunto abierto y dejar\(f \colon U \to {\mathbb{R}}^m\) ser un\(C^1(U)\) mapeo. \((x_0,y_0) \in U\)Sea un punto tal que\(f(x_0,y_0) = 0\) y tal que\[\frac{\partial(f^1,\ldots,f^m)}{\partial(y^1,\ldots,y^m)} (x_0,y_0) \neq 0 .\] Entonces existe un conjunto abierto\(W \subset {\mathbb{R}}^n\) con\(x_0 \in W\), un conjunto abierto\(W' \subset {\mathbb{R}}^m\) con\(y_0 \in W'\), con\(W \times W' \subset U\), y un\(C^1(W)\) mapeo\(g \colon W \to W'\), con\(g(x_0) = y_0\), y para todos\(x \in W\), el punto \(g(x)\)es el punto único en\(W'\) tal que\[f\bigl(x,g(x)\bigr) = 0 .\] Además, si\([ A_x ~ A_y ] = f'(x_0,y_0)\), entonces\[g'(x_0) = -{(A_y)}^{-1}A_x .\]
FIXME: y estos son TODOS los puntos donde se\(f\) desvanece cerca\(x_0,y_0\).
La condición\(\frac{\partial(f^1,\ldots,f^m)}{\partial(y^1,\ldots,y^m)} (x_0,y_0) = \det(A_y) \neq 0\) simplemente significa que\(A_y\) es invertible.
Definir\(F \colon U \to {\mathbb{R}}^{n+m}\) por\(F(x,y) := \bigl(x,f(x,y)\bigr)\). Es claro que\(F\) es\(C^1\), y queremos demostrar que el derivado at\((x_0,y_0)\) es invertible.
Calculemos la derivada. Sabemos que\[\frac{\left\lVert {f(x_0+h,y_0+k) - f(x_0,y_0) - A_x h - A_y k} \right\rVert}{\left\lVert {(h,k)} \right\rVert}\] va a cero como\(\left\lVert {(h,k)} \right\rVert = \sqrt{\left\lVert {h} \right\rVert^2+\left\lVert {k} \right\rVert^2}\) va a cero. Pero entonces también lo hace\[\frac{\left\lVert {\bigl(h,f(x_0+h,y_0+k)-f(x_0,y_0)\bigr) - (h,A_x h+A_y k)} \right\rVert}{\left\lVert {(h,k)} \right\rVert} = \frac{\left\lVert {f(x_0+h,y_0+k) - f(x_0,y_0) - A_x h - A_y k} \right\rVert}{\left\lVert {(h,k)} \right\rVert} .\] Así que el derivado de\(F\) at\((x_0,y_0)\) lleva\((h,k)\) a\((h,A_x h+A_y k)\). Si\((h,A_x h+A_y k) = (0,0)\), entonces\(h=0\), y así\(A_y k = 0\). Como\(A_y\) es uno a uno, entonces\(k=0\). Por lo tanto,\(F'(x_0,y_0)\) es uno a uno o en otras palabras invertible y podemos aplicar el teorema de la función inversa.
Es decir, existe algún conjunto abierto\(V \subset {\mathbb{R}}^{n+m}\) con\((x_0,0) \in V\), y un mapeo inverso\(G \colon V \to {\mathbb{R}}^{n+m}\), es decir\(F\bigl(G(x,s)\bigr) = (x,s)\) para todos\((x,s) \in V\) (dónde\(x \in {\mathbb{R}}^n\) y\(s \in {\mathbb{R}}^m\)). Escribir\(G = (G_1,G_2)\) (el primero\(n\) y el segundo\(m\) componentes de\(G\)). Entonces\[F\bigl(G_1(x,s),G_2(x,s)\bigr) = \bigl(G_1(x,s),f(G_1(x,s),G_2(x,s))\bigr) = (x,s) .\] Entonces Entonces\(x = G_1(x,s)\) y\(f\bigl(G_1(x,s),G_2(x,s)) = f\bigl(x,G_2(x,s)\bigr) = s\). Conectando\(s=0\) obtenemos\[f\bigl(x,G_2(x,0)\bigr) = 0 .\] El conjunto\(G(V)\) contiene todo un vecindario del punto\((x_0,y_0)\) y por lo tanto hay algunos abiertos El conjunto\(V\) está abierto y por lo tanto existen algunos conjuntos abiertos\(\tilde{W}\) y\(W'\) tal que\(\tilde{W} \times W' \subset G(V)\) con\(x_0 \in \tilde{W}\) y \(y_0 \in W'\). Entonces toma\(W = \{ x \in \tilde{W} : G_2(x,0) \in W' \}\). La función que lleva\(x\) a\(G_2(x,0)\) es continua y por lo tanto\(W\) es abierta. Definimos\(g \colon W \to {\mathbb{R}}^m\) por\(g(x) := G_2(x,0)\) cual es el\(g\) en el teorema. El hecho de que\(g(x)\) es el punto único en\(W'\) sigue porque\(W \times W' \subset G(V)\) y\(G\) es uno a uno y hacia\(G(V)\).
Siguiente diferenciar\[x\mapsto f\bigl(x,g(x)\bigr) ,\] en\(x_0\), que debería ser el mapa cero. La derivada se realiza de la misma manera que anteriormente. Lo conseguimos para todos\(h \in {\mathbb{R}}^{n}\)\[0 = A\bigl(h,g'(x_0)h\bigr) = A_xh + A_yg'(x_0)h ,\] y también obtenemos el derivado deseado para\(g\).
Es decir, en el contexto del teorema tenemos\(m\) ecuaciones en\(n+m\) incógnitas. \[\begin{aligned} & f^1 (x_1,\ldots,x_n,y_1,\ldots,y_m) = 0 \\ & \qquad \qquad \qquad \vdots \\ & f^m (x_1,\ldots,x_n,y_1,\ldots,y_m) = 0\end{aligned}\]Y la condición que garantiza una solución es que se trata de un\(C^1\) mapeo (que todos los componentes son\(C^1\), o en otras palabras todas las derivadas parciales existen y son continuas), y la matriz\[\begin{bmatrix} \frac{\partial f^1}{\partial y^1} & \ldots & \frac{\partial f^1}{\partial y^m} \\ \vdots & \ddots & \vdots \\ \frac{\partial f^m}{\partial y^1} & \ldots & \frac{\partial f^m}{\partial y^m} \end{bmatrix}\] es invertible en\((x_0,y_0)\).
Considera el conjunto\(x^2+y^2-{(z+1)}^3 = -1\),\(e^x+e^y+e^z = 3\) cerca del punto\((0,0,0)\). La función que estamos viendo es\[f(x,y,z) = (x^2+y^2-{(z+1)}^3+1,e^x+e^y+e^z-3) .\] Encontramos que\[Df = \begin{bmatrix} 2x & 2y & -3{(z+1)}^2 \\ e^x & e^y & e^z \end{bmatrix} .\] La matriz\[\begin{bmatrix} 2(0) & -3{(0+1)}^2 \\ e^0 & e^0 \end{bmatrix} = \begin{bmatrix} 0 & -3 \\ 1 & 1 \end{bmatrix}\] es invertible. De ahí cerca\((0,0,0)\) podemos encontrar\(y\) y\(z\) como\(C^1\) funciones de\(x\) tal que para\(x\) cerca 0 tenemos\[x^2+y(x)^2-{(z(x)+1)}^3 = -1, \qquad e^x+e^{y(x)}+e^{z(x)} = 3 .\] El teorema no nos dice cómo encontrar\(y(x)\) y\(z(x)\) explícitamente, solo nos dice que existen. Es decir, cerca del origen el conjunto de soluciones es una posada curva suave\({\mathbb{R}}^3\) que pasa por el origen.
Obsérvese que existen versiones del teorema para arbitrariamente muchos derivados. Si\(f\) tiene derivados\(k\) continuos, entonces la solución también tiene\(k\) derivados.
Ejercicios