5.7: El derivado covariante
- Page ID
- 127297
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)En la sección anterior pudimos estimar un efecto relativista general no trivial, la precesión geodésica de los giroscopios a bordo de la sonda de gravedad B, hasta una constante sin unidad 3\(\pi\). Pensemos en qué maquinaria adicional se necesitaría para poder llevar a cabo el cálculo en detalle, incluyendo la 3\(\pi\).
Primero necesitaríamos conocer la ecuación de campo de Einstein, pero en un vacío esto es bastante sencillo:
\[R_{ab} = 0.\]
Einstein postuló esta ecuación basándose esencialmente en las consideraciones establecidas en la Sección 5.1.
Pero el solo hecho de saber que cierto tensor desaparece de manera idéntica en el espacio que rodea a la tierra claramente no nos dice nada explícito sobre la estructura del espacio-tiempo en esa región. Queremos conocer la métrica. Como se sugirió al inicio del capítulo, esperamos que las primeras derivadas de la métrica den una cantidad análoga al campo gravitacional de la mecánica newtoniana, pero esta cantidad no será directamente observable, y no será un tensor. Las segundas derivadas de la métrica son las que esperamos relacionar con el tensor Ricci\(R_{ab}\).
La derivada covariante en electromagnetismo
Estamos hablando alegremente de derivados, pero no es obvio cómo definir un derivado en el contexto de la relatividad general de tal manera que tomar una derivada da como resultado un tensor de buen comportamiento.
Para ver cómo surge este tema, retrocedamos al terreno más familiar del electromagnetismo. En la mecánica cuántica, la fase de la función de onda de una partícula cargada es inobservable, de manera que por ejemplo la transformación\(\Psi \rightarrow − \Psi\) no cambia los resultados de los experimentos. Como ejemplo menos trivial, podemos redefinir la tierra de nuestro potencial eléctrico\(\Phi \rightarrow \Phi + \delta \Phi\), y esto agregará una constante a la energía de cada electrón en el universo, haciendo que sus fases oscilen a mayor velocidad debido a la relación cuántico-mecánica
\[E = hf.\]
No hay consecuencias observables, sin embargo, porque lo que es observable es la fase de un electrón respecto a otro, como en un experimento de interferencia de doble rendija. Dado que cada electrón se ha hecho oscilar más rápido, el efecto es simplemente como dejar que el director de una orquesta ondear su batuta más rápidamente; cada músico sigue en sintonía con todos los demás músicos. La tasa de cambio de la función de onda, es decir, su derivada, tiene alguna ambigüedad incorporada.
Por simplicidad, limitémonos ahora a partículas de giro cero, ya que los detalles de la polarización de los electrones claramente no nos dirán nada útil cuando hagamos la analogía con la relatividad. Para una partícula spin-zero, la función de onda es simplemente un número complejo, y no hay consecuencias observables derivadas de la transformación
\[\Psi \rightarrow \Psi' = e^{i \alpha} \Psi\]
donde\(\alpha\) es una constante. También\(\Phi \rightarrow \Phi + \delta \Phi\) se permite la transformación, y da\(\alpha (t) = (\frac{q \delta \Phi}{\hbar})t\), de manera que el factor de fase e i\(\alpha\) (t) es una función del tiempo\(t\). Ahora, desde el punto de vista del electromagnetismo en la era de Maxwell, con los campos eléctricos y magnéticos imaginados como desempeñando sus papeles en un contexto de espacio euclidiano y tiempo absoluto, la forma de este factor de fase dependiente del tiempo es muy especial y simétrica; depende sólo del tiempo absoluto variable. Pero para un relativista, no hay nada muy agradable en esta función en absoluto, porque no hay nada especial en una coordenada de tiempo. Si vamos a permitir una función de esta forma, entonces basándonos en la coordinada-invarianza de la relatividad, parece que probablemente deberíamos permitir que α sea cualquier función en todas las coordenadas espacio-tiempo. La generalización adecuada de\(\Phi \rightarrow \Phi - \delta \Phi\) es ahora A b → A b −\(\partial_{b} \alpha\), donde A b es el potencial electromagnético de cuatro vectores (sección 4.2).
Ejercicio\(\PageIndex{1}\)
Autocomprobación: Supongamos que dijimos que\(\alpha\) permitiríamos ser una función de t, pero prohibirle depender de las coordenadas espaciales. Demostrar que esto violaría la invarianza de Lorentz.
La transformación no tiene efecto sobre los campos electromagnéticos, que son los observables directos. También podemos verificar que el cambio de calibre no tendrá ningún efecto sobre el comportamiento observable de las partículas cargadas. Esto se debe a que la fase de una función de onda sólo puede determinarse en relación con la fase de la función de onda de otra partícula, cuando ocupan el mismo punto en el espacio y, por ejemplo, interfieren. Dado que el desplazamiento de fase depende únicamente de la ubicación en el espacio-tiempo, no hay cambio en la fase relativa.
Pero van a pasar cosas malas si no hacemos un ajuste correspondiente a las derivadas que aparecen en la ecuación de Schrödinger. Estos derivados son esencialmente los operadores de momentum, y dan resultados diferentes cuando se aplican a\(\Psi'\) que cuando se aplican a\(\Psi\):
\[\begin{split} \partial_{b} \Psi &\rightarrow \partial_{b} (e^{i \alpha} \Psi) \\ &= e^{i \alpha} \partial_{b} \Psi + i \partial_{b} \alpha (e^{i \alpha} \Psi) \\ &= (\partial_{b} + A'_{b} - A_{b}) \Psi' \end{split}\]
Para evitar obtener resultados incorrectos, tenemos que hacer la sustitución\(\partial_{b} \rightarrow \partial_{b} + ieA_{b}\), donde el término de corrección compensa el cambio de calibre. Llamamos al operador\(\nabla\) definido como
\[\nabla_{b} = \partial_{b} + ieA_{b}\]
la derivada covariante. Da la respuesta correcta independientemente de un cambio de calibre.
La derivada covariante en la relatividad general
Ahora considere cómo se desarrolla todo esto en el contexto de la relatividad general. Las transformaciones de calibre de la relatividad general son cambios arbitrarios y suaves de coordenadas. Una de las propiedades más básicas que podríamos requerir de un operador derivado es que debe dar cero en una función constante. Una función escalar constante permanece constante cuando se expresa en un nuevo sistema de coordenadas, pero lo mismo no es cierto para una función de vector constante, o para cualquier tensor de rango superior. Esto se debe a que el cambio de coordenadas cambia las unidades en las que se mide el vector, y si el cambio de coordenadas es no lineal, las unidades varían de punto a punto.
Consideremos el caso unidimensional, en el que un vector v a solo tiene un componente, y la métrica también es un solo número, de manera que podemos omitir los índices y simplemente escribir v y g. (Solo tenemos que recordar que v es realmente un vector covariante, aunque estemos dejando fuera el índice superior.) Si v es constante, su derivada\(\frac{dv}{dx}\), calculada de la manera ordinaria sin ningún término de corrección, es cero. Si además asumimos que la coordenada x es una coordenada normal, de manera que la métrica es simplemente la constante g = 1, entonces cero no es solo la respuesta sino la respuesta correcta. (La existencia de un conjunto global preferido de coordenadas normales es una característica especial de un espacio unidimensional, porque no hay curvatura en una dimensión. En más de una dimensión, normalmente no habrá ningún conjunto posible de coordenadas en las que la métrica sea constante, y las coordenadas normales solo dan una métrica que es aproximadamente constante en la vecindad alrededor de un cierto punto. Consulte la Figura 5.3.7 para ver un ejemplo de coordenadas normales en una esfera, que no tienen una métrica constante.)
Ahora supongamos que nos transformamos en un nuevo sistema de coordenadas X, que no es normal. La métrica G, expresada en este sistema de coordenadas, no es constante. Aplicando la ley de transformación del tensor\(V = v \frac{dX}{dx}\), tenemos, y la diferenciación con respecto a X no dará cero, porque el factor\(\frac{dX}{dx}\) no es constante. Esta es la respuesta incorrecta: V no varía realmente, solo parece variar porque G sí.
Queremos agregar un término de corrección al operador derivado\(\frac{d}{dX}\), formando un operador derivado covariante\(\nabla_{X}\) que dé la respuesta correcta. Este término de corrección es fácil de encontrar si consideramos cuál debería ser el resultado a la hora de diferenciar la métrica en sí. En general, si un tensor parece variar, podría variar ya sea porque realmente sí varía o porque la métrica varía. Si la métrica en sí varía, podría ser ya sea porque la métrica realmente varía o.. porque la métrica varía. En otras palabras, no existe una manera sensata de asignar una derivada covariante distinta de cero a la métrica misma, por lo que debemos tener\(\nabla_{X}\) G = 0. Por lo tanto, la corrección requerida consiste en\(\frac{d}{dX}\) sustituir por
\[\nabla_{X} = \frac{d}{dX} - G^{-1} \frac{dG}{dX} \ldotp\]
Aplicar esto a G da cero. G es un tensor contravariante de segundo rango. Si aplicamos la misma corrección a las derivadas de otros tensores contravariantes de segundo rango, obtendremos resultados distintos de cero, y serán los resultados correctos distintos de cero. Por ejemplo, la derivada covariante del tensor estres-energía T (¡asumiendo que tal cosa podría tener algún significado físico en una dimensión!) será\(\nabla_{X} T = \frac{dT}{dX} − G^{-1} (\frac{dG}{dX})T\).
Físicamente, el término de corrección es un derivado de la métrica, y ya hemos visto que las derivadas de la métrica (1) son lo más cercano que obtenemos en relatividad general al campo gravitacional, y (2) no son tensores. En 1+1 dimensiones, supongamos que observamos que una roca de caída libre tiene\(\frac{dV}{dT}\) = 9.8 m/s 2. Esta aceleración no puede ser un tensor, porque podríamos hacerla desaparecer cambiando de las coordenadas Fijadas a la Tierra X a coordenadas de caída libre (normales, localmente lorentzianas) x, y no se puede hacer que un tensor desaparezca por un cambio de coordenadas. Según un observador de caída libre, el vector v no está cambiando en absoluto; es solo la variación en la métrica G del observador fijo a la Tierra lo que hace que parezca cambiar.
Matemáticamente, la forma de la derivada es\((\frac{1}{y}) \frac{dy}{dx}\), la cual se conoce como una derivada logarítmica, ya que es igual\(\frac{d(\ln y)}{dx}\). Mide la tasa multiplicativa de cambio de y. Por ejemplo, si y escala hacia arriba por un factor de k cuando x aumenta en 1 unidad, entonces la derivada logarítmica de y es ln k. La derivada logarítmica de e cx es c. La naturaleza logarítmica del término de corrección to\(\nabla_{X}\) es una buena cosa, porque nos permite tomar cambios de escala, que son cambios multiplicativos, y convertirlos en correcciones aditivas al operador derivado. La aditividad de las correcciones es necesaria si el resultado de una derivada covariante va a ser un tensor, ya que los tensores son criaturas aditivas.
¿Qué pasa con las cantidades que no son tensores covariantes de segundo rango? Bajo una reescalación de coordenadas contravariantes por un factor de k, los vectores covariantes escalan por k −1 y tensores covariantes de segundo rango por k −2. Por lo tanto, el término de corrección debería ser la mitad para los vectores covariantes,
\[\nabla_{X} = \frac{d}{dX} - \frac{1}{2} G^{-1} \frac{dG}{dX} \ldotp\]
y debe tener un signo opuesto para los vectores contravariantes.
Generalizando el término de corrección a derivados de vectores en más de una dimensión, deberíamos tener algo de esta forma:
\[\begin{split} \nabla_{a} v^{b} &= \partial_{a} v^{b} + \Gamma^{b}_{ac} v^{c} \\ \nabla_{a} v_{b} &= \partial_{a} v_{b} - \Gamma^{c}_{ba} v_{c}, \end{split}\]
donde\(\Gamma^{b}_{ac}\), llamado el símbolo de Christoffel, no se transforma como un tensor, e implica derivados de la métrica. (“Christoffel” se pronuncia “Krist-awful”, con el acento en la sílaba del medio.) El cálculo explícito de los símbolos Christoffel a partir de la métrica se aplaza hasta la sección 5.9, pero las secciones intermedias 5.7 y 5.8 pueden omitirse en una primera lectura sin pérdida de continuidad.
Un problema importante es que cuando evaluamos un componente particular de una derivada covariante tal como\(\nabla_{2} v^{3}\), es posible que el resultado sea distinto de cero aunque el componente v 3 se desvanezca de manera idéntica. Esto se puede ver en el ejemplo 5 y en el ejemplo 21.
Ejemplo 9: Símbolos de Christoffel en el globo
Como ejemplo cualitativo, considere la trayectoria del avión geodésico que se muestra en la Figura 5.6.4, de Londres a la Ciudad de México. En física se acostumbra trabajar con la colatitud,\(\theta\), medida hacia abajo desde el polo norte, en lugar de la latitud, medida desde el ecuador. En P, sobre el Atlántico Norte, la colatitud del avión tiene un mínimo. (Podemos ver, sin tener que tomarlo por fe de la figura, que tal mínimo debe ocurrir. La forma más fácil de convencerse de esto es considerar un camino que va directamente sobre el polo, a\(\theta\) = 0.)
En P, el vector de velocidad del avión apunta directamente al oeste. En Q, sobre Nueva Inglaterra, su velocidad tiene un gran componente al sur. Dado que el camino es geodésico y el plano tiene velocidad constante, el vector de velocidad simplemente está siendo transportado en paralelo; la derivada covariante del vector es cero. Ya que tenemos v \(\theta\)= 0 en P, la única manera de explicar el valor distinto de cero y positivo de\(\partial_{\phi} v^{\theta}\) es que tenemos un valor distinto de cero y negativo de\(\Gamma^{\theta}_{\phi \phi}\).
Por simetría, podemos inferir que\(\Gamma^{\theta}_{\phi \phi}\) debe tener un valor positivo en el hemisferio sur, y debe desaparecer en el ecuador.
\(\Gamma^{\theta}_{\phi \phi}\)se calcula en el ejemplo 10.
La simetría también requiere que este símbolo de Christoffel sea independiente\(\phi\), y también debe ser independiente del radio de la esfera.
El ejemplo 9 está en dos dimensiones espaciales. En el espacio-tiempo,\(\Gamma\) es esencialmente el campo gravitacional (ver problema 7), y los primeros papeles de la relatividad esencialmente se refieren a él de esa manera. 9 Esto puede parecer un reencuentro alegre con nuestro viejo amigo de mecánicos de primer año, g = 9.8 m/s Pero nuestro viejo amigo ha cambiado. En la mecánica newtoniana, aceleraciones como g son invariantes de marco (considerando solo los marcos inerciales, que son los únicos legítimos en esa teoría). En general la relatividad son dependientes del marco, y como vimos antes, la aceleración de la gravedad se puede hacer para igualar a lo que queramos, en base a nuestra elección de un marco de referencia.
Para calcular la derivada covariante de un tensor de rango superior, solo agregamos más términos de corrección, por ejemplo,
\[\nabla_{a} U_{bc} = \partial_{a} U_{bc} - \Gamma^{d}_{ba} U_{dc} - \Gamma^{d}_{ca} U_{bd}\]
o
\[\nabla_{a} U_{b}^{c} = \partial_{a} U_{b}^{c} - \Gamma^{d}_{ba} U_{d}^{c} + \Gamma^{c}_{ad} U_{b}^{d} \ldotp\]
Con la derivada parcial\(\partial_{\mu}\), no tiene sentido utilizar la métrica para elevar el índice y la forma\(\partial^{\mu}\). Tiene sentido hacerlo con derivados covariantes, por lo que\(\nabla^{a} = g^{ab} \nabla_{b}\) es una identidad correcta.
Coma, punto y coma, y notación de pistas de pájaros
Algunos autores utilizan superíndices con comas y punto y coma para indicar derivadas parciales y covariantes. Las siguientes ecuaciones dan notaciones equivalentes para las mismas derivadas:
\[\partial_{\mu} X_{\nu} = X_{\nu,\; \mu}\]
\[\nabla_{a} X_{b} = X_{b;a}\]
\[\nabla^{a} X_{b} = X_{b}^{;a}\]
La Figura 5.6.5 muestra dos ejemplos de la notación correspondiente de las pistas de aves. Debido a que las huellas de aves están destinadas a ser manifiestamente independientes de coordenadas, no tienen una forma de expresar derivados no covariantes. Ya no queremos usar el círculo como notación para un gradiente no covariante como lo hicimos cuando lo introdujimos por primera vez en la sección 2.1.
Referencias
9 “Sobre el campo gravitacional de una masa puntual según la teoría de Einstein”, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften 1 (1916) 189, traducido en arxiv.org/abs/physics/9905030v1.