4.2: Cuatro vectores (Parte 1)
- Page ID
- 127178
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)La velocidad y la aceleración de cuatro vectores
Nuestro vector básico de Lorentz es el desplazamiento espacio-tiempo\(dx^i\). Cualquier otra cantidad que tenga el mismo comportamiento que dx i bajo rotaciones y aumentos también es un vector Lorentz válido. Considera que una partícula se mueve a través del espacio, como se describe en un marco de Lorentz. Dado que la partícula puede estar sujeta a fuerzas no gravitacionales, no se puede hacer que el marco de Lorentz coincida (excepto quizás momentáneamente) con el marco de reposo de la partícula. Si no\(dx^i\) es similar a la luz, entonces el intervalo de tiempo adecuado infinitesimal correspondiente dτ es distinto de cero. Al igual que con los tres vectores newtonianos, dividir un cuatro vector por un escalar de Lorentz produce otra cantidad que se transforma como un cuatro vector, por lo que dividiendo el desplazamiento infinitesimal por un intervalo de tiempo propio infinitesimal distinto de cero, tenemos el vector de cuatro velocidades
\[v^{i} = \frac{dx^{i}}{d \tau}\]
cuyos componentes en un sistema de coordenadas de Lorentz son
\[(\gamma, \gamma u^{1}, \gamma u^{2}, \gamma u^{3})\]
donde (u 1, u 2, u 3) es el vector de velocidad ordinario de tres componentes como se define en la mecánica clásica. La magnitud cuadrada de las cuatro velocidades\(v^iv_i\) es siempre exactamente 1, a pesar de que la partícula no se mueve a la velocidad de la luz. (Si se estuviera moviendo a la velocidad de la luz, tendríamos\(d\tau = 0\), y\(v\) sería indefinido.)
Cuando escuchamos algo que se conoce como un “vector”, solemos tomar esta es una afirmación de que no solo transforma como vector, sino que además agrega como vector. Pero ya hemos visto en la Sección 2.3 que incluso las velocidades colineales en la relatividad no agregan linealmente; por lo tanto, claramente no pueden agregar linealmente cuando se visten con la vestimenta de cuatro vectores. También hemos visto en la Sección 2.5 que la combinación de aumentos no colineales no es conmutativa, y generalmente es equivalente a un impulso más una rotación espacial; esto tampoco es consistente con la adición lineal de cuatro vectores. A riesgo de golpear a un caballo muerto, la magnitud cuadrada de cuatro velocidades es siempre de 1, y esto no es consistente con poder sumar vectores de cuatro velocidades.
Ejemplo 2: ¿Un vector de velocidad cero?
Supongamos que un objeto tiene una cierta v i de cuatro velocidades en un determinado marco de referencia. ¿Podemos transformarnos en un marco diferente en el que el objeto esté en reposo y su cuatro-velocidad sea cero?
Solución
No. En general, la transformación de Lorentz conserva la magnitud de los vectores, por lo que nunca podrá transformar un vector con una magnitud cero en uno con magnitud distinta de cero. Dado que se trata de un objeto material (no un rayo de luz) podemos transformarnos en un marco en el que el objeto está en reposo, pero un objeto en reposo no tiene una fuga de cuatro velocidades. Tiene una velocidad de cuatro (1, 0, 0, 0).
El ejemplo 2 sugiere una buena manera de pensar sobre los vectores de velocidad, que es que cada vector de velocidad representa un observador potencial. Un observador es un objeto material y, por lo tanto, tiene un vector de velocidad similar al tiempo. Este observador escribe su propio vector de velocidad como (1, 0, 0, 0), es decir, como el vector unitario en la dirección temporal. A menudo, cuando vemos una expresión que involucra un vector de velocidad, podemos interpretarla como la descripción de una medición tomada por un observador específico.
Ejemplo 3: La ortogonalidad como simultaneidad
En un espacio donde el producto interior puede ser negativo, la ortogonalidad no significa lo que nuestra intuición euclidiana piensa que significa. Por ejemplo, un vector parecido a la luz puede ser ortogonal a sí mismo —una situación que nunca ocurre en un espacio euclidiano. Supongamos que tenemos un vector tipo tiempo t y un espacio como uno x. ¿Qué significaría para t y x ser ortogonales, con t · x = 0?
Solución
Dado que t es similar al tiempo, podemos hacer un vector unitario\(\hat{\textbf{t}} = \frac{\textbf{t}}{|\textbf{t}|}\) a partir de él, e interpretarlo\(\hat{\textbf{t}}\) como el vector de velocidad de algún observador hipotético. Entonces sabemos que en el marco de ese observador,\(\hat{\textbf{t}}\) es simplemente un vector unitario a lo largo del eje de tiempo. Ahora queda claro que x debe ser paralelo al eje x, es decir, representa un desplazamiento entre dos eventos que este observador considera simultáneos.
Este es un ejemplo de la idea de que las expresiones que involucran vectores de velocidad pueden interpretarse como mediciones tomadas por cierto observador. La expresión t · x = 0 puede interpretarse en el sentido de que según un observador cuya línea mundial es tangente a t, x representa una relación de simultaneidad.
La cuatro aceleración se encuentra tomando una segunda derivada con respecto al tiempo adecuado. Su magnitud cuadrada es solo aproximadamente igual a menos la magnitud cuadrada del trivector de aceleración newtoniana, en el límite de velocidades pequeñas.
Ejemplo 4: Aceleración constante
Supongamos que una nave espacial se mueve para que la aceleración sea juzgada como el valor constante a por un observador a bordo. Encuentra el movimiento x (t) medido por un observador en un marco inercial.
Solución
Dejar\(\tau\) reposar el tiempo adecuado del barco, y dejar que los puntos indiquen derivados con respecto a\(\tau\). La velocidad de la nave tiene magnitud 1, así que $$\ punto {t} ^ {2} -\ punto {x} ^ {2} = 1\ ldotp\]
Un observador que esté instantáneamente en reposo con respecto a los jueces de la nave es tener una cuatro aceleración (0, a, 0, 0) (porque se aplica el límite de baja velocidad). El observador en el marco (t, x) concuerda en la magnitud de este vector, por lo que
\[\ddot{t}^{2} - \ddot{x}^{2} = - a^{2} \ldotp\]
La solución de estas ecuaciones diferenciales es\(t = \frac{1}{a} \sinh a \tau,\; x = \frac{1}{a} \cosh a \tau\), y la eliminación\(\tau\) da
\[x = \frac{1}{a} \sqrt{1 + a^{2} t^{2}} \ldotp\]
Cuando t se acerca al infinito,\(\frac{dx}{dt}\) se acerca a la velocidad de la luz.
El Momentum Cuatro Vectores
Definición para una partícula de material
Si esperamos encontrar algo que desempeñe el papel de impulso en la relatividad, entonces el impulso de tres vectores probablemente necesite generalizarse a algún tipo de cuatro vectores. Si es así, entonces la ley de conservación del impulso será válida independientemente del marco de referencia de uno, que es necesario. 2
Nota
No se nos garantiza que esta sea la forma correcta de proceder, ya que lo contrario no es cierto: algunos tres vectores como los campos eléctrico y magnético están incrustados en tensores de rango 2 de formas más complicadas que esta. Ver sección 4.2.
Si queremos satisfacer el principio de correspondencia, entonces la definición relativista de impulso probablemente debería parecerse lo más posible a la no relativista. Anteriormente, definimos la velocidad de cuatro vectores en el caso de una partícula cuyo dx i no es parecido a la luz. Supongamos por el momento que tiene sentido pensar en la masa como un escalar. Al igual que con los tres vectores newtonianos, multiplicar un escalar de Lorentz por un vector de cuatro vectores produce otra cantidad que se transforma como un vector de cuatro. Por lo tanto, conjeturamos que el cuatro-momento de una partícula material puede definirse como p i = mv i, que en las coordenadas de Lorentz es\((m \gamma, m \gamma v^{1}, m \gamma v^{2}, m \gamma v^{3})\). No hay garantía a priori de que esto sea correcto, pero es lo más razonable de adivinar. Es necesario contrastarlo con el experimento, y también para la coherencia con las otras partes de nuestra teoría.
Los componentes espaciales parecen el vector de impulso clásico multiplicado por un factor de\(\gamma\), siendo la interpretación que para un observador en este marco, la inercia de la partícula en movimiento se incrementa en relación con su valor en el marco de reposo de la partícula. En efecto, tal efecto se observa experimentalmente. Es por ello que los aceleradores de partículas son tan grandes y caros. A medida que la partícula se acerca a la velocidad de la luz,\(\gamma\) diverge, por lo que se necesitan mayores y mayores fuerzas para producir la misma aceleración. En los procesos de dispersión relativista con partículas materiales, encontramos empíricamente que se conserva el cuatroimpulso que hemos definido, lo que confirma que nuestras conjeturas anteriores son válidas, y en particular que la cantidad que estamos llamando m puede ser tratada como un escalar de Lorentz, y esto es lo que hacen hoy todos los físicos . Se advierte al lector, sin embargo, que hasta alrededor de 1950, era común usar la palabra “masa” para la combinación m\(\gamma\) (que es lo que ocurre en la forma coordenada Lorentz del vector de impulso), mientras se refiere a m como la “masa de reposo”. Esta terminología arcaica solo se usa hoy en día en algunos libros de nivel popular y libros de texto escolares de bajo nivel.
Equivalencia de Masa y Energía
El momentum four vector ha encerrado dentro de él la razón del famoso E = mc 2 de Einstein, que en nuestras unidades relativistas se convierte simplemente en E = m. Para ver por qué, considere la inercia medida experimentalmente de un objeto físico hecho de átomos. Todas las partículas subatómicas se están moviendo, y muchas de las velocidades, por ejemplo, las velocidades de los electrones, son bastante relativistas. Esto tiene el efecto de aumentar la masa inercial determinada experimentalmente de todo el objeto, por un factor de\(\gamma\) promediado sobre todas las partículas, a pesar de que las masas de las partículas individuales son escalares de Lorentz invariantes. (Este mismo incremento también debe observarse para la masa gravitacional, basado en el principio de equivalencia verificado por los experimentos de Eötvös.)
Ahora bien, si el objeto se calienta, las velocidades aumentarán en promedio, resultando en un aumento adicional de su masa. Así, una cierta cantidad de energía térmica es equivalente a una cierta cantidad de masa. Pero si la energía térmica contribuye a la masa, entonces lo mismo debe ser cierto para otras formas de energía. Por ejemplo, supongamos que el calentamiento conduce a una reacción química, que convierte algo de calor en energía de unión electromagnética. Si un julio de energía vinculante no se convirtiera en la misma cantidad de masa que un julio de calor, entonces esto permitiría que el objeto cambiara espontáneamente su propia masa, y luego por conservación del impulso tendría que cambiar espontáneamente su propia velocidad, lo que violaría claramente el principio de relatividad. Concluimos que la masa y la energía son equivalentes, tanto inercial como gravitacionalmente. En la relatividad, ninguno se conserva por separado; la cantidad conservada es su suma, referida como la masa-energía, E. Una derivación alternativa, de Einstein, se da en el ejemplo 16.
La energía es el componente Timelike del Cuatro Momentum
La transformación de Lorentz de un vector cero es siempre cero. Esto significa que el cuatro vector de impulso de un objeto material no puede ser igual a cero en el marco de reposo del objeto, ya que entonces también sería cero en todos los demás fotogramas. Entonces, para un objeto de masa m, deja que su momentum cuatro-vector en su trama de descanso sea (f (m), 0, 0), donde f es alguna función que necesitamos determinar, y f puede depender únicamente de m ya que no hay otra propiedad del objeto que pueda ser dinámicamente relevante aquí. Dado que las leyes de conservación son aditivas, f tiene que ser f (m) = km para alguna constante universal k. En donde c = 1, k no tiene unidades. Ya que queremos recuperar el límite newtoniano apropiado para cuerpos masivos, y como vt = 1 en ese límite, necesitamos k = 1. Transformando el cuatro vector momentum del marco de reposo de la partícula en algún otro marco, encontramos que el componente timelike ya no es m. Interpretamos esto como la masa-energía relativista, E.
Dado que el vector de impulso cuatro se obtuvo a partir de la magnitud-1 velocidad de cuatro vectores a través de la multiplicación por m, su magnitud cuadrada p i p i es igual al cuadrado de la masa de la partícula. Escribiendo p para la magnitud del momentum tres-vector, y E para la masa-energía, encontramos la relación útil m 2 = E 2 −p 2. Tomamos esta como la definición relativista la masa de cualquier partícula, incluida aquella cuyo dx i es parecido a la luz.
Partículas que viajan a c
La definición de cuatro momentos como p i = mv i solo funciona para partículas que se mueven a menos de c. Para las que se mueven a c, la velocidad de cuatro es indefinida. Como veremos en el ejemplo 6, esta clase de partículas es exactamente las que son sin masa. Como se muestra en la sección 1.5, el triple impulso de una onda de luz viene dado por p = E. El hecho de que este impulso sea distinto de cero implica que para la luz p i = mv i representa una forma indeterminada. El hecho de que este impulso sea igual a E es consistente con nuestra definición de masa como m 2 = E 2 − p 2.
La masa no es aditiva
Dado que el momentum cuatro vector p a es aditivo, y nuestra definición de masa como p a p a depende del vector de manera no lineal, se deduce que la masa no es aditiva (incluso para partículas que no están interactuando sino que simplemente se consideran colectivamente).
Ejemplo 5: Masa de dos ondas de luz
Deje que el impulso de una determinada onda de luz sea (p t, p x) = (E, E), y deje que otra onda de este tipo tenga impulso (E, −E). El impulso total es (2E, 0). Así, este par de partículas sin masa tiene una masa colectiva de 2E.
Ejemplo 6: Las partículas sin masa viajan a c
Esto lo demostramos demostrando que si suponemos lo contrario, entonces hay dos consecuencias diferentes, cualquiera de las cuales sería físicamente inaceptable.
Cuando una partícula tiene una masa que no se desvanece, tenemos
\[\lim_{\frac{E}{m} \rightarrow \infty} |v| = \lim_{\frac{E}{m} \rightarrow \infty} \frac{|p|}{E} = 1 \ldotp\]
Así, si tuviéramos una partícula sin masa con |v| ≠ 1, su comportamiento sería diferente al comportamiento limitante de las partículas masivas. Pero esto es físicamente inaceptable porque entonces tendríamos un método mágico para detectar arbitrariamente masas pequeñas como 10 −10000000000 kg. En realidad no sabemos que el fotón, por ejemplo, es exactamente sin masa; ver ejemplo 13.
Además, supongamos que una partícula sin masa tenía |v| < 1 en el marco de algún observador. Entonces algún otro observador podría estar en reposo relativo a la partícula. En tal marco, el triple impulso p de la partícula es cero por simetría, ya que no hay dirección preferida para ello. Entonces E 2 = p 2 + m 2 también es cero, por lo que el cuatro vector energía-momento completo de la partícula es cero. Pero un cuatro vectores que se desvanece en un fotograma también se desvanece en todos los demás fotogramas. Eso significa que estamos hablando de una partícula que no puede sufrir dispersión, emisión o absorción, y por lo tanto es indetectable por cualquier experimento. Esto es físicamente inaceptable porque no consideramos que los fenómenos (por ejemplo, las hadas invisibles) sean de interés físico si son indetectables incluso en principio.
Ejemplo 7: desplazamientos al rojo gravitacionales
Dado que la energía E de un fotón es equivalente a cierta masa gravitacional m, los fotones que suben o bajan en un campo gravitacional deben perder o ganar energía, y esto debe observarse como un desplazamiento al rojo o cambio azul en la frecuencia. Esperamos que el cambio en la energía potencial gravitacional sea E\(\Delta \phi\), dando un cambio opuesto correspondiente en la energía del fotón, así que eso\(\frac{\Delta E}{E} = \Delta \varphi\). En unidades métricas, esto se vuelve\(\frac{\Delta E}{E} = \frac{\Delta \varphi}{c^{2}}\), y en el campo cercano a la superficie de la Tierra tenemos\(\frac{\Delta E}{E} = \frac{gh}{c^{2}}\). Este es el mismo resultado que se encontró en la sección 1.5 con base únicamente en el principio de equivalencia, y verificado experimentalmente por Pound y Rebka como se describe en la sección 1.5.
Ejemplo 8: Restricciones en la polarización
Observamos que las ondas electromagnéticas son siempre polarizadas transversalmente, nunca longitudinalmente. Tal restricción sólo puede aplicarse a una onda que se propaga en c. Si se aplicara a una onda que se propagó a menos de c, podríamos movernos a un marco de referencia en el que la onda estuviera en reposo. En este marco, todas las direcciones en el espacio serían equivalentes, y no habría forma de decidir qué direcciones de polarización deberían permitirse. Para una onda que se propaga en c, no hay marco en el que la onda esté en reposo (ver sección 3.4).
Ejemplo 9: Teorema relativista de trabajo-energía
En el artículo original de Einstein de 1905 sobre la relatividad, asumió sin aportar justificación alguna que la relación trabajo-energía newtoniana W = Fd era válida relativisticamente. Una forma de justificar esto es que podemos construir una máquina simple con una ventaja mecánica A y una reducción del movimiento por\(\frac{1}{A}\), siendo estas relaciones relativisticamente exactas. 3 Entonces se puede calcular, como hizo Einstein,
\[W = \int \frac{dp}{dt} dx = \int \frac{dp}{dv} \frac{dx}{dt} dv = m (\gamma - 1),\]
que es consistente con nuestro resultado para E en función de\(\gamma\) si lo equiparamos a E (\(\gamma\)) − E (1).
3 Para un ejemplo explícito, véase bit.ly/1AuXiA8.
Ejemplo 10: El mar de Dirac
Gran parte de la física puede derivarse del principio de T.H. White de que “lo que no está prohibido en obligatorio” —originalmente destinado a hormigas pero aplicado a partículas por Gell-Mann. En la mecánica cuántica se supone que ocurre cualquier proceso que no esté prohibido por una ley de conservación. La relación relativista\(E = \pm \sqrt{p^{2} + m^{2}}\) tiene dos raíces, una positiva y otra negativa. Los estados de energía positiva y energía negativa están separados por una tierra de nadie de 2m de ancho, por lo que ningún proceso clásico continuo puede conducir de un lado a otro. Pero cuánto-mecánicamente, si existe un electrón con energía\(E = + \sqrt{p^{2} + m^{2}}\), debería ser capaz de dar un salto cuántico a un estado con\(E = − \sqrt{p^{2} + m^{2}}\), emitiendo la diferencia de energía de 2E en forma de fotones. ¿Por qué no sucede esto? Una explicación es que los estados con E < 0 ya están ocupados. Este es el “mar Dirac”, que ahora interpretamos como lleno de electrones. Una vacante en el mar se manifiesta como un antielectrón.
Ejemplo 11: Neutrinos masivos
Durante mucho tiempo se pensó que los neutrinos eran sin masa, pero ahora se cree que tienen masas en el rango eV. Si hubieran sido sin masa, siempre habrían tenido que propagarse a la velocidad de la luz. Aunque ahora se piensa que tienen masa, esa masa es seis órdenes de magnitud menor que la escala de energía MeV de las reacciones nucleares en las que se producen, por lo que todos los neutrinos observados en experimentos se mueven a velocidades muy cercanas a la velocidad de la luz.
Ejemplo 12: Sin desintegración radiactiva de partículas sin masa
Un fotón no puede descomponerse en un electrón y un positrón,\(\gamma\) → e + + e −, en ausencia de una partícula cargada con la que interactuar. Para ver esto, considere el proceso en el marco de referencia en el que el par electrón-positrón tiene un impulso total cero. En este marco, el fotón debió haber tenido cero (tres) impulso, pero un fotón con impulso cero también debe tener cero energía. Esto significa que se ha violado la conservación del cuatro-momento relativista: el componente timelike del cuatro-momentum es la masa-energía, y ha aumentado de 0 en el estado inicial a al menos 2mc 2 en el estado final.
Para demostrar la consistencia de la teoría, podemos llegar a la misma conclusión por un método diferente. Siempre que una partícula tenga una masa pequeña (pequeña en comparación con su energía, digamos), debe viajar cerca de c. Por lo tanto, debe tener una dilatación de tiempo muy grande, y tardará mucho tiempo en sufrir desintegración radiactiva. En el límite a medida que la masa se acerca a cero, el tiempo requerido para la decadencia se acerca al infinito. Otra forma de decir esto es que la tasa de desintegración radiactiva debe fijarse en términos de tiempo adecuado, pero no existe el tiempo adecuado para una partícula sin masa. Por lo tanto, no es sólo este proceso específico el que está prohibido, sino cualquier proceso de desintegración radiactiva que involucre una partícula sin masa.
Hay varias lagunas en este argumento. La pregunta es investigada más a fondo por Fiore y Modanese. 4
Ejemplo 13: fotones masivos
Continuando en la misma línea que en el ejemplo 11, podemos considerar la posibilidad de que el fotón tenga alguna masa no desaparecida. Un experimento de 2003 de Luo et al. 5 ha colocado un límite de aproximadamente 10 −54 kg sobre esta masa. Esto es increíblemente pequeño, pero supongamos que el trabajo experimental futuro utilizando técnicas mejoradas muestra que la masa es menor que esta, pero en realidad distinta de cero. Una reacción ingenua ante este escenario es que sacudiría la relatividad hasta su núcleo, ya que la relatividad se basa en el supuesto de que la velocidad de la luz es una constante, mientras que para una partícula masiva no necesita ser constante. Pero esto es una mala interpretación del papel de c en la relatividad. Como debe quedar claro a partir del enfoque adoptado en la sección 2.2, c es principalmente una propiedad geométrica del espacio-tiempo, no una propiedad de la luz.
En realidad, tal descubrimiento sería más un problema para los físicos de partículas que para los relativistas, como podemos ver en el siguiente boceto de un argumento. Imagina dos partículas cargadas, en reposo, interactuando a través de una atracción eléctrica. La mecánica cuántica describe esto como un intercambio de fotones. Ya que las partículas están en reposo, no hay fuente de energía, entonces, ¿de dónde sacamos la energía para hacer los fotones? El principio de incertidumbre de Heisenberg\(\Delta E \Delta t \gtrsim h\),, nos permite robar esta energía, siempre que la devolvamos dentro de un tiempo\(\Delta\) t. Este límite de tiempo impone un límite a la distancia que pueden recorrer los fotones, pero al usar fotones de energía suficientemente baja, podemos hacer que este límite de distancia sea lo más grande que queramos, y por lo tanto, no hay límite en el alcance de la fuerza. Pero supongamos que el fotón tiene una masa. Entonces se requiere una masa-energía mínima mc 2 para crear un fotón, el tiempo máximo es h/mc 2, y el rango máximo es h/mc. Refinando un poco estos argumentos crudos, uno encuentra que el intercambio de partículas de zeromasa da una fuerza que va como\(\frac{1}{r^{2}}\), mientras que resulta una masa distinta de cero en\(\frac{e^{− \mu r}}{r^{2}}\), dónde\(\mu^{−1} = \frac{\hbar}{mc}\). Para el fotón, el mejor límite de masa de corriente corresponde a\(\mu^{−1} \gtrsim 10^{11}\) m, por lo que la desviación de\(\frac{1}{r^{2}}\) sería difícil de medir en experimentos terrestres.
Ahora la ley de Gauss es una característica específica de\(\frac{1}{r^{2}}\) los campos. Se violaría ligeramente si los fotones tuvieran masa. Tendríamos que modificar las ecuaciones de Maxwell, y resulta 6 que el cambio necesario a la ley de Gauss sería de la forma\(\nabla \cdot \textbf{E} = (\ldots) \rho − (\ldots) \mu^{2} \Phi\), dónde\(\Phi\) está el potencial eléctrico, y (..) indica factores que dependen de la elección de las unidades. Esto nos dice que\(\Phi\), que en el electromagnetismo clásico sólo se puede medir en términos de diferencias entre diferentes puntos en el espacio, ahora se puede medir en términos absolutos. Se ha roto la simetría del calibre. Pero la simetría de calibre es indispensable para crear teorías de campo relativistas de buen comportamiento, y esta es la razón por la que, en general, los físicos de partículas tienen dificultades con las fuerzas que surgen del intercambio de partículas masivas. La hipotética partícula de Higgs, que se puede observar en el Gran Colisionador de Hadrones en un futuro próximo, es esencialmente un mecanismo para escabullirse de esta dificultad en el caso de las partículas masivas W y Z que son responsables de la débil fuerza nuclear; sin embargo, el mecanismo no puede extenderse para permitir un fotón masivo.
5 Luo et al., “Nuevo límite experimental en la masa de reposo de fotones con una balanza de torsión giratoria”, Phys. Rev. Let. 90 (2003) 081801. La interpretación de tales experimentos es difícil, y este trabajo atrajo una serie de comentarios. Un encuadernado más débil pero más universalmente aceptado es de 8 × 10 −52 kg, Davis, Goldhaber, y Nieto, Phys. Rev. Let. 35 (1975) 1402.
6 Goldhaber y Nieto,” Límites terrestres y extraterrestres a la masa fotónica”, Rev. Mod. Phys. 43 (1971) 277
Ejemplo 14: Polvo y radiación en modelos cosmológicos
En los modelos cosmológicos, se necesita una ecuación de estado que relacione la presión P con la densidad masa-energía\(\rho\). La presión es un escalar de Lorentz. La densidad masa-energía no lo es (ya que la masenergia es solo el componente temporal de un vector en particular), sino en un sistema de coordenadas sin ningún flujo neto de masa, podemos aproximarlo como uno solo.
El universo primitivo estuvo dominado por la radiación. Un fotón en una caja aporta una presión en cada pared que es proporcional a |p \(\mu\)|, donde\(\mu\) es un índice espacial. En equilibrio térmico, cada uno de estos tres grados de libertad lleva una cantidad igual de energía, y dado que el impulso y la energía son iguales para una partícula sin masa, el impulso promedio a lo largo de cada eje es igual a\(\frac{1}{3}\) E. La ecuación de estado resultante es P =\(\frac{1}{3} \rho\). A medida que el universo se expandió, las longitudes de onda de los fotones se expandieron en proporción al estiramiento del espacio que ocupaban, dando como resultado\(\lambda \propto a^{−1}\), donde a es una escala de distancia que describe la curvatura intrínseca del universo en un tiempo fijo. Dado que la densidad numérica de fotones se diluye en proporción a −3, y la masa por fotón varía como −1, ambos\(\rho\) y P varían como −4.
Los cosmólogos se refieren a materiales no interactuantes y no relativistas como “polvo”, lo que podría significar muchas cosas, incluyendo gas hidrógeno, polvo real, estrellas, galaxias y algunas formas de materia oscura. Para el polvo, el impulso es insignificante en comparación con la masa-energía, por lo que la ecuación de estado es P = 0, independientemente de\(\rho\). La densidad de masenergia está dominada simplemente por la masa del polvo, por lo que no hay escala de desplazamiento al rojo del tipo a −1. La densidad masa-energía se escala como −3. Dado que esta es una dependencia menos pronunciada de a que la a-4, hubo un punto, unos mil años después del Big Bang, cuando la materia comenzó a dominar sobre la radiación. En este punto, la velocidad de expansión del universo hizo una transición a un comportamiento cualitativamente diferente resultante del cambio en la ecuación de estado.
En la época actual, la ecuación de estado del universo no está dominada ni por el polvo ni la radiación sino por la constante cosmológica (ver sección 8.1). La Figura 4.2.1 muestra la evolución del tamaño del universo para los tres regímenes diferentes. Algunos de los casos más simples se derivan a partir de la sección 8.2.