10.1: Apéndice A (Parte 1)
- Page ID
- 127161
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Las siguientes traducciones al inglés de extractos de tres artículos de Einstein se publicaron originalmente en “The Principle of Relativity”, Methuen and Co., 1923. La traducción fue de W. Perrett y G.B. Jeffery, y las notas fueron proporcionadas por A. Sommerfeld. John Walker (www. fourmilab.ch) ha proporcionado versiones legibles por máquina de las dos primeras y las ha colocado en el dominio público. Se ha modernizado alguna notación, se ha americanizado la ortografía británica, etc. Las notas al pie de página de Sommerfeld, Walker y B. Crowell están marcadas con iniciales. B. Las modificaciones de Crowell a la presente versión también son de dominio público.
- El artículo “Sobre la electrodinámica de los cuerpos móviles” contiene dos partes, la primera dedicada a la cinemática y la segunda a la electrodinámica. Aquí sólo he dado la primera parte, ya que la segunda es larga, y dolorosa de leer debido a la engorrosa notación anticuada. La segunda sección se puede obtener del sitio web de John Walker.
- El artículo “¿La inercia de un cuerpo depende de su contenido energético? ,” que comienza más tarde, es muy breve y legible. En la sección 4.2 se da una versión más corta y menos general de su argumento principal.
- “El fundamento de la teoría general de la relatividad” es un largo artículo de revisión en el que Einstein expuso sistemáticamente la teoría general, que había publicado previamente en una serie de trabajos más cortos. Las tres primeras secciones del artículo dan el razonamiento físico general detrás de la independencia de coordenadas, denominada covarianza general. Comienza más tarde.
El lector que esté interesado en ver estos trabajos en su totalidad puede obtenerlos a bajo costo en una reimpresión de Dover de la antología original de Methuen.
“Sobre la electrodinámica de los cuerpos móviles”
A. Einstein, Aninalen der Physik 17 (1905) 891. Se sabe que la electrodinámica de Maxwell —como se entiende habitualmente en la actualidad— cuando se aplica a cuerpos en movimiento, conduce a asimetrías que no parecen ser inherentes a los fenómenos. 13 Tomemos, por ejemplo, la acción electrodinámica recíproca de un imán y un conductor. El fenómeno observable aquí depende únicamente del movimiento relativo del conductor y del imán, mientras que la visión habitual dibuja una clara distinción entre los dos casos en los que uno u otro de estos cuerpos está en movimiento. Porque si el imán está en movimiento y el conductor en reposo, surge en las proximidades del imán un campo eléctrico con cierta energía definida, produciendo una corriente en los lugares donde se sitúan partes del conductor. Pero si el imán es estacionario y el conductor en movimiento, no surge campo eléctrico en las inmediaciones del imán. En el conductor, sin embargo, encontramos una fuerza electromotriz, a la que en sí misma no hay energía correspondiente, sino que da lugar —asumiendo igualdad de movimiento relativo en los dos casos discutidos— a corrientes eléctricas de la misma trayectoria e intensidad que las producidas por las fuerzas eléctricas en el primer caso.
Nota
Einstein comienza dando un ejemplo que involucra la inducción electromagnética, considerada en dos marcos de referencia diferentes. En retrospectiva moderna, lo describiríamos diciendo que un impulso de Lorentz mezcla los campos eléctrico y magnético, como se describe en la sección 4.2. —BC
Ejemplos de este tipo, junto con los intentos infructuosos de descubrir cualquier movimiento de la tierra en relación con el “medio ligero”, sugieren que los fenómenos de la electrodinámica así como de la mecánica no poseen propiedades correspondientes a la idea de reposo absoluto. 14 Sugieren más bien que, como ya se ha demostrado al primer orden de pequeñas cantidades, 15 las mismas leyes de electrodinámica y óptica serán válidas para todos los marcos de referencia para los que se mantienen buenas las ecuaciones de la mecánica. 16 Elevaremos esta conjetura (cuyo significado en lo sucesivo se llamará el “Principio de Relatividad”) a la condición de postulado, y también introduciremos otro postulado, que solo aparentemente es irreconciliable con el primero, es decir, que la luz siempre se propaga en el espacio vacío con un velocidad definida c que es independiente del estado de movimiento del cuerpo emisor. 17 Estos dos postulados son suficientes para lograr una teoría simple y consistente de la electrodinámica de cuerpos móviles basada en la teoría de Maxwell para cuerpos estacionarios. La introducción de un “éter luminífero” resultará superflua en la medida en que la visión que se va a desarrollar aquí no requerirá un “espacio absolutamente estacionario” dotado de propiedades especiales, ni asignar un vector de velocidad a un punto del espacio vacío en el que tienen lugar los procesos electromagnéticos.
Notas
14 Einstein sabía del experimento de Michelson-Morley en 1905 (J. van Dongen, arxiv.org/abs/0908.1545), pero no se cita aquí específicamente. Los documentos de 1881 y 1887 de Michelson-Morley están disponibles en línea en en. wikisource.org. —BC
15 Es decir, a primer orden en\(\frac{v}{c}\). Los experimentadores ya en Fresnel (1788-1827) habían demostrado que no había efectos de orden\(\frac{v}{c}\) debido al movimiento de la tierra a través del éter, pero pudieron interpretar esto sin echar a perder el éter, ideando modelos en los que sustancias sólidas arrastraban el éter junto con ellos. El resultado negativo del experimento de Michelson-Morley mostró una falta de efecto de orden (\(\frac{v}{c}\)) 2. —BC
16 Las memorias anteriores de Lorentz no eran conocidas en este momento por el autor. —COMO
17 El segundo postulado es redundante si tomamos las “leyes de la electrodinámica y la óptica” para hacer referencia a las ecuaciones de Maxwell. Las ecuaciones de Maxwell requieren que la luz se mueva en c en cualquier marco de referencia en el que sean válidas, y el primer postulado ya ha afirmado que son válidas en todos los marcos de referencia inerciales. Einstein probablemente afirma la constancia de c como un postulado separado porque su audiencia está acostumbrada a pensar en las ecuaciones de Maxwell como una representación matemática parcial de ciertos aspectos de una teoría del éter subyacente. A lo largo de la parte I del artículo, Einstein es capaz de derivar todos sus resultados sin asumir nada de las ecuaciones de Maxwell que no sea la constancia de c. El uso del término “postulado” sugiere la construcción de un sistema axiomático formal como la geometría euclidiana, pero la verdadera intención de Einstein aquí es sentar un conjunto de criterios filosóficos para evaluar las teorías de los candidatos; trae libremente otros supuestos, menos centrales, más adelante en el artículo, como cuando invoca posteriormente la homogeneidad del espacio-tiempo. —BC
18 Esencialmente lo que Einstein quiere decir aquí es que no se pueden tener las ecuaciones de Maxwell sin establecer coordenadas de posición y tiempo, y no se pueden tener coordenadas de posición y tiempo sin relojes y reglas. Por lo tanto, incluso la descripción de un fenómeno puramente electromagnético como una onda de luz depende de la existencia de objetos materiales. No explica exactamente lo que quiere decir con “rígido”, y ahora sabemos que la relatividad en realidad no permite la existencia de sólidos perfectamente rígidos (ver sección 3.5). Esencialmente quiere poder hablar de gobernantes que se comportan como sólidos más que líquidos, en el sentido de que si se aceleran lo suficientemente suavemente desde el reposo y posteriormente se vuelven a descansar suavemente, sus propiedades permanecerán inalteradas. Cuando deriva la contracción de longitud más tarde, quiere que quede claro que no se trata de un fenómeno dinámico provocado por un efecto como el arrastre del éter. —BC
La teoría a desarrollar se basa —como toda electrodinámica— en la cinemática del cuerpo rígido, ya que las afirmaciones de tal teoría tienen que ver con las relaciones entre cuerpos rígidos (sistemas de coordenadas), relojes y procesos electromagnéticos. 18 La consideración insuficiente de esta circunstancia radica en la raíz de las dificultades que encuentra actualmente la electrodinámica de los cuerpos en movimiento.
Parte Cinemática
§1. Definición de simultaneidad
Tomemos un sistema de coordenadas en el que se mantienen buenas las ecuaciones de la mecánica newtoniana. 19 Para hacer nuestra presentación más precisa y distinguir verbalmente este sistema de coordenadas de otros que se introducirán en lo sucesivo, lo llamamos el “sistema estacionario”.
Nota
es decir, a la primera aproximación. —COMO
Si un punto material está en reposo con relación a este sistema de coordenadas, su posición puede definirse con relación al mismo mediante el empleo de estándares rígidos de medición y los métodos de geometría euclidiana, y puede expresarse en coordenadas cartesianas.
Si queremos describir el movimiento de un punto material, damos los valores de sus coordenadas como funciones del tiempo. Ahora debemos tener en cuenta cuidadosamente que una descripción matemática de este tipo no tiene ningún significado físico a menos que tengamos bastante claro lo que entendemos por “tiempo”. Tenemos que tomar en cuenta que todos nuestros juicios en los que el tiempo juega un papel son siempre juicios de eventos simultáneos. Si, por ejemplo, digo: “Ese tren llega aquí a las 7 en punto”, me refiero a algo como esto: “El señalar de la manecilla de mi reloj a las 7 y la llegada del tren son eventos simultáneos”. 20
Nota
No discutiremos aquí la inexactitud que acecha en el concepto de simultaneidad de dos eventos aproximadamente en el mismo lugar, que sólo pueden ser removidos por una abstracción. —COMO
Podría parecer posible superar todas las dificultades para atender la definición de “tiempo” sustituyendo “la posición de la manecilla de mi reloj” por “tiempo”. Y de hecho tal definición es satisfactoria cuando nos preocupa definir un tiempo exclusivamente para el lugar donde se encuentra el reloj; pero ya no es satisfactoria cuando tenemos que conectarnos en series temporales de eventos que ocurren en diferentes lugares, o —lo que viene a lo mismo— evaluar los tiempos de eventos que ocurren en lugares alejados del reloj.
Podríamos, por supuesto, contentarnos con valores de tiempo determinados por un observador estacionado junto con el reloj en el origen de las coordenadas, y coordinando las posiciones correspondientes de las manos con señales de luz, emitidas por cada evento a cronometrar, y llegando a él a través del espacio vacío. Pero esta coordinación tiene la desventaja de que no es independiente del punto de vista del observador con el reloj o el reloj, como sabemos por experiencia. Llegamos a una determinación mucho más práctica siguiendo la siguiente línea de pensamiento.
Si en el punto A del espacio hay un reloj, un observador en A puede determinar los valores de tiempo de los eventos en la proximidad inmediata de A encontrando las posiciones de las manecillas que son simultáneas con estos eventos. Si hay en el punto B del espacio otro reloj en todos los aspectos parecido al de A, es posible que un observador en B determine los valores de tiempo de eventos en la vecindad inmediata de B. Pero no es posible sin mayor suposición comparar, respecto al tiempo, un evento en A con un evento en B. Hasta ahora solo hemos definido un “tiempo A” y un “tiempo B”. No hemos definido un “tiempo” común para A y B, ya que este último no puede definirse en absoluto a menos que establezcamos por definición que el “tiempo” requerido por la luz para viajar de A a B es igual al “tiempo” que requiere para viajar de B a A. Deja que un rayo de luz comience en el “tiempo A” t A de A hacia B, dejar que en el “tiempo B” t B se refleje en B en dirección a A, y vuelva a llegar a A en el “tiempo A” t' A.
De acuerdo con la definición los dos relojes sincronizan 21 si
\[t_{B} - t_{A} = t'_{A} - t_{B} \ldotp\]
Nota
El procedimiento aquí descrito se conoce como sincronización de Einstein. —BC
Suponemos que esta definición de sincronismo está libre de contradicciones, y es posible para cualquier número de puntos; y que las siguientes relaciones son universalmente válidas: —
- Si el reloj en B se sincroniza con el reloj en A, el reloj en A se sincroniza con el reloj en B.
- Si el reloj en A se sincroniza con el reloj en B y también con el reloj en C, los relojes en B y C también se sincronizan entre sí. 22
Nota
Esta suposición falla en un marco giratorio (ver sección 3.5), pero Einstein se ha limitado aquí a un marco de referencia aproximadamente inercial. —BC
Así, con la ayuda de ciertos experimentos físicos imaginarios hemos establecido lo que debe entenderse por relojes estacionarios sincrónicos ubicados en diferentes lugares, y evidentemente hemos obtenido una definición de “simultáneo”, o “sincrónico”, y de “tiempo”. El “tiempo” de un evento es aquel que se da simultáneamente con el evento por un reloj estacionario ubicado en el lugar del evento, siendo este reloj sincrónico, y de hecho sincrónico para todas las determinaciones de tiempo, con un reloj estacionario especificado.
De acuerdo con la experiencia asumimos además la cantidad
\[\frac{2AB}{t'_{A} - t_{A}} = c,\]
para ser una constante universal: la velocidad de la luz en el espacio vacío.
Es esencial tener el tiempo definido por medio de relojes estacionarios en el sistema estacionario, y el tiempo ahora definido siendo apropiado al sistema estacionario lo llamamos “el tiempo del sistema estacionario”.
§ 2. Sobre la Relatividad de Longitudes y Tiempos
Las siguientes reflexiones se basan en el principio de relatividad y en el principio de la constancia de la velocidad de la luz. Estos dos principios los definimos de la siguiente manera: —
- No se ven afectadas las leyes por las que los estados de los sistemas físicos experimentan cambios, ya sea que estos cambios de estado se refieran a uno u otro de dos sistemas de coordenadas en movimiento traslorio uniforme.
- Cualquier rayo de luz se mueve en el sistema “estacionario” de coordenadas con la velocidad determinada c, ya sea que el rayo sea emitido por un cuerpo estacionario o en movimiento. De ahí $$velocity =\ frac {light\; path} {time\; interval} $$donde el intervalo de tiempo debe tomarse en el sentido de la definición en § 1.
Que se le dé una varilla rígida estacionaria; y que su longitud sea l medida por una varilla de medición que también es estacionaria. Ahora imaginamos el eje de la varilla que se extiende a lo largo del eje de x del sistema estacionario de coordenadas, y que luego se imparte a la varilla un movimiento uniforme de traslación paralela con velocidad v a lo largo del eje de x en la dirección de aumentar x. Ahora indagamos en cuanto a la longitud de la varilla móvil, e imaginamos que su longitud se determinará mediante las dos operaciones siguientes: —
- El observador se mueve junto con la varilla medidora dada y la varilla a medir, y mide la longitud de la varilla directamente superponiendo la varilla medidora, de la misma manera que si las tres estuvieran en reposo.
- Por medio de relojes estacionarios instalados en el sistema estacionario y sincronizados de acuerdo con § 1, el observador determina en qué puntos del sistema estacionario se encuentran los dos extremos de la varilla a medir en un tiempo definido. La distancia entre estos dos puntos, medida por la varilla de medición ya empleada, que en este caso está en reposo, es también una longitud que puede designarse “la longitud de la varilla”.
De acuerdo con el principio de relatividad la longitud a descubrir por la operación (a) —la llamaremos “la longitud de la varilla en el sistema móvil” —debe ser igual a la longitud l de la varilla estacionaria.
La longitud a descubrir por la operación (b) llamaremos “la longitud de la varilla (móvil) en el sistema estacionario”. Esto lo determinaremos con base en nuestros dos principios, y encontraremos que difiere de l.
La cinemática actual asume tácitamente que las longitudes determinadas por estas dos operaciones son precisamente iguales, o en otras palabras, que un cuerpo rígido móvil en la época t puede, en aspectos geométricos, estar perfectamente representado por el mismo cuerpo en reposo en una posición definida.
Imaginamos además que en los dos extremos A y B de la varilla, se colocan relojes que se sincronizan con los relojes del sistema estacionario, es decir que sus indicaciones corresponden en cualquier instante al “tiempo del sistema estacionario” en los lugares donde se encuentran. Por lo tanto, estos relojes son “sincrónicos en el sistema estacionario”.
Imaginamos además que con cada reloj hay un observador en movimiento, y que estos observadores aplican a ambos relojes el criterio establecido en el § 1 para la sincronización de dos relojes. Deje que un rayo de luz salga de A en el momento 23 t A, deje que se refleje en B en el momento t B, y llegue de nuevo a A en el momento t' A. Tomando en consideración el principio de la constancia de la velocidad de la luz encontramos que
\[t_{B} - t_{A} = \frac{r_{AB}}{c - v}\quad and\quad t_{A} - t_{B} = \frac{r_{AB}}{c + v}\]
donde r AB denota la longitud de la varilla móvil, medida en el sistema estacionario. Los observadores que se mueven con la varilla móvil encontrarían así que los dos relojes no eran sincrónicos, mientras que los observadores en el sistema estacionario declararían que los relojes eran sincrónicos.
Nota
“Tiempo” aquí denota “tiempo del sistema estacionario” y también “posición de manecillas del reloj móvil situado en el lugar en discusión”. —COMO
Entonces vemos que no podemos atribuir ninguna significación absoluta al concepto de simultaneidad, sino que dos eventos que, vistos desde un sistema de coordenadas, son simultáneos, ya no pueden ser vistos como eventos simultáneos cuando se conciben desde un sistema que está en movimiento con relación a ese sistema.
§ 3. Teoría de la Transformación de Coordenadas y Tiempos de un Sistema Estacionario a Otro Sistema en Movimiento Uniforme de Traslación Relativa al Antiguo
Tomemos en el espacio “estacionario” dos sistemas de coordenadas, es decir, dos sistemas, cada uno de tres líneas de material rígido, perpendiculares entre sí, y que salen de un punto. Que coincidan los ejes de X de los dos sistemas, y sus ejes de Y y Z, respectivamente, sean paralelos. Que cada sistema esté provisto de una varilla de medición rígida y una serie de relojes, y que las dos barras de medición, e igualmente todos los relojes de los dos sistemas, sean iguales en todos los aspectos.
Ahora al origen de uno de los dos sistemas (k) dejar que se imparta una velocidad constante v en la dirección de la x creciente del otro sistema estacionario (K), y dejar que esta velocidad sea comunicada a los ejes de las coordenadas, la varilla de medición relevante, y los relojes. A cualquier momento del sistema estacionario K entonces corresponderá una posición definida de los ejes del sistema móvil, y a partir de razones de simetría tenemos derecho a suponer que el movimiento de k puede ser tal que los ejes del sistema móvil estén en el momento t (esta “t” siempre denota un tiempo del estacionario sistema) paralelo a los ejes del sistema estacionario.
Ahora imaginamos el espacio a medir desde el sistema estacionario K por medio de la varilla de medición estacionaria, y también desde el sistema móvil k por medio de la varilla de medición que se mueve con ella; y que así obtenemos las coordenadas x, y, z, y\(\xi, \eta, \zeta\) respectivamente. Además, se determine el tiempo t del sistema estacionario para todos los puntos del mismo en los que haya relojes por medio de señales de luz de la manera indicada en el § 1; de manera similar, se determine el tiempo τ del sistema móvil para todos los puntos del sistema móvil en los que haya relojes en reposo en relación con ese sistema aplicando el método, dado en el § 1, de señales de luz entre los puntos en los que se encuentran estos últimos relojes.
A cualquier sistema de valores x, y, z, t, que define completamente el lugar y la hora de un evento en el sistema estacionario, le pertenece un sistema de valores\(\xi, \eta, \zeta, \tau\), determinando ese evento relativo al sistema k, y nuestra tarea es ahora encontrar el sistema de ecuaciones que conecta estas cantidades.
En primer lugar es claro que las ecuaciones deben ser lineales por las propiedades de homogeneidad que atribuimos al espacio y al tiempo.
Si colocamos x' = x − vt, es claro que un punto en reposo en el sistema k debe tener un sistema de valores x', y, z, independiente del tiempo. Primero definimos τ en función de x;, y, z y t. Para ello tenemos que expresar en ecuaciones que τ no es otra cosa que el resumen de los datos de los relojes en reposo en el sistema k, los cuales han sido sincronizados de acuerdo con la regla dada en § 1.
Desde el origen del sistema k dejar que se emita un rayo en el momento a\(\tau_{0}\) lo largo del eje X hasta x', y en su momento\(\tau_{1}\) se refleje de allí al origen de las coordenadas, llegando ahí en su momento\(\tau_{2}\); entonces debemos tener\(\frac{1}{2} (\tau_{0} + \tau_{2}) = \tau_{1}\), o, insertando los argumentos de la función\(\tau\) y aplicando el principio de constancia de la velocidad de la luz en el sistema estacionario: —
\[\frac{1}{2} \Bigg[ \tau (0, 0, 0, t) + \tau \left( 0, 0, 0, t + \dfrac{x'}{c - v} + \dfrac{x'}{c + v} \right) \Bigg] = \tau \left( x', 0, 0, t + \dfrac{x'}{c - v} \right) \ldotp\]
Por lo tanto, si x' se elige infinitesimalmente pequeño,
\[\frac{1}{2} \left(\dfrac{1}{c - v} + \dfrac{1}{c + v} \right) \frac{\partial \tau}{\partial t} = \frac{\partial \tau}{\partial x'} + \frac{1}{c - v} \frac{\partial \tau}{\partial t},\]
o
\[\frac{\partial \tau}{\partial x'} + \frac{v}{c^{2} - v^{2}} \frac{\partial \tau}{\partial t} = 0 \ldotp\]
Es de señalar que en lugar del origen de las coordenadas podríamos haber elegido cualquier otro punto para el punto de origen del rayo, y la ecuación recién obtenida es, por lo tanto, válida para todos los valores de x', y, z.
Una consideración análoga, aplicada a los ejes de Y y Z, teniendo en cuenta que la luz siempre se propaga a lo largo de estos ejes, cuando se ve desde el sistema estacionario, con la velocidad que nos\(\sqrt{c^{2} − v^{2}}\) da
\[\frac{\partial \tau}{\partial y} = 0,\; \frac{\partial \tau}{\partial z} = 0 \ldotp\]
Dado que\(\tau\) es una función lineal, de estas ecuaciones se deduce que
\[\tau = a \left(t - \dfrac{v}{c^{2} - v^{2}} x' \right)\]
donde a es una función\(\phi\) (v) actualmente desconocida, y donde por brevedad se supone que en el origen de k,\(\tau\) = 0, cuando t = 0.
Con la ayuda de este resultado determinamos fácilmente las cantidades\(\xi, \eta, \zeta\) expresando en ecuaciones que la luz (como lo requiere el principio de la constancia de la velocidad de la luz, en combinación con el principio de relatividad) también se propaga con la velocidad c cuando se mide en el sistema móvil. Para un rayo de luz emitido en el momento\(\tau\) = 0 en la dirección del aumento\(\xi\)
\[\xi = c \tau \quad or \quad \xi = ac \left( t - \dfrac{v}{c^{2} - v^{2}} x' \right) \ldotp\]
Pero el rayo se mueve con relación al punto inicial de k, cuando se mide en el sistema estacionario, con la velocidad c − v, de manera que
\[\frac{x'}{c - v} = t \ldotp\]
Si insertamos este valor de t en la ecuación para\(\xi\), obtenemos
\[\xi = a \frac{c^{2}}{c^{2} - v^{2}} x' \ldotp\]
De manera análoga encontramos, al considerar los rayos que se mueven a lo largo de los otros dos ejes, que
\[\eta = c \tau = ac \left( t - \dfrac{v}{c^{2} - v^{2}} x' \right)\]
cuando
\[\frac{y}{\sqrt{c^{2} - v^{2}}} = t, x' = 0 \ldotp\]
Por lo tanto
\[\eta = a \frac{c}{\sqrt{c^{2} - v^{2}}} y \quad and \quad \zeta = a \frac{c}{\sqrt{c^{2} - v^{2}}} z \ldotp\]
Sustituyendo por x' su valor, obtenemos
\[\begin{split} \tau &= \phi (v) \beta \left( t - \dfrac{vx}{c^{2}} \right), \\ \xi &= \phi (v) \beta (x - vt), \\ \eta &= \phi (v) y, \\ \zeta &= \phi (v) z, \end{split}\]
donde
\[\beta = \frac{1}{\sqrt{1 - \frac{v^{2}}{c^{2}}}},\]
y\(\phi\) es una función aún desconocida de v. Si no hay suposición alguna que se haga en cuanto a la posición inicial del sistema en movimiento y en cuanto al punto cero de\(\tau\), se debe colocar una constante aditiva en el lado derecho de cada una de estas ecuaciones.
Ahora tenemos que probar que cualquier rayo de luz, medido en el sistema móvil, se propaga con la velocidad c, si, como hemos supuesto, este es el caso en el sistema estacionario; pues aún no hemos aportado la prueba de que el principio de la constancia de la velocidad de la luz es compatible con el principio de la relatividad.
En el momento t =\(\tau\) = 0, cuando el origen de las coordenadas es común a los dos sistemas, deje que se emita una onda esférica de los mismos, y se propague con la velocidad c en el sistema K. Si (x, y, z) es un punto que acaba de alcanzar esta onda, entonces
\[x^{2} + y^{2} + z^{2} = c^{2} t^{2} \ldotp\]
Transformando esta ecuación con la ayuda de nuestras ecuaciones de transformación obtenemos después de un simple cálculo
\[\xi^{2} + \eta^{2} + \zeta^{2} = c^{2} \tau^{2} \ldotp\]
Por lo tanto, la onda en consideración no es menos una onda esférica con velocidad de propagación c cuando se ve en el sistema en movimiento. Esto demuestra que nuestros dos principios fundamentales son compatibles. 24
Nota
Las ecuaciones de la transformación de Lorentz pueden deducirse más simplemente directamente de la condición de que en virtud de esas ecuaciones la relación x 2 + y 2 + z 2 = c 2 t 2 tendrá como consecuencia la segunda relación\(\xi^{2} + \eta^{2} + \zeta^{2} = c^{2} \tau^{2}\). —COMO
En las ecuaciones de transformación que se han desarrollado entra una función desconocida\(\phi\) de v, que ahora determinaremos.
Para ello se introduce un tercer sistema de coordenadas K', que en relación con el sistema k se encuentra en un estado de movimiento de traslación paralelo paralelo al eje de\(\Xi\), 25 tal que el origen de las coordenadas del sistema K' se mueve con velocidad −v sobre el eje de\(\Xi\). En el momento t = 0 dejemos que coincidan los tres orígenes, y cuando t = x = y = z = 0 deje que el tiempo t' del sistema K' sea cero. Llamamos a las coordenadas, medidas en el sistema K', x', y', z', y por una doble aplicación de nuestras ecuaciones de transformación obtenemos
\[\begin{split} t' &= \phi (-v) \beta (-v) \left(\tau + \dfrac{v \xi}{c^{2}} \right) &= \phi (v) \phi (-v) t, \\ x' &= \phi (-v) \beta (-v) (\xi + v \tau) &= \phi (v) \phi (-v) x, \\ y' &= \phi (-v) \eta &= \phi (v) \phi (-v) y, \\ z' &= \phi (-v) \zeta &= \phi (v) \phi (-v) z \ldotp \end{split}\]
Nota
En el artículo original de Einstein, se introdujeron los símbolos (\(\Xi\), H, Z) para las coordenadas del sistema móvil k sin definirlos explícitamente. En la traducción al inglés de 1923, se utilizaron (X, Y, Z), creando una ambigüedad entre las coordenadas X en el sistema fijo K y el eje paralelo en el sistema móvil k. Aquí y en referencias posteriores utilizamos\(\Xi\) cuando nos referimos al eje del sistema k a lo largo del cual el sistema se está traduciendo con respecto a K. Además, la referencia al sistema K' más adelante en esta frase se dio incorrectamente como “k” en la traducción al inglés de 1923. —JW
Dado que las relaciones entre x', y', z' y x, y, z no contienen el tiempo t, los sistemas K y K' están en reposo uno con respecto al otro, y es evidente que la transformación de K a K' debe ser la transformación idéntica. Por lo tanto
\[\phi (v) \phi (-v) = 1 \ldotp\]
Ahora indagamos en la significación de\(\phi\) (v). Damos nuestra atención a esa parte del eje de Y del sistema k que se encuentra entre\(\xi\) = 0,\(\eta\) = 0,\(\zeta\) = 0 y\(\xi\) = 0,\(\eta\) = l,\(\zeta\) = 0. Esta parte del eje de Y es una varilla que se mueve perpendicularmente a su eje con velocidad v relativa al sistema K. Sus extremos poseen en K las coordenadas
\[x_{1} = vt, \quad y_{1} = \frac{l}{\phi (v)}, \quad z_{1} = 0\]
y
\[x_{2} = vt, \quad y_{2} = 0, \quad z_{2} = 0 \ldotp\]
La longitud de la varilla medida en K es por lo tanto\(\frac{l}{\phi}\) (v); y esto nos da el significado de la función\(\phi\) (v). Por razones de simetría ahora es evidente que la longitud de una varilla dada que se mueve perpendicularmente a su eje, medida en el sistema estacionario, debe depender únicamente de la velocidad y no de la dirección y el sentido del movimiento. La longitud de la varilla móvil medida en el sistema estacionario no cambia, por lo tanto, si v y −v se intercambian. De ahí se deduce que\(\frac{l}{\phi}\) (v) =\(\frac{l}{\phi}\) (−v), o
\[\phi (v) = \phi (-v) \ldotp\]
De esta relación se desprende y la que se encontró previamente que\(\phi\) (v) = 1, de manera que las ecuaciones de transformación que se han encontrado se convierten
\[\begin{split} \tau &= \beta \left( t - \dfrac{vx}{c^{2}} \right), \\ \xi &= \beta (x - vt), \\ \eta &= y, \\ \zeta &= z, \end{split}\]
donde
\[\beta = \frac{1}{\sqrt{1 - \frac{v^{2}}{c^{2}}}} \ldotp\]
Colaboradores