La teoría de la relatividad especial

einstein_patentclerk

El esfuerzo de Einstein por conciliar el principio de relatividad y la electrodinámica le llevó a elaborar, en 1905 (en su artículo Sobre la electrodinámica de los cuerpos en movimiento), una teoría sustentada por dos postulados fundamentales:

Primer postulado. Todas las leyes de la Física son invariantes respecto a las transformaciones entre sistemas de referencia inerciales.

Segundo postulado. La velocidad de la luz en el vacío es siempre la misma para cualquier sistema de referencia inercial.

El primero se conoce como principio de la relatividad especial, que extiende el principio de la relatividad a todas las leyes físicas, no sólo a las de la mecánica. Su consecuencia más inmediata es que obliga a desterrar la idea de un movimiento absoluto. Sólo pueden observarse en la naturaleza los movimientos relativos de unos sistemas respecto a otros.

El segundo principio, el de la constancia de la velocidad de la luz (en el vacío es 299 792458 m/s), se desprende directamente de las ecuaciones de Maxwell. Destierra la idea del éter, pues la luz no podría tener la misma velocidad con respecto a un sistema de referencia en el cual el éter estuviera en reposo, que respecto de otro en el que estuviera en movimiento.

Los postulados de Einstein distaban de ser, como los de Euclides, suposiciones que, de puro obvias, se aceptaban sin rechistar. Su autoridad se basaba en evidencias experimentales, y sus implicaciones comunes resultan sorprendentes y contradicen lo que normalmente denominamos sentido común.

Simultaneidad de sucesos

Hasta la aparición de la teoría especial de la relatividad nadie había pensado que pudiera existir ambigüedad en la afirmación de que dos sucesos en lugares diferentes sucedían al mismo tiempo. Se podía admitir que si los lugares estaban muy alejados hubiese dificultad en averiguar si los dos sucesos eran simultáneos. Pero todos creían que el significado de la cuestión era muy concreto. Resultaba, sin embargo, que era un error. ¿Cómo decidiríamos nosotros si dos hechos en diferentes lugares fueron simultáneos? Uno diría, naturalmente: son simultáneos si son vistos simultáneamente por una persona que está situada a igual distancia de los dos.

Supongamos que hay dos estrellas gemelas en el espacio y un astronauta está viajando a lo largo de la línea que va de una a otra. Nosotros estamos en un punto de la mediatriz de esa línea, por lo que nos separa la misma distancia de ambas. Cuando el astronauta está a mitad de camino, de repente, las dos estrellan explotan. Como nosotros estamos a la misma distancia veremos a la vez la luz procedente de las dos estrellas, es decir, que para nosotros las dos han explotado al mismo tiempo, han sido dos sucesos simultáneos. Sin embargo, como el astronauta está viajando de la primera estrella a la segunda, percibirá primero la luz que procede de ésta, por lo que para él las dos explosiones no se han producido simultáneamente.

Según esto, si dos sucesos son simultáneos en un sistema de referencia, no lo serán en cualquier otro sistema que se mueva respecto al primero. Es decir, el tiempo no transcurre de la misma manera en todos los sistemas de referencia inerciales. Incluso, puede ocurrir que para un observador el orden de los sucesos ¡esté invertido! con respecto al de otro observador (siempre y cuando éstos sean independientes, pues si no se violaría el principio de causalidad, según el cual la causa siempre precede al efecto).

Dilatación del tiempo

Como se acaba de ver, el tiempo no es absoluto, sino que depende del sistema de referencia. A partir de las ecuaciones de transformación de Lorentz se puede demostrar que el intervalo de tiempo, medido en un sistema de referencia respecto al cual el punto en el que ocurren los acontecimientos se está moviendo, es mayor que respecto a un sistema de referencia ligado a dicho punto:

dilatacion-tiempo

Este crecimiento se denomina dilatación del tiempo y el intervalo de tiempo en el sistema ligado al punto móvil (Δt0) se llama tiempo propio. Los efectos relativistas sólo son observables para velocidades extremadamente altas: para detectar diferencias del 5 % entre medidas realizadas por dos observadores, uno en reposo y otro en movimiento, haría falta que éste se moviese a una velocidad de más de 90.000 km/s.

Este extraño comportamiento ha sido comprobado en numerosos experimentos posteriores (como el llevado a cabo por Rossi y Hall en 1941) y es la clave para resolver las aparentes paradojas que se plantean en la relatividad (la más conocida es la paradoja de los gemelos).

La contracción de la longitud

Un fenómeno estrechamente relacionado con la dilatación del tiempo es la contracción de longitudes. La longitud de un objeto medida en el sistema de referencia en que dicho objeto se encuentra en reposo se denomina longitud propia (l0). En un sistema de referencia en el que el objeto se está movimiento, la longitud medida es más corta que su longitud propia. Al igual que antes, se puede deducir, entonces:

contraccion-longitud

Esta expresión se conoce como contracción de Lorentz – Fitzgerald, ya que ellos la habían planteado previamente como solución al experimento de Michelson – Morley.

El valor heurístico de la teoría de la relatividad

La experiencia había llevado a la convicción de que el principio de la relatividad era válido y, por otro lado, que la velocidad de propagación de la luz era una constante. La unión de estos dos postulados nos permitió concluir que, cuando pasamos de un sistema de referencia S definido por las variables x, y, z y t a otro sistema de coordenadas S’ definido por las variables x’, y’, z’ y t’, todas las leyes de la naturaleza deben comportarse de la misma manera, y la relación matemática que permite relacionar estos dos sistemas de variables viene dada por las transformaciones de Lorentz.

Se trata de una condición matemática precisa que la teoría de la relatividad prescribe a las leyes naturales, con lo cual se convierte en un valioso instrumento heurístico para la búsqueda de leyes generales de la naturaleza. Si se encontrase una ley general de la naturaleza que no cumpliera esa condición, quedaría refutado por lo menos uno de los dos supuestos fundamentales de la teoría.

Las transformaciones de Lorentz

El experimento de Michelson – Morley parecía contradecir el principio de relatividad, ya que las transformaciones de Galileo no justificaban que la velocidad de la luz no variase con la posición del interferómetro. Para resolver las contradicciones la única alternativa era corregir las transformaciones de Galileo, por mucho que las dictase el sentido común.

En 1892, de manera independiente, Lorentz y Fitzgerald, ofrecieron una solución a este dilema: en su movimiento por el éter, un brazo del interferómetro se contraía en una fracción de su longitud que era exactamente la cantidad que permitía que los dos rayos llegaran simultáneamente. A partir de este supuesto se deducen las siguientes expresiones, que conocemos como transformaciones de Lorentz:

transformaciones-lorentz

sistemas-referencia

Estas expresiones se pueden reducir a las de Galileo si consideramos que la velocidad de la luz se hace infinitamente grande, es decir, que éstas son una aproximación de las de Lorentz a velocidades pequeñas.

A continuación se muestra un vídeo, elaborado por una alumna de Bachillerato, en el que compara las transformaciones de Galileo con las de Lorentz, a partir de dos problemas: en el primero ambas transformaciones conducen a resultados equivalentes, pero en el segundo se comprueba cómo las transformaciones de Galileo dejan de ser válidas cuando trabajamos con velocidades próximas a las de la luz:

Entonces, ¿cómo afectan las transformaciones de Lorentz a la medida del tiempo y de la longitud a velocidades próximas a c?

El principio de relatividad de Galileo

Un principio de relatividad es un enunciado que establece con respecto a qué sistemas de referencia las leyes de la Física tienen exactamente la misma forma, es decir, son invariantes.

Según el principio de la relatividad de Galileo las leyes de la mecánica son invariantes respecto de todos los sistemas de referencia que se muevan unos con respecto a otros con movimiento rectilíneo y uniforme (sistemas inerciales).

Dados dos sistemas de referencia inerciales, uno con origen en O en el que las coordenadas de un punto dado son (x,y,z), y otro con origen en O’ que se mueve a lo largo del eje X con velocidad relativa v en el que las coordenadas del mismo punto son (x’, y’, z’), las expresiones que nos permiten relacionar las mediciones realizadas en ambos sistemas son las denominadas transformaciones de Galileo:

transformaciones-Galileo

 

Las transformaciones de Galileo son consistentes con la noción intuitiva de espacio y tiempo, pero vamos a ver que entran en serias contradicciones cuando son aplicadas a las ondas electromagnéticas.

Las ecuaciones de la dinámica de Newton incluyen las aceleraciones de los cuerpos, así que son “ciegas” a la velocidad: la transformación de Galileo deja intactas las ecuaciones de la dinámica. Por lo que sólo podemos hablar de movimientos relativos, es decir, no puede detectarse el movimiento absoluto.

Sin embargo, las ecuaciones de Maxwell presentan una simetría diferente y no se muestran invariantes frente a las transformaciones de Galileo, es decir, no se muestran “ciegas” a la velocidad y, entonces, el movimiento relativo podría detectarse a partir de ellas. Este hecho supuso un duro golpe para la física clásica de finales del siglo XIX, pues se había comprobado que las ecuaciones de Maxwell explicaban igualmente bien los fenómenos tanto en sistemas de referencia en reposo, como en sistemas de referencia en movimiento uniforme.

El experimento de Michelson – Morley parecía contradecir el principio de relatividad: las transformaciones de Galileo no justificaban que la velocidad de la luz no variase con la posición del interferómetro. Para resolver las contradicciones la única alternativa era corregir las transformaciones de Galileo, por mucho que las dictase el sentido común. Y así lo hicieron Lorentz y Fitzgerald.

El experimento de Michelson–Morley

michelson-morley

La teoría electromagnética de Maxwell demostraba que la luz era una onda electromagnética, pero para comprender su movimiento ondulatorio los físicos de finales del siglo XIX se veían condicionados a suponer la existencia del éter, un medio elástico que llenaba todo el espacio y que permitiría la propagación de la luz a través de él.

De modo que el éter rodeaba todo a nuestro alrededor, y no sólo la luz viajaba en su seno, sino que incluso la Tierra se desplazaba a través de él por el espacio.

La Tierra a través del éter

Si nuestro planeta se mueve en el seno del éter en reposo y la luz viaja a una velocidad constante respecto al éter, podríamos pensar que si se mide la velocidad de la luz (respecto a la Tierra) cuando ésta se mueve en la misma dirección y sentido del movimiento del planeta resultaría una velocidad inferior que cuando se mide en sentido contrario.

Podemos imaginarnos esta situación si consideramos el movimiento de dos nadadores que parten del mismo punto de un río. Ambos nadan a la misma velocidad y recorren la misma distancia de ida y vuelta, pero uno de ellos lo hace en dirección perpendicular a la corriente y el otro lo hace a contracorriente:

nadador-experimento-michelson

El primer nadador tarda menos en recorrer la misma distancia, ya que tanto el punto de referencia como él se ven arrastrados de la misma manera por la corriente, por lo que ésta no afecta a su movimiento. Sin embargo, el segundo llegará más tarde, pues la corriente se opone a su movimiento.

Cuanto mayor sea la velocidad de la corriente mayor será el tiempo que emplea en recorrer la misma distancia. Así, la velocidad de la corriente podría determinarse a partir de la diferencia de tiempos entre el primer y el segundo nadador.

Al igual que un nadador contracorriente es frenado por el arrastre del río, un haz de luz viajando en la misma dirección que se movía la Tierra en torno al Sol resultaría frenado por el “viento del éter”.

Michelson pensó que si en lugar de nadadores, considerásemos dos haces de luz que se desplazan perpendicularmente, uno en la misma dirección que el movimiento de la Tierra respecto al éter y otro de manera perpendicular a éste, deberíamos notar una pequeña diferencia (la luz se mueve diez veces más rápido que la Tierra) entre ambos movimientos, es decir, que la luz se movería con diferente velocidad dependiendo de la dirección en la que se propague.

El experimento de Michelson y Morley

Albert Michelson era un científico obsesionado con la precisión. Ya en 1879 midió la velocidad de la luz obteniendo el valor de 299.940 kilómetros por segundo. Para poder medir la velocidad de la Tierra con respecto al éter, Michelson diseñó en 1881 un aparato denominado interferómetro:

Michelson_Morley

Estuvo perfeccionándolo durante años y, con la ayuda de Morley, en 1887, llevó a cabo el siguiente experimento:

experimento-michelson-morley

El planteamiento es el siguiente. La luz procedente de una fuente incide sobre un espejo semitransparente A, que en parte se refleja y en parte se transmite. El haz reflejado llega hasta el espejo M2 y vuelve hasta el punto de observación O donde miramos con nuestro ojo. El haz transmitido viaja hacia el espejo M1 pasando a través de una placa de vidrio B y vuelve de nuevo hacia el espejo semitransparente y más tarde al ojo situado en O. La placa B que tiene el mismo espesor que el espejo semitransparente es para garantizar que los dos haces 1 y 2 atraviesen el mismo espesor de vidrio. Cuando los dos haces se junten en O formarán un diagrama de interferencias. Si los dos haces se recombinan en fase, la intensidad de la luz aumentará (interferencia constructiva). Si por el contrario los haces se recombinan con fase opuesta (interferencia destructiva) la intensidad disminuirá llegando incluso a producirse una franja oscura.

Durante el experimento el interferómetro giraba lentamente mientras Michelson, sin tocar el instrumento, leía y Morley anotaba las lecturas de las franjas de interferencia. Uno de los haces, el que viaja en la dirección del desplazamiento de la Tierra, debería sufrir el arrastre del éter y llegar más tarde al punto de encuentro, perdiendo la sincronía con el otro haz. Sin embargo, lo que encontraron fue inesperado: se halló un perfecto acuerdo entre ambos, para cualquier orientación del interferómetro las franjas de interferencias permanecían, sin desplazarse, en la misma posición:

michelson-morley_interferometer

La velocidad de los haces de luz era la misma en cualquier dirección (observa esta simulación). A pesar del cuidadoso esmero con que se realizaron los experimentos, el movimiento de la Tierra respecto al éter no pudo ser detectado.

Esto planteaba un importante dilema: o bien el éter no existe, y por eso no se puede detectar el movimiento de ningún cuerpo respecto a él, o bien existe y los cuerpos se mueven en su seno, pero hay ciertos mecanismos de compensación que anulan los efectos de este movimiento.

¿Cuál fue la respuesta de la ciencia a este experimento? ¿Influyó en el desarrollo de la teoría de la relatividad?

Los antecedentes históricos de la teoría de la relatividad

En el siglo XIX se había alcanzado un gran desarrollo de la física y se tenían ya desarrolladas las grandes teorías de la dinámica, la óptica, el electromagnetismo o la termodinámica. Incluso Lord Kelvin se atrevió a decir que no quedaba “nada nuevo por descubrir en la física actualmente” y que lo único que faltaba era “tener mediciones más precisas”. Sin embargo, la física clásica se tuvo que enfrentar a nuevos retos y contradicciones que pusieron en tela de juicio las teorías clásicas y las concepciones más arraigadas en la comunidad científica.

La naturaleza electromagnética de la luz

james-clerk-maxwell

A finales del siglo XIX se había llegado a la conclusión, gracias a los trabajos de Maxwell y Hertz, de que la luz era una onda electromagnética.

En el año 1865 el físico James Maxwell unificó los fenómenos eléctricos y magnéticos en una única teoría electromagnética. Con ellas se podían describir las perturbaciones del campo electromagnético con las mismas expresiones que las ondas sonoras y permitían deducir su velocidad de propagación, próxima a los 300 000 000 m/s.

Este valor era sospechosamente cercano al de las mediciones que se habían hecho de la velocidad de la luz. En 1849, el parisino Hippolyte Fizau había atrapado un rayo de luz en un laberinto de espejos y, armado con un delicado mecanismo, logró medir su velocidad en el aire, obteniendo un valor de unos 315 000 000 m/s, que su compatriota Foucault afinó hasta los 298 000 000 m/s.

Ante tan asombrosa coincidencia, Maxwell se atrevió a anunciar: la velocidad se aproxima tanto a la de la luz que, según parece, existen poderosas razones para concluir que la propia luz es una perturbación electromagnética que se propaga en forma de ondas a través del campo electromagnético, de acuerdo con las leyes electromagnéticas.

El éter luminífero

Al igual que todos los movimientos ondulatorios conocidos, la luz necesitaría un medio material para propagarse lo que hizo suponer la existencia de un medio elástico que llenaba el espacio y que denominaron éter.

La existencia del éter presuponía que la velocidad de la luz, de la que se habían hecho mediciones muy precisas, era sólo válida en un sistema de referencia respecto al cual el éter estuviera en reposo. En cualquier otro sistema de referencia sería otra debido a que el éter arrastraría la luz en su movimiento.

El esfuerzo experimental (véase el experimento de Michelson y Morley) realizado para comprobar de algún modo si existía un sistema de referencia preferible a todos los demás permitió descartar la existencia del éter, una de las bases de la teoría de la relatividad.