miércoles, 18 de marzo de 2009

La ecuación de desviación geodésica

El tensor de Riemann tiene una importancia fundamental a la hora de calcular la desviación de dos líneas inicialmente paralelas cuando se desplazan a través de una superficie curva. Si bien en un espacio dimensional plano las líneas paralelas nunca se cortan, esta regla no es aplicable en el caso de las superficies curvas de geometría elíptica. Supóngase que dos viajeros salen del Ecuador en dirección norte. En ambos casos, el ángulo que la trayectoria de su barco forma con el Ecuador es inicialmente de 90º, por lo que se trata de dos líneas inicialmente paralelas. Sin embargo, conforme los viajeros se van desplazando hacia el norte, su distancia recíproca se hace cada vez más pequeña hasta que se hace nula en el Polo Norte, que es donde se encuentran sus trayectorias de viaje. Para calcular la tasa de aproximación entre las dos geodésicas utilizamos la siguiente ecuación conocida como la ecuación de desviación geodésica:



en donde dξβ y dξν representan el recorrido desde el Ecuador de ambas líneas geodésicas y ξμ la distancia de separación entre ellas. Al hablar de una desviación geodésica, en ningún momento estamos diciendo que cualquiera de los dos objetos inicialmente paralelos puestos en movimiento se desviará de su ruta geodésica. La desviación de la que se está hablando es de la trayectoria que ambos objetos tendrían si continuaran moviéndose siguiendo rutas paralelas al estar en un espacio-tiempo plano.

En el espacio-tiempo curvo de la Relatividad General, las cosas funcionan de un modo parecido a como funcionan en el espacio geométrico N-dimensional de Bernhard Riemann: el tensor de Riemann determina la aceleración recíproca entre las líneas del mundo (o líneas del universo, en el diagrama espacio-tiempo de Minkowski) de dos sistemas inerciales (p.ej. dos asteroides que se acercan progresivamente como consecuencia de su mutua atracción gravitatoria). Para calcular dicha aceleración, aplicamos de nuevo la ecuación de desviación geodésica con una ligera modificación introduciendo el tiempo local (o tiempo propio):



en donde es un parámetro afín (en este caso el tiempo local) y uβ y uν son los 4-vectores de la 4-velocidad de cada uno de los cuerpos que, según el esquema de Minkowski, equivalen geométricamente a campos vectoriales tangentes a ambas líneas de universo. Esquemáticamente esto representa la aceleración de dos líneas del mundo geodésicas:





Como podemos ver, conforme se avanza en la línea temporal (hacia arriba) el tensor de Riemann curva las geodésicas y provoca el acercamiento recíproco de las dos partículas. Las geodésicas en un espacio-tiempo plano (Lorentziano) mantienen su separación y permanecen paralelas, mientras que las geodésicas en un espacio-tiempo curvo no lo hacen.

Considérense dos geodésicas con vectores tangentes V y V’ que empiezan como paralelas cercanas la una a la otra, una en un punto A y la otra en un punto A’. Llamemos λ al parámetro afín en las geodésicas (que puede ser un elemento de arco o el tiempo local τ). Definamos ahora un “vector de conexión” ξ (como en el diagrama de arriba) que llega a una geodésica desde la otra, conectando puntos de ambas a intervalos iguales (como ξ1 y ξ2 en el diagrama de arriba). Para mayor simplicidad, adoptaremos un sistema de coordenadas (x0, x1, x2, x3) localmente inercial en el punto A, en el cual la coordenada x0 apunta a lo largo de la geodésica (la selección del componente-0 que es el componente temporal a lo largo de la geodésica nos ayudará en relacionar los resultados con el caso en el cual λ es el tiempo local). Entonces en el punto A tenemos que la única componente del 4-vector velocidad es la componente temporal (trabajaremos con una velocidad de la luz c igual a la unidad para no estar arrastrando innecesariamente dicha constante a lo largo de la demostración) a la cual le daremos un valor unitario:

V = (Vα) = (1, 0, 0, 0) = (δα0)

Notacionalmente, en conformidad con lo que se ha indicado, las siguientes tres representaciones estarán simbolizando una misma cosa:



Nuestro punto de partida será la ecuación diferencial para la ruta geodésica (ecuación geodésica):



Puesto que estamos considerando al punto A como parte de un marco de referencia inercial plano (Lorentziano) esto implica que para el punto A los símbolos de Christoffel en dicho punto deben ser nulos, y en tal caso debe ser cierto lo siguiente para el punto A:



Pero el punto de la otra geodésica, el punto A’, no está en un marco de referencia plano, por lo cual recurriendo nuevamente a la ecuación geodésica tenemos que la ecuación de la geodésica V’ en A’ debe ser (puesto que Vα = δα0 entonces en la sumatoria sobre los símbolos de Christoffel requerida por la convención de sumación -en virtud de los índices repetidos- el único símbolo de Christoffel que no será cero es Γα00 , todos los demas serán iguales a cero):



Puesto que A y A’ están separados por el vector ξ, los símbolos de Christoffel en el punto A y en el punto A’ están relacionados de la siguiente manera:



Con la relación previa, esto nos conecta los puntos de partida A y A’ de las geodésicas del siguiente modo:



Ahora bien, la diferencia entre el componente xα que corresponde al punto A’ y el componente xα que corresponde al punto A debe ser igual al componente ξα del vector de separación ξ entre ambas geodésicas:

xα (A’) - xα (A) = ξα

Con esto podemos establecer una conexión entre las geodésicas y el vector de separación metiendo las relaciones anteriores en esto último obteniendo así:



Haremos ahora un pequeño paréntesis. En el lado izquierdo de esta última ecuación tenemos a la segunda derivada ordinaria de ξ con respecto al parámetro afín, o sea d²ξ/dλ². Esto es perfectamente válido dentro de un espacio-tiempo plano, Lorentziano. El problema es que no estamos trabajando dentro de un espacio-tiempo plano, estamos trabajando dentro de un espacio-tiempo curvo. Y al trabajar en un espacio-tiempo curvo, para que los resultados puedan ser válidos en cualquier sistema de coordenadas tenemos que reemplazar a la derivada ordinaria por la derivada covariante. Y en este caso, no basta con llevar a cabo una sola diferenciación covariante, tenemos que llevar a cabo dos diferenciaciones covariantes. Para la obtención de la velocidad (de cambio) de ξ requerimos de la primera derivada covariante de ξ, y para obtener la aceleración de ξ usamos la segunda derivada covariante de ξ, lo cual será válido (tensorialmente) para cualquier sistema de coordenadas.

Si representamos a la primera derivada covariante del vector ξ = (ξα) con respecto al parámetro λ como (obsérvese el uso del semicolon con el cual indicamos una diferenciación covariante):

ξα; λ

entonces podemos representar a la segunda derivada covariante del vector ξ = (ξα) con respecto al parámetro λ como (obsérvese de nueva cuenta el uso del semicolon con el cual indicamos una diferenciación covariante):

α; λ) ; λ

Es importante aclarar aquí que algunos autores de reconocido prestigio representan esta segunda derivada covariante de una manera como la siguiente:

vv ξ

Aunque cada autor es libre de inventar la notación que le plazca, esta selección del símbolo nabla (∇) para denotar una derivada covariante es desafortunada por el hecho de que en una gran cantidad de textos y trabajos científicos el símbolo ∇ está reservado para representar al operador diferencial vectorial ∇ = (∂/∂x, ∂/∂y, ∂/∂z). El operador diferencial vectorial ∇ y la diferenciación covariante representan dos conceptos completamente distintos (el primero ni siquiera involucra símbolos de Christoffel). Y la colocación de un vector (V) como sub-índice después del símbolo ∇ no ayuda mucho en aclarar la posible confusión en virtud de que se puede malinterpretar como una derivada absoluta o derivada intrínseca, la cual aunque ciertamente es una operación matemática que especifica una diferenciación covariante también va aparejada con la contracción tensorial con el vector en cuestión que viene siendo la tangente de la curva a lo largo de la cual se lleva a cabo la diferenciación covariante.

Para evitar confusiones, nos mantendremos fieles a la simbología que hemos estado usando en entradas anteriores.

La definición de la derivada covariante nos dá la primera derivada del tensor contravariante (ξα) con respecto a λ (que en este caso es x0) de la siguiente manera de acuerdo a la definición de derivada covariante:



En virtud del índice repetido β en el segundo término que activa a la convención de sumación, el segundo término se expande a cuatro términos de Christoffel de segundo género en un 4-espacio correspondiendo a las cuatro componentes de ξβ. Tenemos un índice libre, q, pero en virtud de que ambas geodésicas son inicialmente paralelas también la geodésica que parte de A se trasladará a lo largo de la coordenada x0 (la componente temporal), siendo las otras tres componentes iguales a cero para las otras tres coordenadas (no lo serían si las geodésicas en los puntos A y A’ apuntaran en direcciones diferentes que involucraran a las otras tres coordenadas que son las coordenadas espaciales estando lo más anti-paralelas que pudieran estar). Tomando esto en cuenta e invocando la propiedad de los símbolos de Christoffel de segundo género que nos dice que son simétricos en el intercambio de los dos índices inferiores, lo anterior lo podemos escribir del siguiente modo:



Llevándose a cabo el cambio de ξα únicamente con respecto a la primera coordenada (la coordenada temporal), podemos reemplazar a la diferenciación parcial ∂ξα/∂λ por la diferenciación ordinaria α/dλ, escribiendo así:



Esta es la primera derivada covariante de ξ = (ξα). Pero estamos interesados en la segunda derivada covariante de ξ. Esto nos requiere aplicar de nueva cuenta la definición de derivada covariante. Es así como habiendo utilizado el hecho de que los símbolos de Christoffel son iguales a cero en el punto A llegamos a lo siguiente:



Removiendo el paréntesis tomando la diferenciación indicada con respecto a λ tenemos lo siguiente:



Puesto que el factor β/dx0 es igual a cero, el tercer término se nos hace cero quedándonos únicamente:



Aquí podemos introducir el resultado que habíamos obtenido previamente para d²ξα/dλ² obteniendo de este modo lo siguiente:



En este punto revertiremos a notación simbólica más compacta habiendo quedado claro aquello de lo que estamos hablando, usando la coma sencilla para indicar las diferenciaciones ordinarias:

α; λ) ; λ = - Γα00 ξβ + Γαβ0,0 ξβ

Factorizando ξβ:

α; λ) ; λ = (Γαβ0,0 - Γα00) ξβ

Esto se puede simplificar aún más si recurrimos a la definición del tensor de Riemann:

Rαβμν = Γαβν - Γαβμ,ν + Γα σμ Γσ βν - Γα σν Γσ βμ

Poniendo ceros en el lugar en donde están los primeros dos sub-índices (β y μ) tenemos entonces:

Rα00ν = Γα,0 - Γα00,ν + Γα σ0 Γσ - Γα σν Γσ 00

El tercer término y el cuarto término se nos anulan, quedándonos únicamente los dos primeros términos. En el primer término podemos hacer un reacomodo en los dos primeros sub-índices haciendo uso del hecho de que el símbolo de Christoffel de segundo género es simétrico en sus índices inferiores y de que esta simetría se mantienen en pie al tomarse la derivada ordinaria de dicho símbolo de Christoffel:

Rα00ν = Γαν0,0 - Γα00,ν

Si tomamos el lado derecho de esta ecuación:

Γαν0,0 - Γα00,ν

y hacemos una comparación con lo que habíamos obtenido previamente:

α; λ) ; λ = (Γαβ0,0 - Γα00) ξβ

podemos ver que podemos reemplazar en esto último lo que está dentro de los paréntesis por el símbolo del tensor de Riemann con los dos índices que se han puesto en ceros. Es así como llegamos a lo siguiente:

α; λ) ; λ = Rα00β ξβ

Desde el principio hemos supuesto que (Vα) = (δα0). Entonces V0 = δ00 = 1, lo cual nos permite escribir lo siguiente:

α; λ) ; λ = Rα00β (1)(1) ξβ

α; λ) ; λ = Rα00β (V0)(V0) ξβ

Esto es válido en lo que respecta a una coordenada, la coordenada temporal. Pero todas las cuatro coordenadas están al mismo nivel (en inglés se acostumbra decir on equal footing), ninguna de ellas está privilegiada sobre la otra. Esto significa que la generalización del resultado que acabamos de obtener se puede enunciar de modo completamente general de la manera siguiente:

α; λ) ; λ = Rαμνβ (Vμ)(Vν) ξβ

en donde Vμ es el 4-vector velocidad que corresponde a una de las geodésicas y Vν es la 4-velocidad que corresponde a la otra geodésica. Esta es esencialmente la ecuación de desviación geodésica.

Si tomamos el parámetro λ como el tiempo local o tiempo propio τ, entonces podemos hacer:

α; λ) ; λ = d²ξ/dτ²

con lo cual:

d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ

Esta es la ecuación de desviación geodésica, desde la perspectiva de la Relatividad General, enunciada al principio de esta entrada.

La ecuación de desviación geodésica puede ser derivada de modo más riguroso (y más satisfactorio desde el punto de vista matemático formal) mediante algo que llamamos la segunda variación covariante del Lagrangiano de una partícula puntual, o bien de la primera variación de un Lagrangiano combinado. El resultado que obtenemos a fin de cuentas es exactamente el mismo.

PROBLEMA: Dimensionalmente hablando, ¿qué es lo que estamos midiendo con el tensor Rαμνβ a la luz de la ecuación de desviación geodésica?

ξ es un 4-vector cuyas cuatro componentes son medidas en unidades de longitud (metros). Tomando al parámetro τ como el tiempo propio (tiempo local), medido en segundos, entonces en el lado derecho de la ecuación de desviación geodésica d²ξ/dτ² tiene unidades de metros/(segundo)², con lo cual estamos midiendo una aceleración, la aceleración con la cual se está acortando la longitud del 4-vector ξ. Puesto que cada componente de la 4-velocidad Vμ así como de la 4-velocidad Vν está medido en metros por segundo, entonces la ecuación de desviación geodésica:

d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ

tiene la siguiente expresión dimensional en unidades del sistema MKS:



Simplificando:



Para que esta ecuación pueda ser dimensionalmente correcta, se requiere que tenga unidades de metros-2, o sea:



Siendo los metros cuadrados algo que corresponde a una dimensión de superficie, esto nos mide algo por unidad de área. Recordemos en una de las derivaciones del tensor de Riemann cómo el tensor de curvatura fue obtenido a partir de un “parche de coordenadas” tomado de la hoja que representa la 2-superficie bajo consideración. Si todos los componentes del tensor de Riemann son iguales a cero, esto significa que estamos situados en un espacio Euclideano plano. Pero si tan sólo uno de los componentes del tensor de Riemann es diferente de cero, entonces estamos situados en un espacio curvo (o mejor dicho, en un espacio-tiempo curvo). Esto significa que podemos equiparar a Rαμνβ como una medida de la curvatura por unidad de área del espacio dimensional bajo consideración. A mayor magnitud de cualquiera de los componentes del tensor de Riemann Rαμνβ , tanto mayor será la curvatura por unidad de área del “parche de coordenadas” sobre el cual se está midiendo dicha curvatura.