miércoles, 18 de marzo de 2009

El tensor de Riemann II

Antes de continuar queremos dejar en claro lo que entendemos por una hoja.

El concepto de hoja (en inglés se le llama manifold), conocida también como carta en muchos textos de geometría diferencial escritos en castellano (aquí nos limitaremos a llamarle simplemente hoja porque es la palabra que mejor transmite la idea del concepto del que estamos hablando), es precisamente lo que su nombre indica; se trata de una superficie suave y continua sobre la cual se pueden aplicar los conceptos del cálculo infinitesimal, se puede obtener una derivada. A continuación tenemos un ejemplo de una hoja que podríamos llamar silla de montar:





Al empezar a cubrir el tema del tensor de Riemann, lo hicimos formulándonos una simple pregunta, sobre si el orden de la diferenciación al tomar una derivada covariante tras otra era indiferente respecto al orden en que se tomasen las derivadas, o si el orden de la diferenciación importaba, encontrándose que el orden de la diferenciación es relevante, con la diferencia entre una expresión y la otra cuantificada por el tensor de Riemann.

Hay otra manera de llegar al tensor de Riemann, y esta es mediante el uso del concepto del transporte paralelo, porque el tensor de Riemann es de hecho una descripción matemática de la curvatura intrínseca de una hoja. Para ello, recurrimos al transporte paralelo de un vector V alrededor de una trayectoria cerrada que nos regrese al punto de origen después de darle una vuelta completa a un pedazo de superficie. Identificaremos a este pedacito de superficie como un “parche de coordenadas” (coordinate patch) cortado con unas tijeras imaginarias de la hoja (manifold) mostrada en la figura de arriba. De este modo, imaginemos en nuestra hoja un pedacito muy pequeño de superficie cuyos cuatro lados coinciden con las líneas de coordenadas x1 = a, x1 = a + δa, x2 = b y x2 = b + δb:





Empezando desde el punto A, llevaremos a cabo el transporte-paralelo de un vector V a lo largo de la coordenada x2 = b = constante llevándolo desde la coordenada x1 = a hasta la coordenada x1 = a + δa para situarlo en el punto B. Tras esto, para la segunda trayectoria, trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x1 = a + δa = constante desde el punto B hasta el punto C llevándolo desde la coordenada x2 = b hasta la coordenada x2 = b + δb. Hecho esto, para la tercera trayectoria trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x2 = b + δb = constante desde el punto C hasta el punto D llevándolo desde la coordenada x1 = a + δa hasta la coordenada x1 = a. Y por último, para la cuarta trayectoria, trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x1 = a = constante desde el punto D hasta el punto A llevándolo desde la coordenada x2 = b + δb hasta la coordenada x2 = b, regresándolo al punto de partida y completando de este modo un circuito cerrado.

La trayectoria completa del vector V a lo largo de la retícula de coordenadas (x1, x2) es:

Ruta 1: A(a, b) → B(a + δa, b)

Ruta 2: B(a + δa, b) → C(a + δa, b + δb)

Ruta 3: C(a + δa, b + δb) → D(a, b + δb)

Ruta 4: D(a, b + δb) → A(a, b)

Tomaremos ahora una enunciación simbólica usual de la operación de transporte paralelo (en la cual el símbolo ∇ no representa al operador vectorial diferencial usual) que representa al transporte paralelo del vector V a lo largo de la trayectoria U:



y haremos U = e1 simbolizando con esto el transporte paralelo del vector V a lo largo del vector tangente a la coordenada x1:



Para fines de cálculo, tensorialmente hablando, esta simbolización en realidad no es más que la derivada absoluta o derivada intrínseca que involucra dos operaciones distintas: (1) la obtención de la derivada covariante de V y (2) la contracción tensorial con el vector U:



Expandiendo la sumatoria múltiple en la operación de transporte paralelo que estamos considerando, llevada a cabo a lo largo de e1, tenemos entonces:



U1Vα;1 = 0

Aquí podemos aplicar directamente la definición de la derivada covariante a Vα (usaremos la notación de la coma para denotar la diferenciación parcial con respecto a la coordenada x1:

U1(Vα,1 + Γαμ1Vμ) = 0

Puesto que la trayectoria (y consecuentemente la tangente a la trayectoria) a lo largo de la coordenada x1 no es nula, entonces el factor entre los paréntesis debe de serlo:

Vα,1 + Γαμ1Vμ = 0

Vα,1 = - Γαμ1Vμ

o bien, explícitamente:



Con esto, si llevamos a cabo una integración de cada una de las componentes de V = (Vα) desde el punto A hasta el punto B:



tenemos entonces lo siguiente con el resultado que hemos obtenido:



Procediendo del mismo modo, obtenemos lo siguiente para la ruta que lleva mediante transporte paralelo al vector V desde el punto B hasta el punto C:



Para la ruta que lleva mediante transporte paralelo al vector V desde el punto C hasta el punto D tenemos lo siguiente:



Y por último, la ruta que lleva mediante transporte paralelo al vector V desde el punto D hasta el punto A está dada por la siguiente relación:



Obsérvese que, intencionalmente, el vector Vα(A) que parte del punto A y el vector Vα(A) que llega al punto A después de un recorrido completo se han simbolizado de color distinto, uno azul y el otro rojo. Esto se debe a que después de recorrer el circuito completo el vector V apuntará a una dirección diferente en relación a la dirección a la cual apuntaba al iniciar el recorrido en virtud de haberse hecho el recorrido sobre una superficie curva (como la superficie de una esfera). La única forma posible en la cual el vector V puede ser exactamente el mismo después del recorrido A-B-C-D mediante el transporte paralelo es que el “parche de coordenadas” corresponda a una superficie plana.

Si llamamos al cambio neto en el vector V = (Vα) como δVα, definido de la siguiente manera:

δVα = Vα(A) - Vα(A)

entonces este cambio neto se puede obtener sumando todas las integrales obtenidas arriba:



Además de haberse sumado los términos, se ha llevado a cabo una inversión en los límites de las integrales de la ruta 3 (de C a D) y de la ruta 4 (de D a A), lo cual tiene como efecto matemático la inversión de signos, y se han reacomodado las integrales para que el siguiente paso sea más obvio.

A primera vista, se antoja de inmediato una cancelación de los términos. La integral de la ruta 1 (de A a B) puesta en color azul y con signo negativo parece que puede ser cancelada por la integral de la ruta 3 (de C a D) puesta en color rojo, de signo positivo. Lo mismo puede decirse para el otro par de integrales. Sin embargo, para que pueda efectuarse dicha cancelación, se requiere para el primer par que tanto Γαμ1 como Vμ sean términos constantes, y no lo son. Serían constantes en un espacio-tiempo plano. Pero ciertamente no son constantes en un espacio-tiempo curvo. Puesto de otra manera:



Y lo mismo puede decirse para el otro par de integrales.

Ante esta situación, podemos recurrir a una aproximación de primer orden mediante una serie de Taylor-McLaurin, la cual para una función F de dos variables x1 y x2 es la siguiente cuando es desarrollada en torno a un punto P(x1,x2) = P(m,n):



Lo anterior lo podemos escribir de la siguiente manera (se recuerda que los super-índices no son exponentes, son usados para denotar los componentes contravariantes de un vector):



Descartando los términos de orden superior, de esta expansión en serie de Taylor-MacLaurin obtenemos la siguiente expresión cuando la coordenada x1 se mantiene constante (esto ocurre al llevar a cabo el transporte paralelo del vector V del punto A al punto B, y del punto C al punto D):



Y de la misma manera obtenemos la siguiente expresión cuando la coordenada x2 se mantiene constante (esto ocurre al llevar a cabo el transporte paralelo del vector V del punto B al punto C, y del punto D al punto A):



De este modo, podemos obtener la siguiente aproximación a un primer orden a la variación neta del vector V al llevarse a cabo la operación de transporte paralelo :



Podemos sacar fuera de cada una de estas integrales lo que no es afectado por el proceso de integración de acuerdo con la variable que está siendo integrada:



Las dos integrales son triviales, y llevándolas a cabo tenemos lo siguiente:



Factorizando y reagrupando:



El siguiente paso consiste en tomar las diferenciales aplicando la regla de Leibniz para la diferencial del producto de dos funciones:



Podemos simplificar esto eliminando las derivadas de Vα utilizando para ello el resultado derivado al principio usando además su equivalente reemplazando el índice 1 con un índice 2:



De este modo, obtenemos lo siguiente, usando la notación de la coma para indicar diferenciación ordinaria:

δVα = δa δb [Γαμ1,2 - Γαμ2,1 + Γασ2 Γσμ1 - Γασ1 Γσμ2] Vμ

En el 4-espacio de la Relatividad General, esta expresión representa cuatro ecuaciones en virtud de que el vector V es un 4-vector. El índice μ que tenemos puesto en el vector V en el lado derecho es un índice libre que nos permite representar cualquiera de las cuatro componentes del vector trasladado. También en el lado derecho de la ecuación tenemos el producto δaδb, el cual podemos tomar como el área del “parche de coordenadas”. Ahora bien, los índices 1 y 2 aparecen en esta expresión porque la ruta de recorrido fue seleccionada para ser llevada a cabo sobre una superficie descrita por las coordenadas x1 y x2. Pero igual podríamos haber seleccionado otra ruta de recorrido, como aquella en la cual utilizamos las coordenadas x1 y x3 y consecuentemente aparecerán los índices 1 y 3 en la expresión, o como aquella en la cual utilizamos las coordenadas x3 y x4 y consecuentemente aparecerán los índices 3 y 4. La expresión toda es antisimétrica en los índices 1 y 2 porque el cambio δVα en el vector V tras efectuarse la operación de transporte paralelo debe tener el signo opuesto si uno lleva a cabo el recorrido en la dirección contraria (en el lenguaje del Cálculo de las Formas Diferenciales conocido también como el Cálculo Exterior esto se refleja en la anticonmutatividad de la operación cuña uΛv = - vΛu). Si en lugar de limitarnos al uso de las coordenadas x1 y x2 modificamos ligeramente la expresión obtenida para hacerla válida usando líneas coordenadas generalizadas xp y xq en un espacio N-dimensional, obtenemos lo siguiente:

δVα = δa δb [Γαμp,q - Γαμq,p + Γασq Γσμp - Γασp Γσμq] Vμ

Si la longitud en el recorrido a lo largo de una de las dos coordenadas utilizadas para el viaje del vector V es aumentado en un factor de dos, esto también aumenta el área del “parche de coordenadas” δaδb en un factor de dos, doblando el valor de δVα. Esto significa que δVα depende linealmente de (δa)ep y de (δb)eq (aquí ep y eq son los vectores unitarios de base tangentes a las líneas de coordenadas seleccionadas para llevar a cabo el viaje), y obviamente también depende del 4-vector Vμ. Si tomamos el término entre paréntesis y lo definimos como:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ

entonces tenemos los componentes de un tensor R al cual si se le suministran como argumentos el vector V (o mejor dicho, los componentes Vμ del vector V a través del índice μ) así como (δa)ep, y de (δb)eq a través de los índices β y ν nos proporcionará δVα, el cambio en el componente α del vector V cuando se le aplica una operación de transporte paralelo sobre una trayectoria en una superficie curva. Esto es precisamente lo que nos fija geométricamente el tensor de Riemann.

PROBLEMA: Demostrar la segunda identidad de Bianchi:

Rαβμν;λ + Rαβλμ;ν + Rαβνλ;μ = 0

Podemos intentar llevar a cabo directamente la diferenciación covariante ya sea sobre el tensor de Riemann de primer género o sobre el tensor de Riemann de segundo género, involucrando con ello a los símbolos de Christoffel que nos resultan como consecuencia de la diferenciación covariante. Pero tal cosa no es necesaria, porque podemos llevar a cabo una diferenciación ordinaria si utilizamos primero un marco inercial (Lorentziano) de coordenadas. Tomando la relación correspondiente al tensor de Riemann de primer género:

Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2

y llevando a cabo la diferenciación ordinaria con respecto al parámetro λ tenemos lo siguiente:

Rαβμν,λ = (gαν,βμλ - gαμ,βνλ + gβμ,ανλ - gβν,αμλ)/2

De esta relación, usando el hecho de que el tensor métrico g es simétrico ( gab = gba) y el hecho de que las derivadas parciales ordinarias conmutan, obtenemos la segunda identidad de Bianchi.

PROBLEMA: Sabiendo de antemano que en una 2-superficie la curvatura Riemanniana-Gaussiana K está definida de la siguiente manera:



siendo g el determinante del tensor métrico g, obtener la expresión correspondiente a K para la siguiente métrica:



Del elemento de línea ds² obtenemos los siguientes componentes que corresponden al tensor métrico g:

g11 = 1/(x1) ²___g22 = 1/(x1) ²

g12 = g21 = 0

así como los siguientes componentes que corresponden al tensor métrico conjugado g-1:

g11 = (x1) ²___g22 = 1/(x1) ²

g12 = g21 = 0

Con esto podemos obtener los símbolos de Christoffel que nos permitirán obtener al componente del tensor de Riemann que estamos buscando, R1212.

Cuando los tres índices del símbolo de Christoffel son iguales como en el caso de Γ111, tenemos que recurrir a la relación explícita sin haber atajos posibles:

Γαμν = gαβ (- gμν,β + gνβ,μ + gμβ,ν)/2

Γαμν = gαβ (- ∂gμν/∂xβ + ∂gνβ/∂xμ + ∂gμβ/∂xν)/2

Entonces:

Γ111 = g11 (- ∂g11/∂x1 + ∂g11/∂x1 + ∂g11/∂x1)/2

Γ111 = {(x1) ²} {∂g11/∂x1}/2

Γ111 = {(x1) ²} {- 2 (x1) -3}/2



Siendo la métrica una métrica diagonal, sin componentes “cruzados”, podemos llevar a cabo la evaluación de los otros símbolos de Christoffel mediante las relaciones simplificadas para métricas diagonales que ya obtuvimos en una entrada previa, las cuales son:



Empezamos con la evaluación de Γ122:



A continuación llevamos a cabo la evaluación del símbolo de Christoffel Γ221 que por la propiedad de simetría de los símbolos de Christoffel de segundo género es igual a Γ212:



Como no requerimos el símbolo de Christoffel Γ222 para la obtención de R1212, no se llevará a cabo aquí la evaluación del mismo.

Para la obtención de R1212 utilizamos la relación general que nos dá los componentes del tensor de Riemann:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ

la cual en este caso se nos convierte en:

R1212 = Γ122,1 - Γ121,2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21

R1212 = ∂Γ122/∂x1 - ∂Γ121/∂x2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21

La evaluación detallada se muestra a continuación:





En cuanto al determinante del tensor métrico, g, este será:

g = g11 g22 - g12 g21

Siendo g12 = g21 se tiene entonces:

g = g11 g22 - (g12

La evaluación de la curvatura K en base a la fórmula dada es la siguiente:



Finalmente:



Esta curvatura no depende de las coordenadas, y por lo tanto la superficie descrita por esta métrica es una superficie de curvatura constante. Una curvatura igual a cero corresponde a la curvatura de una superficie plana. Una curvatura positiva constante corresponde a una superficie como la de la esfera. Y una superficie de curvatura negativa constante corresponde a algo como un hiperboloide.

En el espacio-tiempo de 4 dimensiones, de las 20 componentes del tensor de Riemann la esencia de diez de ellas es capturada por el tensor de Ricci obtenido mediante una contracción del tensor de Riemann que será discutida posteriormente, mientras que la esencia de las diez restantes es capturada por otro tensor conocido como el tensor de Weyl:



En el manejo que se llevará a cabo del tensor de Riemann en otras entradas posteriores, tanto el tensor de Ricci como el escalar de Ricci que se pueden considerar como trazas del tensor de Riemann (el concepto de traza se toma prestado de la definición dada a la traza de la diagonal principal de una matriz como la suma de los elementos de la diagonal principal) obtenidas mediante el proceso de contracción tensorial. En ocasiones es deseable considerar por separado aquellas partes del tensor de Riemann que son removidas por el tensor de Ricci y el escalar de Ricci. Para ello inventamos el tensor de Weyl que es básicamente el tensor de Riemann con todas sus contracciones posibles removidas. Usando la notación de paréntesis cuadrados en los sub-índices que representa simbólicamente una antisimetrización:



el tensor de Weyl queda definido de la siguiente manera (la definición que se dé al tensor de Weyl depende del número de dimensiones, en este caso suponemos una dimensión de cuatro):



En la práctica, la obtención de los componentes del tensor de Weyl resulta mucho más fácil si simplemente obtenemos primero todos los componentes del tensor de Ricci, y removemos estos últimos de los componentes del tensor de Riemann, en lugar de andar usando fórmulas demasiado elaboradas.