miércoles, 18 de marzo de 2009

La derivada absoluta

En la entrada anterior titulada “El transporte paralelo”, se definió a la derivada absoluta de un tensor T = (Ti) como la contracción de la derivada covariante de dicho tensor (Ti; q) con otro tensor dxq/dt que sea un vector tangente a una curva espacial. El resultado de estas operaciones es un tensor del mismo tipo y del mismo orden que el tensor original (contravariante de orden uno). Dada la importancia del concepto, llevaremos a cabo aquí algunos ejercicios de práctica para familiarizarnos mejor con las propiedades y las aplicaciones de la derivada absoluta que nos permiten llevar a cabo la tensorialización de la física clásica, trasladando posteriormente los resultados hacia la física relativista.

La metodología para la obtención de la derivada absoluta es la misma en todos los casos:

a) Se toma la derivada covariante del tensor proporcionado.

b) Se escribe la expresión que denota a las componentes de la tangente con la cual se llevará a cabo la contracción.

c) Se lleva a cabo la contracción de ambas aplicando la convención de sumación para índices repetidos.

PROBLEMA: Obténganse las derivadas absolutas de cada uno de los siguientes tensores, los cuales suponemos que son funciones diferenciales de la variable t:

1) La invariante Φ

2) Tk

3) Tj

(1) Empezando con Φ, podemos recurrir a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante de Φ como Φ;q; y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de partida usual para la obtención de una derivada absoluta:



Si Φ es una invariante, entonces al tomar la derivada covariante del mismo los símbolos de Christoffel son todos iguales a cero, con lo cual Φ,q se nos convierte simplemente en ∂Φ/∂xq (el semicolon va hacia una coma):



Entonces lo que tenemos para llevar a cabo la operación de contracción, sumando sobre los índices repetidos, es lo siguiente:


Pero por la regla de la cadena, lo que tenemos en el lado derecho es simplemente la derivada ordinaria de Φ con respecto a t, o sea dΦ/dt. Entonces:



En este caso, la derivada absoluta viene siendo igual a la derivada ordinaria.

(2) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante del tensor covariante Tk como Tk;q; y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de partida usual para la obtención de una derivada absoluta:



El siguiente paso consiste en implementar la derivada covariante del tensor covariante T = (Tk):



Removiendo paréntesis y simplificando:



(3) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante del tensor contravariante Tj como Tj;q designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, con lo cual las operaciones que tenemos que llevar a cabo aparecen en el punto de inicio usual para la obtención de una derivada absoluta:



Tomamos ahora la derivada covariante del tensor contravariante T = (Tj):



Removiendo paréntesis:



Simplificando:



PROBLEMA: Obténgase la derivada absoluta del tensor contravariante de orden dos U= (Uab).

Simbolizando a la derivada covariante del tensor contravariante de orden dos Uab como Uab;q y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:



Tomando la derivada covariante de U y efectuando la contracción tensorial con dxq/dt obtenemos:



PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de orden dos, el cual suponemos que es una función diferenciable de la variable t:



Simbolizando a la derivada covariante del tensor mixto Tjk como Tjk;q y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:



El siguiente paso consiste en tomar la derivada covariante del tensor mixto, lo cual nos introduce a los símbolos de Christoffel dándonos lo siguiente:



Removiendo los paréntesis y simplificando:



PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de quinto orden, el cual suponemos que es una función diferenciable de la variable t:



Simbolizando a la derivada covariante del tensor mixto Tjklmn como Tjklmn;q y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:



La expansión de la derivada covariante del tensor mixto de quinto orden nos conduce al siguiente paso intermedio:



Removiendo el paréntesis y simplificando el primer término con la ayuda de la regla de la cadena llegamos a la siguiente respuesta final:



PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico g = (gjk) es igual a cero.

La derivada absoluta del tensor métrico está dada por la relación:



Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico (resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor métrico es igual a cero:



PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico conjugado g-1: = (gjk) es igual a cero.

La derivada absoluta del tensor métrico conjugado está dada por la relación:


Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico conjugado (resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor métrico conjugado es igual a cero:



PROBLEMA: Demostrar que la derivada absoluta del tensor delta Kronecker δ = (δjk) es igual a cero.

La derivada absoluta del tensor delta Kronecker está dada por la relación:



Pero ya se demostró en una entrada anterior que la derivada covariante del tensor delta Kronecker (resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor delta Kronecker es igual a cero:



PROBLEMA: En el cálculo diferencial ordinario, el diferencial del producto de dos funciones u y v es igual al producto de la primera función u por la diferencial dv de la segunda más la segunda función v por la diferencial du de la primera:

d(uv) = udv + vdu

Esta regla es conocida como la regla de Leibniz. Demostrar que para la derivada absoluta también tenemos una regla similar.

En el cálculo tensorial, las expresiones para las funciones u y v se convierten en tensores T y S. Por definición de la derivada absoluta, la derivada absoluta del producto de los tensores T y S será:



en donde se ha utilizado la notación del semicolon para indicar la toma de la derivada covariante con respecto a la coordenada xk.

En una entrada previa ya se demostró la aplicabilidad de la regla de Leibniz al tomar la derivada covariante del producto de dos tensores. Aplicando dicha regla aquí en el lado derecho de la ecuación, tenemos entonces lo siguiente:



A continuación removemos los paréntesis introduciendo a dxk/dt de una manera que nos servirá para la simplificación posterior:



No cuesta trabajo reconocer lo que tenemos en el lado derecho. En el primer término tenemos a la derivada absoluta del tensor T multiplicada por el tensor S. Y en el segundo término tenemos al tensor T multiplicado por la derivada absoluta del tensor S:



Esta es precisamente la regla de Leibniz, aplicada en el caso de la derivada absoluta.

PROBLEMA: Demostrar que al tomarse la derivada absoluta de un producto de tensores, tanto el tensor métrico como el tensor métrico conjugado pueden tratarse como si fuesen constantes.

Si tomamos la derivada absoluta del tensor métrico g estando multiplicado por un tensor contravariante T de primer orden, podemos ver en el siguiente desarrollo en el cual aplicamos la regla de Leibniz y aplicamos también el hecho de que la derivada absoluta del tensor métrico es igual a cero:



que el tensor métrico g puede tratarse como si fuese una constante al evaluar la derivada absoluta de un producto de tensores.

En el caso del tensor métrico conjugado se logra el mismo resultado siguiendo el mismo procedimiento:



De la misma manera, obtenemos el resultado de que el tensor delta Kronecker puede tratarse como si fuese una constante al momento de tomar una derivada absoluta.

En la diferenciación absoluta, tanto el tensor métrico como el tensor métrico conjugado como el tensor delta Kronecker pueden tratarse como si fuesen constantes.

PROBLEMA: Obtener la siguiente derivada absoluta del producto de los tensores U y V:



En este problema podemos utilizar ventajosamente el resultado del problema anterior aplicando la regla de Leibniz:



Aplicamos ahora en cada término la definición de lo que es la derivada absoluta:



La expansión en cada término de la derivada covariante nos conduce al resultado final:



PROBLEMA: Demostrar que la velocidad instantánea de una partícula es un tensor de orden uno.

Definamos un sistema de coordenadas utilizando super-índices, de modo tal que la posición de la partícula en un espacio tri-dimensional esté especificada por el vector posición x = (xk). Clásicamente, en este sistema de coordenadas, la velocidad instantánea de la partícula será el vector velocidad v = (vk) dado por:



En otro sistema de coordenadas x = (xp). la velocidad instantánea v = (vp) de la misma partícula estará dada por:



Si teniendo a la mano la velocidad instantánea v = (vk) queremos determinar la velocidad instantánea en otro sistema de coordenadas alterno, la relación de transformación para lograrlo es muy sencilla, ya que está dada por la regla de la cadena:



Pero esta es precisamente la definición matemática de un tensor contravariante de orden uno.

Si en vez de un sistema de coordenadas utilizando super-índices hubiéramos usado un sistema de coordenadas con sub-índices, el resultado habría sido casi el mismo, habríamos obtenido un tensor también de orden uno, pero covariante, sin cambio alguno en el significado físico.

Se concluye que la velocidad instantánea de una partícula es un tensor de orden uno.

Clásicamente, la definición de la aceleración instantánea está dada por la relación a = dv/dt. El problema con esta definición de aceleración es que no es invariante bajo una transformación de coordenadas. No hay forma en que la derivada ordinaria de la velocidad con respecto al tiempo se pueda se pueda hacer invariante bajo una transformación de coordenadas, o lo que es lo mismo, la definición clásica de aceleración instantánea no es un tensor.

PROBLEMA: Demostrar que la aceleración, definida clásicamente como la derivada de la velocidad instantánea de un objeto con respecto al tiempo, no es un tensor.

A continuación, tenemos en el lado izquierdo la expresión para la aceleración de un objeto medida en el sistema de coordenadas x = (xk) = (x1,x2,x3), y tenemos en el lado derecho la expresión para la aceleración del mismo objeto medida en el sistema de coordenadas x = (xj) = (x1,x2,x3)



No existe forma alguna con la cual podamos “conectar” matemáticamente estas dos expresiones de segundo orden de modo tal que una se pueda transformar en la otra de acuerdo con la definición del tensor.

Se concluye que la definición clásica de la aceleración instantánea que se enseña en los cursos elementales de física y en los cursos de Análisis Vectorial no es una invariante bajo un cambio de sistema de coordenadas.

Sin embargo, hay una forma muy fácil de redefinir el concepto de aceleración para que esta pueda ser también invariante bajo un cambio en un sistema de coordenadas, y esta consiste simplemente en tomar la derivada absoluta de la velocidad:



Esta es precisamente una de las principales motivaciones para el desarrollo del cálculo tensorial o “cálculo diferencial absoluto”. Aún si la Teoría de la Relatividad nunca hubiese existido por no haber nacido aún Einstein u otro científico que la descubriera, el interés en poder obtener definiciones físicas válidas dentro de cualquier sistema de coordenadas habría sido motivación suficiente para desarrollar esta herramienta matemática. La obtención de la derivada absoluta justifica con creces el tiempo invertido en el desarrollo de los nuevos conceptos que hemos estudiado. Estamos habilitados ya para poder llevar a cabo toda la tensorialización de la física.

PROBLEMA: Obtener una expresión para la aceleración instantánea de un objeto definida de modo tal que que tenga las propiedades de un tensor.

Empezaremos con una nueva definición de la aceleración a = (ak) definiéndola como la derivada absoluta de la velocidad con respecto al tiempo:



Aplicaremos ahora de modo riguroso la definición de la derivada absoluta tal y como se ha especificado arriba, definida como la derivada covariante (de la velocidad en este caso) a lo largo de la trayectoria sobre la cual se lleva a cabo el movimiento mediante una operación de contracción tensorial:



Expandiendo la derivada covariante tenemos entonces:



Como la velocidad instantánea v = (vk) = (dxk/dt) sí es un tensor, podemos reemplazar esta expresión en el primer término obteniendo así:



En esta última expresión se ha hecho un ligero cambio en el super-índice s de vs renombrándolo como p haciendo lo mismo en el símbolo de Christoffel para que no se pierda la sumación requerida por la convención de sumación para índices repetidos. Haciendo un intercambio en los sub-índices del símbolo de Christoffel usando la propiedad de simetría de dicho símbolo, y escribiendo a vp en su forma explícita como la derivada de la posición con respecto al tiempo, llegamos a nuestra nueva definición de aceleración, tensorial en el pleno sentido de la palabra:



Escrita de esta manera, la aceleración instantánea nos debe resultar familiar como una ecuación diferencial de la geodésica, lo cual era de esperarse porque el móvil se está acelerando precisamente a lo largo de la curva geodésica sobre la cual se está desplazando de un punto a otro.

Una vez definida tensorialmente la aceleración instantánea, podemos revisar una de las leyes más veneradas de la física clásica, la segunda ley de Newton, que nos dice que “la fuerza es igual al producto de la masa de un cuerpo multiplicada por la aceleración que dicha fuerza produce en dicho cuerpo”.

PROBLEMA: Expresar la segunda ley de Newton en forma tensorial.

La segunda ley de Newton para una masa M que permanece invariante y es independiente del tiempo, escrita tanto en notación vectorial compacta como en notación de componentes, es la siguiente:



Obviamente, esto no es algo que pueda permanecer invariante en forma bajo un cambio de coordenadas, porque para que ello ocurra la derivada ordinaria tienen que ser reemplazadas por la derivada absoluta. Podemos utilizar el resultado del problema anterior para escribir la ley de Newton en forma tensorial:



Esta fórmula es válida dentro de la física clásica pre-relativista. Pero si vamos a hacer la transición hacia la física relativista, tendremos que contender con el hecho de que, para fines teóricos, en una gran mayoría de los casos la definición de fuerza dinámica ha pasado a ser una pieza de museo, empezando por el hecho de que la masa M de un cuerpo en movimiento deja de ser invariante, sumado a la eliminación por completo del concepto de la fuerza de atracción gravitacional entre dos cuerpos como causante del movimiento de dichos cuerpos en el espacio libre. De cualquier manera, seguiremos requiriendo del concepto de la derivada absoluta, el cual volverá a mostrarnos su cara en cuanto veamos la derivación desde el punto de vista geométrico del tensor de curvatura de Riemann.

El concepto de la derivada absoluta nos lleva de modo casi natural a otro concepto importante en las matemáticas puras: el álgebra Lie. Considerando a dxβ/dt como un vector velocidad U = (Uβ) en un espacio N-dimensional, para un tensor V = (Vα) podemos escribir:



Esta derivada absoluta la podemos interpretar como la componente α de la derivada covariante del vector V a lo largo de la trayectoria trazada por el vector tangente U, representada en algunos textos como:



PROBLEMA: Si tomamos la definición fundamental de la derivada absoluta de un tensor V a lo largo de una trayectoria curva cuya tangente es el vector U, escrita en notación de componentes como:

UβVαβ

e invertimos los papeles de U y V definiendo la siguiente derivada absoluta de U:

VβUαβ

y restamos el uno del otro:

UβVαβ - VβUαβ

tenemos entonces la definición de algo nuevo que se simboliza como:



Demostrar que:



La demostración en este caso es trivial. Invirtiendo los papeles de U y V dentro del corchete se tiene para un componente α:



Si esta relación es cierta para todo componente α de los tensores de primer orden U y V, entonces debe ser cierta en lo general, y podemos escribir:

[U,V] = - [V,U]

Esto que hemos definido sobre un par de campos vectoriales se conoce como el corchete Lie (Lie bracket), en honor al matemático Sophus Lie que lo concibió por vez primera, y nos conduce directamente al estudio de un importante campo de las matemáticas. El corchete Lie toma dos campos tensoriales (vectoriales) U y V, y define a partir de los mismos un nuevo campo tensorial (vectorial) [U,V] que tiene propiedades interesantes. Más aún, a lo que acabamos de definir se le puede dar una interpretación como una derivada Lie simbolizada como:



Lo más relevante para nosotros es que a través del álgebra Lie y de la derivada Lie tenemos a la mano la definición de un campo tensorial en donde no se requieren los símbolos de Christoffel. Es importante entender, físicamente hablando, lo que hemos llevado a cabo. La ruta o trayectoria a lo largo de la cual se toma la derivada absoluta ha sido reemplazada por una familia completa (infinita) de trayectorias. Ha sido reemplazada, en efecto, por un campo vectorial. La derivada Lie evalúa esencialmente el cambio de un campo vectorial a lo largo del flujo de otro campo vectorial.

Si partimos de la definición convencional del gradiente mediante la cual con el operador diferencial nabla (∇) aplicado sobre un campo escalar f en un espacio N-dimensional:

f = f (x1,x2,x3,...,xα,...,xN)

obtenemos a partir del campo escalar f un campo vectorial :



conocido como el gradiente del campo escalar f, entonces podemos entresacar un componente α entre cualesquiera de sus demás componentes con la siguiente notación simbólica:



Tomemos ahora el componente α de otro vector U definido sobre el mismo espacio N-dimensional (con una misma cantidad de componentes o coordenadas) y multipliquémoslo por la igualdad anterior, obteniendo así:



Este componente α lo podemos representar simbólicamente de la siguiente manera en notación vectorial más compacta:



Ahora bien, si tomamos el correspondiente componente α de un tercer campo vectorial V y lo multiplicamos por lo anterior, el componente producido se puede representar de la manera siguiente:



A continuación tenemos en forma más explícita lo que estamos definiendo con esto último:



Dejemos temporalmente esto a un lado y volvamos a la definición del corchete Lie en notación de componentes:



Si en vez del campo vectorial V metemos en el corchete Lie el producto del campo escalar f por el mismo campo vectorial V, entonces tendremos lo siguiente en el lado derecho de la igualdad:



Desarrollando la derivada del primer término de acuerdo con la regla de Leibniz, tenemos:



Reacomodando y reagrupando los términos:



Se han renombrado los índices en el último término teniendo en cuenta que son índices monigote al fin y al cabo. Si observamos detenidamente, podemos ver que lo que tenemos en el primer término es un corchete Lie, el corchete Lie [U,V], en notación de componentes. Y el segundo término puede ser substituído por el resultado intermedio que habíamos dejado pendiente arriba. Esto nos lleva a lo siguiente:



Pero si esto es válido para todos y cada uno de los componentes α desde α = 1 hasta α = N, entonces podemos prescindir de la notación de componentes para llevar a cabo la representación simbólica de una manera más compacta:



Ahora bien, en el lado izquierdo de esta igualdad tenemos básicamente lo que podemos considerar como la derivada Lie de f V con respecto a U:



Y en el lado derecho de la igualdad tenemos en el primer término la derivada Lie de V con respecto a U que en notación Lie podemos representar como:



Por último, en el tercer término del lado derecho de la igualdad, tenemos lo que podemos definir como la derivada Lie del campo escalar f con respecto al campo vectorial U, representado de la siguiente manera:



Es así como usando notación Lie podemos escribir el resultado obtenido anteriormente de la siguiente manera en la forma de una regla de Leibniz para el operador derivativo Lie:



Los resultados que hemos obtenido nos muestran que es posible definir para campos tensoriales (vectoriales) en un espacio N-dimensional un operador derivativo sin necesidad de tener que recurrir a coeficientes de conexión (símbolos de Christoffel) o inclusive a una métrica, siendo por lo tanto el álgebra Lie y la derivada Lie conceptos de naturaleza muy fundamental.

Varias áreas de la Relatividad General se pueden estudiar y desarrollar con la ayuda de la derivada Lie, para lo cual hay que pagar el costo ineludible de una mayor sofisticación matemática. Sin embargo, esto no se cubrirá aquí más a fondo por no ser absolutamente indispensable para nuestros propósitos.