Efectivamente, en un plano de dos dimensiones la menor distancia entre dos puntos P y Q cualesquiera es la recta que une a dichos puntos. En un espacio tridimensional, también la menor distancia entre dichos puntos P y Q será la recta que los une, y esa recta podemos imaginarla trazada sobre una superficie plana. Aunque nuestra intuición geométrica humana no nos ayude, podemos extender esta suposición hacia un espacio de más de tres dimensiones, elevándolo a la categoría de postulado, y de hecho podemos justificar tal suposición recurriendo a las herramientas del cálculo infinitesimal para encontrar la distancia mínima entre dos puntos en un espacio n-dimensional.
Pero la vieja afirmación Euclideana se nos viene abajo cuando consideramos una superficie curva, como la superficie de una pelota o la superficie de un cilindro. Consideremos primero la superficie de un cilindro. Un cilindro es una superficie que al igual que un rollo de papel puede ser desenrollada y extendida sobre un plano, y sobre la superficie del mismo cilindro cuando ha sido desenrollado la menor distancia entre dos puntos es la recta que une a dichos puntos:
Sin embargo, cuando volvemos a enrollar la superficie dándole un carácter curvo en un espacio tridimensional, aunque para una hormiga que esté caminando sobre dicha recta nada parece haber cambiado, para alguien que observa el enrollamiento la ruta más corta entre dos puntos está dada por la hélice que conecta a dichos puntos:
Y como era de esperarse, la longitud de la línea no ha cambiado nada. La longitud de la línea recta cuando el cilindro está desenrollado es exactamente la misma que cuando enrollamos el cilindro, por el hecho de que la longitud es una cantidad escalar. Sin embargo, la línea trazada sobre la superficie del cilindro tiene una curvatura que antes no existía cuando el cilindro estaba extendido sobre un plano. Esto es precisamente lo que ocurre cuando la superficie sobre la cual ocurre un movimiento es transformada de una superficie plana a una superficie curva.
En el caso de la superficie de una pelota esférica de futbol, desde la perspectiva de un observador externo la menor distancia entre dos puntos P y Q puestos sobre la superficie de la pelota no es la línea recta que une a los puntos puestos en dicha pelota trazada dicha línea a través de la pelota (lo cual requeriría perforar la pelota con un picahielos) sino el arco de círculo máximo que pasa por dichos puntos, al cual podemos llamar “la línea más derecha posible de todas” entre dichos puntos. Esta es la trayectoria que tomaría sobre la superficie de la pelota una cuerda elástica tensa estirada para poner sus extremos en los puntos P y Q. Para una hormiga que camina sobre la superficie de la pelota, y que por su tamaño no se dá cuenta de que camina sobre una superficie curva (del mismo modo que nosotros en nuestra experiencia cotidiana no nos damos cuenta de la redondez de la Tierra, razón por la cual hasta antes del descubrimiento de América muchos creían que la Tierra era plana), la distancia entre dos puntos P y Q cuando camina de frente y siempre hacia adelante sin desviarse hacia la derecha o hacia la izquierda es una línea recta; se requiere de un ser “superior” capaz de poder ver desde una perspectiva mucho más amplia esa superficie en la que habita la hormiga para darse cuenta de que si la hormiga pudiera perforar de alguna manera la superficie de la pelota podría encontrar una trayectoria más corta aún entre dichos puntos. Pero si no le es dado a la hormiga el poder llevar a cabo esta “perforación”, si está confinada a vivir y caminar toda su vida sobre la superficie de la pelota, jamás se dará cuenta de ello. De lo que no nos queda duda alguna es que también en la superficie de la pelota hay una infinitud de rutas posibles para llegar del punto P al punto Q, y de todas las rutas posibles hay una que le tomará a la hormiga el menor tiempo posible, la cual será la menor distancia entre los dos puntos de una superficie curva, “la curva más derecha posible” que podamos trazar entre dos puntos, a la cual designamos como la ruta geodésica o simplemente geodésica.
Expuesto lo anterior, podemos reformular el clásico enunciado de Euclides en una forma moderna más correcta:
“La menor distancia entre dos puntos es la geodésica que los une.”
En el espacio-tiempo plano de la Teoría Especial de la Relatividad, las geodésicas son líneas rectas para cualquier observador. Pero en el espacio-tiempo curvo de la Teoría General de la Relatividad, las geodésicas dejan de ser líneas rectas. Y nosotros estamos interesados en estudiar la naturaleza geométrica de esas geodésicas en un espacio-tiempo curvo en cuatro dimensiones porque en un espacio tal los cuerpos se mueven siguiendo rutas geodésicas. Puesto de otra manera:
Las trayectorias elípticas que siguen los planetas en sus movimientos de traslación alrededor del Sol son las rutas geodésicas que corresponden a un espacio-tiempo curvo.
Esto que se acaba de enunciar representa una ruptura total con la filosofía detrás del esquema de Newton que proclamaba la existencia de una fuerza invisible de atracción central F que era la que mantenía a la Luna en órbita alrededor de la Tierra impidiéndole salir disparada hacia el espacio exterior del mismo modo que se requiere de una fuerza central para mantener a un objeto girando en torno a nosotros en una trayectoria circular:
Una forma de mantener a un cuerpo en una trayectoria circular es, efectivamente, con la aplicación de una fuerza central que sea perpendicular a la dirección en la cual se está moviendo el cuerpo como en la ilustración de arriba. Pero otra forma de mantener a un objeto en una trayectoria circular sin necesidad de que exista una fuerza de atracción entre el objeto y el punto central en torno al cual está girando el objeto es restringiendo al cuerpo en movimiento a moverse sobre una superficie que es la que le dicta al objeto la trayectoria que debe seguir, como lo muestra la siguiente figura:
Estrictamente hablando, la anterior representación no transmite a plenitud la idea relativista detrás de los cuerpos desviándose de sus trayectorias rectilíneas debido a una curvatura en el espacio-tiempo, porque en el diagrama de arriba si bien se ha eliminado el concepto de una fuerza de atracción que provoca una desviación de la trayectoria rectilínea, la superficie hemisférica mostrada altera la trayectoria a través de una fuerza de contacto entre el objeto y la superficie hemisférica, aplicada por el contorno de la superficie sobre el objeto. En la Teoría de la Relatividad, el concepto de fuerza como causante de la gravedad ha sido eliminado por completo. La superficie curva existe, pero no es una superficie “sólida”, es una superficie dictada por la curvatura en el espacio-tiempo causada por la gravedad, es una superficie tan “sólida” (desde el punto de vista material) como puedan serlo el mismo tiempo y espacio.
Nos preguntamos ahora: si un cuerpo de masa m es libre para moverse inercialmente excepto que su movimiento esté restringido a llevarse a cabo en una superficie curva, ¿cuál es la curva trazada por el movimiento del cuerpo sobre dicha superficie? (Podemos imaginar al objeto totalmente cubierto de tinta con la cual va dejando un rastro de su trayectoria al recorrer la superficie curva.) De la física clásica el resultado viene siendo una geodésica de la superficie, una curva que representa la menor distancia posible, o bien “la curva más derecha posible”. Esto captura la esencia detrás de la propuesta de Einstein, la idea de que los cuerpos se mueven sobre una superficie cuatri-dimensional de un espacio-tiempo curvo siguiendo una ruta geodésica. En la física clásica tal y como fue desarrollada por Newton, un cuerpo se mueve libremente en el espacio en torno a otro objeto excepto que su movimiento aparenta estar restringido a llevarse a cabo dentro de una superficie bi-dimensional (el interior de una esfera o una elipse) empotrada en un espacio tri-dimensional tal y como lo tenemos arriba. Sin embargo, en la Teoría General de la Relatividad una masa se mueve libremente en el espacio-tiempo al estar en caída libre de modo tal que la gravedad actúa sobre ella a través de la curvatura del espacio-tiempo. En la física clásica, la trayectoria espacial de un cuerpo es la geodésica de lo que para nosotros parece ser el interior de una superficie bi-dimensional, trazando la curva de menor longitud posible sobre dicha superficie, mientras que en la Teoría General de la Relatividad la trayectoria es una trayectoria espacio-tiempo, la cual es una geodésica del espacio-tiempo que va trazando una curva de intervalo espacio-tiempo extremo en el espacio-tiempo. (Al utilizar la palabra extremo para designar al intervalo, estamos dejando abierta la posibilidad de que se pueda tratar de un mínimo o de un máximo como se acostumbra tener en los estudios introductorios de cálculo infinitesimal).
El concepto de los cuerpos moviéndose en el espacio siguiendo rutas geodésicas en el espacio-tiempo sin que exista una fuerza de atracción entre los mismos como lo suponía Newton parece haber sacado por completo fuera del panorama el papel que desempeña el cuerpo central como fuente de una fuerza de atracción gravitacional en base a la cantidad de masa M que contiene. Sin embargo, esto no es así, ya que si bien la fuerza invisible ha dejado de existir la curvatura en el espacio-tiempo es producida directamente por la masa M del cuerpo en torno al cual está girando su satélite. Entre mayor sea el contenido de masa M del cuerpo central así como su contenido de energía (esto ya no lo anticipó Newton), tanto mayor será la curvatura del espacio-tiempo. Si no hay masa en el espacio circundante, entonces un cuerpo cualquiera se mantendrá moviéndose en línea recta a velocidad constante, inercialmente. De este modo, el contenido total de masa sumado al contenido energético total de un cuerpo provoca una curvatura en su espacio-tiempo circundante que le dice a los cuerpos que se le aproximan la trayectoria que deben seguir, la forma en la que deben moverse, siguiendo rutas geodésicas. Esta idea la expresó Einstein en notación tensorial en octubre de 1915 de la siguiente manera:
R = 8πGT
En notación explícita (empleando índices) la ecuación se escribe como:
Rμν = 8πGTμν
en donde Rμν es el tensor de Ricci con el cual se representa la curvatura del espacio-tiempo, Tμν es el tensor energía-tensión, y G es la constante de gravitación universal. Sin embargo, no le llevó mucho tiempo a Einstein el darse cuenta de que la ecuación tensorial anterior, que representa un conjunto de ecuaciones, era incorrecta, ya que las ecuaciones resultaban ser inconsistentes con la conservación local de la energía-momentum a menos de que la densidad de la masa-energía-momentum del Universo fuese una cantidad constante. En otras palabras, un ladrillo, el aire e inclusive el vacío tenían que tener la misma densidad para que lo anterior fuese cierto. Esto requirió revisar el enunciado original, con una solución que resultó ser más que obvia, la cual fue publicada al mes siguiente, dándonos la ecuación tensorial fundamental de la Teoría General de la Relatividad:
que nos dice cómo la masa-energía nos provoca una curvatura en el espacio-tiempo cuatri-dimensional, en la cual R es el escalar de Ricci y gμν es el tensor métrico con el cual ya debemos estar familiarizados. Pero esta ecuación no nos dice cómo deben moverse los cuerpos en el espacio en proximidad el uno del otro. Para saberlo, Einstein especificó una segunda ecuación independiente de la primera que nos permite calcular las geodésicas que recorre un cuerpo en movimiento en un espacio-tiempo cuatri-dimensional curvo. Es la siguiente:
En esta ecuación, la cual también es una ecuación tensorial, tenemos la presencia de los símbolos de Christoffel Γabc.
Para poder llegar a la fórmula anterior, tenemos que hacer primero un repaso de algunos conceptos básicos del cálculo infinitesimal.
Sabemos del cálculo infinitesimal que en un espacio bi-dimensional Cartesiano (plano xy) la distancia entre dos puntos a(x1,y1)y b(x2,y2) cualesquiera (no necesariamente la ruta geodésica) está dada por la siguiente relación:
PROBLEMA.- ¿Cuál será la longitud de un arco descrito por la ecuación y = x3/2 desde x1.=.0 hasta x2.=.1?
La derivada de la función proporcionada es:
Aplicando la fórmula obtenemos lo siguiente:
Esta es la longitud del arco de curva que une los puntos a(x1,y1) = (0,0) y b(x2,y2)=(1,1), pero no es la geodésica entre dichos puntos. Aquí la geodésica es la línea recta que une a dichos puntos.
Introduciendo la variable tiempo, también podemos especificar la siguiente fórmula general para describir la longitud de una línea (recta o curva) en un espacio bi-dimensional:
Al introducir el tiempo como una variable independiente en la anterior fórmula para describir una línea (ya sea recta o curva) en un espacio plano, estamos recurriendo a lo que se conoce en matemáticas como ecuaciones paramétricas.
PROBLEMA.- Encontrar la longitud del arco de una curva descrita por las ecuaciones paramétricas x=t3 y y=t² situado entre los puntos (x1,y1) = (1,1) y (x2,y2) = (8,4).
En un espacio tri-dimensional, la descripción de una línea (ya sea recta o curva) por necesidad tiene que llevarse a cabo empleando ecuaciones paramétricas, y tienen que especificarse tres ecuaciones independientes, una para cada coordenada. A continuación tenemos un conjunto de ecuaciones que nos especifican la trayectoria de una partícula que viaja a lo largo de una línea recta conforme avanza el tiempo:
____x = 2 + 6t
____y = t
____z = -2 + 3t
Podemos ver la naturaleza rectilínea de este conjunto de ecuaciones con tres gráficas diferentes, una para la variable dependiente x en función de la variable independiente t, la otra para la variable y en función de la variable t, y y la otra para la variable z en función de la variable t.
Podemos extender fácilmente la fórmula usada para calcular la longitud de un arco en un plano bidimensional a una fórmula que nos permita calcular la longitud de un arco de curva tridimensional. Usando ecuaciones paramétricas, la expresión a ser usada será:
A modo de ejemplo, supóngase que se tienen las siguientes ecuaciones paramétricas que nos trazan una curva en el espacio tridimensional:
siendo a, b y c constantes numéricas. Podemos hacer esto un poco más claro metiéndole números al asunto. Supóngase que a.=.1, b.=.1 y c.=.2. En tal caso, se tiene el siguiente conjunto de ecuaciones:
Tomando las derivadas para el cálculo de la longitud del arco trazado desde t1.=.0 hasta t2.=.1, se tiene:
Por lo tanto, la longitud del arco de curva trazado desde t1.=.0 hasta t2.=.1 será:
Si hacemos una gráfica de la curva (puesto que la curva es tridimensional, lo mejor que se puede lograr aquí es una proyección sobre un plano intentando simular los ejes tridimensionales), vemos que las ecuaciones paramétricas describen una curva muy común, una hélice, como la siguiente:
El lector astuto se habrá percatado de que esta curva tridimensional es precisamente como la curva que se mostró arriba al principio de esta entrada conectando dos puntos marcados sobre la superficie de un cilindro.
Cualquiera diría que la línea comprendida entre los puntos t1 y t2 del ejemplo que se acaba de resolver con una longitud aproximada de 6.59 unidades no es la menor distancia posible entre dichos puntos, y argumentaría que la menor distancia posible entre tales puntos está dada por la recta que une dichos puntos. Puesto que las coordenadas rectangulares Cartesianas para cada punto son:
Para t1 = 0: (x1, y1, z1) = (1, 0, 0)
Para t2 = 0: (x2, y2, z2) = (0, 1, 2)
entonces, usando la conocida fórmula Pitagórica, la longitud de la línea recta que une tales puntos debe ser:
y efectivamente, una hormiga caminando sobre esta recta usaría menos de la mitad de su tiempo requerido para llegar de un punto a otro siguiendo el arco de curva tridimensional. Sin embargo, supóngase que la hélice del ejemplo es la ruta recorrida sobre un cilindro de acero sólido, impenetrable, no siendo posible “perforar” el cilindro. Entonces no queda más alternativa que seguir la ruta de la hélice o cualquier otra trayectoria que conecte los puntos t1 y t2. Intuitivamente, la hélice parece ser la ruta más corta sobre la superficie de un cilindro que conecte dos puntos cualesquiera marcados sobre la superficie del cilindro. En pocas palabras, la hélice parece ser la geodésica que conecta los puntos t1 y t2. Pero, ¿lo es? ¿Podemos demostrarlo? Veremos esto en mayor detalle un poco más abajo, pero antes, haremos una reflexión sobre lo que acabamos de ver.
Hemos tomado la fórmula que nos proporciona la longitud de un arco bidimensional en un plano, y la hemos extendido sin problema alguno para obtener una fórmula que nos proporciona la longitud de un arco tridimensional. Pero... ¿podemos hacer lo mismo tratándose de una curva cuatridimensional? De ser tal cosa posible, la definición tentativa para la longitud de un arco de una 4-curva sería la siguiente:
Obsérvese que estamos metiendo aquí las coordenadas del 4-vector espacio-tiempo de la teoría relativista. En la fórmula, se ha metido la constante c (la velocidad de la luz) para que la fórmula sea dimensionalmente correcta (todo medido en metros). Y para poder calcular algún tipo de derivadas, hemos metido un parámetro adicional, simbolizado como τ, a reserva de definir posteriormente dicho parámetro, aunque nuestra intuición nos sugiere que tal parámetro bien podría ser el tiempo local del observador viajero, el cual puesto que es medido por el observador que lleva su propio reloj siempre marchará al mismo ritmo.
Y si hablamos de rutas geodésicas en un espacio tridimensional, debe ser posible hablar de lo mismo en un espacio cuatridimensional. ¿Pero cómo las habremos de determinar? Tómese en cuenta que no hemos demostrado aún ni siquiera que la hélice sea la geodésica sobre la superficie de un cilindro en el espacio tridimensional. Obviamente, puesto que se trata de un mínimo (la ruta más corta entre dos puntos), tendremos que echar mano de las herramientas del cálculo infinitesimal, extendiéndolas hacia un espacio cuatridimensional.
Antes de continuar, repasemos el hecho de que el siguiente conjunto de ecuaciones definitivamente nos describen una línea curva trazada en un espacio bi-dimensional:
____x = t²
____y = 2t - t² + 5t
mientras que el siguiente conjunto de ecuaciones definitivamente nos describen una línea curva trazada en un espacio tri-dimensional:
____x = 2t
____y = 1+ t²
____z = 8 - t
Aparentemente, aquí tenemos una perspectiva gráfica sobre el espacio cuatri-dimensional relativista, ya que en el anterior conjunto de ecuaciones tenemos a las cuatro variables (x,y,z,t). Sin embargo, el problema es que las cuatro variables no son variables independientes, y una de ellas no está en la misma categoría que las otras tres. Tenemos a tres variables dependientes y a una variable independiente, siendo que en un espacio cuatri-dimensional puro ninguna de las variables debe estar privilegiada sobre la otra. Esto es lo que nos obligará a buscar otro tipo de enunciación matemática para poder especificar formalmente la determinación de la longitud de un arco de curva en el espacio cuatri-dimensional relativista. Y aquí es precisamente en donde entra el tensor métrico g = (gij) de 16 componentes.
En general, para poder describir el trazo que nos produce una curva en varias dimensiones, digamos cinco, necesitaremos recurrir forzosamente a ecuaciones paramétricas, con las cuales asociamos una n-pla de valores (posiciones) en las coordenadas (x0, x1, x2, x3, x4, ..., xn) a cada punto específico de la curva. Así, en el 5-espacio Cartesiano, si las ecuaciones paramétricas de una curva son:
____x0 = τ² + 1
____x1 = τ - 4
____x2 = 4 sen(τ)
____x3 = τ + 7
____x4 = 4 cos(τ)
entonces el punto de la curva para τ.=.0 estará posicionado en:
(x0, x1, x2, x3, x4) = (1, -4, 0, 7, 4)
No es necesario recurrir a visiones místicas en planos superiores de consciencia para tratar de imaginar el comportamiento de esta curva en un 5-espacio Cartesiano. Nos basta con proyectar sobre varios planos bi-dimensionales lo que ocurre para varios valores de τ para poder “ver” lo que está ocurriendo en las cinco dimensiones. En el plano (x2, x4) la curva estará dando vueltas interminables alrededor de un círculo de radio 2 con centro en el origen del 5-espacio Cartesiano. Y en el plano (x1, x3) la proyección de la curva sobre dicho plano nos indica que el móvil avanza allí en línea recta, mientras que en el plano (x0, x1) la curva sigue la trayectoria de una parábola. Para un 5-espacio Cartesiano hay un total de nueve planos (nueve posibles pares de combinaciones de las coordenadas), nueve proyecciones que juntas nos dan una idea general sobre la trayectoria y forma de la curva. Esto es algo así como una “visión de rayos X” con la cual si sacamos la placa del esqueleto de una persona de frente y otra placa de perfil, con ambas placas podemos hacer una reconstrucción parcial tridimensional del esqueleto. Pero podemos llevar esta estrategia más lejos aún, utilizando graficados tri-dimensionales. Hay nueve proyecciones estereográficas posibles con las cuales podemos “ver” mejor aún en cinco dimensiones. Y si recurrimos a una ilustración animada en donde vamos variando una proyección tridimensional conforme va aumentando o disminuyendo una de las otras dos variables manteniendo la quinta variable constante (ya hay programas de cómputo que pueden llevar esto a cabo) tenemos entonces cinco proyecciones estereográficas animadas con las cuales nos es posible “ver” mucho mejor la trayectoria de una curva en cinco dimensiones.
Hemos visto cómo “medir” la distancia entre dos puntos diferentes en un espacio multidimensional no necesariamente plano, pero hasta ahora no hemos visto cómo obtener la geodésica entre dichos puntos, la ruta más corta de todas las otras rutas alternas que se puedan trazar de un punto a otro. Para poder encontrar esa ruta óptima, para poder encontrar la geodésica en un espacio multidimensional, tenemos que recurrir a una rama de las matemáticas conocida como el cálculo de variaciones, en el cual la cantidad a ser minimizada (o maximizada) aparece como una integral. La determinación de los valores extremos (máximos o mínimos) de integrales cuyos integrandos contienen funciones desconocidas es precisamente la clase de problemas a los cuales está dirigido el cálculo de variaciones. El más sencillo de tales problemas consiste en la determinación de una función y = y(x) para la cual la integral
evaluada entre los puntos x0 = a y x1 = b adquiere su valor mínimo (obsérvese que con fines de simplificación notacional se ha simbolizado la derivada de y con respecto a x con una comilla, o sea y’). La función integrable F de las variables x, y y y’ se dá por conocida, por ejemplo:
en donde F = y√1 +(y’)². Al postularse el problema, la dependencia específica de y en x no está prefijada, y(x) es precisamente la función desconocida que queremos encontrar. Esto es lo que nos lleva a la derivación de la siguiente ecuación obtenida por primera vez por Euler (esta misma ecuación fue aplicada casi al mismo tiempo por Lagrange a la mecánica para formular sobre principios variacionales lo que hoy se conoce como dinámica Lagrangiana en la cual la función F es reemplazada por la letra L, lo que hoy conocemos como el Lagrangiano del sistema):
Pero antes de ver cómo podemos derivar de esta ecuación, consideremos primero un ejemplo de una aplicación de la misma.
PROBLEMA: Hallar la curva y = y(x) con y(0) = 0 y y(a) = b que minimice la longitud del arco que va del punto A(0,0) al punto B(a,b).
La longitud del arco en el plano Cartesiano x-y está dada por:
Aquí F = √1 +(y’)², y podemos aplicar de inmediato la ecuación de Euler, para lo cual evaluamos primero:
∂F/∂y = 0
y:
∂F/∂y’ = (½)(1/√1 +(y’)²) 2y’
∂F/∂y’ = y’ / √1 +(y’)²
Usamos ahora directamente la ecuación de Euler:
∂F/∂y - (d/dx)(∂F/∂y’) = 0
0 - (d/dx)(y’ / √1 +(y’)²) = 0
(d/dx)[y’ {1 + (y’)²}-½] = 0
0 - (d/dx)(y’ / √1 +(y’)²) = 0
(d/dx)[y’ {1 + (y’)²}-½] = 0
No es necesario tomar aquí la derivada con respecto a x. Para que lo que tenemos sea cierto, se requiere que el término entre corchetes sea constante, lo cual a su vez requiere que y’ = dy/dx en el denominador de la expresión también sea igual a una constante C, o sea:
Esto último es, desde luego, la ecuación de una línea recta. La curva extrema es por lo tanto una recta, y se confirma el dicho de Euclides de que en un plano (Euclideano) la menor distancia entre dos puntos es la recta que los une.
Habiendo visto el anterior ejemplo de la forma en la cual se aplica la ecuación de Euler para poder determinar la naturaleza de la ruta mínima entre dos puntos cualesquiera, estamos en mejores condiciones para poder entender cómo se lleva a cabo la derivación de dicha fórmula.
Considérese el siguiente diagrama:
En el diagrama, suponemos que la ruta óptima (la más corta de todas) para minimizar una integral I bajo cierta función y(x) es la de color rojo. En el mismo diagrama se han trazado dos rutas alternas de color verde que darían a la integral un valor mayor que el valor que obtendríamos recorriendo la ruta de color rojo. La diferencia entre cualquier otra curva y la ruta óptima es llamada la variación de y o δy. Sobre el eje horizontal se ha proyectado dicha variación de color ciano. Para la ruta óptima, la variación δy al recorrer una ruta desde el punto x0 hasta el punto x1 debe ser igual a cero. Cualquier otra ruta podemos describirla como una función desconocida η(x) así como con un factor de escala variable que llamaremos α y el cual nos dá la magnitud de la variación. La función η(x) es una función arbitraria excepto por el requerimiento de que todas las rutas alternas pasen también por los puntos x0.=.a y x1.=.b en donde la variación debe ser cero, o sea:
η(x0) = η(a) = 0
η(x1) = η(b) = 0
η(x1) = η(b) = 0
Entonces, si la curva óptima que extremiza (minimiza) a la integral es Y(x), cualquier otra ruta alterna estará dada por:
y(x) = Y(x) + αη(x)
Abreviaremos notacionalmente para simplicidad sin olvidar la dependencia sobre la variable x:
y = Y + αη
Tomando diferenciales con respecto a la variable x:
y’ = Y’ + αη’
La integral I a ser extremizada es la siguiente:
I = ∫F(x, y, y’) dx
o en mayor detalle introduciendo los parámetros de variación:
y la condición para obtener un valor extremo en α = 0, análoga a la derivada dy/dx igualada a cero en el cálculo infinitesimal ordinario será:
[∂I(α) /∂α]α = 0 = 0
Extremizamos (minimizamos) ahora la integral tomando la derivada de la integral I con respecto al parámetro α manteniendo todo lo demás constante:
I’(α) = ∂I(α) /∂α
Esto requiere llevar a cabo una diferenciación metiendo al símbolo ∂ dentro del símbolo ∫, o sea efectuando una diferenciación bajo el símbolo de la integral, lo cual podemos hacer en virtud de que la diferenciación la estamos llevando a cabo con respecto a la variable α y no la variable dx sobre la cual se efectúa la acción del integrando:
Por la regla de la diferenciación para funciones compuestas, tenemos la siguiente relación:
Usando las expresiones de arriba para ∂Y/∂α = η(x) y ∂Y’/∂α = η’(x), podemos escribir:
De este modo, la integral a ser extremizada es la siguiente:
Es evidente que en el punto extremo, haciendo α = 0, tendremos:
y = Y + αη = Y
y’ = Y’ + αη’ = Y’
y’ = Y’ + αη’ = Y’
Con esto, podemos expresar de la siguiente manera la integral que será llevada a cabo:
Separaremos temporalmente la integral en la suma de dos integrales para trabajar sobre el segundo término:
Al segundo término en esta integral se le puede aplicar una integración por partes:
Puesto que η(a) = η(b) = 0, la parte integrada es igual a cero, con lo cual:
Juntando esto nuevamente con el primer término de la integral original, tenemos entonces:
Para que esto sea cierto lo que tenemos dentro del paréntesis debe ser cero, ya que siendo η arbitrario si lo escogemos diferente de cero no hay otra forma de hacer que la expresión de la izquierda sea igual a cero más que igualando todo lo que hay dentro de los paréntesis a cero. Se concluye de lo anterior que:
Esta es la ecuación de Euler.
PROBLEMA: Demostrar que la geodésica sobre la superficie de un cilindro circular recto es una hélice.
El elemento de distancia en un espacio tri-dimensional está dado por:
ds² = (dx)² + (dy)² + (dz)²
o bien:
ds = √(dx)² + (dy)² + (dz)²
Para poder expresar el elemento de distancia en coordenadas cilíndricas recurrimos a las relaciones que conectan las coordenadas rectangulares Cartesianas (x,y,z) con las coordenadas cilíndricas (r,φ,z):
x = r cos φ
y = r sen φ
z = z
y = r sen φ
z = z
Puesto que estamos interesados en obtener la geodésica sobre la superficie de un cilindro, en este problema el radio r se mantendrá constante en todo momento sin ser objeto de variación alguna. Con esto en mente y tomando diferenciales en cada una de las tres relaciones anteriores obtenemos lo siguiente:
dx = - r sen φ dφ
dy = r cos φ dφ
dz = dz
dy = r cos φ dφ
dz = dz
Substituyendo estas diferenciales en la relación de la fórmula para el elemento de línea y llevando a cabo la integración sobre la trayectoria completa, tenemos entonces:
Obsérvese que en este último paso hemos sacado fuera a la diferencial dφ y hemos utilizado la notación de punto poniendo un punto encima de la variable z para así tener:
Esta variable z con un punto puesto encima debe ser tratada matemáticamente como si fuese una nueva variable.
Podemos identificar de inmediato dentro del integrando a la función F que debemos utilizar para aplicar la ecuación de Euler:
La ecuación de Euler en este caso será:
Puesto que ∂F/∂z = 0, la ecuación de Euler se nos reduce a:
Llevando a cabo la integración, obtenemos lo siguiente:
Despejando para la variable z con el punto encima:
Puesto que todo lo que está del lado derecho de la ecuación es una constante, esto significa que:
dz/dφ = constante
En pocas palabras, la geodésica entre dos puntos cualesquiera sobre la superficie de un cilindro está dada por la hélice que conecta dichos puntos. Hemos logrado lo que nos habíamos propuesto desde un principio. Hemos llegado así a la determinación formal de la geodésica sobre la superficie del cilindro con el cual empezamos esta discusión.
El siguiente paso consistirá en extender el concepto de la geodésica en un espacio tri-dimensional Euclideano hacia la geodésica en un espacio 4-dimensional propio de la Teoría de la Relatividad, el espacio-tiempo curvo. Para ello, podemos extender sin dificultad alguna el concepto de la ecuación de Euler usado para encontrar la longitud más corta sobre una superficie en un espacio de tres dimensiones (como lo es el caso de una esfera) hacia el espacio de cuatro dimensiones, obteniendo así la ecuación de la geodésica entre dos puntos cualesquiera de dicho espacio 4-dimensional. No hay nuevos principios matemáticos involucrados ni nuevas ideas, se trata únicamente de extender el concepto de la geodésica hacia un plano multi-dimensional. Es precisamente así como se obtiene la ecuación general de la geodésica en un espacio-tiempo curvo propio de la Teoría General de la Relatividad.
No hay que perder de vista el hecho de que la geodésica, por ser a fin de cuentas una distancia, un número medido en metros, kilómetros o millas, sin dirección y sentido, es algo que esperamos que permanezca invariable bajo cualquier transformación de coordenadas.