Physique et géométrie

Transcription

Physique et géométrie
Physique et géométrie
par
Boris KOLEV
Version du 22 janvier 2010
Résumé. — « div 𝑇 = 0 ; c’est la mécanique ! ». A partir de cette expression
attribuée à Einstein, Jean-Marie Souriau a formulé une équation universelle
𝑇 𝐷 = 0, vérifiée par la plupart des modèles de la mécanique des milieux
continus. Ce cours propose de présenter cette approche originale, élégante et
encore peu connue.
Note : le texte qui suit a été rédigé à l’occasion d’un cours de DEA donné à l’Université
de Provence en 2003-2004. Il ne s’agit pas d’un texte abouti mais de notes de cours.
E-mail : [email protected]
Page web : http://www.cmi.univ-mrs.fr/~kolev/
c Le texte « Physique et Géométrie » par Boris Kolev est mis à disposition selon les
○
termes de la licence Creative Commons Paternité-Pas d’Utilisation Commerciale-Pas de
Modification 2.0 France.
Table des matières
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 Géométrie différentielle
1.1 Fibrés vectoriels . . . . . . . . . . . . . .
1.2 Champs de tenseurs . . . . . . . . . . . .
1.3 Algèbre de Lie des champs de vecteurs .
1.4 Groupes de Lie . . . . . . . . . . . . . .
1.5 Dérivée de Lie . . . . . . . . . . . . . . .
1.6 Loi de dérivation sur les fibrés vectoriels
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
6
. 6
. 7
. 9
. 10
. 14
. 15
2 Problèmes variationnels
27
2.1 Problèmes variationnels à une dimension . . . . . . . . . . . . . . . . . . . 27
2.2 Les géodésiques d’une variété riemannienne . . . . . . . . . . . . . . . . . . 31
2.3 Problèmes variationnels à plusieurs dimensions . . . . . . . . . . . . . . . . 35
3 Un
3.1
3.2
3.3
3.4
3.5
principe de covariance général
Introduction . . . . . . . . . . . .
La chute des corps . . . . . . . .
Mécanique des milieux continus .
Collisions et assemblages . . . . .
Second gradient . . . . . . . . . .
.
.
.
.
.
4 Relativité générale
4.1 Introduction . . . . . . . . . . . . .
4.2 Notations et résultats préliminaires
4.3 Tenseur d’énergie-impulsion . . . .
4.4 L’équation d’Einstein . . . . . . . .
4.5 La limite newtonienne . . . . . . .
4.6 Le principe des géodésiques . . . .
5 Trois solutions particulières
5.1 Introduction . . . . . . . . . . .
5.2 Isométries et champs de Killing
5.3 La relativité restreinte . . . . .
5.4 La métrique de Schwarzschild .
5.5 Le modèle de Friedmann . . . .
.
.
.
.
.
.
.
.
.
.
Bibliographie
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
39
40
42
47
48
.
.
.
.
.
.
52
52
53
56
60
65
67
.
.
.
.
.
70
70
71
76
85
95
100
i
Introduction
Le paradigme de la mécanique classique
Le modèle mathématique sur lequel repose la mécanique classique telle qu’elle est
enseignée dans les lycées et les premières années universitaires contient deux notions. Il
y’a d’une part l’espace, qui est représenté par un espace euclidien orienté de dimension 3
après avoir effectué le choix d’une unité de longueur (notre fameux mètre étalon) et que
nous noterons 𝐸 3 . D’autre part le temps, qui est représenté, après avoir fixé une unité de
temps, par un espace euclidien orienté (la flèche du temps) de dimension 1. Ces concepts
correspondent assez bien à la perception immédiate que nous avons du « monde qui nous
entoure ». On peut les regrouper formellement pour décrire l’« univers » (espace-temps 1 )
de la mécanique newtonienne
𝑀 = 𝐸 3 ⊕ 𝐸 1.
L’univers newtonien, c’est donc un espace euclidien tridimensionnel et un temps absolu
(nos horloges sont théoriquement synchrones et nous nous attendons à ce que quelque
soit le destin de chacun d’entre nous, elles indiquent la même heure à chacune de nos
rencontres et par extension que le temps soit le même partout). Le choix d’un repère de
temps et d’un repère d’espace orthonormé permet ainsi de localiser tout évenement de
l’univers par un quadruplet de nombre réels qui sont les coordonnées de cet évenement
dans ce référentiel « fixe ».
La mécanique classique, comme les autres théories physiques, repose sur des principes,
c’est à dire des équations ou postulats concernant des grandeurs physiques issues d’un
modèle mathématique et devant être vérifiées expérimentalement avec la plus grande précision par l’expérience. Tout écart expérimental significatif et suffisamment confirmé par
rapport à ce principe donnant lieu tôt ou tard à une correction du modèle initial qui
n’apparaît plus alors que comme une approximation d’un nouveau modèle plus précis de
la « réalité physique » qu’il est censé décrire. Par exemple, la mécanique classique est une
très bonne approximation de la mécanique relativiste quand les vitesses des phénomènes
étudiés sont faibles devant la vitesse de la lumière.
En mécanique newtonienne, le concept de base est celui de point matériel. Son mouvement est représenté, après le choix d’un référentiel fixe de l’espace-temps, par un arc
𝑡 ↦→ 𝑟(𝑡) de 𝐼 dans R3 où 𝐼 est un intervalle de temps. Cette mécanique repose sur deux
principes fondamentaux 2 . D’une part le principe de déterminisme qui assure que :
1. le terme « espace-temps » suggère fortement l’existence de deux choses séparées qui seraient l’« espace » et le « temps » et l’idée trompeuse d’un « espace » intemporel.
2. Les équations des modèles plus compliqués comme les systèmes de plusieurs points matériels s’en
déduisent et ne nécessitent pas l’introduction de nouveaux principes fondamentaux à part celui de l’égalité
entre l’action et la réaction.
1
2
TABLE DES MATIÈRES
la position et la vitesse à un instant donné d’un point matériel détermine de
façon univoque son mouvement passé et futur,
ce qui se traduit mathématiquement par
𝑟¨ = 𝑓 (𝑡, 𝑟, 𝑟).
˙
(0.1)
D’autre part le principe de relativité galiléenne :
Les équations du mouvement d’un système isolé sont invariantes sous l’action
du groupe de Galilée.
Ce second principe est plus difficile à expliciter car il faut définir ce qu’on entend par
système isolé et par groupe de Galilée.
L’univers newtonien possède une structure naturelle d’espace affine. Le groupe de
Galilée est un sous groupe du groupe affine de l’univers. Une fois donné un référentiel
comme il a été décrit plus haut, l’action de ce groupe s’écrit
{︃
𝑟′ = a𝑟 + b𝑡 + c
𝑡′ = 𝑡 + 𝑒
(0.2)
où a appartient au groupe orthogonal 𝑂(3), b et c sont des vecteurs de R3 et 𝑒 est un
réel. Il est caractérisé par les deux propriétés suivantes
1. 𝑡2 − 𝑡1 = 𝑡′2 − 𝑡′1 ,
2. si 𝑡1 = 𝑡2 alors ‖𝑟2 − 𝑟1 ‖ = ‖𝑟2′ − 𝑟1′ ‖.
Autrement dit, c’est le groupe des transformations de 𝐸 3 ⊕𝐸 1 qui préservent les intervalles
de temps et qui, lorsqu’elles fixent 𝑡, sont des isométries de 𝐸 3 . Attention, il ne faudrait
pas croire pour autant que le groupe de Galilée est le groupe laissant invariant une certaine
forme bilinéaire de 𝐸 3 ⊕𝐸 1 . L’univers newtonien a seulement une structure d’espace affine
sur lequel agit ce groupe.
La notion de système isolé est plus vague. On dit habituellement qu’un système est
isolé s’il n’est soumis à aucune action extérieure, autrement dit si le système que l’on
considère est « un tout » et non une partie d’un système plus vaste. Un corollaire des
deux principes fondamentaux est le principe d’inertie :
Un point matériel, soustrait à l’action de tous les autres corps, a un mouvement de translation rectiligne et uniforme.
L’apparente simplicité d’un tel principe est trompeuse. En effet, la validité de cet énoncé
suppose l’existence de référentiels privilégiés qui n’existent que dans la tête du mathématicien. Pour le physicien, la justification de l’existence d’un tel référentiel est un véritable
casse-tête. Cette question est souvent soigneusement évitée dans les cours de physique et
de mécanique, où l’on considère que les indications d’une horloge et le choix d’un référentiel, dont par exemple, l’origine spatiale est le centre de gravité du système solaire et
dont les trois axes orthonormés sont dirigés vers des étoiles « fixes », correspond à peu
près avec l’artifice mathématique mentionné.
En revanche, si l’on admet l’existence d’un référentiel ou le principe d’inertie est valide,
il est facile de voir que tout autre référentiel déduit du premier par une transformation
de Galilée est encore un référentiel dans lequel le principe d’inertie se vérifie. On arrive
ainsi à la notion de référentiel d’inertie ou référentiel galiléen, qui est donc une propriété
partagée par une classe de référentiels, sous l’action du groupe de Galilée 3 . On ne peut
distinguer l’« immobilité » du « mouvement de translation rectiligne uniforme ».
3. Est-il nécessaire de rappeler que l’impression que notre chambre pourrait définir un référentiel
TABLE DES MATIÈRES
3
Relativité, groupes et géométries
Ce qui fait la force d’une loi physique, c’est qu’elle peut être vérifiée par différents
observateurs, à différents endroits et différentes époques. Ceci se traduit par le fait qu’elle
est nécessairement invariante si l’on fait agir sur les grandeurs qu’elle met en jeu certaines transformations (translations spatiales ou temporelles dans notre exemple). Ces
transformations forment un groupe et celui-ci est la racine du principe de relativité. Dans
le cas présent, il s’agit du groupe de Galilée et de la relativité galiléenne. Deux observateurs différents sont censés subir la même physique, ce qui confère à cette physique sa
nature objective, reproductible et universelle. Attention cependant, l’universalité d’une
loi physique est limité par le groupe même qui définit sa relativité.
Dans certains ouvrages de physique, on rencontre parfois l’expression « formulation
covariante ». Dans le langage courant, ceci signifie qu’on a réussi à exprimer un principe
physique sous une forme qui ne dépend pas d’un système particulier de coordonnées. Bien
entendu, on s’attend à ce que les grandeurs physiques significatives soient indépendantes
du choix d’un système de coordonnées.
Prenons un exemple. L’équation de Newton (0.1) n’est valable que dans certains systèmes de coordonnées bien particuliers dont nous avons évoqué la difficulté à justifier
l’existence. Cette équation est invariante par le groupe de Galilée, qui définit en quelque
sorte la classe des observateurs « habilités à l’utiliser ».
Que signifierait alors dans ce contexte : donner à l’équation de Newton une forme
« covariante » ? Eh bien simplement écrire une équation plus générale, qui décrive les même
phénomènes que l’équation (0.1) mais qui soit valable dans des systèmes de coordonnées
moins restrictifs. Autrement dit, écrire une équation invariante par un groupe plus gros
que le groupe de Galilée, par exemple le groupe des difféomorphisme de l’univers tout
entier. On parle alors de relativité générale pour distinguer cette relativité de la relativité
galiléenne qui est plus faible 4 .
Il existe une démarche similaire en mathématiques. Le programme d’Erlangen de Felix
Klein (1872) [16] a stigmatisé le lien étroit qui existait entre la géométrie et les groupes :
une géométrie, c’est un groupe qui agit sur un ensemble. On serait donc tenté de dire qu’il
n’y a pas de modèle physique rigoureux tant qu’il n’y a pas de groupe derrière. C’est du
moins ce que suggère Souriau (« Les groupes comme Universaux »), et ce point de vue
sera largement adopté dans ce cours. Toujours est-il, et quelque soit le point de vue qu’on
adopte à ce sujet, nul ne peut ignorer aujourd’hui le rôle crucial joué par les groupes dans
les diverses théories physiques.
galiléen est trompeuse. Une expérience plus fine comme celle du pendule de Foucault (1851) met en
évidence que les effets dus à la rotation de la Terre ne sont pas si négligeables.
4. Einstein a formulé sa théorie de la relativité générale (1915) dix ans après la relativité restreinte
(1905) afin d’y intégrer la gravitation. La relativité restreinte avait seulement remplacé le groupe de
Galilée par celui de Poincaré.
4
TABLE DES MATIÈRES
Un principe de mécanique très général
Comme l’indique le titre de ce cours, notre but est de présenter une équation fondamentale 5 formulée par Jean-Marie Souriau et qui s’écrit, sous forme condensée
𝑇 𝐷 = 0.
(0.3)
Dans cette équation, 𝑇 est un tenseur-distribution, qui représente la « matière », et 𝐷 est
une connexion linéaire symétrique sur une variété 𝑀 6 . Il s’agit, tout comme l’équation
de Newton, d’un principe fondamental de la physique, dont découlent les équations habituelles de la mécanique. Comme tout principe de la physique, cela signifie qu’une fois que
certaines grandeurs issues d’un problème donné ont été convenablement identifiées, elles
doivent satisfaire l’équation (0.3).
La géométrie de cette équation, c’est celle du groupe des difféomorphismes 𝐶 ∞ de
𝑀 . Ce groupe, Souriau l’appelle le groupe souple, en référence aux célèbres « montres
molles » du peintre Dali, lui-même faisant allusion aux « mollusques de référence » qu’avait
introduit Einstein, non sans humour, pour décrire les systèmes de coordonnées quelconques
de la relativité générale où l’espace et le temps s’entremêlent et semblent échapper à notre
sens commun.
Pour résumer, on peut dire que la géométrie associée à la mécanique newtonienne est
celle du groupe de Galilée, celle de la mécanique relativiste (relativité restreinte) est celle
du groupe de Poincaré et que la géométrie de la relativité générale est celle du groupe
souple (le groupe des difféomorphismes). L’équation (0.3) rentre donc dans le cadre de la
relativité générale.
Voilà donc l’esprit général et l’ambition de ce cours ; présenter ce principe de la mécanique, dont découlent beaucoup d’autres. Comme cela est implicite dans cette introduction, le cadre est celui de la mécanique des milieux continus au sens le plus général du
terme ; la mécanique quantique ne sera pas abordée.
Un modèle mathématique est au physicien ce qu’est une carte marine au navigateur. Il
y’a des « routières » pour les grandes traversées et des cartes de détails pour les « atterrissages » à l’approche des côtes. Le navigateur ne confond pas sa carte avec le paysage réel
qui l’entoure mais il est capable de faire le lien entre la carte et le paysage. Sa carte l’aide
à se situer, à se faire une image mentale de la géographie des océans qu’il traverse et des
terres qu’il rencontre. Il n’est pas utile d’utiliser une carte de détail au milieu de l’océan
atlantique, loin de toute côte. Inversement il serait dangereux d’utiliser une « routière »
au voisinage d’une côte. Un modèle mathématique, aussi puissant soit-il, n’est qu’une
description extrêmement simplifiée du « réel » et possède ses limites. Suivant ce que l’on
veut étudier, on n’utilisera pas forcément la même « carte » : ne pas confondre la carte
avec le territoire 7 .
5. Voir également l’excellent diaporama de Shlomo Sternberg, General covariance and the passive
equations of physics et disponible à cette url : http://www.pitt.edu/~super7/23011-24001/23801.ppt
pour un exposé de présentation générale.
6. 𝑀 , c’est l’univers, le laboratoire avec ou sans le temps, le système solaire, etc... bref, le cadre de
notre sujet d’étude.
7. Expression attribuée au philosophe Alfred Korzybski.
TABLE DES MATIÈRES
5
Plan du cours
Le cours est divisé en cinq chapitres. Les connaissances requises sont les notions de base
de l’algèbre linéaire et du calcul différentiel, en particulier la notion de variété différentielle
et celle de produit tensoriel.
Le premier chapitre est purement mathématique, et regroupe des notions fondamentales de géométrie différentielle. On y trouve des rappels sur les fibrés vectoriels et les
champs de tenseurs, des éléments sur les groupes de Lie et la définition des connexions
sur les fibrés vectoriels. On y introduit les notions de torsion, de courbure, de flot géodésique et d’exponentielle.
Le deuxième chapitre est une introduction aux méthodes du calcul variationnel à
travers quelques exemples. On y présente d’abord les équations d’Euler-Lagrange et le
théorème de Noether pour un lagrangien dans R𝑛 . On traite ensuite le problème des
géodésiques d’une variété riemannienne comme solution d’un problème variationnel et on
calcule la seconde variation. Dans la dernière section, on envisage les problèmes faisant
intervenir plusieurs paramètres et en particulier le problème des surfaces minimales dans
R3 .
Le troisième chapitre est consacré au principe de covariance général introduit par JeanMarie Souriau. A travers plusieurs exemples, notamment la chute des corps, les collisions,
la mécanique des milieux continus, . . . , on montre comment les principales équations de
la mécanique se déduisent de ce principe général.
Le quatrième chapitre est une introduction à la relativité générale. On y introduit la
métrique, le tenseur énergie-impulsion et l’équation d’Einstein. On montre ensuite que
l’équation de covariance générale (0.3) se déduit du principe de relativité générale. On
étudie ensuite la « limite newtonienne » de la gravitation einsteinienne et le principe dit
« des géodésiques ».
Dans le cinquième et dernier chapitre, on discute des symétries, des tenseurs de Killing
et on traite trois solutions particulières de la relativité générale : la solution de Schwarzschild, le modèle de Friedmann et la métrique de Minkowski, autrement dit la relativité
restreinte. L’apparition de la relativité restreinte est l’occasion de faire une digression sur
le groupe de Poincaré et son lien avec le groupe de Galilée. On en profite pour parler
un peu de géométrie symplectique, de l’intérêt des groupes de Lie en mécanique et de la
notion fondamentale d’application moment qui permet de donner un sens mathématique
aux observables de la mécanique non-quantique.
Chapitre 1
Notions fondamentales de géométrie
différentielle
En mécanique des milieux continus, l’outil mathématique adéquate pour décrire l’espace ou l’univers est celui de variété différentielle. L’objet de ce chapitre est de récapituler les notions fondamentales de géométrie différentielle
que nous utiliserons par la suite. Toutes les variétés considérées seront, sauf
mention explicite du contraire, supposées de classe 𝐶 ∞ . La définition d’une
variété 𝐶 ∞ , d’espace tangent, d’application 𝐶 ∞ entre deux variétés et de son
application linéaire tangente sont supposées connues. Pour plus de détails sur
ces notions et ce qui suit, on pourra consulter, entre autre, [7, 8, 9, 18, 22].
1.1
Fibrés vectoriels
« Relier » ensemble de manière régulière une famille d’espaces vectoriels (𝐸𝑥 ) où 𝑥
parcourt une variété 𝑀 , tel est l’objet de la définition d’un fibré vectoriel.
1.1.1
Définition d’un fibré vectoriel
Soit 𝐸 et 𝑀 des variétés de classe 𝐶 ∞ et 𝜋 : 𝐸 → 𝑀 , une application 𝐶 ∞ telle que
pour tout 𝑥 ∈ 𝑀 , 𝐸𝑥 = 𝜋 −1 (𝑥) soit un espace vectoriel de dimension finie. On dit que 𝐸
est un fibré vectoriel de fibre type l’espace vectoriel 𝐹 si pour tout 𝑥0 ∈ 𝑀 , il existe un
voisinage ouvert 𝑈 de 𝑥0 et un difféomorphisme 𝜙 : 𝜋 −1 (𝑈 ) → 𝑈 × 𝐹 tel que :
1. 𝜋 = 𝑝1 ∘ 𝜙,
2. la restriction de 𝑝2 ∘ 𝜙 à chaque fibre 𝜋 −1 (𝑥) est linéaire,
où 𝑝1 et 𝑝2 désignent respectivement les projections suivant le premier et le deuxième
facteur.
Un ouvert tel que 𝑈 est dit trivialisant. On a le diagramme commutatif suivant :
𝜙
𝜋 −1 (𝑈 )
𝜋
#
𝑈
|
/
𝑈 ×𝐹
𝑝1
On appelle 𝑀 la base du fibré et 𝐸𝑥 = 𝜋 −1 (𝑥), la fibre au-dessus de 𝑥. Toutes les fibres sont
(linéairement) isomorphes à la fibre type 𝐹 mais il n’y’a pas d’isomorphisme canonique.
6
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
7
Exercice 1.1. Montrer qu’il existe un atlas de 𝑀 formé par des ouverts trivialisants.
1.1.2
Morphisme de fibrés vectoriels
Un morphisme de fibré vectoriel c’est une application 𝐶 ∞ entre deux fibrés qui préserve
les fibres et la structure vectorielle de chaque fibre. Plus précisément :
On appelle morphisme de fibrés vectoriels, la donnée de deux applications 𝐶 ∞ , 𝑓 :
𝐸 → 𝐸 ′ et 𝑓¯ : 𝑀 → 𝑀 ′ telles que le diagramme suivant soit commutatif :
𝐸
𝜋
𝑓
/
𝑀
𝑓¯
/
𝐸′
𝜋′
𝑀′
et que la restriction de 𝑓 à chaque fibre 𝐸𝑥 soit une application linéaire.
Un fibré vectoriel est localement le produit d’un espace vectoriel 𝐹 par sa base 𝑀 .
L’exemple le plus simple qui soit est bien entendu le produit 𝑀 × 𝐹 . On dit qu’un fibré
vectoriel est trivial s’il est isomorphe (en tant que fibré) au produit 𝑀 × 𝐹 de sa base 𝑀
par la fibre type 𝐹 .
L’ensemble de tous les vecteurs tangents à une variété différentielle 𝑀
𝑇𝑀 =
⋃︁
𝑇𝑥
𝑥∈𝑀
muni de l’application 𝜋 : 𝑇 𝑀 → 𝑀 qui envoie le vecteur tangent 𝑋𝑥 sur 𝑥 fournit un
autre exemple ; c’est le fibré tangent à 𝑀 . Le fibré cotangent 𝑇 * 𝑀 et plus généralement le
fibré des tenseurs 𝑝-fois covariants et 𝑞-fois contravariants, 𝑇𝑝𝑞 𝑀 en fournissent d’autres.
Exercice 1.2. Montrer que le fibré tangent au cercle S1 et plus généralement le fibré
tangent au tore T𝑛 sont triviaux. En est-il de même de 𝑇 S2 , le fibré tangent de la sphère
S2 ? Qu’en est-il de 𝑇 S3 ?
1.2
1.2.1
Champs de tenseurs
Section d’un fibré vectoriel
Une section d’un fibré vectoriel 𝐸 (continue, 𝐶 ∞ , . . .) est une application 𝜎 : 𝑀 → 𝐸
telle que
𝜋 ∘ 𝜎 = 𝐼𝑑𝐸 .
Une section locale au-dessus d’un ouvert 𝑈 de 𝐸 est une application 𝜎 : 𝑈 → 𝐸 telle que
𝜋 ∘ 𝜎 = 𝐼𝑑𝑈 .
Une section, c’est donc le choix (continue, 𝐶 ∞ , . . .) pour chaque 𝑥 ∈ 𝑀 d’un vecteur dans
la fibre 𝐸𝑥 au dessus de 𝑥. Si 𝑈 est un ouvert trivialisant du fibré 𝐸, une section locale
(ou la restriction à 𝑈 d’une section quelconque 𝜎) correspond à la donnée d’une fonction
𝑠 : 𝑈 → 𝐹 que l’on appellera l’expression locale de 𝜎 :
𝜎𝑈 (𝑥) = (𝑥, 𝑠(𝑥)),
𝑥 ∈ 𝑈.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
8
Remarque 1.3. Souvent, on prend pour 𝑈 une carte locale de 𝑀 , qu’on identifie avec un
ouvert de R𝑛 . L’application 𝑠 est alors une fonction de 𝑈 ⊂ R𝑛 à valeur dans l’espace
vectoriel 𝐹 .
L’ensemble des sections d’un fibré vectoriel (𝐸, 𝜋, 𝑀 ), que nous noterons Γ(𝐸) est bien
entendu un R-espace vectoriel. C’est également un 𝐶 ∞ (𝑀 )-module, la multiplication d’un
section 𝜎 ∈ Γ(𝐸) par un fonction 𝑓 ∈ 𝐶 ∞ (𝑀 ) étant donnée par (𝑓 𝜎)(𝑥) = 𝑓 (𝑥) 𝜎(𝑥).
1.2.2
Champs de tenseurs
En considérant divers fibrés vectoriels, on arrive aux définitions suivantes :
Champ de vecteurs : C’est une section 𝑠 du fibré tangent 𝑇 𝑀 . On notera Vect(𝑀 )
l’ensemble des sections 𝐶 ∞ de 𝑇 𝑀 .
Champ de tenseurs de type (𝑝, 𝑞) : C’est une section du fibré 𝑇𝑝𝑞 𝑀 .
Forme différentielle de degré 𝑟 sur 𝑀 : C’est une section du fibré des tenseurs 𝑟⋀︀
fois covariants alternés 𝑟 𝑇 * 𝑀 . On notera Ω𝑟 (𝑀 ) l’ensemble des sections 𝐶 ∞ de
⋀︀𝑟 *
𝑇 𝑀.
Métrique riemannienne : C’est une section du fibré 𝑆2 𝑇 * 𝑀 , des tenseurs 2-fois covariants symétriques qui est, de plus définie positive en chaque point.
Métrique pseudo-riemannienne de signature (𝑟, 𝑠) : C’est également une section du
fibré 𝑆2 𝑇 * 𝑀 , des tenseurs 2-fois covariants symétriques mais qui est de signature
(𝑟, 𝑠) en chaque point.
Le groupe des difféomorphismes Diff(𝑀 ) agit à gauche sur les champs de vecteurs de la
façon suivante
(𝜙* 𝑋)(𝑥) = 𝑇𝜙−1 (𝑥) 𝜙 · 𝑋(𝜙−1 (𝑥)),
(1.1)
mais également à droite de la façon suivante
(𝜙* 𝑋)(𝑥) = 𝑇𝜙(𝑥) 𝜙−1 · 𝑋(𝜙(𝑥)).
(1.2)
Il agit également à droite sur les champs de covecteurs de la façon suivante
(𝜙* 𝛼)(𝑋𝑥 ) = 𝛼𝜙(𝑥) (𝑇𝑥 𝜙 · 𝑋𝑥 ),
(1.3)
et plus généralement sur les formes différentielles, les métriques riemanniennes ou pseudoriemanniennes (de classe 𝐶 ∞ ) et les champs de tenseurs. Ce sont des objets de la géométrie
souple, au même titre que la droite, le triangle, le cercle appartiennent à la géométrie
euclidienne.
Exercice 1.4. Montrer que si 𝛼 est une 1-forme et 𝑋, un champ de vecteur on a
(𝜙* 𝛼)(𝜙* 𝑋)(𝑥) = 𝛼(𝑋)(𝜙(𝑥) = 𝜙* (𝛼(𝑋)).
Exercice 1.5. Écrire l’action naturelle de Diff(𝑀 ) sur les 1-formes, les métriques.
9
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.3
1.3.1
Algèbre de Lie des champs de vecteurs
Dérivations sur une algèbre
Il y’a une correspondance bien connue entre les champs de vecteurs 𝐶 ∞ de 𝑀 et les
dérivations sur l’algèbre des fonctions 𝐶 ∞ sur 𝑀 .
Définition 1.6. Une dérivation sur une algèbre 𝐴 est une application linéaire 𝐷 : 𝐴 → 𝐴
vérifiant la règle de Leibniz :
𝐷(𝑓 𝑔) = 𝑓 𝐷(𝑔) + 𝐷(𝑓 ) 𝑔.
(1.4)
A tout champ 𝑋 ∈ Vect(𝑀 ) correspond une dérivation sur la R-algèbre 𝐶 ∞ (𝑀 ), notée
𝐿𝑋 et définie par :
𝐿𝑋 (𝑓 )(𝑥) = 𝑇𝑥 𝑓 · 𝑋(𝑥) = (𝑋 · 𝑓 )(𝑥).
(1.5)
Soit (𝑈, 𝜙) une carte locale sur 𝑀 (de dimension 𝑛) et (𝑥𝑖 ), les composantes de 𝜙 dans
R𝑛 . A 𝜙 correspond 𝑛 dérivations sur 𝐶 ∞ (𝑈 ), que l’on notera 𝜕 𝑖 et définies par
𝜕𝑖 𝑓 =
𝜕
(𝑓 ∘ 𝜙−1 ).
𝜕 𝑥𝑖
Ces dérivations forment, en tout point 𝑥 ∈ 𝑈 , une base de 𝑇𝑥 𝑀 .
Exercice 1.7.
1. Montrer que toute dérivation 𝐷 sur 𝐶 ∞ (𝑀 ) est locale, c’est à dire
que si 𝑓 et 𝑔 coïncident sur 𝑈 , alors 𝐷(𝑓 ) et 𝐷(𝑔) aussi.
2. Montrer que si 𝐷 est une dérivation sur 𝐶 ∞ (𝑀 ), alors pour tout ouvert 𝑈 de 𝑀 ,
on peut définir une dérivation 𝐷𝑈 sur 𝐶 ∞ (𝑈 ) telle que pour tout 𝑓 ∈ 𝐶 ∞ (𝑀 ) :
𝐷𝑈 (𝑓|𝑈 ) = 𝐷(𝑓 )|𝑈 .
3. En déduire que l’espace des champs de vecteurs 𝐶 ∞ de 𝑀 , Vect(𝑀 ), est isomorphe
à l’espace des dérivations de 𝐶 ∞ (𝑀 ).
Si 𝑋 et 𝑌 sont deux champs de vecteurs, l’opérateur
𝐿𝑋 𝐿𝑌 − 𝐿𝑌 𝐿𝑋
est encore une dérivation (le vérifier). Cette dérivation correspond donc à un champ de
vecteur que l’on notera [𝑋, 𝑌 ]. Si 𝑈 est un ouvert trivialisant et 𝑢 et 𝑣 sont les expressions
locales des champs 𝑋 et 𝑌 , alors l’expression locale du champ [𝑋, 𝑌 ] s’écrit :
𝑣 ′ (𝑥)𝑢(𝑥) − 𝑢′ (𝑥)𝑣(𝑥),
(1.6)
où 𝑢′ et 𝑣 ′ sont les différentielles usuelles des fonctions vectorielles 𝑢 et 𝑣 à valeur dans
R𝑛 .
L’opération (𝑋, 𝑌 ) ↦→ [𝑋, 𝑌 ] est une opération R-bilinéaire, antisymétrique qui vérifie
l’identité de Jacobi :
[𝑋, [𝑌, 𝑍 ] ] + [𝑌, [𝑍, 𝑋 ] ] + [𝑍, [𝑋, 𝑌 ] ] = 0,
𝑋, 𝑌, 𝑍 ∈ Vect(𝑀 ).
(1.7)
Vect(𝑀 ) forme donc une algèbre de Lie, l’algèbre des champs de vecteurs sur 𝑀 .
Exercice 1.8. Vérifier l’équation (1.7). Quelle signification algébrique simple donner à
cette équation ?
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.3.2
10
Équation différentielle ordinaire du premier ordre
Chaque champ de vecteurs 𝑋 définit une équation différentielle ordinaire du premier
ordre
𝑑𝑥
= 𝑋(𝑥(𝑡))
(1.8)
𝑑𝑡
dont l’existence et l’unicité locale des solutions est assuré par le théorème de CauchyLipschitz.
Le flot de 𝑋 est le sous-groupe local à 1 paramètre noté 𝜙𝑡 où 𝜙𝑡 (𝑥) = 𝜙(𝑡, 𝑥) est la
valeur de la solution de (1.8) au temps 𝑡 qui a pour condition initiale (à 𝑡 = 0) la valeur
𝑥.
Attention, en général, 𝜙𝑡 est seulement défini sur un voisinage de 𝑥 et pour 𝑡 appartenant à un intervalle borné. C’est un difféomorphisme local. Si, pour tout 𝑥, le flot 𝜙𝑡
est défini sur R tout entier, on dit que le champ 𝑋 est complet et chaque 𝜙𝑡 est bien un
difféomorphisme global de 𝑀 . Quand la variété 𝑀 est compacte (ou si 𝑋 est à support
compact), c’est toujours le cas.
Exercice 1.9. Soit 𝑋 et 𝑌 deux champs de vecteurs sur une variété 𝑀 . Désignons par
𝜙 et 𝜓 leur flot respectif. Monter que 𝜙𝑡 ∘ 𝜓 𝑠 = 𝜓 𝑠 ∘ 𝜙𝑡 si et seulement si [𝑋, 𝑌 ] = 0.
1.4
Groupes de Lie
La théorie des groupes de Lie permet d’enrichir la théorie des groupes avec les outils
puisant de la géométrie différentielle. Cette section rappelle les principales définitions de
cette théorie. En pratique et bien que ce soit bien sûr exagéré (et faux en général), on
pourra toujours penser à un groupe de Lie comme à un sous groupe de 𝐺𝐿(𝑛, 𝐾) où
𝐾 = R ou C car tous les groupes de Lie que nous rencontrerons dans ce cours le sont.
1.4.1
Groupes de Lie
Un groupe de Lie 𝐺 est un groupe muni d’une structure de variété 𝐶 ∞ tel que les
applications 𝑔 ↦→ 𝑔 −1 et (𝑔, ℎ) ↦→ 𝑔ℎ sont 𝐶 ∞ . Sur 𝐺, on définit les translations à droite
𝑅ℎ : 𝐺 → 𝐺 par 𝑅𝑔 (ℎ) = ℎ𝑔 et les translations à gauche 𝐿𝑔 : 𝐺 → 𝐺 par 𝐿𝑔 (ℎ) = 𝑔ℎ.
Un groupe de Lie est muni d’une 1-forme canonique à valeur vectorielle, appelée la
forme de Maurer-Cartan 𝜔(𝑋𝑔 ) = 𝐿𝑔−1 𝑋𝑔 qui montre que le fibré tangent de 𝐺 est trivial :
𝑇 𝐺 ≃ 𝐺 × g,
où g est l’espace tangent à l’élément neutre du groupe 𝑒.
Un champ de tenseurs sur 𝐺 invariant à gauche est complètement déterminé par sa
valeur au point 𝑒. On a donc, en particulier, un isomorphisme canonique entre l’espace
tangent au point 𝑒 et l’espace des champs de vecteurs invariants à gauche.
Exercice 1.10. Montrer que le crochet de Lie de deux champs de vecteurs invariants à
gauche est lui même invariant à gauche.
Par conséquent, le crochet de Lie sur les champs de vecteurs induit une structure
d’algèbre de Lie sur l’espace tangent au point 𝑒. Cet espace, que nous noterons g, muni
de cette opération est appelé l’algèbre de Lie du groupe 𝐺.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
11
Exercice 1.11. Montrer que si on définit le crochet de Lie sur g à partir des champs de
vecteurs invariants à droite, on a
[𝜉, 𝜔 ]𝑅 = − [𝜉, 𝜔 ]𝐿 ,
où [, ]𝑅 (resp. [, ]𝐿 ) désigne le crochet induit par translation à droite (resp. à gauche).
Exercice 1.12. Montrer que l’algèbre de Lie so(𝑛) du groupe SO(𝑛) est constitué par le
sous espace des matrices de 𝑛 × 𝑛 antisymétriques.
1.4.2
Sous-groupes à un paramètre
Tout élément 𝜔 de l’algèbre de Lie d’un groupe de Lie 𝐺 définit un champ de vecteur
invariant à gauche.
Exercice 1.13. Démontrer qu’un champ de vecteur invariant à gauche sur un groupe de
Lie 𝐺 est complet (i.e son flot est défini pour tout 𝑡 ∈ R).
A tout élément 𝜔 ∈ g est donc associé un sous-groupe à un paramètre 𝑔(𝑡), solution
de l’équation différentielle
𝑑𝑔
= 𝑇 𝐿𝑔 · 𝜔.
(1.9)
𝑑𝑡
On appelle application exponentielle (du groupe), l’application de g dans 𝐺 définie par
exp(𝜔) = 𝑔(1).
Exercice 1.14. Montrer que cette application possède les propriétés suivantes :
1. 𝑔(𝑡) = exp(𝑡 𝜔),
2. exp(𝑡 𝜔) exp(𝑠 𝜔) = exp((𝑡 + 𝑠) 𝜔).
En exhibant un contre-exemple, montrer qu’on a pas en général :
exp(𝜔) exp(𝜉) = exp(𝜔 + 𝜉).
Exercice 1.15. Montrer que l’exponentielle de groupe est un difféomorphisme d’un voisinage de 0 dans g sur un voisinage de 𝑒 dans 𝐺.
Ce difféomorphisme définit donc une carte locale au voisinage de 𝑒, qu’on appelle la
carte exponentielle. Étant donnée une base (𝜔𝑖 )1≤𝑖≤𝑛 de g, tout vecteur 𝜔 de g se met sous
la forme
𝑛
𝜔=
∑︁
𝑥𝑖 𝜔𝑖 ,
𝑖=1
où 𝑥𝑖 sont les composantes de 𝜔 dans cette base. Comme exp est un difféomorphisme
local en 𝑒 de 𝐺 sur un voisinage ouvert 0 de g, on peut prendre (𝑥𝑖 ) comme coordonnées
du point 𝑔 = exp(𝜔) ∈ 𝐺. Les fonctions coordonnées 𝑒𝑥𝑝(𝜔) ↦→ 𝑥𝑖 sont appelées les
coordonnées canoniques ou normales de 𝑔 relativement à la base 𝜔𝑖 de g.
On verra un peu plus loin qu’une notion similaire peut être définie sur une variété
quelconque munie d’une connexion linéaire.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.4.3
12
Représentation adjointe de 𝐺
La composée 𝐼𝑔 = 𝑅𝑔−1 𝐿𝑔 : 𝐺 → 𝐺 qui envoie un élément ℎ ∈ 𝐺 sur 𝑔ℎ𝑔 −1 est un
automorphisme
𝐼𝑔 (ℎ𝑘) = 𝐼𝑔 (ℎ)𝐼𝑔 (𝑘).
C’est l’automorphisme intérieur de 𝐺 (autrement dit l’action naturelle de 𝐺 sur lui même).
Comme 𝐼𝑔 (𝑒) = 𝑒, son application linéaire tangente au point 𝑒, que l’on notera Ad𝑔 , est
un isomorphisme linéaire de g.
⃒
Ad𝑔 : g → g,
𝑑 ⃒⃒
𝐼𝑔 (exp(𝑡 𝜔)).
Ad𝑔 𝜔 = ⃒⃒
𝑑𝑡 𝑡=0
Ad définit une représentation de 𝐺 sur son algèbre de Lie g (Ad𝑔ℎ = Ad𝑔 Adℎ ), la représentation adjointe de 𝐺.
Exercice 1.16. Montrer que la représentation adjointe préserve le crochet de Lie de g,
c’est à dire
[Ad𝑔 𝜉, Ad𝑔 𝜔 ] = Ad𝑔 [𝜉, 𝜔 ] .
Exercice 1.17. Montrer que si 𝑔 ∈ SO(𝑛) and Ω ∈ so(𝑛), on a Ad𝑔 Ω = 𝑔Ω𝑔 −1 .
1.4.4
Représentation adjointe de g
On vient de définir une représentation du groupe 𝐺 sur g, on va à présent définir une
représentation de l’algèbre de Lie g sur g. L’application Ad, qui associe à 𝑔 ∈ 𝐺 l’opérateur
Ad𝑔 peut être considérée comme une application de 𝐺 dans l’espace vectoriel End(g) des
endomorphismes (linéaires) de g. La différentielle de cette application au point 𝑒, que l’on
notera ad, est appelée la représentation adjointe de l’algèbre de Lie g sur elle-même. Elle
est définie par
⃒
𝑑 ⃒⃒
Adexp(𝑡 𝜉) 𝜔.
ad : g → End(g),
ad𝜉 𝜔 = ⃒⃒
𝑑𝑡 𝑡=0
Exercice 1.18. Montrer que
ad𝜉 𝜔 = [𝜉, 𝜔 ] ,
où [, ] est le crochet de Lie de l’algèbre de Lie de 𝐺 défini à partir des champs de vecteurs
invariants à gauche.
1.4.5
Représentation coadjointe de 𝐺
Soit g* le dual de l’espace vectoriel g. Les éléments de g* sont les formes linéaires sur
g. Comme nous le verrons, l’espace g* joue un rôle fondamental en physique, c’est à partir
de cet espace que serons définie les observables. C’est pourquoi nous l’introduisons ici.
Attention, en général, g* n’a pas de structure naturelle d’algèbre de Lie.
A toute application linéaire 𝐴 : 𝐸 → 𝐹 entre deux espaces vectoriels, on peut associer
un opérateur dual 𝐴* : 𝐹 * → 𝐸 * , défini par l’équation
(𝐴* 𝛼)(𝑥) = 𝛼(𝐴 𝑥),
𝑥 ∈ 𝐸, 𝛼 ∈ 𝐹 * .
13
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
La représentation coadjointe d’un groupe de Lie 𝐺 sur g* est celle qui associe à tout
élément 𝑔 de 𝐺 l’opérateur linéaire
Ad*𝑔 : g* → g*
donné par Ad*𝑔 = (Ad𝑔−1 )* . Autrement dit,
(Ad*𝑔 𝑚)(𝜔) = 𝑚(Ad𝑔−1 𝜔)
pour tout 𝑔 ∈ 𝐺, 𝑚 ∈ g* et 𝜔 ∈ g.
Remarque 1.19. Le choix de 𝑔 −1 dans cette définition de Ad*𝑔 est tel que Ad* soit une
représentation (action à gauche) Ad*𝑔ℎ = Ad*𝑔 Ad*ℎ et non une anti-représentation (action
à droite) Ad*𝑔ℎ = Ad*ℎ Ad*𝑔 .
Exercice 1.20. Montrer que pour SO(𝑛) (𝑛 ≥ 3) les représentations adjointe et coadjointe
sont équivalentes. Décrire les orbites de la représentation adjointe de SO(3).
Comme nous avons défini la représentation adjointe de g à partir de la représentation
adjointe de 𝐺, on peut définir la représentation coadjointe de g* .
⃒
𝑑⃒
ad*𝜉 𝑚 = (ad𝜉 )* (𝑚) = − ⃒⃒
Ad*exp(𝑡 𝜔) 𝑚.
𝑑𝑡 ⃒𝑡=0
ad* : g → End(g* ),
1.4.6
Et le groupe des difféomorphismes dans tout ça ?
Le groupe des difféomorphismes d’une variété différentielle 𝑀 n’est pas un groupe de
dimension finie. Il est cependant possible d’équiper Diff(𝑀 ) d’une structure de variété
modelée sur un espace de Fréchet et tel que les opérations du groupe deviennent 𝐶 ∞
(dans un sens affaibli appelé différentiabilité au sens de Gâteaux). On peut alors, dans
une certaine mesure considérer Diff(𝑀 ) comme un groupe de Lie, de dimension infinie.
Dans ce contexte, l’algèbre de Lie de Diff(𝑀 ) est l’algèbre de Lie, Vect(𝑀 ), des champs
de vecteurs de 𝑀 . La justification est la suivante : considérons une famille à un paramètre
de difféomorphismes 𝜙𝑡 (𝑥) = 𝜙(𝑡, 𝑥) de classe 𝐶 ∞ et telle que 𝜙(0, 𝑥) = 𝑥, ∀𝑥 ∈ 𝑀 . Un
vecteur tangent au point 𝑖𝑑 ∈ Diff(𝑀 ) est typiquement la dérivée en 𝑡 = 0 d’un tel arc 𝜙𝑡
dans Diff(𝑀 )
)︃
(︃
𝜕𝜙
𝑑𝜙𝑡
(𝑥) =
(0, 𝑥) = 𝑋(𝑥)
𝑑𝑡 𝑡=0
𝜕𝑡
qui appartient à Vect(𝑀 ) puisque 𝜋(𝑋(𝑥)) = 𝑥, 𝜋 désignant la projection canonique
𝑇 𝑀 → 𝑀 . D’une façon similaire, on voit qu’il est possible d’identifier l’espace tangent en
un point 𝜙 ∈ Diff(𝑀 ) quelconque avec l’espace vectoriel des applications 𝐶 ∞ , 𝑉 : 𝑀 →
𝑇 𝑀 telles que 𝜋(𝑉 (𝑥)) = 𝜙(𝑥). Ce ne sont pas des sections de 𝑇 𝑀 (et donc pas des
champs de vecteurs).
Le groupe des difféomorphismes Diff(𝑀 ) agit sur lui même à gauche (action que nous
notons 𝐿𝜙 ) et à droite (action que nous notons 𝑅𝜙 ). En prenant les applications linéaires
tangentes à ces actions, on obtient l’ action à gauche de 𝑇𝜓 Diff(𝑀 ) dans 𝑇𝜙∘𝜓 Diff(𝑀 ) :
′
(𝐿𝜙 𝑉 )(𝑥) = 𝑇𝜓(𝑥) 𝜙 · 𝑉 (𝑥),
et à droite de 𝑇𝜓 Diff(𝑀 ) dans 𝑇𝜓∘𝜙 Diff(𝑀 ) :
′
(𝑅𝜙 𝑉 )(𝑥) = 𝑉 (𝜙(𝑥)).
14
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
La formule (1.1), autrement dit l’action naturelle à gauche sur les champs de vecteurs,
s’interprète alors comme l’action adjointe de Diff(𝑀 ) sur son algèbre de Lie, Vect(𝑀 ). La
formule (1.8) est celle qui définit le sous-groupe à un paramètre associé à un élément de
l’algèbre de Lie. Attention, dans ce cas les sous-groupes à un paramètres ne sont pas défini
globalement contrairement à ce qui se passe pour un groupe de Lie de dimension fini. On
a seulement un flot défini localement. Remarquer également que dans l’équation (1.9), il
s’agit d’une translation à gauche alors que dans l’équation (1.8), l’élément 𝑋 de l’algèbre
de Lie du groupe des difféomorphismes est translaté à droite. Ceci va conduire a des
changements de signes lorsqu’on voudra interpréter des expressions de la géométrie souple
par des formules classiques de la théorie usuelle des groupes de Lie qui sont arbitrairement
définis à partir des translations à gauche.
1.5
Dérivée de Lie
Le problème qui va nous occuper maintenant est le suivant. Étant donné un champ de
vecteur 𝑋, donc une section 𝑋 : 𝑥 ↦→ 𝑋(𝑥) du fibré tangent, on ne sais pas dériver cette
fonction. Pourquoi ?
En fait ce n’est pas tout à fait exact. La section en question est une application entre
deux variétés différentielles, de 𝑀 vers 𝑇 𝑀 . Or on connaît la notion d’application linéaire
tangente à un application de classe 𝐶 ∞ entre deux variétés. Mais cette différentielle qu’on
pourrait noter 𝑇 𝑋 va de 𝑇 𝑀 dans 𝑇 𝑇 𝑀 , le fibré tangent du fibré tangent. Et ce n’est
pas tout à fait cela qui nous intéresse ici.
Si 𝑀 = R𝑛 , on a pas tous ces problèmes. Pourquoi ? Et bien parce que on identifie
un peu rapidement notre section 𝑋 avec une fonction vectorielle de 𝑈 ⊂ R𝑛 dans R𝑛 ; la
valeurs 𝑋(𝑥) et 𝑋(𝑦) de 𝑋 en deux points voisins appartiennent au même espace vectoriel
R𝑛 . Mais ceci n’est pas le cas pour un champ 𝑋 sur une variété 𝑀 quelconque ; 𝑋(𝑥)
appartient à 𝑇𝑥 𝑀 et 𝑋(𝑦) appartient à 𝑇𝑦 𝑀 qui sont différents.
Pour pouvoir définir un objet qui soit en quelque sorte la différentielle de 𝑋 au point
𝑥 et qui habite également 𝑇𝑥 𝑀 , il va falloir trouver une astuce ou une loi pour relier ou
connecter les espaces tangents 𝑇𝑥 𝑀 et 𝑇𝑦 𝑀 de deux points voisins. On peut résoudre ce
problème de deux façons différentes ; la première conduit à la notion de dérivée de Lie et
la seconde conduit à la notion de connexion qui sera abordé dans la section suivante.
Soit 𝑋 un champ de vecteur. Si 𝑓 ∈ 𝐶 ∞ (𝑀 ), on a déjà définit ce que l’on entendait
par 𝐿𝑋 𝑓 . C’est la différentielle de 𝑓 dans la « direction » 𝑋
(𝐿𝑋 𝑓 )(𝑥) = 𝑇𝑥 𝑓 · 𝑋(𝑥) = (𝑋 · 𝑓 )(𝑥).
Si 𝜙𝑡 désigne le flot du champ de vecteur 𝑋, on a également
⃒
⃒
𝑑 ⃒⃒
𝑑 ⃒⃒
(𝐿𝑋 𝑓 )(𝑥) = ⃒ 𝑓 (𝜙𝑡 (𝑥)) = ⃒ 𝜙𝑡* 𝑓 (𝑥).
𝑑𝑡 ⃒𝑡=0
𝑑𝑡 ⃒𝑡=0
Et cette définition peut être étendu pour définir la dérivée de Lie d’un autre champ de
vecteur 𝑌 . Pour 𝑡 au voisinage de 0, posons :
𝜙𝑡* 𝑌 (𝑥) = 𝑇𝜙𝑡 (𝑥) 𝜙−𝑡 · 𝑌 (𝜙𝑡 (𝑥)).
15
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
Ce vecteur appartient pour tout 𝑡 à l’espace vectoriel 𝑇𝑥 𝑀 . On peut donc calculer la
dérivée (par rapport à 𝑡) dans l’espace vectoriel 𝑇𝑥 𝑀 et on arrive à la définition suivante :
⃒
⃒
𝑑 ⃒⃒
𝑑 ⃒⃒
(𝐿𝑋 𝑌 )(𝑥) = ⃒⃒ 𝜙𝑡* 𝑌 (𝑥) = − ⃒⃒ 𝜙𝑡* 𝑌 (𝑥).
𝑑𝑡 𝑡=0
𝑑𝑡 𝑡=0
(1.10)
Le vecteur 𝐿𝑋 𝑌 définit un nouveau champ de vecteur que nous appellerons la dérivée de
Lie du champ 𝑌 par rapport au champ 𝑋.
Exercice 1.21. Montrer que 𝐿𝑋 𝑌 = [𝑋, 𝑌 ] et calculer 𝐿𝑓 𝑋 𝑌 et 𝐿𝑋 𝑓 𝑌 .
Remarque 1.22. Si on désigne l’anti-action « naturelle » du groupe des difféomorphismes
Diff(𝑀 ) sur Vect(𝑀 ) par 𝜙* 𝑋 (l’étoile en haut, voir l’exercice 1.5), alors
⃒
⃒
𝑑⃒
𝑑⃒
𝐿𝑋 𝑌 = ⃒⃒ 𝜙𝑡* 𝑌 = − ⃒⃒ 𝜙𝑡* 𝑌.
𝑑𝑡 ⃒𝑡=0
𝑑𝑡 ⃒𝑡=0
La dérivée de Lie d’un champ de vecteur correspond à un signe près 1 à l’action adjointe
de l’algèbre de Lie du groupe des difféomorphismes, Vect(𝑀 ), sur elle-même.
La définition de la dérivée de Lie s’étend aux formes différentielles et plus généralement
à tous les champs de tenseurs. Pour une forme différentielle 𝛼 on a :
⃒
𝑑⃒
𝐿𝑋 𝛼 = ⃒⃒ 𝜙𝑡* 𝛼
𝑑𝑡 ⃒𝑡=0
où (𝜙* 𝛼)(𝑥) = 𝛼𝜙(𝑥) ∘ 𝑇𝑥 𝜙.
Exercice 1.23. Soit 𝛼 une 1-forme et 𝑋, 𝑌 des champs de vecteurs, montrer que :
𝑋 · 𝛼(𝑌 ) = (𝐿𝑋 𝛼)(𝑌 ) + 𝛼(𝐿𝑋 𝑌 ). ♠
La dérivée de Lie n’est pas une « généralisation » de la différentielle d’un champ de
vecteurs de R𝑛 (ce qui sera l’objet de la section suivante). Elle correspond à ce qu’on
appelle l’action infinitésimal du groupe des difféomorphismes.
1.6
1.6.1
Loi de dérivation sur les fibrés vectoriels
Lois de dérivation sur un fibré vectoriel
Nous venons de voir la raison essentielle pour laquelle il n’est pas possible de dériver
un champ de vecteur sans introduire le deuxième fibré tangent ou sans utiliser le flot
d’un champ de vecteur pour connecter deux espaces tangents en des points voisins, ce
qui conduit à la notion de dérivée de Lie. Mais nous avons vu que celle-ci ne généralise
pas la notion de différentielle usuelle d’un champs de vecteurs de R𝑛 . Dans cette section,
nous allons montrer, plus généralement, comment dériver les sections d’un fibré vectoriel (𝐸, 𝜋, 𝑀 ) en restant dans 𝐸. Il n’y a pas de moyen canonique de le faire : il faut
arbitrairement introduire une loi de dérivation.
1. La structure d’algèbre de Lie de Vect(𝑀 ) est celle des champs invariants à droite, comme nous
l’avions déjà remarqué, ce qui explique ce problème de signe.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
16
Définition 1.24. Une loi de dérivation ∇ sur le 𝐶 ∞ (𝑀 )-module Γ(𝐸) des sections d’un
fibré vectoriel (𝐸, 𝜋, 𝑀 ) est une application R-bilinéaire ∇ : Vect(𝑀 ) × Γ(𝐸) → Γ(𝐸),
notée (𝑋, 𝜎) ↦→ ∇𝑋 𝜎 telle que
1. Pour tout 𝑋 ∈ Vect(𝑀 ), 𝑓 ∈ 𝐶 ∞ (𝑀 ), 𝜎 ∈ Γ(𝐸),
∇𝑓 𝑋 𝜎 = 𝑓 ∇𝑋 𝜎.
2. Pour tout 𝑋 ∈ Vect(𝑀 ), 𝑓 ∈ 𝐶 ∞ (𝑀 ), 𝜎 ∈ Γ(𝐸),
∇𝑋 (𝑓 𝜎) = (𝑋 · 𝑓 ) 𝜎 + 𝑓 ∇𝑋 𝜎.
Remarque 1.25. L’opérateur ∇ est local : pour tout ouvert 𝑈 de 𝑀 , il existe une loi de
dérivation ∇𝑈 sur les sections du fibré 𝐸𝑈 tel que
∇𝑈𝑋𝑈 𝜎𝑈 = (∇𝑋 𝜎)𝑈 ,
l’indice 𝑈 désignant la restriction à l’ouvert 𝑈 .
Remarque 1.26. Si l’on désigne par Ω𝑝 (𝑀, Γ(𝐸)) l’espace des formes différentielles de degré
𝑝 sur 𝑀 à valeur dans l’espace des sections de 𝐸, alors ∇𝜎 appartient à Ω1 (𝑀, Γ(𝐸)) et
∇ est une application R-linéaire de Ω0 (𝑀, Γ(𝐸)) = Γ(𝐸).
Exemple 1.27. Si l’on considère 𝐶 ∞ (𝑀 ) comme l’espace des sections du fibré trivial
𝑀 × R, alors la loi définie par
∇ 𝑋 𝑓 = 𝐿𝑋 𝑓 = 𝑋 · 𝑓
est une loi de dérivation sur Γ(𝑀 × R) dite loi de dérivation canonique.
Exercice 1.28. Est-ce que la dérivée de Lie des champs de vecteurs définie une loi de
dérivation sur les sections du fibré tangent d’une variété 𝑀 . pourquoi ?
Exercice 1.29. Soit ∇ et ∇′ deux lois de dérivation sur Γ(𝐸). Montrer que si ℎ = ∇−∇′ ,
alors ℎ(𝑓 𝑋, 𝜎) = 𝑓 ℎ(𝑋, 𝜎) et ℎ(𝑋, 𝑓 𝜎) = 𝑓 ℎ(𝑋, 𝜎).
1.6.2
Lois de dérivation associées
Supposons qu’on se soit donné des lois de dérivation ∇1 et ∇2 sur les fibrés 𝐸1 et 𝐸2
respectivement. On peut alors en déduire plusieurs autres lois de dérivation.
1. Sur Γ(𝐸1
⨁︀
𝐸2 ) en posant pour tout 𝜎 = 𝜎1 + 𝜎2
∇𝑋 𝜎 = ∇1𝑋 𝜎1 + ∇2𝑋 𝜎2 .
2. Sur Γ(𝐸1
⨂︀
𝐸2 ) en posant pour tout 𝜎 = 𝜎1 ⊗ 𝜎2
∇𝑋 𝜎 = ∇1𝑋 𝜎1 ⊗ 𝜎2 + 𝜎1 ⊗ ∇2𝑋 𝜎2 .
Remarque 1.30. En particulier, sur le fibré vectoriel des endomorphismes linéaires de 𝐸1
⨂︀
dans 𝐸2 qui n’est autre que Γ(𝐸1* 𝐸2 ) on a la loi de dérivation suivante
(∇𝑋 𝐴)(𝜎1 ) = ∇2𝑋 𝐴(𝜎1 ) + 𝐴(∇1𝑋 𝜎1 ).
17
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.6.3
Connexion linéaire
On appelle connexion linéaire (ou dérivée covariante) sur une variété différentielle 𝑀
la donnée d’une loi de dérivation sur les sections du fibré tangent à 𝑀 , autrement dit sur
les champs de vecteurs.
Remarque 1.31. Une connexion linéaire sur Vect(𝑀 ) induit donc, en vertu des remarques
précédentes, une loi de dérivation sur les 1-formes en posant
(∇𝑋 𝛼)(𝑌 ) = 𝑋 · 𝛼(𝑌 ) − 𝛼(∇𝑋 𝑌 ),
et plus généralement sur tous les champs de tenseurs sur 𝑀 .
∇𝑋 définit un opérateur linéaire de Vect(𝑀 ) dans Vect(𝑀 ) mais ce n’est pas un champ
de tenseurs de type (1, 1) : en effet on n’a pas ∇𝑋 𝑓 𝑌 = 𝑓 ∇𝑋 𝑌 . En revanche, les objets
suivants, associés à ∇ le sont. Il s’agit de :
1. la torsion de ∇ définie par :
𝑇 (𝑋, 𝑌 ) = ∇𝑋 𝑌 − ∇𝑌 𝑋 − [𝑋, 𝑌 ] ,
2. et la courbure de ∇ définie par :
𝑅(𝑋, 𝑌 ) = ∇𝑋 ∇𝑌 − ∇𝑌 ∇𝑋 − ∇[𝑋,𝑌 ] .
Exercice 1.32. Vérifier que la torsion et la courbure d’une connexion linéaire sont bien
des champs de tenseurs.
Remarque 1.33. Si on désigne par [𝑃, 𝐷] = 𝑃 𝐷 − 𝐷 𝑃 le commutateur habituel de deux
opérateurs linéaires, remarquer que l’opérateur 𝑅(𝑋, 𝑌 ) s’écrit
𝑅(𝑋, 𝑌 ) = [∇𝑋 , ∇𝑌 ] − ∇[𝑋,𝑌 ] .
Une connexion linéaire est dite symétrique si sa torsion est nulle. Si, de plus sa courbure
est nulle, on dit qu’elle est plate.
Exemple 1.34. Sur R𝑛 considéré comme variété 𝐶 ∞ on a la connexion définie par
∇𝑋 𝑌 = 𝑌 ′ · 𝑋,
où 𝑌 ′ désigne la différentielle usuelle de la fonction vectorielle 𝑌 . On l’appelle la connexion
canonique de R𝑛 . Elle est bien entendue symétrique et même plate.
Exercice 1.35. Soit ∇ une connexion linéaire symétrique sur une variété 𝑀 . Montrer
que pour toute 1-forme différentielle 𝛼 sur 𝑀 , on a
𝑑𝛼 (𝑋, 𝑌 ) = (∇𝑋 𝛼)(𝑌 ) − (∇𝑌 𝛼)(𝑋),
𝑋, 𝑌 ∈ Vect(𝑀 ).
Exercice 1.36. Soit 𝐺 un groupe de Lie. Expliquer pourquoi on définit une connexion
sur 𝐺 en posant
1
∇𝐿𝜔 𝐿𝜉 = [𝐿𝜔 , 𝐿𝜉 ]
2
où 𝐿𝜔 désigne le champ de vecteur invariant à gauche engendré par le vecteur 𝜔 ∈ g.
Montrer que cette connexion est symétrique et calculer sa courbure.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.6.4
18
Connexion riemannienne
Comme nous l’avons déjà fait remarquer, il n’existe pas de connexion linéaire canonique
sur une variété 𝑀 nue (sans structure supplémentaire) mais ceci est différent si la variété
est munie d’une métrique riemannienne ou pseudo-riemannienne 𝑔. Une connexion linéaire
∇ est dite compatible avec la métrique 𝑔 si
∇𝑋 𝑔 = 0,
pour tout 𝑋 ∈ Vect(𝑀 ).
Exercice 1.37. Montrer que les deux équation suivantes sont équivalentes
∇𝑋 𝑔 = 0, ∀𝑋 ∈ Vect(𝑀 )
𝑋 · 𝑔(𝑌, 𝑍) = 𝑔(∇𝑋 𝑌, 𝑍) + 𝑔(𝑌, ∇𝑋 𝑍), ∀𝑋, 𝑌, 𝑍 ∈ Vect(𝑀 )
(1.11)
(1.12)
Theorème 1.38. Étant donné une variété riemannienne (ou pseudo-riemannienne) (𝑀, 𝑔),
il existe une connexion linéaire symétrique, et une seule, ∇, compatible avec la métrique
𝑔.
Démonstration. Si la connexion ∇ est symétrique et compatible avec 𝑔, alors quels que
soient 𝑋, 𝑌, 𝑍 on a
∇𝑋 − ∇𝑌 = [𝑋, 𝑌 ] ,
𝑋 · 𝑔(𝑌, 𝑍) = 𝑔(∇𝑋 𝑌, 𝑍) + 𝑔(𝑌, ∇𝑋 𝑍).
En écrivant la deuxième équation pour toutes les permutations circulaires de 𝑋, 𝑌, 𝑍 et
en faisant la somme alternée, on en déduit
2 𝑔(∇𝑋 𝑍, 𝑌 ) = 𝑋 · 𝑔(𝑌, 𝑍) − 𝑌 · 𝑔(𝑍, 𝑋) + 𝑍 · 𝑔(𝑋, 𝑌 )+
− 𝑔([𝑋, 𝑌 ] , 𝑍) + 𝑔([𝑌, 𝑍 ] , 𝑋) − 𝑔([𝑍, 𝑋 ] , 𝑌 ).
L’application Vect(𝑀 ) → Ω1 (𝑀 ) induite par 𝑔 étant un isomorphisme, cette équation
définit ∇𝑋 de manière unique. Inversement, l’opérateur ∇ défini par cette équation est
bien une connexion linéaire symétrique et compatible avec 𝑔.
1.6.5
Expression locale d’une connexion linéaire
Soit (𝑥𝑖 ) un système de coordonnées locales. La connexion linéaire ∇ est (localement)
entièrement déterminée par la connaissance des champs de vecteurs
∇𝜕 𝑖 𝜕 𝑗 = Γ𝑘𝑖𝑗 𝜕 𝑘 .
Les Γ𝑘𝑖𝑗 , appelés, symboles de Christoffel sont donc les coordonnées de ∇ dans la carte
locale (𝑥𝑖 ).
Exercice 1.39. Calculer les composantes (∇𝑋 𝑌 )𝑘 et (∇𝑋 𝛼)𝑘 des dérivées covariantes
d’un champ de vecteur 𝑋 et d’une 1-forme 𝛼 en coordonnées locales.
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
19
Exercice 1.40. Montrer que dans une carte locale les composantes de la torsion et du
tenseur de courbure s’écrivent respectivement :
𝑇𝑖𝑗𝑘 = Γ𝑘𝑖𝑗 − Γ𝑘𝑗𝑖 ,
𝑙
𝑅𝑖𝑗𝑘
= 𝜕 𝑖 Γ𝑙𝑗𝑘 − 𝜕 𝑗 Γ𝑙𝑖𝑘 + Γ𝑠𝑗𝑘 Γ𝑙𝑖𝑠 − Γ𝑠𝑖𝑘 Γ𝑙𝑗𝑠 .
̃︀ 𝑘 sont les
Exercice 1.41. Montrer que si (𝑦 𝑖 ) est un autre système de coordonnées et Γ
𝑖𝑗
symboles de Christoffel dans ce nouveau système de coordonnées, on a
̃︀ 𝛾 =
Γ
𝛼𝛽
∑︁
𝑖,𝑗,𝑘
Γ𝑘𝑖𝑗
𝑛
𝜕𝑥𝑖 𝜕𝑥𝑗 𝜕𝑦 𝛾 ∑︁
𝜕 2 𝑥𝑙 𝜕𝑦 𝛾
+
.
𝜕𝑦 𝛼 𝜕𝑦 𝛽 𝜕𝑥𝑘 𝑙=1 𝜕𝑦 𝛼 𝜕𝑦 𝛽 𝜕𝑥𝑙
(1.13)
Comme on s’y attend, les fonctions Γ𝑘𝑖𝑗 ne se comportent pas comme les composantes
d’un champ de tenseurs de type (2, 1). Toutefois, une connexion linéaire est bien un objet
souple. Le groupe des difféomorphismes agit à gauche sur les connexions de la façon
suivante
(𝜙* ∇)𝑋 (𝑌 ) = 𝜙* (∇𝜙−1
𝜙−1
* 𝑌 ).
* 𝑋
Exercice 1.42. Montrer que la connexion linéaire canonique d’un groupe de Lie 𝐺, définie
par :
1
∇𝐿𝜔 𝐿𝜉 = [𝐿𝜔 , 𝐿𝜉 ]
2
est invariante à la fois par les translations à gauche et les translations à droite.
A tout champ de vecteur 𝑋 est associé une équation différentielle du premier ordre,
dont la solution défini le flot du champ 𝑋. De la même façon, nous allons voir, dans le paragraphe suivant qu’on peut associer à toute connexion linéaire une équation différentielle
du deuxième ordre, dont la solution constitue ce qu’on appelle le flot géodésique associé à
la connexion.
1.6.6
Champ de vecteurs du second ordre
Un champ de vecteurs du deuxième ordre sur une variété 𝑀 est un champs de vecteurs
sur le fibré tangent 𝑇 𝑀 (donc une section 𝐹 du deuxième fibré tangent 𝑇 𝑇 𝑀 ) qui vérifie
de plus l’équation
𝜋 ′ ∘ 𝐹 = 𝑖𝑑𝑇 𝑀 ,
où 𝜋 ′ est l’application linéaire tangente de la projection canonique
𝜋 : 𝑇𝑀 → 𝑀 .
Soit 𝑈 un carte locale sur 𝑀 . Localement on peut écrire
𝑇 (𝑈 ) ∼
= 𝑈 × R𝑛
et
𝑇 (𝑇 (𝑈 )) ∼
= (𝑈 × R𝑛 ) × (R𝑛 × R𝑛 ).
Avec ces notations, on a 𝜋(𝑥, 𝑢) = 𝑥 pour la projection canonique du fibré tangent et
𝜋 ′ (𝑥, 𝑣, 𝑢, 𝑤) = (𝑥, 𝑢) pour son application linéaire tangente. Quant à la projection canõ︀ elle s’écrit 𝜋(𝑥,
̃︀
nique du deuxième fibré tangent, 𝜋,
𝑣, 𝑢, 𝑤) = (𝑥, 𝑣). Par conséquent, tout
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
20
champ de vecteurs 𝐹 sur 𝑇 𝑀 (qui vérifie 𝜋̃︀ ∘ 𝐹 = 𝑖𝑑𝑇 𝑀 ) est donné localement par une
fonction vectorielle
𝑓 : 𝑈 × R𝑛 → R𝑛 × R𝑛
où 𝑓 (𝑥, 𝑣) = (𝑓1 (𝑥, 𝑣), 𝑓2 (𝑥, 𝑣)). La condition pour que 𝐹 soit un champ du deuxième
ordre conduit alors à 𝑓1 (𝑥, 𝑣) = 𝑣, conséquence immédiate de 𝜋 ′ ∘ 𝐹 = 𝑖𝑑𝑇 𝑀 .
Considérons à présent une courbe intégrale du champ de vecteurs du deuxième ordre
𝐹 , c’est à dire une courbe 𝛽 sur 𝑇 𝑀 solution de l’équation
𝑑𝛽
= 𝐹 (𝛽(𝑡)).
𝑑𝑡
En coordonnées locales, on a 𝛽(𝑡) = (𝑥(𝑡), 𝑣(𝑡)) et l’équation précédente s’écrit sous la
forme du système du deuxième ordre suivant :
{︃
𝑥˙ = 𝑣,
𝑣˙ = 𝑓2 (𝑥, 𝑣).
Exercice 1.43. Montrer qu’un champ de vecteur 𝐹 sur 𝑇 𝑀 est un champ de vecteur du
deuxième ordre si et seulement si toute courbe intégrale 𝛽 de 𝐹 vérifie (𝜋(𝛽))′ = 𝛽.
On dit qu’une courbe 𝛼(𝑡) sur 𝑀 est une géodésique du champ du deuxième ordre 𝐹 , si
𝛼 est une courbe intégrale de 𝐹 , autrement dit si 𝛼 est solution de l’équation différentielle
du second ordre
𝛼′′ = 𝐹 (𝛼′ ).
′
1.6.7
Champ du deuxième ordre associé à une connexion linéaire
Parmi les champs de vecteurs du deuxième ordre, il y’en a qui sont plus remarquables
que d’autres, ce sont ceux qui sont quadratiques et qui sont intimement liés aux connexions
linéaires. Soit 𝐸 un fibré vectoriel et 𝑠 un nombre réel non nul. On définit un isomorphisme
du fibré 𝐸 en posant
𝑠𝐸 : 𝑋 ∈ 𝐸𝑥 ↦→ 𝑠𝑋 ∈ 𝐸𝑥 .
On vérifie alors que pour 𝐸 = 𝑇 𝑀 on a :
(𝑠𝑇 𝑀 )′ ∘ 𝑠𝑇 𝑇 𝑀 = 𝑠𝑇 𝑇 𝑀 ∘ (𝑠𝑇 𝑀 )′
sur 𝑇 𝑇 𝑀 .
Définition 1.44. On dit qu’un champ de vecteur du deuxième ordre 𝐹 est une gerbe s’il
vérifie l’équation
𝐹 (𝑠𝑋) = ((𝑠𝑇 𝑀 )′ ∘ 𝑠𝑇 𝑇 𝑀 )𝐹 (𝑋).
En coordonnées locales, ceci se traduit par le fait que 𝑓2 (𝑥, 𝑣) est une fonction homogène de degré 2 en 𝑣.
Exercice 1.45. Soit 𝑈 ⊂ R𝑛 un voisinage de 0 et 𝑓 : 𝑈 :→ R𝑝 une fonction homogène de
de degré 2, de classe 𝐶 2 au voisinage de 0. Montrer que 𝑓 est une application quadratique,
i.e. qu’il existe une application bilinéaire symétrique 𝑏 : R𝑛 × R𝑛 → R𝑝 telle que 𝑓 (𝑣) =
(1/2) 𝑏(𝑣, 𝑣).
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
21
Exercice 1.46. En explicitant l’expression de 𝑓2 à l’aide des fonctions coordonnées (𝑥𝑖 ),
montrer que :
𝑓2 (𝑥, 𝑣) = (1/2) 𝑏𝑘𝑖𝑗 (𝑥) 𝑣 𝑖 𝑣 𝑗 𝜕 𝑘 ,
où les 𝑏𝑘𝑖𝑗 sont les composantes de l’application bilinéaire symétrique 𝑏. Montrer que dans
un changement de coordonnées, les fonctions 𝑏𝑘𝑖𝑗 (𝑥) se transforment comme les Γ𝑘𝑖𝑗 (𝑥)
suivant la règle (1.13).
Ainsi, à toute connexion linéaire ∇, est associée la gerbe 𝐹 donnée par l’expression
locale
−𝑏𝑘𝑖𝑗 (𝑥) = Γ𝑘𝑖𝑗 (𝑥) + Γ𝑘𝑗𝑖 (𝑥),
et inversement, à toute gerbe 𝐹 est associée une unique connexion linéaire symétrique,
dont les symboles de Christoffel dans une carte locale quelconque vérifient Γ𝑘𝑖𝑗 = −(1/2)𝑏𝑘𝑖𝑗 .
1.6.8
Le flot géodésique et l’application exponentielle
Le caractère quadratique particulier d’une gerbe 𝐹 a des conséquences importantes
sur son flot. En effet, pour une gerbe on a
Lemme 1.47. Pour tout 𝑋 ∈ 𝑇 𝑀 , 𝑡 appartient à l’intervalle d’existence de la courbe
𝛽𝑠𝑋 si et seulement si 𝑠𝑡 appartient à l’intervalle d’existence de 𝛽𝑋 et dans ce cas on a :
𝛽𝑠𝑋 (𝑡) = 𝑠𝛽𝑋 (𝑠𝑡).
Par conséquent, pour tout point 𝑥 ∈ 𝑀 , il existe un voisinage ouvert 𝑂 de 0 dans 𝑇𝑥 𝑀
tel que pour tout 𝑣 ∈ 𝑂, 𝛽(𝑥,𝑣) (1) soit défini. On définit alors l’exponentielle au point 𝑥
𝑒𝑥𝑝𝑥 : 𝑂 → 𝑀
en posant
exp𝑥 (𝑣) = 𝜋𝛽(𝑥,𝑣) (1).
Comme dans le cas d’un groupe de Lie, on démontre le résultat suivant
Theorème 1.48. Soit 𝐹 une gerbe sur 𝑀 . L’application
𝑒𝑥𝑝𝑥 : 𝑇𝑥 𝑀 → 𝑀
induit un difféomorphisme local d’un voisinage ouvert de 0 dans 𝑇𝑥 𝑀 sur un voisinage
ouvert de 𝑥 dans 𝑀 .
Le flot de la gerbe 𝐹 associée à une connexion linéaire ∇ s’appelle le flot géodésique
de la connexion. En coordonnées locales, l’équation des géodésiques s’écrit
𝑑 2 𝑥𝑘
+ Γ𝑘𝑖𝑗 (𝑥) 𝑥˙𝑖 𝑥˙𝑗 = 0,
𝑑𝑡2
1 ≤ 𝑘 ≤ 𝑛.
(1.14)
L’application exponentielle de 𝐹 au point 𝑥, étant un difféomorphisme local d’un
voisinage ouvert de 0 ∈ 𝑇𝑥 𝑀 sur un voisinage ouvert de 𝑥 dans 𝑀 , il définit une carte
locale particulière, qu’on appelle la carte exponentielle. Étant donnée une base (𝑒𝑖 )1≤𝑖≤𝑛
de 𝑇𝑥 𝑀 , tout vecteur 𝑣 de 𝑇𝑥 𝑀 se met sous la forme
𝑣=
𝑛
∑︁
𝑖=1
𝑥𝑖 𝑒 𝑖 ,
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
22
où 𝑥𝑖 sont les composantes de 𝑣 dans cette base. Comme dans le cas des groupes de
Lie, on peut prendre (𝑥𝑖 ) comme coordonnées du point 𝑥 = exp𝑥 (𝑣) ∈ 𝑀 . Les fonctions
coordonnées exp𝑥 (𝑣) ↦→ 𝑥𝑖 sont appelées les coordonnées géodésiques ou normales de 𝑥
relativement à la base 𝑒𝑖 de 𝑇𝑥 𝑀 .
Dans ce système de coordonnées, une géodésique 𝛼 issue de 𝑥 dans la direction 𝑣 =
∑︀ 𝑖
𝑘
𝑖
𝑖 𝜉 𝑒𝑖 s’écrit simplement 𝑥 (𝑡) = 𝑡 𝜉 .
Exercice 1.49. Soit 𝐺 un groupe de Lie. Calculer les géodésiques issue de l’élément
neutre du groupe pour la connexion canonique définie dans l’exercice 1.36.
1.6.9
Dérivée covariante le long d’une courbe
Soit 𝛼 une courbe sur 𝑀 . Par un champ de vecteur le long de 𝛼, ou relèvement de 𝛼,
on entend une courbe 𝑋 : 𝐼 → 𝑇 𝑀 (de classe 𝐶 ∞ ), telle que 𝜋 ∘ 𝑋 = 𝛼. Notons 𝐿(𝛼)
l’ensemble des relèvements de 𝛼. Comme on a défini une dérivé covariante des champs
de vecteurs, on peut définir une dérivée covariante le long de 𝛼. C’est une application
𝐷
et telle que
R-linéaire de 𝐿(𝛼) dans 𝐿(𝛼) notée 𝐷𝑡
𝐷
𝐷
(𝑓 𝑋) = 𝑓˙ 𝑋 + 𝑓
𝑋.
𝐷𝑡
𝐷𝑡
pour tout fonction réelle 𝑓 ∈ 𝐶 ∞ (𝐼, R) et tout 𝑋 ∈ 𝐿(𝛼).
Toute connexion linéaire ∇ sur 𝑀 induit une dérivée covariante sur 𝐿(𝛼) pour toute
courbe 𝛼 de classe 𝐶 ∞ . Elle est donnée localement par l’expression
(︂
𝐷𝑋
𝐷𝑡
)︂𝑘
=
𝑑𝑋 𝑘
+ Γ𝑘𝑖𝑗 𝛼˙ 𝑖 𝑋 𝑗 .
𝑑𝑡
Exercice 1.50. Soit 𝑋 un champ de vecteurs sur 𝑀 et 𝛼 une courbe sur 𝑀 . Montrer
que si on pose 𝑋(𝑡) = 𝑋(𝛼(𝑡)) alors on a
(︂
𝐷𝑋
(𝑡) = (∇𝛼˙ 𝑋)(𝛼(𝑡)).
𝐷𝑡
)︂
Avec ces notations, une géodésique 𝛼 de la connexion ∇ est définie comme une solution
de l’équation
𝐷𝛼˙
= 0,
𝐷𝑡
qu’on interprète en disant qu’une géodésique est une courbe « d’accélération nulle ».
Plus généralement, on dit qu’un champ 𝑋(𝑡) le long d’une courbe quelconque 𝛼 est
parallèle le long de 𝛼 s’il vérifie l’équation
𝐷𝑋
= 0.
𝐷𝑡
Cette dernière équation est une équation linéaire du premier ordre en 𝑋. Elle définit, en
particulier, une application linéaire bijective entre les espaces tangents aux deux extrémités de la courbe 𝛼. Cette application, appelée le transport parallèle, permet de connecter
les deux espaces tangents 𝑇𝛼(0) et 𝑇𝛼(1) . Attention, ce transport parallèle dépend, en général, du chemin suivi 𝛼.
23
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
1.6.10
Équation de Jacobi
Considérons une équation différentielle ordinaire dans R𝑛
𝑥˙ = 𝑓 (𝑥),
(1.15)
où 𝑓 est une application 𝐶 ∞ défini sur un voisinage d’un point 𝑥0 . Le théorème de CauchyLipschitz assure l’existence, l’unicité et la dépendance 𝐶 ∞ de la solution par rapport à
une condition initiale choisie au voisinage de 𝑥0 . Soit 𝑥(𝑠, 𝑡) une famille à un paramètre
de solutions 𝑥𝑠 (𝑡) telles que 𝑥𝑠 (0) = 𝑥0 (𝑠) (où 𝑥0 (0) = 𝑥0 ). Posons
𝑋(𝑡) =
𝜕𝑥
(0, 𝑡).
𝜕𝑠
Alors le vecteur 𝑋(𝑡) est solution de l’équation différentielle linéaire
𝑋˙ = 𝑇𝑥(𝑡) 𝑓 · 𝑋(𝑡),
(1.16)
appelée équation linéarisée de l’équation (1.15) le long de la solution 𝑥(𝑡). Cette équation
intervient en particulier dans l’étude de la stabilité d’un point stationnaire ou d’une orbite
périodique de l’équation (1.15). L’équation de Jacobi que nous allons introduire dans ce
paragraphe est en quelque sorte l’équation linéarisée de l’équation des géodésiques d’un
connexion linéaire ∇.
Soit 𝑀 une variété munie d’une connexion linéaire ∇, 𝐼1 et 𝐼2 deux intervalles ouverts
de R et 𝜎 : 𝐼1 × 𝐼2 → 𝑀 une application 𝐶 ∞ . Par un relèvement de 𝜎, on entend une
application 𝑋 : 𝐼1 × 𝐼2 → 𝑇 𝑀 (de classe 𝐶 ∞ ), telle que 𝜋 ∘ 𝑋 = 𝜎. Si l’on fixe 𝑠 ∈ 𝐼1 , on
𝐷
. On défini
a une dérivée covariante le long de la courbe 𝜎𝑠 (𝑡) = 𝜎(𝑠, 𝑡) que l’on notera
𝐷𝑡
𝐷
de la même manière, la dérivée covariante « par rapport à 𝑠 »,
. Avec ces notations,
𝐷𝑠
on a le lemme suivant dont la démonstration sera laissée en exercice.
Lemme 1.51. Soit ∇ une connexion linéaire symétrique sur 𝑀 , 𝜎 : 𝐼1 × 𝐼2 → 𝑀 une
application 𝐶 ∞ et 𝑋 un relèvement de 𝜎. Alors on a :
𝐷
𝐷𝑡
(︃
𝜕𝜎
𝜕𝑠
)︃
𝐷
=
𝐷𝑠
(︃
𝜕𝜎
𝜕𝑡
et
𝐷 𝐷𝑋
𝐷𝑡 𝐷𝑠
(︂
)︂
𝐷 𝐷𝑋
−
𝐷𝑠 𝐷𝑡
(︂
)︂
)︃
(1.17)
,
(︃
)︃
𝜕𝜎 𝜕𝜎
=𝑅
,
𝑋,
𝜕𝑡 𝜕𝑠
(1.18)
où 𝑅 désigne le tenseur de courbure de la connexion.
Considérons à présent une géodésique 𝛼. Soit 𝜎 : 𝐼1 × 𝐼2 → 𝑀 une application 𝐶 ∞
telle que 𝜎(0, 𝑡) = 𝛼(𝑡) et telle que 𝜎𝑠 (𝑡) = 𝜎(𝑠, 𝑡) soit une géodésique pour tout 𝑠 fixé. On
appelle 𝜎 une variation de la géodésique 𝛼. Le champ de vecteur le long de 𝛼 défini par
𝐽(𝑡) =
𝜕𝜎
(0, 𝑡)
𝜕𝑠
est appelé un champ de Jacobi et on a le théorème suivant.
24
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
Theorème 1.52. Soit 𝐽(𝑡) un champ de Jacobi le long de la géodésique 𝛼. Il vérifie
l’équation suivante dite de Jacobi
𝐷2 𝐽
𝐷 𝐷𝐽
=
2
𝐷𝑡
𝐷𝑡 𝐷𝑡
(︂
)︂
= 𝑅(𝛼,
˙ 𝐽)𝛼˙ .
(1.19)
Démonstration. La démonstration de ce théorème est une conséquence directe du lemme
précédent. En effet on a
𝐷2 𝐽
𝐷 𝐷 𝜕𝜎
𝐷 𝐷 𝜕𝜎
(0, 𝑡) =
(0, 𝑡) = 𝑅(𝛼,
˙ 𝐽)𝛼˙
=
2
𝐷𝑡
𝐷𝑡 𝐷𝑡 𝜕𝑠
𝐷𝑡 𝐷𝑠 𝜕𝑡
car
𝐷 𝐷 𝜕𝜎
(𝑠, 𝑡) = 0,
𝐷𝑠 𝐷𝑡 𝜕𝑡
∀𝑠, 𝑡
Remarque 1.53. Il est important de noter que l’équation de Jacobi est une équation linéaire
du second ordre. L’espace des champs de Jacobi 𝐽(𝑡) le long de la géodésique 𝛼 est un
espace vectoriel de dimension 2𝑛 (si 𝑛 est la dimension de 𝑀 ). Chaque champ 𝐽(𝑡) est
𝐷𝐽
(0).
défini par les valeurs initiales 𝐽(0) et
𝐷𝑡
1.6.11
Lemmes fondamentaux
Pour terminer ce chapitre d’introduction aux notions fondamentales de géométrie différentielle, nous citerons deux théorèmes qui illustrent la signification de la torsion et de
la courbure d’une connexion linéaire.
Theorème 1.54. Soit ∇ une connexion linéaire sur une variété 𝑀 . Sa torsion est nulle
si et seulement si, pour tout point 𝑥0 , il est possible de trouver des coordonnées locales
(𝑥𝑖 ) pour lesquelles on a Γ𝑘𝑖𝑗 (𝑥0 ) = 0.
Démonstration. Supposons d’abord que pour tout point 𝑥0 , il soit possible de trouver des
coordonnées locales (𝑥𝑖 ) où Γ𝑘𝑖𝑗 (𝑥0 ) = 0. Alors on a :
𝑇𝑖𝑗𝑘 (𝑥0 ) = Γ𝑘𝑖𝑗 (𝑥0 ) − Γ𝑘𝑗𝑖 (𝑥0 ) = 0
pour tout 𝑖, 𝑗, 𝑘 et donc 𝑇 (𝑥0 ) = 0. Le point 𝑥0 étant arbitraire, on a donc 𝑇 = 0.
Inversement supposons que le tenseur 𝑇 soit identiquement nul. Fixons un point 𝑥0 et
choisissons les coordonnées géodésiques en ce point. Dans ces coordonnées, la géodésique
issue de 𝑥0 dans la direction 𝜉 a pour expression
𝑥𝑘 (𝑡) = 𝑡 𝜉 𝑘
et l’équation des géodésiques (1.14) s’écrit
Γ𝑘𝑖𝑗 ((𝑡 𝜉)) 𝜉 𝑖 𝜉 𝑗 = 0,
pour tout 𝑘 et tout vecteur 𝜉. En particulier au point 𝑥0 on a
Γ𝑘𝑖𝑗 (0) 𝜉 𝑖 𝜉 𝑗 = 0,
et comme Γ𝑘𝑖𝑗 = Γ𝑘𝑗𝑖 , on a nécessairement Γ𝑘𝑖𝑗 (0) = 0 pour tout 𝑖, 𝑗, 𝑘.
25
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
Theorème 1.55. Soit ∇ une connexion linéaire sur une variété 𝑀 . Sa courbure est nulle
si et seulement si, il est possible en tout point 𝑥0 , de trouver des coordonnées locales (𝑥𝑖 )
pour lesquelles on a Γ𝑘𝑖𝑗 (𝑥) = 0 sur un voisinage de 𝑥0 .
Démonstration. La nullité des symboles de Christoffel entraîne bien entendu la nullité du
tenseur de courbure 𝑅 localement. Il suffit donc de montrer la réciproque. La démonstration se fait en deux étapes. La première étape consiste à montrer que si 𝑅 = 0 et si (𝑥𝑖 )
désigne une carte locale au voisinage d’un point 𝑥0 , alors il existe un ouvert ouvert 𝑈 de
𝑥0 dans cette carte tel que : pour tout vecteur 𝑊0 ∈ 𝑇𝑥0 , il existe un champ de vecteurs
𝑊 sur 𝑈 parallèle, c’est à dire vérifiant
∇𝑋 𝑊 = 0,
∀𝑋 ∈ Vect(𝑀 )
et tel que 𝑊 (𝑥0 ) = 𝑊0 . La deuxième étape consiste à montrer que si la carte sur laquelle on
travaille est la carte exponentielle et si 𝑅 = 0 alors un champ parallèle est nécessairement
constant (i.e. ces composantes dans cette carte locale sont des fonctions constantes). Par
conséquent, les vecteurs de bases 𝜕 𝑖 sont eux mêmes parallèles et donc Γ𝑘𝑖𝑗 = 0.
1𝑒𝑟𝑒 étape : Soit (𝑥𝑖 ) une carte locale autour de 𝑥0 . On peut supposer que les coordonnées de 𝑥0 sont toutes nulles. Pour 𝑘 = 1, . . . , 𝑛, soit 𝐼𝑘 un intervalle ouvert contenant 0
tel que 𝐼1 ×· · ·×𝐼𝑛 soit dans le domaine de la carte locale. On commence par construire un
champ de vecteur parallèle 𝑊 (𝑥1 ) le long de l’arc (𝑥1 , 0, . . . , 0) (𝑥1 ∈ 𝐼1 ). Pour chaque 𝑥1 ,
on construit alors un champ de vecteur parallèle 𝑊 (𝑥1 , 𝑥2 ) le long de l’arc (𝑥1 , 𝑥2 , 0, . . . , 0)
(𝑥2 ∈ 𝐼2 ). On a donc
𝐷𝑊 1
(𝑥 , 0) = 0, ∀𝑥1
𝐷𝑥1
et
𝐷𝑊 1 2
(𝑥 , 𝑥 ) = 0, ∀𝑥1 , 𝑥2 .
𝐷𝑥2
Mais si 𝑅 = 0, on a en vertu de l’équation (1.18)
𝐷
𝐷𝑥2
(︂
𝐷
𝐷𝑊
(𝑥1 , 𝑥2 ) =
1
𝐷𝑥
𝐷𝑥1
)︂
(︂
𝐷𝑊
(𝑥1 , 𝑥2 ) = 0 .
𝐷𝑥2
)︂
ce qui signifie que le vecteur
𝐷𝑊 1 2
(𝑥 , 𝑥 )
𝐷𝑥1
est parallèle le long de l’arc (𝑥1 , 𝑥2 , 0, . . . , 0) (𝑥2 ∈ 𝐼2 ). Comme de plus ce vecteur est nul
pour 𝑥2 = 0, il est nul partout :
𝐷𝑊 1 2
(𝑥 , 𝑥 ) = 0,
𝐷𝑥1
∀𝑥1 , 𝑥2 .
En itérant ce procédé, on construit un champ de vecteur 𝑊 (𝑥1 , . . . , 𝑥𝑛 ) tel que
∇𝜕 𝑘 𝑊 =
𝐷𝑊
= 0,
𝐷𝑥𝑘
pour tout (𝑥1 , . . . , 𝑥𝑛 ) ∈ 𝐼1 × · · · × 𝐼𝑛 , autrement dit un champ parallèle.
2𝑒𝑚𝑒 étape : On suppose à présent que (𝑥𝑖 ) désigne un système de coordonnées normales
au voisinage de 𝑥0 . Comme nous l’avons déjà remarqué, une géodésique 𝛼 issue de 𝑥0 s’écrit
dans ce système de coordonnées : 𝑥𝑘 (𝑡) = 𝑡𝜉 𝑘 où les 𝜉 𝑘 sont des constantes. Une variation
CHAPITRE 1. GÉOMÉTRIE DIFFÉRENTIELLE
26
de cette géodésique issue de 𝑥0 laissant cette extrémité fixe s’écrit 𝜎 𝑘 (𝑠, 𝑡) = 𝑡𝜉 𝑘 (𝑠). Le
champ de Jacobi qui lui est associé est donné par
𝐽 𝑘 (𝑡) =
𝜕𝜎 𝑘
(0, 𝑡) = 𝑡𝜉˙𝑘 (0) .
𝜕𝑠
Nous poserons 𝜉 𝑘 (0) = 𝜉 𝑘 et 𝜉˙𝑘 (0) = 𝑤𝑘 . Si 𝑅 = 0, l’équation de Jacobi s’écrit
𝐷2 𝐽
= 0.
𝐷𝑡2
Soit 𝑊 un champ de vecteur parallèle dont les composantes en 𝑥0 sont égales à 𝑤𝑘 .
La première étape de la démonstration a montré qu’un tel champ existait. Remarquons
alors que le champ 𝑡𝑊 (𝛼(𝑡)) défini le long de la géodésique 𝛼 vérifie l’équation
𝐷2 (𝑡𝑊 )
= 0.
𝐷𝑡2
Comme de plus, on a en 𝑡 = 0
𝐽(0) = (𝑡𝑊 )(0) = 0,
et
𝐷(𝑡𝑊 )
𝐷𝐽
(0) =
(0) = 𝑤,
𝐷𝑡
𝐷𝑡
on a nécessairement égaux 𝐽(𝑡) = 𝑡𝑊 (𝑡) pour tout 𝑡. Or 𝐽 𝑘 (𝑡) = 𝑡𝑤𝑘 et donc, 𝑊 𝑘 (𝑡) = 𝑤𝑘
quelque soit 𝑡. La géodésique 𝛼 étant arbitraire, ceci montre que les composantes du champ
parallèle 𝑊 dans la base (𝜕 𝑖 ) sont constantes. La condition initiale 𝑤 étant arbitraire, on
en déduit que les vecteur de base 𝜕 𝑖 sont eux-même parallèles et donc que Γ𝑘𝑖𝑗 = 0, ce qui
achève la démonstration.
Remarque 1.56. La démonstration de ce théorème montre en fait plus : les Γ𝑘𝑖𝑗 sont nuls
dans un système de coordonnées normales si 𝑅 = 0. On voit ainsi apparaître toute l’importance de ces systèmes de coordonnées normales qui jouent un rôle privilégié.
Chapitre 2
Problèmes variationnels
Ce chapitre est une introduction aux méthodes du calcul variationnel à travers
quelques exemples. On y présente d’abord les équations d’Euler-Lagrange et le
théorème de Noether pour un lagrangien dans R𝑛 . On traite ensuite les géodésiques d’une variété riemannienne comme solution d’un problème variationnel
et on calcule la seconde variation. Dans la dernière section on envisage les
problèmes faisant intervenir plusieurs paramètres et en particulier le problème
des surfaces minimales dans R3 .
2.1
2.1.1
Problèmes variationnels à une dimension
Équations d’Euler-Lagrange
Étant donné deux points 𝑎 et 𝑏 dans R𝑛 , on définit l’ensemble Ω𝑎𝑏 de tous les chemins
dans R𝑛 joignant 𝑎 et 𝑏
Ω𝑎𝑏 (R𝑛 ) = {𝛾 ∈ 𝐶 ∞ ([0, 1], R𝑛 ); 𝛾(0) = 𝑎, 𝛾(1) = 𝑏} .
Cet ensemble est une sous-variété affine de l’espace vectoriel 𝐶 ∞ ([0, 1], R𝑛 ) de codimension
2.
Attention, l’espace vectoriel 𝐶 ∞ ([0, 1], R𝑛 ) n’est pas un espace vectoriel normé. On
ne peut donc pas y définir la différentielle d’une fonction car celle-ci requiert l’existence
d’une norme. Toutefois la notion de dérivée directionnelle ou dérivée au sens de Gâteaux
à un sens. Une fonction 𝐹 : Ω𝑎𝑏 (R𝑛 ) → R est dérivable au sens de Gâteaux si pour tout
𝑋 ∈ 𝐶 ∞ ([0, 1], R𝑛 ), la limite
𝐹 (𝛾 + 𝑠𝑋) − 𝐹 (𝛾)
𝑠→0
𝑠
𝐷𝐹 (𝛾)𝑋 = lim
existe. La fonction 𝐹 est de classe 𝐶 1 si 𝐷𝐹 est une application continue en 𝛾 et 𝑋.
C’est à ces définitions que nous ferons référence dans la suite lorsque nous calculerons les
dérivées d’une fonction sur Ω𝑎𝑏 (R𝑛 ) 1 . L’espace tangent à la sous-variété affine Ω𝑎𝑏 (R𝑛 ) au
1. Pour plus de détails sur le calcul différentiel dans les espaces de Fréchet, on pourra consulter
l’excellent article de Hamilton [14]. Une autre approche du calcul différentiel sur les espaces de dimension infinie repose sur la théorie des espaces difféologiques développée par Souriau et Iglesias (voir
http ://www.umpa.ens-lyon.fr/ iglesias/)
27
CHAPITRE 2. PROBLÈMES VARIATIONNELS
28
point 𝛾 est simplement l’espace
𝑇𝛾 Ω𝑎𝑏 (R𝑛 ) = {𝑋 ∈ 𝐶 ∞ ([0, 1], R𝑛 ); 𝑋(0) = 0, 𝑋(1) = 0} .
Soit (𝑥, 𝑣) ↦→ 𝐿(𝑥, 𝑣) une fonction 𝐶 ∞ de R𝑛 × R𝑛 dans R. Un problème variationnel
à une dimension consiste à rechercher les courbes 𝛾 ∈ Ω𝑎𝑏 (R𝑛 ) qui rendent l’intégrale
ˆ 1
𝑆(𝛾) =
𝐿(𝑥(𝑡), 𝑥(𝑡))
˙
𝑑𝑡,
(2.1)
0
dite intégrale d’action, extrémale. La fonction 𝐿 est appelée le lagrangien du problème
variationnel.
La première étape consiste à rechercher les points critiques. La dérivée de la fonction
𝑆 au point 𝛾 dans la direction 𝑋 s’écrit
}︃
ˆ 1 {︃
𝜕𝐿 𝑖 𝜕𝐿 ˙ 𝑖
𝐷𝑆(𝛾)𝑋 =
𝑋 + 𝑖 𝑋 𝑑𝑡,
𝜕𝑥𝑖
𝜕𝑣
0
où l’intégrale est prise le long de la courbe 𝛾. Une intégration par partie nous donne,
compte-tenu que 𝑋(0) = 𝑋(1) = 0 :
(︃
)︃}︃
ˆ 1 {︃
𝑑 𝜕𝐿
𝜕𝐿
−
𝑋 𝑖 𝑑𝑡.
𝐷𝑆(𝛾)𝑋 =
𝑖
𝑖
𝜕𝑥
𝑑𝑡
𝜕𝑣
0
D’où le théorème
Theorème 2.1. Si une courbe 𝛾 ∈ Ω𝑎𝑏 (R𝑛 ) est une extrémale de la fonction
ˆ 1
𝑆(𝛾) =
𝐿(𝑥(𝑡), 𝑥(𝑡))
˙
𝑑𝑡,
0
alors elle vérifie les équations dite d’Euler-Lagrange
𝑑
𝑑𝑡
(︃
𝜕𝐿
𝜕𝑣 𝑖
)︃
−
𝜕𝐿
= 0,
𝜕𝑥𝑖
𝑖 = 1, . . . , 𝑛.
(2.2)
Exemple 2.2. Les équations de la mécanique classique peuvent s’écrire sous forme d’un
problème variationnel lorsque les « forces » dérivent d’un potentiel. En effet, dans le cas
d’un point matériel, posons
𝐿=
𝑚 2
𝑣 − 𝑈 (𝑥) = 𝐾 − 𝑈.
2
Les équations de Lagrange nous donnent alors
𝑚¨
𝑥𝑖 = −
𝜕𝑈
.
𝜕𝑥𝑖
Cet exemple conduit, par analogie, à introduire, dans le cas général, les définitions suivantes :
1. L’énergie
𝐸 = 𝑣𝑖
𝜕𝐿
− 𝐿,
𝜕𝑣 𝑖
CHAPITRE 2. PROBLÈMES VARIATIONNELS
29
2. L’impulsion
𝑝𝑖 =
𝜕𝐿
,
𝜕𝑣 𝑖
𝑓𝑖 =
𝜕𝐿
.
𝜕𝑥𝑖
3. La force
Remarque 2.3. Pour traiter le cas d’une intégrale d’action dont le lagrangien 𝐿 est une
fonction qui dépend explicitement du paramètre 𝑡, on se ramène à l’étude précédente en
posant 𝑞 = (𝑥, 𝑡) et en se plaçant dans R𝑛+1 .
Exercice 2.4. Montrer que si le lagrangien 𝐿 ne dépend pas explicitement de 𝑡, la fonction
𝐸(𝑥(𝑡), 𝑥(𝑡))
˙
est constante le long de chaque extrémale 𝛾.
2.1.2
Théorème de Noether
Il arrive souvent que le lagrangien 𝐿 possède certaines symétries. Soit 𝐺 un groupe de
Lie agissant sur R𝑛 et supposons que l’action de ce groupe laisse 𝐿 invariant, c’est à dire
(𝑔* 𝐿)(𝑥, 𝑥)
˙ = 𝐿(𝑔(𝑥), 𝑇𝑥 𝑔(𝑥))
˙ = 𝐿(𝑥, 𝑥).
˙
Pour tout 𝐴 dans l’algèbre de Lie g du groupe 𝐺, on pose
⃒
𝑑 ⃒⃒
⃒
exp(𝑠𝐴)(𝑥).
𝑋𝐴 (𝑥) =
𝑑𝑠 ⃒𝑠=0
On a le résultat suivant
Theorème 2.5 (Théorème de Noether). Soit 𝐿 un lagrangien invariant sous l’action d’un
groupe de Lie 𝐺 et 𝛾 une extrémale de 𝑆. Alors pour tout 𝐴 ∈ g on a
𝑑
𝑑𝑡
(︃
)︃
𝜕𝐿 𝑖
𝑋
= 0,
𝜕𝑣 𝑖 𝐴
le long de 𝛾.
Démonstration. Comme 𝐿 est invariant par 𝐺 on a
𝑑
exp(𝑠𝐴)* 𝐿(𝑥, 𝑥)
˙
𝑑𝑠
𝜕𝐿 𝜕𝑋𝐴𝑖 𝑗
𝜕𝐿 𝑖
=
(𝑥)
+
𝑋
𝑥˙
𝑖 𝜕𝑥𝑗
𝜕𝑥𝑖 𝐴
{︃
(︃ 𝜕𝑣 )︃}︃
(︃
)︃
𝜕𝐿
𝑑 𝜕𝐿
𝑑 𝜕𝐿 𝑖
𝑖
=
𝑋𝐴 +
−
𝑋 .
𝜕𝑥𝑖 𝑑𝑡 𝜕𝑣 𝑖
𝑑𝑡 𝜕𝑣 𝑖 𝐴
(︂
)︂
0=
Par conséquent, la fonction
𝜇𝐴 (𝑥, 𝑥)
˙ =
est constante le long de 𝛾.
𝜕𝐿
(𝑥, 𝑥)
˙ 𝑋𝐴𝑖 (𝑥)
𝜕𝑣 𝑖
30
CHAPITRE 2. PROBLÈMES VARIATIONNELS
On dit aussi que la fonction est une intégrale première ou une grandeur conservée des
équations d’Euler-Lagrange.
Remarquer que si le couple (𝑥, 𝑣) ∈ R𝑛 × R𝑛 est fixé, l’application
𝐴 ↦→
𝜕𝐿 𝑖
𝑋 = 𝑝𝑖 𝑋𝐴𝑖 ,
𝜕𝑣 𝑖 𝐴
𝐴∈g
est une forme linéaire sur g, autrement dit un élément de g* . L’application
[︁
𝜇(𝑥, 𝑣) = 𝐴 ↦→ 𝑝𝑖 𝑋𝐴𝑖
]︁
(2.3)
de 𝑇 R𝑛 = R𝑛 × R𝑛 dans g* est appelé l’application moment.
2.1.3
Formulation hamiltonienne
Soit 𝑃 (𝑥, 𝑣) la forme linéaire sur R𝑛 définie par :
𝑃𝑖 (𝑥, 𝑣) =
𝜕𝐿
(𝑥, 𝑣).
𝜕𝑣 𝑖
On définit ainsi une application
𝑃 : 𝑇 R𝑛 → 𝑇 * R𝑛 ,
appelée application de Legendre. Elle permet de ramener la 1-forme canonique 𝜃 (ou forme
de Liouville) sur 𝑇 * R𝑛 sur 𝑇 R𝑛
𝜃𝐿 = 𝑝* 𝜃.
Si le lagrangien 𝐿 est non dégénéré, c’est à dire si 𝑇(𝑥,𝑣) 𝑝 est un isomorphisme pour chaque
(𝑥, 𝑣) ou encore si
(︃
)︃
𝜕 2𝐿
det
̸= 0,
𝜕𝑣 𝑖 𝜕𝑣 𝑗
alors la 2-forme
𝜔𝐿 = 𝑑𝜃𝐿 = 𝑝* 𝜔 = 𝑝* 𝑑𝜃
est non dégénérée et définie une structure symplectique sur 𝑇 R𝑛 .
Exercice 2.6. Soit 𝑈 une carte locale d’une variété quelconque 𝑀 . Calculer l’expression
locale de la forme de Liouville 𝜃 sur 𝑇 𝑀 ainsi que de sa dérivée extérieure 𝜔. En déduire
alors une expression de 𝜃𝐿 et 𝜔𝐿 sur 𝑇 R𝑛 .
Soit 𝐹 = (𝑓1 , 𝑓2 ) le champ de vecteur du deuxième ordre sur R𝑛 défini implicitement
par les équations
𝑓1 (𝑥, 𝑣) = 𝑣
𝜕 𝐿 𝑖
𝜕 2 𝐿 𝑖 𝜕𝐿
𝑓
(𝑥,
𝑣)
+
𝑣 − 𝑗 = 0,
𝜕𝑣 𝑖 𝜕𝑣 𝑗 2
𝜕𝑥𝑖 𝜕𝑥𝑗
𝜕𝑥
2
et dont les courbes intégrales sont les solutions des équations de Lagrange. On peut
montrer que ce champ est le gradient symplectique de la fonction
𝐸(𝑥, 𝑣) = 𝑝𝑖 (𝑥, 𝑣)𝑣 𝑖 − 𝐿(𝑥, 𝑣).
31
CHAPITRE 2. PROBLÈMES VARIATIONNELS
Remarque 2.7. Dans ce cas, l’application moment définie par l’équation (2.3) s’écrit
˜ 𝐴 ),
𝜇𝐴 = 𝑝(𝑋𝐴 ) = 𝜃𝐿 (𝑋
˜ 𝐴 est le champ de vecteur engendré par 𝐴 ∈ g sur 𝑇 R𝑛 (le vérifier). 𝜇 coïncide donc
où 𝑋
bien avec l’application moment qu’on définit formellement en géométrie symplectique et
dont l’origine remonte au théorème de Noether.
Si de plus la fonction 𝑃 est un difféomorphisme de 𝑇 R𝑛 sur 𝑇 * R𝑛 , on dit que le
lagrangien 𝐿 est fortement non dégénéré. On peut alors exprimer les équations de Lagrange
à l’aide des variable (𝑥, 𝑝) à la place des variables (𝑥, 𝑣) et on obtient le résultat suivant :
Theorème 2.8. Soit 𝐿 un lagrangien fortement non dégénéré et 𝐻(𝑥, 𝑝) l’énergie 𝐸
exprimée en fonction des variables 𝑥 et 𝑝 (𝐻 est la transformée de Legendre de 𝐿). Alors
les équations de Lagrange sont équivalentes aux équations de Hamilton :
𝑥˙ =
𝜕𝐻
,
𝜕𝑝
𝑝˙ = −
𝜕𝐻
𝜕𝑥
(2.4)
Exercice 2.9. Démontrer le théorème précédent.
2.2
Les géodésiques d’une variété riemannienne
Soit (𝑀, 𝑔) une variété riemannienne de classe 𝐶 ∞ . Étant donné deux points 𝑎 et 𝑏
appartenant à 𝑀 , on introduit l’ensemble Ω𝑎𝑏 (𝑀 ) des chemins joignant ces deux points
dans 𝑀
Ω𝑎𝑏 (𝑀 ) = {𝛼 ∈ 𝐶 ∞ ([0, 1], 𝑀 ); 𝛼(0) = 𝑎, 𝛼(1) = 𝑏} .
On peut munir cet espace d’une structure de variété de Fréchet où l’on sait faire du
calcul différentiel au sens faible, c’est à dire calculer des dérivées directionnelles. L’espace
vectoriel tangent à Ω𝑎𝑏 (𝑀 ) au point 𝛼 est
𝑇𝛼 Ω𝑎𝑏 (𝑀 ) = {𝑋 ∈ 𝐶 ∞ ([0, 1], 𝑇 𝑀 ); 𝜋 ∘ 𝑋 = 𝛼, 𝑋(0) = 0, 𝑋(1) = 0} .
𝑇𝛼 Ω𝑎𝑏 (𝑀 ) est donc le sous-espace des relèvements de 𝛼, que nous avons noté 𝐿(𝛼) au
chapitre 1 et qui sont nuls en 𝑎 et en 𝑏.
Si 𝐹 : Ω𝑎𝑏 (𝑀 ) → R est une fonction 𝐶 ∞ , on définit la dérivée directionnelle de 𝐹 en
𝛼 dans la direction 𝑋 ∈ 𝑇𝛼 Ω𝑎𝑏 (𝑀 ) par
𝐹 (𝜎𝑠 ) − 𝐹 (𝛼)
,
𝑠→0
𝑠
𝐷𝐹 (𝛼) 𝑋 = lim
(2.5)
où 𝜎𝑠 (𝑡) = 𝜎(𝑠, 𝑡) est tel que
𝜎(𝑠, 0) = 𝑎,
𝜎(𝑠, 1) = 𝑏,
𝜎(0, 𝑡) = 𝛼(𝑡),
On définit sur Ω𝑎𝑏 (𝑀 ) deux fonctions, l’énergie
ˆ 1
1
𝐾(𝛼) =
⟨𝛼,
˙ 𝛼˙ ⟩ 𝑑𝑡 ,
0 2
et la longueur
ˆ
1
√︁
⟨𝛼,
˙ 𝛼˙ ⟩ 𝑑𝑡 .
𝐿(𝛼) =
0
𝜕𝜎
(0, 𝑡) = 𝑋(𝑡).
𝜕𝑠
(2.6)
(2.7)
32
CHAPITRE 2. PROBLÈMES VARIATIONNELS
Exercice 2.10.
1. Montrer que tout chemin 𝛼 qui minimise l’énergie minimise également la longueur.
2. Montrer que si 𝛼(𝑡) minimise la longueur, il en est de même de 𝛼 ∘ 𝜙(𝑡) pour tout
difféomorphisme 𝜙 de l’intervalle [0, 1]. En déduire que si 𝛼(𝑡) est un minimum de
la fonctionnelle de longueur paramétré par sa longueur, alors c’est également un
minimum pour l’énergie.
2.2.1
Calcul de la première variation de l’énergie
Soit 𝜎(𝑠, 𝑡) = 𝜎𝑠 (𝑡) une famille à un paramètre de chemins joignant 𝑎 et 𝑏
𝜎(𝑠, 0) = 𝑎,
𝜎(𝑠, 1) = 𝑏,
ˆ
On a
𝐷𝐾(𝛼)𝑋 =
0
1
𝜕𝜎
(0, 𝑡) = 𝑋(𝑡).
𝜕𝑠
𝜎(0, 𝑡) = 𝛼(𝑡),
⃒
⟨
1
𝑑 ⃒⃒
⃒
⃒
𝑑𝑠 𝑠=0 2
𝜕𝜎 𝜕𝜎
,
𝜕𝑡 𝜕𝑡
ˆ
⟩
1
𝑑𝑡 =
0
⟨
𝐷𝑋
𝛼,
˙
𝐷𝑡
⟩
𝑑𝑡,
du fait que
𝐷
𝐷𝑡
(︃
𝜕𝜎
𝜕𝑠
)︃
𝐷
=
𝐷𝑠
(︃
𝜕𝜎
𝜕𝑡
)︃
.
Mais
𝑑
𝐷𝑋
𝐷𝛼˙
⟨𝛼,
˙ 𝑋⟩=
, 𝑋 + 𝛼,
˙
,
𝑑𝑡
𝐷𝑡
𝐷𝑡
ce qui nous donne finalement, compte tenu que 𝑋(0) = 0 et 𝑋(1) = 0
ˆ 1⟨
⟩
𝐷𝛼˙
𝐷𝐾(𝛼)𝑋 = −
, 𝑋 𝑑𝑡.
𝐷𝑡
0
⟨
⟩
⟨
⟩
(2.8)
par conséquent, les points critiques de l’énergie sont les géodésiques.
2.2.2
Calcul de la seconde variation de l’énergie
Soit 𝜎(𝑠, 𝑡) = 𝜎𝑠 (𝑡) une famille à un paramètre de chemins joignant 𝑎 et 𝑏 et vérifiant
𝜎(𝑠, 0) = 𝑎,
𝜎(𝑠, 1) = 𝑏,
𝜎(0, 𝑡) = 𝛼(𝑡),
𝜕𝜎
(0, 𝑡) = 𝑌 (𝑡).
𝜕𝑠
Soit 𝑋(𝑠, 𝑡) = 𝑋𝑠 (𝑡) un relèvement de 𝜎(𝑠, 𝑡) tel que 𝑋(0, 𝑡) = 𝑋(𝑡). On va maintenant
calculer la dérivé seconde de 𝐾 en un point critique 𝛼. Elle est définie par
⃒
⟩
ˆ 1 ⃒⃒ ⟨
⃒
𝑑
𝑑⃒
𝐷 𝜕𝜎
⃒
2
𝐷 𝐾(𝛼)(𝑋, 𝑌 ) =
⃒
𝐷𝐾(𝜎𝑠 )𝑋𝑠 = −
⃒
, 𝑋𝑠 𝑑𝑡,
⃒
𝑑𝑠 ⃒𝑠=0
0 𝑑𝑠 𝑠=0 𝐷𝑡 𝜕𝑡
ˆ
soit
2
𝐷 𝐾(𝛼)(𝑋, 𝑌 ) = −
0
1
⟨
𝐷 𝐷 𝜕𝜎
,𝑋
𝐷𝑠 𝐷𝑡 𝜕𝑡
⟩
⟨
+
𝐷𝛼˙ 𝐷𝑋𝑠
,
𝐷𝑡 𝐷𝑠
⟩
𝑑𝑡.
Le second terme de droite est si 𝛼 est un point critique. En utilisant les lemmes du
chapitre 1 sur les propriétés de commutation des opérateur de dérivation covariante, on a
𝐷 𝐷 𝜕𝜎
𝐷2 𝑌
=
+ 𝑅(𝑌, 𝛼)
˙ 𝛼,
˙
𝐷𝑠 𝐷𝑡 𝜕𝑡
𝐷𝑡2
33
CHAPITRE 2. PROBLÈMES VARIATIONNELS
ce qui nous donne finalement
ˆ
1
⟨
𝐷2 𝐾(𝛼)(𝑋, 𝑌 ) = −
0
𝐷2 𝑌
− 𝑅(𝛼,
˙ 𝑌 )𝛼,
˙ 𝑋
𝐷𝑡2
⟩
𝑑𝑡.
On voit donc que le noyau de la forme bilinéaire symétrique 𝐷2 𝐾(𝛼)(𝑋, 𝑌 ) (où 𝛼 est
un point critique) est constitué par les champs de Jacobi le long de 𝛼 qui vérifient de plus
𝑌 (0) = 0 et 𝑌 (1) = 0.
2.2.3
Exemple : Géodésiques de la sphère 𝑆 2
On considère la sphère unité de R3 paramétrée par latitude et longitude
𝑥 = cos 𝜃 cos 𝜙
𝑦 = cos 𝜃 sin 𝜙
𝑧 = sin 𝜃
où 𝜃 appartient à l’intervalle [−𝜋/2, 𝜋/2] et 𝜙 à l’intervalle [−𝜋, 𝜋].
Calcul de la métrique La métrique de la sphère est induite par celle de l’espace
ambiant. On a donc
𝑑𝑠2 = 𝑑𝑥2 + 𝑑𝑦 2 + 𝑑𝑧 2 = 𝑑𝜃2 + cos2 𝜃 𝑑𝜙2
c’est à dire
𝑔𝜃𝜃 = 1,
𝑔𝜙𝜙 = cos2 𝜃.
𝑔𝜃𝜙 = 0,
Équation des géodésiques Ce sont les extrémales de l’énergie
ˆ 1
ˆ 1
1 ˙2
2
2
˙ 𝜙)
𝐾(𝛼) =
(𝜃 + cos 𝜃 𝜙˙ )𝑑𝑡 =
𝐿(𝜃, 𝜙, 𝜃,
˙ 𝑑𝑡.
2
0
0
Ces extrémales sont définies par les équations d’Euler-Lagrange
𝑑
𝑑𝑡
(︃
𝜕𝐿
𝜕 𝑞˙
)︃
=
𝜕𝐿
,
𝜕𝑞
ce qui nous donne
𝑑 ˙
(𝜃) = − cos 𝜃 sin 𝜃 𝜙˙ 2 ,
𝑑𝑡
𝑑
(cos2 𝜃 𝜙)
˙ = 0.
𝑑𝑡
On a donc une intégrale première cos2 𝜃 𝜙˙ = 𝜔 = 𝐶𝑠𝑡𝑒 et une équation différentielle
𝜃¨ = 𝜔 2 tan 𝜃(1 + tan2 𝜃).
Remarquez la solution particulière 𝜃(𝑡) = 0, 𝜙(𝑡) = 𝜔𝑡 qui correspond à l’équateur.
34
CHAPITRE 2. PROBLÈMES VARIATIONNELS
Calcul des symboles de Christoffel On réécrit les équations des géodésiques sous la
forme
𝜃¨ + cos 𝜃 sin 𝜃 𝜙˙ 𝜙˙ = 0,
𝜙¨ − 2 tan 𝜃 𝜃˙𝜙˙ = 0,
ce qui nous donne par identification
Γ𝜃𝜃𝜃 = 0,
Γ𝜃𝜃𝜙 = 0,
Γ𝜙𝜃𝜃 = 0,
Γ𝜃𝜙𝜙 = cos 𝜃 sin 𝜃,
Γ𝜙𝜃𝜙 = − tan 𝜃,
Γ𝜙𝜙𝜙 = 0.
Calcul des champs de Jacobi Nous commencerons par calculer le tenseur de courbure. Comme
𝑅(𝑋, 𝑌 ) = −𝑅(𝑋, 𝑌 ),
il suffit de calculer 𝑅(𝜕𝜃 , 𝜕𝜙 ) sur la base 𝜕𝜃 , 𝜕𝜙 . On commence par calculer
∇𝜕𝜃 𝜕𝜃 = 0,
∇𝜕𝜃 𝜕𝜙 = ∇𝜕𝜙 𝜕𝜃 = − tan 𝜃 𝜕𝜙 ,
∇𝜕𝜙 𝜕𝜙 = cos 𝜃 sin 𝜃 𝜕𝜃 .
puis
𝑅(𝜕𝜃 , 𝜕𝜙 )𝜕𝜃 = −𝜕𝜙 ,
𝑅(𝜕𝜃 , 𝜕𝜙 )𝜕𝜙 = cos2 𝜃 𝜕𝜃 .
En particulier, le long de la géodésique 𝜃(𝑡) = 0, 𝜙(𝑡) = 𝜔𝑡, on a
(︃
)︃
0 −1
𝑅(𝜕𝜃 , 𝜕𝜙 ) =
,
1 0
ce qui nous donne pour un champ de vecteurs quelconque de composantes (𝑋𝜃 , 𝑋𝜙 )
𝑅(𝛼,
˙ 𝑋)𝛼˙ = −𝜔 2 𝑋𝜃 𝜕𝜃 ,
alors que
𝐷2 𝑋
¨ 𝜃 𝜕𝜃 + 𝑋
¨ 𝜙 𝜕𝜙 .
=𝑋
𝐷𝑡2
L’équation de Jacobi s’écrit donc
¨ 𝜃 = −𝜔 2 𝑋𝜃 ,
𝑋
¨ 𝜙 = 0.
𝑋
35
CHAPITRE 2. PROBLÈMES VARIATIONNELS
Les solutions de ce système d’équations qui vérifient en plus 𝑋(0) = 0 s’écrivent
𝑋𝜃 = 𝐴 sin(𝜔𝑡) = 𝐴 sin 𝜙(𝑡),
𝑋𝜙 = 𝐵𝑡,
où 𝐴 et 𝐵 sont des constantes. On voit donc que pour 𝜙 = 𝜋 il existe un champ de Jacobi
non nul qui s’annule aux deux extrémités de la géodésique, ce qui traduit le fait que cette
géodésique cesse d’être un minimum stricte.
2.3
Problèmes variationnels à plusieurs dimensions
Un problème analogue en dimension 2 à celui qui consiste à rechercher parmi toutes
les courbes joignant deux points donnés 𝑎 et 𝑏 sur une surface riemannienne, ceux qui
sont de longueur minimale est le suivant :
- Soit Γ une courbe fermée dans R3 , pas nécessairement connexe. Déterminer, parmi
toutes les nappes plongées dans R3 , de bord Γ, celles qui possède une aire minimale.
Un tel problème est dit de recherche de surface minimale. Nous en traiterons un
exemple qui servira à motiver l’introduction des équations d’Euler-Lagrange à plusieurs
dimensions.
2.3.1
Surfaces minimales dans R3
Commençons par quelques rappels sur les surfaces plongées ou immergées dans R3 .
Soit 𝐷 un domaine de R2
𝑓 : 𝐷 → R3 ,
(𝑢, 𝑣) ↦→ 𝑓 (𝑢, 𝑣)
une application de classe 𝐶 ∞ telle que
𝑓𝑢′ ∧ 𝑓𝑣′ ̸= 0,
et 𝒮 = 𝑓 (𝐷) ⊂ R3 . 𝐷 est donc une carte locale de la surface 𝒮. L’espace tangent 𝑇𝑚 𝒮 est
le sous-espace vectoriel de R3 engendré par les vecteurs 𝑓𝑢′ et 𝑓𝑣′ . La normale unitaire à la
surface 𝒮 au point 𝑚 s’écrit
𝑓 ′ ∧ 𝑓𝑣′
.
𝑛 = 𝑢′
‖𝑓𝑢 ∧ 𝑓𝑣′ ‖
L’application 𝑓 induit une métrique riemannienne 𝑔 sur 𝐷 par pull-back de la métrique
ambiante de R3
𝑔 = 𝑓 * (𝑑𝑥2 + 𝑑𝑦 2 + 𝑑𝑧 2 ).
On appelle également la métrique 𝑔 la première forme fondamentale de 𝒮. Sa matrice
dans la base locale (𝑓𝑢′ , 𝑓𝑣′ ) s’écrit :
(︃
𝑄1 =
où 𝐸 = ‖𝑓𝑢′ ‖2 , 𝐺 = ‖𝑓𝑣′ ‖2 et 𝐹 = 𝑓𝑢′ · 𝑓𝑣′ .
𝐸 𝐹
𝐹 𝐺
)︃
36
CHAPITRE 2. PROBLÈMES VARIATIONNELS
La connexion de Lévi-Civita associé à cette métrique est donnée par
∇𝑋 𝑌 = 𝑃 ⊥ (𝑑𝑌. 𝑋)
où 𝑃 ⊥ désigne, en chaque point 𝑚 ∈ 𝒮, la projection orthogonale de R3 sur 𝑇𝑚 𝒮. La
projection normale de 𝑑𝑌. 𝑋
(𝑑𝑌. 𝑋) · 𝑛
est une forme bilinéaire symétrique en 𝑋, 𝑌 mais contrairement à la projection tangentielle
de 𝑑𝑌. 𝑋 qui est un objet intrinsèque de la variété (i.e. qui ne dépend que de la métrique
et non du plongement), celle-ci ne l’est pas. On pose
𝑞(𝑋, 𝑌 ) = −(𝑑𝑌. 𝑋) · 𝑛
et on appelle 𝑞 la deuxième forme fondamentale. Sa matrice dans la base locale (𝑓𝑢′ , 𝑓𝑣′ )
s’écrit :
(︃
)︃
𝐿 𝑀
𝑄2 =
𝑀 𝑁
′′
′′
′′
où 𝐿 = 𝑓𝑢𝑢
· 𝑛, 𝑀 = 𝑓𝑢𝑣
· 𝑛 et 𝑁 = 𝑓𝑣𝑣
· 𝑛. En chaque point 𝑚 ∈ 𝒮, il existe un opérateur
linéaire 𝐻 : 𝑇𝑚 𝒮 → 𝑇𝑚 𝒮 tel que
𝑞(𝑋, 𝑌 ) = 𝑔(𝐻(𝑋), 𝑌 ) = 𝑔(𝑋, 𝐻(𝑌 )).
Comme on peut le vérifier facilement, on a
𝐻(𝑋) = 𝑑𝑛. 𝑋 .
La matrice de 𝐻 dans la base locale (𝑓𝑢′ , 𝑓𝑣′ ) s’écrit 𝑄−1
1 𝑄2 . Les valeurs propres de 𝐻 au
point 𝑚 sont appelés les courbures principales de 𝒮. Le déterminant de 𝐻 est la courbure
de Gauss, qui est intrinsèque et la trace de 𝐻 est la courbure moyenne qui ne l’est pas.
Supposons à présent que 𝐷 soit un domaine relativement compact de R3 , bordé par
une courbe fermée 𝜕𝐷 (pas nécessairement connexe) et soit 𝛾 un plongement de 𝜕𝐷 dans
R3 . On pose
{︁
}︁
Ω𝛾 (R3 ) = 𝑓 ∈ 𝐶 ∞ (𝐷, R3 ); 𝑓𝑢′ ∧ 𝑓𝑣′ ̸= 0, et 𝑓|𝜕𝐷 = 𝛾 .
L’aire de la surface 𝒮 = 𝑓 (𝐷) s’écrit
ˆ
ˆ
ˆ √︁
′
′
𝒜(𝑓 ) =
‖𝑓𝑢 ∧ 𝑓𝑣 ‖ 𝑑𝑢 𝑑𝑣 =
𝜈(𝑓 ) 𝑑𝑢 𝑑𝑣 =
det(𝑄1 ) 𝑑𝑢 𝑑𝑣 .
𝐷
𝐷
𝐷
Comme pour le problème des géodésiques, on peut calculer les dérivées directionnelles
de la fonction 𝒜. Dans le cas qui nous intéresse, on a
ˆ (︃ )︃
𝑑𝜈
𝐷𝒜(𝑓 ). 𝜉 =
𝑑𝑢 𝑑𝑣 ,
𝑑𝑠 𝑠=0
𝐷
où
𝜈(𝑠) = 𝜈(𝑓 + 𝑠𝜉)
et 𝜉 : 𝐷 → R3 est telle que 𝜉 = 0 sur 𝜕𝐷. Un calcul élémentaire nous donne
(︃
𝑑𝜈
𝑑𝑠
)︃
= 𝑛 · (𝜉𝑢′ ∧ 𝑓𝑣′ + 𝑓𝑢′ ∧ 𝜉𝑣′ )
𝑠=0
= (𝑓𝑣′ ∧ 𝑛) · 𝜉𝑢′ + (𝑛 ∧ 𝑓𝑢′ ) · 𝜉𝑣′ .
CHAPITRE 2. PROBLÈMES VARIATIONNELS
ˆ
ˆ
Écrivons la formule de Stokes
37
𝑑𝜔 =
𝐷
𝜔
𝜕𝐷
avec
𝜔 = (𝜉 · (𝑓𝑣′ ∧ 𝑛)) 𝑑𝑣 − (𝜉 · (𝑛 ∧ 𝑓𝑢′ )) 𝑑𝑢,
il vient
ˆ
𝐷𝒜(𝑓 ). 𝜉 = −
ˆ𝐷
{𝜕𝑢 (𝑓𝑣′ ∧ 𝑛) + 𝜕𝑣 (𝑛 ∧ 𝑓𝑢′ )} · 𝜉 𝑑𝑢 𝑑𝑣
(𝑓𝑣′ ∧ 𝜕𝑢 𝑛 + 𝜕𝑣 𝑛 ∧ 𝑓𝑢′ ) · 𝜉 𝑑𝑢 𝑑𝑣 .
=−
𝐷
Soit
(︃
𝑎 𝑏
𝑐 𝑑
)︃
la matrice de l’endomorphisme symétrique 𝐻 dans la base locale (𝑓𝑢′ , 𝑓𝑣′ ), alors
𝜕𝑢 𝑛 = 𝑎 𝑓𝑢′ + 𝑐 𝑓𝑣′
𝜕𝑣 𝑛 = 𝑏 𝑓𝑢′ + 𝑑 𝑓𝑣′ ,
et donc
ˆ
(𝑎 𝑓𝑣′ ∧ 𝑓𝑢′ + 𝑑 𝑓𝑣′ ∧ 𝑓𝑢′ ) · 𝜉 𝑑𝑢 𝑑𝑣
𝐷𝒜(𝑓 ). 𝜉 = −
ˆ 𝐷
=
tr(𝐻) (𝑛 · 𝜉) 𝜈(𝑓 ) 𝑑𝑢 𝑑𝑣
𝐷
Un point critique de 𝒜 est donc défini par l’équation
tr(𝐻) = 0.
Theorème 2.11. Une condition nécessaire pour qu’une surface de R3 de bord donné soit
minimale est que sa courbure moyenne soit nulle.
Exercice 2.12. On considère 2 cercles coaxiaux de rayon 𝑅, espacés d’une distance 𝐿.
Montrer qu’il existe une surface minimale stable joignant ces deux cercles si 𝐿/𝑅 n’est
pas trop grand. Déterminer la valeur de 𝐿/𝑅 pour laquelle cette solution perd sa stabilité.
2.3.2
Équations d’Euler-Lagrange et tenseur d’impulsion-énergie
Plus généralement, soit 𝐿(𝑞 𝑖 , 𝑝𝑗𝑘 ) une fonction de classes 𝐶 ∞ définie sur R𝑛 × R𝑛𝑝 . On
cherche à déterminer les extrema de la fonction
ˆ
𝒜(𝑓 ) =
𝐿(𝑓 𝑖 (𝑢), 𝑓𝑢𝑗𝑘 (𝑢)) 𝑑𝑢1 ∧ · · · ∧ 𝑑𝑢𝑝 ,
𝐷
où on a noté 𝑓𝑢𝑗𝑘 la dérivée partielle de 𝑓 𝑗 par rapport à 𝑢𝑘 et 𝑓 appartient à un espace de
fonctions de classe 𝐶 ∞ de R𝑝 dans R𝑛 qui ont toutes une même valeur donnée (condition
limite) sur le bord 𝜕𝐷 du domaine 𝐷.
38
CHAPITRE 2. PROBLÈMES VARIATIONNELS
Comme nous l’avons fait dans la recherche des surfaces minimales, considérons une
variations 𝑓𝑠 = 𝑓 + 𝑠𝜉 de 𝑓 où la fonction 𝜉 est nulle sur 𝜕𝐷. La dérivée directionnelle de
𝒜 s’écrit alors
}︃
ˆ {︃
𝜕𝐿 𝑖 𝜕𝐿 𝑗
𝐷𝒜(𝑓 ). 𝜉 =
𝜉 + 𝑗 𝜉𝑢𝑘 𝑑𝑢1 ∧ · · · ∧ 𝑑𝑢𝑝 .
𝑖
𝜕𝑝𝑘
𝐷 𝜕𝑞
Écrivons la formule de Stokes avec
𝜔=
𝑝
∑︁
(︃
𝑘+1
(−1)
𝑘=1
𝜕𝐿
𝜕𝑓𝑢𝑗𝑘
)︃
̂︂𝑘 ∧ · · · ∧ 𝑑𝑢𝑝 ,
𝑑𝑢1 ∧ · · · ∧ 𝑑𝑢
ˆ {︃
il vient
)︃}︃
(︃
𝜕𝐿
𝜕
𝜕𝐿
𝐷𝒜(𝑓 ). 𝜉 =
𝜉 𝑖 𝑑𝑢1 ∧ · · · ∧ 𝑑𝑢𝑝 .
−
𝑖
𝑖
𝑘
𝜕𝑞
𝜕𝑢
𝜕𝑝
𝐷
𝑘
Les points critiques de 𝒜 sont donc les fonctions 𝑓 qui vérifient les équations d’EulerLagrange
(︃
)︃
𝜕𝐿
𝜕𝐿
𝜕
= 0, 1 ≤ 𝑖 ≤ 𝑛.
(2.9)
−
𝜕𝑞 𝑖 𝜕𝑢𝑘 𝜕𝑝𝑖𝑘
Dans le cas d’un problème variationnel à une dimension, nous avons vu que si le
lagrangien 𝐿 ne dépendait pas explicitement du paramètre 𝑡 alors la fonction
𝜕𝐿
𝐸 = 𝑣𝑖 𝑖 − 𝐿
𝜕𝑣
appelée énergie était constante le long de toute extrémale. Nous avons un résultat analogue
en dimension supérieure. Introduisons le tenseur
𝜕𝐿
𝑇𝑖𝑗 = 𝑓𝑢𝑘𝑖
− 𝛿𝑖𝑗 𝐿
𝜕𝑓𝑢𝑘𝑗
qu’on appelle le tenseur d’énergie-impulsion et qui généralise la fonction énergie évoquée
plus haut.
Lemme 2.13. Si 𝑓 est une solution des équations d’Euler-Lagrange, on a
𝑛
∑︁
𝜕𝑇𝑖𝑗
= 0.
div 𝑇 =
𝑗
𝑗=1 𝜕𝑢
Démonstration. On a
(︃
)︃
𝜕𝐿
𝜕
𝑓𝑢𝑙 𝑖
(div 𝑇 )𝑖 =
− 𝛿𝑖𝑘 𝐿
𝑘
𝜕𝑢
𝜕𝑓𝑘𝑙
)︃
(︃
)︃
(︃
𝜕𝐿
𝜕
𝜕𝐿
𝜕𝐿
𝑙
+ 𝑘
𝑓𝑢𝑙 𝑖 − 𝑖 .
= 𝑓𝑢𝑘 𝑢𝑖
𝑙
𝑙
𝜕𝑓𝑘
𝜕𝑢 𝜕𝑓𝑘
𝜕𝑢
Mais
(︃
𝑖
𝜕𝐿/𝜕𝑢 =
)︃
d’où
(︃
(div 𝑇 )𝑖 =
(︃
𝜕𝐿
𝜕𝐿
𝑙
𝑓
+
𝑢
𝑖
𝜕𝑓 𝑙
𝜕𝑓𝑢𝑙 𝑘
𝑓𝑢𝑙 𝑖
𝜕
𝜕𝑢𝑘
(︃
𝜕𝐿
𝜕𝑓𝑘𝑙
)︃
)︃
𝑓𝑢𝑙 𝑘 𝑢𝑖 ,
𝜕𝐿
− 𝑙
𝜕𝑓
)︃
Remarque 2.14. Si le nombre de paramètres 𝑘 est égal au nombre de fonctions 𝑛 et si
det(𝜕𝑖 𝑓 𝑗 ) ̸= 0 sur l’espace de fonctions sur lequel on définit l’action 𝒜, alors le système
des équations d’Euler-Lagrange est équivalent à l’équation div 𝑇 = 0.
Chapitre 3
Un principe de covariance général
Ce chapitre est une introduction à l’équation universelle de la mécanique
𝑇𝐷 = 0
formulée par Jean-Marie Souriau et à partir de laquelle on peut dériver la
plupart des équations connues de la mécanique. Il reprend essentiellement
l’article original de Souriau [27]. L’objectif de ce chapitre est d’illustrer, à
travers quelques exemples, comment on retrouve les équations usuelles de la
mécanique à partir de ce principe général.
3.1
Introduction
Soit 𝑀 une variété de classe 𝐶 ∞ muni d’une connexion linéaire symétrique ∇. Comme
nous l’avons déjà signalé, cette connexion induit une loi de dérivation sur tous les champs
de tenseurs et en particulier sur les 1-formes différentielles. Étant donné une 1-forme
𝑍 ∈ Ω1 (𝑀 ), celle-ci s’écrit :
(∇𝑋 𝑍) (𝑌 ) = 𝐿𝑋 (𝑍(𝑌 )) − 𝑍(∇𝑋 𝑌 ).
La symétrie de la connexion se traduit par l’équation
𝑑𝑍(𝑋, 𝑌 ) = (∇𝑋 𝑍) (𝑌 ) − (∇𝑌 𝑍) (𝑋),
(3.1)
pour tout 𝑋, 𝑌 ∈ Vect(𝑀 ) et 𝑍 ∈ Ω1 (𝑀 ). Nous poserons
𝐷𝑍(𝑋, 𝑌 ) = (∇𝑋 𝑍) (𝑌 ) + (∇𝑌 𝑍) (𝑋).
(3.2)
𝐷𝑍 est donc un 2-tenseur covariant symétrique dont la connaissance pour tout 𝑍 ∈ Ω1 (𝑀 )
décrit complètement la connexion linéaire symétrique ∇.
Un tenseur distribution 𝑇 désigne ici une forme linéaire sur les sections à support
compact d’un fibré vectoriel. Dans ce chapitre, nous nous intéressons exclusivement au
fibré des tenseurs deux fois covariants symétriques. On ne cherchera pas, dans un premier
temps, à préciser une quelconque topologie sur cet espace de sections ; nous ne ferons
pas appel à une éventuelle continuité de 𝑇 . Le support de 𝑇 qu’on note Σ est défini
de la façon suivante. Soit 𝑈 un ouvert de 𝑀 . On dit que 𝑇 s’annule sur 𝑈 si 𝑇 𝐺 = 0
pour tout champ de tenseurs 𝐺 dont le support appartient à 𝑈 . Notons Ω le plus grand
ouvert vérifiant cette propriété (i.e. l’union des tous les ouverts qui la vérifient). Alors on
peut montrer, en utilisant des partitions de l’unité que 𝑇 s’annule également sur Ω. Nous
poserons Σ = 𝑆𝑢𝑝𝑝(𝑇 ) = 𝑀 ∖ Ω.
39
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
3.2
40
La chute des corps
Vers 1590, Galilée établit les premières lois de la chute des corps. Elles expriment
l’existence, en chaque point de l’Univers, d’un « vecteur accélération » 𝑔 que subit tout
corps tombant dans cette région de l’espace. Trois paramètres donc pour caractériser la
pesanteur. Mais les expérience de Foucault (pendule, gyroscope) nous indiquent que la
pesanteur est plus riche que ça. Elles suggèrent l’idée que la gravitation galiléenne puisse
être décrite par une connexion linéaire symétrique sur l’Univers. Pourquoi symétrique ?
Parce qu’il est possible de l’annuler en tout point de l’Univers : il suffit d’être en chute
libre pour ne plus peser (voir chapitre 1). Avec ce point de vue, la gravitation galiléenne est
représentée par un objet souple 𝐷, une connexion affine symétrique sur l’Univers 𝑀 . Le
groupe souple (groupe des difféomorphismes 𝐶 ∞ de 𝑀 ) agit sur l’Univers et son contenu,
mais cette action est globale et inobservable. C’est ce que suggérait Einstein en parlant
du « principe général de relativité ».
Mais pour décrire complètement la chute d’un corps, la connaissance de 𝐷 ne suffit
pas. Il faut un autre objet pour décrire ce corps, ce qui pèse : on l’écrira 𝑇 . Dans le cas
d’un « point matériel » en chute libre, 𝑇 décrit à la fois la ligne d’Univers du corps qui
tombe et sa masse : c’est un tenseur-distribution. la loi de Galilée s’exprime alors par une
simple équation, invariante par le groupe souple
𝑇 𝐷 = 0,
reliant 𝑇 à la gravitation 𝐷. Cette dernière expression n’étant que la forme condensée de
l’équation plus explicite
𝑇 (𝐷𝑍) = 0, ∀𝑍 ∈ Ω1𝑐 (𝑀 ),
(3.3)
Ω1𝑐 (𝑀 ) désignant l’espace des 1-formes à support compact.
Pour rendre compte de l’expérience de Galilée, nous choisissons les coordonnées usuelles
𝑥1 = 𝑥,
𝑥2 = 𝑦,
𝑥3 = 𝑧,
𝑥4 = 𝑡
avec la convention que les lettres latines 𝑖, 𝑗 désignent un indice quelconque 1, 2, 3 alors
qu’une lettre grecque 𝛼, 𝛽 désigne un indice quelconque 1, 2, 3, 4. Dans ce système de
coordonnées, l’opérateur 𝐷 défini par l’équation (3.2) s’écrit
𝜌
𝐷𝑍𝜇𝜈 = 𝜕𝜇 𝑍𝜈 + 𝜕𝜈 𝑍𝜇 + 𝐷𝜇𝜈
𝑍𝜌 ,
𝑗
𝜌
où 𝐷𝜇𝜈
= −2Γ𝜌𝜇𝜈 . On définit la gravité galiléenne en posant 𝐷44
= 2𝑔 𝑗 , les autres composantes étant nulles.
Le point matériel est représenté par une forme linéaire sur les champs de tenseurs deux
fois covariants symétriques à support compact (un tenseur-distribution)
𝑇 : Γ𝑐 (𝑇 * 𝑀 ⊙ 𝑇 * 𝑀 ) → R,
dont le support Σ est sous-variété connexe 𝐶 ∞ de dimension 1 (non compacte et sans bord)
et qui s’écrit, après le choix d’une paramétrisation quelconque 𝑥(𝑠) de cette courbe :
ˆ 𝑏
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 𝑑𝑠 ,
(3.4)
𝑎
où 𝑇 𝜇𝜈 sont les composantes d’un champ de tenseurs 𝐶 ∞ , 2 fois contravariant symétrique
le long de la courbe Σ.
41
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
Lemme 3.1. Si 𝑇 𝐷 = 0, alors il existe une fonction 𝜙 de classe 𝐶 ∞ sur Σ telle que
ˆ 𝑏
𝜙 𝑥˙ 𝜇 𝑥˙ 𝜈 𝐺𝜇𝜈 𝑑𝑠
𝑇𝐺 =
𝑎
Démonstration. L’équation 𝑇 𝐷 = 0 nous donne
ˆ 𝑏
(︁
)︁
𝜌
𝑇 𝜇𝜈 2𝜕𝜇 𝑍𝜈 + 𝐷𝜇𝜈
𝑍𝜌 𝑑𝑠 = 0,
𝑎
pour tout 𝑍 ∈ Ω1𝑐 (𝑀 ). Soit 𝑢, une fonction quelconque de classe 𝐶 ∞ , nulle sur la courbe
Σ. En prenant comme fonction test 𝑢𝑍, on obtient
ˆ 𝑏
𝑇 𝜇𝜈 (𝜕𝜇 𝑢)𝑍𝜈 𝑑𝑠 = 0,
𝑎
pour toute fonction 𝑢 ∈ 𝐶 ∞ (𝑀 ) nulle sur la courbe Σ et tout 𝑍 ∈ Ω1𝑐 (𝑀 ). Mais ceci
entraîne
𝑇 𝜇𝜈 𝜕𝜇 𝑢 = 0, 𝜈 = 1, 2, 3, 4 ,
pour toute fonction 𝑢 ∈ 𝐶 ∞ (𝑀 ) nulle sur la courbe Σ. Remarquons que lorsque 𝑢 parcours
l’ensemble des fonctions 𝐶 ∞ nulle sur Σ, le covecteur de composantes 𝜕𝜇 𝑢(𝑥(𝑠)) décrit
l’ensemble des formes linéaires nulles sur 𝑥(𝑠).
˙
On applique alors le résultat de l’exercice
d’algèbre linéaire qui suit, au tenseur 𝑇 et au vecteur 𝑥,
˙ en chaque point de la courbe Σ.
On en déduit l’existence d’une fonction 𝜙(𝑠) telle que
𝑇 𝜇𝜈 (𝑠) = 𝜙(𝑠)𝑥˙𝜇 𝑥˙𝜈 .
Exercice 3.2. Soit 𝐸 un espace vectoriel de dimension fini, 𝑇 ∈ 𝐸 𝐸 et 𝑣 ∈ 𝐸. On
note (𝑣)0 le sous-espace des formes linéaires nulle sur 𝑣. Montrer que si
⨂︀
𝑇 (𝛼, 𝛽) = 0,
∀𝛼 ∈ (𝑣)0 , ∀𝛽 ∈ 𝐸 * ,
alors, il existe 𝑢 ∈ 𝐸 tel que 𝑇 = 𝑣 ⊗ 𝑢. Montrer que si de plus 𝑇 est symétrique alors
𝑇 = 𝜆𝑣 ⊗ 𝑣 où 𝜆 ∈ R.
En écrivant à nouveau l’équation 𝑇 𝐷𝑍 = 0, pour un covecteur test 𝑍 nul aux extrémités 𝑎 et 𝑏 de la paramétrisation, on obtient, après une intégration par partie, un système
de quatre équations
−2
𝑑
𝜌 ˙𝜇 ˙𝜈
(𝜙 𝑥˙𝜌 ) + 𝜙 𝐷𝜇𝜈
𝑥 𝑥 = 0,
𝑑𝑠
𝜌 = 1, 2, 3, 4.
(3.5)
La gravitation galiléenne impose alors
𝑑 (︁ ˙4 )︁
𝜙 𝑥 = 0,
𝑑𝑠
autrement dit, 𝜙 𝑥˙ 4 = 𝑚 = 𝐶𝑠𝑡𝑒. Il faut donc envisager deux cas.
- Si 𝑚 ̸= 0, il est possible de choisir comme paramétrage de notre courbe 𝑠 = 𝑡
et dans ce cas on a 𝜙(𝑡) = 𝑚. La courbe Σ ainsi paramétrée est alors une géodésique
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
42
de la connexion. Σ représente la ligne d’univers d’un « point matériel » de masse 𝑚.
En explicitant les trois premières équations du système (3.5), on retrouve les équations
familières
𝑑 2 𝑥𝑗
= 𝑔𝑗 .
2
𝑑𝑡
- Si 𝑚 = 0, et en supposant que 𝜙 n’est pas identiquement nulle (sinon il n’y a rien à
décrire), alors 𝑑𝑡/𝑑𝑠 = 0. Autrement dit 𝑡 = 𝐶𝑠𝑡𝑒. La gravitation galiléenne nous donne
dans ce cas
𝜙(𝑠) 𝑥˙ 𝑗 = 𝑎𝑗 = 𝐶𝑠𝑡𝑒,
qui est l’équation d’une droite. Ce cas correspond à la description des rayons lumineux
selon Descartes (vitesse de la lumière infinie).
Remarque 3.3. Plus généralement, l’équation
𝑑
𝜌
(𝜙𝑥˙ 𝜌 ) = 𝜙𝐷𝜇𝜈
𝑥˙ 𝜇 𝑥˙ 𝜈
𝑑𝑠
permet d’écrire la chute des corps selon Galilée avec des coordonnées quelconques, dans
un système de coordonnées « tournantes » comme les coordonnées terrestres par exemple.
Remarque 3.4. L’expérience de Galilée est plus subtile qu’elle en a l’air. Sur la Lune, en
l’absence d’atmosphère, l’expérience serait simple mais à cause de l’atmosphère terrestre,
Galilée a du recourir à quelques artifices pour vérifier son postulat. En effet, un corps animé
d’une vitesse ⃗𝑣 , subit, dans l’atmosphère terrestre une force de frottement proportionnelle
au carré de sa vitesse (∼ 𝑐𝑣 2 ) et de direction opposée. Par conséquent, un corps de
masse 𝑚, lâché dans
l’atmosphère terrestre sans vitesse initiale atteint assez rapidement
√︁
la vitesse limite 𝑚𝑔/𝑐 (le montrer). C’est pourquoi si deux cyclistes dévalent une pente
en bicyclette à partir du même instant, sans vitesse initiale et sans pédaler, c’est le plus
lourd des deux qui gagne la course, ce qui semble contradictoire avec l’expérience de
Galilée si l’on ne prend pas en compte la résistance de l’air.
On peut reprendre le même calcul dans le cas où 𝑀 = R3 et ∇ est la connexion
canonique de R3 . On a montré que la condition 𝑇 𝐷 = 0 conduisait à l’existence d’une
fonction 𝜏 (𝑠) telle que
𝑑𝑥𝑖 𝑑𝑥𝑗
𝑇 𝑖𝑗 = 𝜏
.
𝑑𝑠 𝑑𝑠
L’équation 𝑇 𝐷 = 0 traduit dans ce cas la loi d’équilibre d’un fil libre. La tension de ce fil
est alors décrite par le vecteur
𝑑𝑥𝑖
𝑃𝑖 = 𝜏
,
𝑑𝑠
qui est constant sur la courbe, à moins que 𝜏 ne soit nul.
3.3
Mécanique des milieux continus
Dans la théorie classique des milieux continus, la matière étendue (dans l’espacetemps) est décrite par un objet géométrique 𝑇 , le tenseur Énergie-impulsion, caractérisé
par des composantes 𝑇 𝜇𝜈 supposées symétriques : 𝑇 𝜇𝜈 = 𝑇 𝜈𝜇 . L’équation du mouvement
s’exprime par les quatre équations
(div 𝑇 )𝜇 = 𝜕𝜈 𝑇 𝜇𝜈 = 0
(3.6)
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
43
Quatre équations pour dix inconnues : ce système est sous-déterminé, il doit être
complété par des lois de comportement caractéristiques du milieu étudié.
Dans le cas présent, on définira donc 𝑇 à partir de la densité tensorielle 𝑇 𝜇𝜈
˘
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 𝑑𝑥4
(3.7)
Exercice 3.5. Montrer que, dans ce cas, l’équation 𝑇 𝐷 = 0 est équivalente à div 𝑇 = 0.
3.3.1
Matière libre
Commençons par nous placer dans un espace libre de toute gravitation. Autrement
dit, on fait l’hypothèse que 𝑀 = R4 et que ∇ est la connexion canonique de R4 .
Les 𝑇 𝜇𝜈 qui peuvent se découper en
(︃
𝑇 𝑗𝑘 𝑇 𝑗4
𝑇 4𝑘 𝑇 44
)︃
dont l’interprétation classique s’obtient en introduisant 10 nouvelles variables 𝜌, 𝑉 𝑗 , 𝜎 𝑗𝑘
qui mettent le tableau des 𝑇 𝜇𝜈 sous la forme :
(︃
𝜎 𝑗𝑘 + 𝜌𝑉 𝑗 𝑉 𝑘 𝜌𝑉 𝑗
𝜌𝑉 𝑘
𝜌
)︃
Alors l’équation 𝑇 𝐷 = 0 devient :
(︁
)︁
𝜕𝜌
= 0,
(︃ 𝜕𝑡
𝜕𝑗 𝜌𝑉 𝑗 +
𝜕𝑉 𝑘
𝜕𝑗 𝜎 𝑗𝑘 + 𝜌 𝑉 𝑗 𝜕𝑗 𝑉 𝑘 +
𝜕𝑡
(3.8)
)︃
= 0,
𝑘 = 1, 2, 3.
On reconnaît les équations d’Euler des milieux continus où 𝜌 désigne la masse spécifique, 𝑉 𝑘 la vitesse du milieu et 𝜎 𝑗𝑘 son tenseur des contraintes.
La première équation, dite équation de continuité s’interprète comme conservation de
la masse.
Les trois dernières équations s’interprètent comme la loi fondamentale de la dynamique
newtonienne – parce que
𝜕𝑉 𝑘
+ 𝑉 𝑗 𝜕𝑗 𝑉 𝑘
𝐴𝑘 =
𝜕𝑡
est l’accélération du milieu et
𝐹 𝑘 = −𝜕𝑗 𝜎 𝑗𝑘
est la force spécifique à laquelle est soumis le milieu du fait de sa contrainte.
Bien entendu ces équations doivent être complétées par les diverses lois de comportement que proposent la mécanique des fluides, la théorie de l’élasticité et de la plasticité,
la géophysique, la chimie, etc.
Un cas particulier célèbre est celui des fluides parfaits incompressibles, où 𝜌 = 𝐶𝑠𝑡𝑒
et 𝜎 𝑗𝑘 = 𝑝 𝛿 𝑗𝑘 est la pression.
On peut aussi étudier les répartitions de matière sur des sous-variétés de l’espace-temps
dont la dimension vaudra 𝑑 = 1, 2, 3 :
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
44
– 𝑑 = 3 : membranes en mouvement ;
– 𝑑 = 2 : cordes vibrantes ;
– 𝑑 = 1 : le cas déjà envisagé du mouvement des particules.
Remarque 3.6. En écrivant 𝑇 𝐷 = 0 dans R3 muni de la connexion canonique, et en considérant différents cas particuliers de distributions 𝑇 , distribution possédant une densité,
distribution portée par une surface, par une courbe, on retrouve les lois d’équilibre de la
statique.
Exercice 3.7. On se place dans le cas où 𝑀 = R3 et ∇ est la connexion canonique de
R3 . On considère une distribution 𝑇 portée par une surface et donnée par
¨
𝑇𝐺 =
𝑇 𝑗𝑘 𝐺𝑗𝑘 𝑑𝑠1 𝑑𝑠2
après le choix de coordonnées 𝑠1 , 𝑠2 sur cette surface. Montrer que la condition 𝑇 𝐷 = 0
conduit à l’existence de fonctions 𝜏 𝛼𝛽 de 𝑠1 , 𝑠2 (𝛼, 𝛽 = 1, 2, 𝜏 𝛼𝛽 = 𝜏 𝛽𝛼 ) telles que
𝑇
𝑗𝑘
=𝜏
𝛼𝛽
𝜕𝑥𝑗 𝜕𝑥𝑘
𝜕𝑠𝛼 𝜕𝑠𝛽
et que ces variables vérifient les trois équations suivantes :
𝑗
𝜕
𝛼𝛽 𝜕𝑥
𝜏
𝜕𝑠𝛼
𝜕𝑠𝛽
(︃
3.3.2
)︃
=0
Lois de conservation
Considérons une distribution de matière 𝑇 dans R4 , occupant à chaque instant 𝑡, une
région compacte de l’espace.
Soit 𝑍 une solution de l’équation 𝐷𝑍 = 0 et 𝑢, une fonction du temps, nulle pour
𝑡 < 𝑡0 , égale à 1 pour 𝑡 > 𝑡1 . Le tenseur 𝐷[𝑢𝑍] est à support compact sur le support de
𝑇 . On peut donc calculer 𝑇 𝐷[𝑢𝑍] :
˘
𝑇 𝜇𝜈 𝜕𝜇 𝑢𝑍𝜈 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 𝑑𝑥4
𝑇 𝐷[𝑢𝑍] =
ˆ 𝑡1 Σ
=
𝑢˙ 𝐽(𝑡, 𝑍) 𝑑𝑡,
𝑡0
˚
où
𝑇 4𝜈 𝑍𝜈 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 ,
𝐽(𝑡, 𝑍) =
Σ𝑡
et Σ𝑡 désigne l’intersection de Σ avec l’hyperplan 𝑥4 = 𝑡.
Si 𝑣 est une fonction du temps nulle pour 𝑡 < 𝑡0 et 𝑡 > 𝑡1 alors 𝑣𝑍 est à support
compact sur le support de 𝑇 . Par conséquent :
𝑇 𝐷[𝑣𝑍] = 0
et donc
ˆ
ˆ
𝑡1
𝑡1
𝑢˙ 𝐽(𝑡, 𝑍) 𝑑𝑡 = −
𝑡0
𝑡0
˙ 𝑍) 𝑑𝑡 = 0
𝑢 𝐽(𝑡,
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
45
ce qui entraîne que 𝐽(𝑡, 𝑍) est indépendant de 𝑡. Ainsi la grandeur
𝑇 𝐷[𝑢𝑍] = 𝐽(𝑡, 𝑍)
est une « grandeur conservée ».
Exercice 3.8. Montrer que dans R𝑛 les solutions de l’équation 𝐷𝑍 = 0 sont toutes de la
forme :
𝑍𝜆 = 𝐴𝜆 + 𝐵𝜆𝜇 𝑥𝜇
les 𝐴𝜆 et 𝐵𝜆𝜇 étant des constantes arbitraires (𝐵𝜆𝜇 = −𝐵𝜇𝜆 ).
La fonction 𝐽(𝑡, 𝑍) dépend linéairement des coefficients 𝐴𝜆 , 𝐵𝜆𝜇 ; on peut donc l’écrire
1
𝐴𝜆 𝑃 𝜆 + 𝐵𝜆𝜇 𝑆 𝜆𝜇
2
(3.9)
les dix grandeurs 𝑃 𝜆 , 𝑆 𝜆𝜇 (= −𝑆 𝜇𝜆 ) étant les composantes d’un objet conservé, le
moment. Le libre choix des dates permet de calculer ce moment à une date arbitraire. Sur
l’exemple des équations d’Euler d’un milieu continu quelconque, le calcul des grandeurs
(3.9) fournit le résultat suivant :
˚
4
𝜌 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 ,
𝑃 =
˚Σ𝑡
𝜌𝑉 𝑗 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 ,
𝑃𝑗 =
˚Σ𝑡 [︁
(3.10)
]︁
𝑘
𝑘
1
2
3
4𝑘
𝜌 𝑥 − 𝑉 𝑡 𝑑𝑥 𝑑𝑥 𝑑𝑥 ,
𝑆 =
Σ𝑡
˚
[︁
]︁
𝑗𝑘
𝑆 =
𝜌 𝑉 𝑗 𝑥𝑘 − 𝑉 𝑘 𝑥𝑗 𝑑𝑥1 𝑑𝑥2 𝑑𝑥3 ,
Σ𝑡
où la valeur des intégrales est indépendante de la date 𝑡 choisie.
Ainsi l’interprétation du moment est claire : 𝑃 4 est la masse, 𝑃 𝑗 l’impulsion, 𝑆 𝑗𝑘 le
moment angulaire, 𝑆 4𝑘 le passage 1 .
Une absence tout à fait remarquable dans cette liste : on n’y rencontre pas l’énergie.
Pourquoi donc ?
Essentiellement parce que la présente description de la mécanique concerne aussi bien
les phénomènes dissipatifs que les autres. Le bilan d’énergie ne pourrait donc y figurer
qu’en termes thermodynamiques, et devrait s’accompagner d’autres grandeurs, telles que
l’entropie, la chaleur, la température, etc. L’énergie est donc reléguée ici au rang des
variables concernant les lois de comportement 2 . Par contre, les grandeurs figurant dans
le moment ci-dessus restent pertinentes dans ce genre de phénomènes.
La procédure présentée ici pour construire le « moment » s’applique à d’autres situations, notamment la statique ; on doit noter que ces procédures utilisent essentiellement
les propriétés topologiques du vide extérieur au support de la distribution 𝑇 . Soit 𝛼 une
1-forme telle que 𝑆𝑢𝑝𝑝(𝛼) ∩ Σ soit compact ; on peut calculer 𝑇 (𝛼 ⊙ 𝑍) où 𝑍 désigne une
1. Grandeur conservée qui caractérise le mouvement du centre de masse X : 𝑚𝑋 𝑘 = 𝑆 4𝑘 + 𝑃 𝑘 𝑡
2. Bien sûr, la relativité propose une autre définition de l’énergie, par la formule 𝐸 = 𝑚𝑐2 . Mais au
niveau actuel, cette définition est transparente : on peut la considérer comme une définition facultative
de la variable 𝐸.
46
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
Figure 3.1 – Torseur des efforts.
solution de 𝐷𝑍 = 0. On remarque alors que si 𝛽 est une autre forme du même type telle
que 𝛼 − 𝛽 = 𝑑𝑓 où 𝑓 est une fonction telle que 𝑆𝑢𝑝𝑝(𝑓 ) ∩ Σ soit compact, alors
𝑇 [(𝛼 − 𝛽) ⊙ 𝑍] = 𝑇 𝐷(𝑓 𝑍) = 0.
Ainsi l’application 𝑍 ↦→ 𝑇 (𝛼 ⊙ 𝑍) induit une forme linéaire sur l’espace des solutions
de 𝐷𝑍 = 0 qui ne dépend que d’une classe de cohomologie de 𝛼 à préciser. C’est cette
application que nous avons baptisée ici le « moment ».
Sur la Figure 3.1, on a représenté un problème de statique. L’intégrale de 𝑇 𝑖𝑗 𝑍𝑗 sur
l’intersection de Σ avec un disque bordé par une des courbes est indépendant de la classe
d’homologie de cette courbe dans le complémentaire de Σ (comparer avec la 2-homologie
évoquée implicitement dans le cas de la dynamique). Cette intégrale représente la résultante des efforts qui s’exercent sur la section orientée (par le sens de la courbe) découpée
par un disque bordée par cette courbe. Cette résultante est un objet à 6 composantes (10
dans le cas de la dynamique). Il s’agit d’un torseur de R3 où champ équiprojectif (qui
est une notion affine). L’identification de ce torseur à un moment du groupe d’Euclide
n’apparaît a priori que comme une coïncidence.
3.3.3
Matière dans un champ de gravitation
Nous avons déjà envisager l’action de la pesanteur sur une particule. Pour la prendre
en compte, il suffit de remplacer la connexion plate de R4 utilisée plus haut par une
connexion linéaire symétrique ∇ qui décrit le champ de pesanteur à la surface de la terre.
Dans le cas envisagé ici, les seuls Γ𝜈𝜆𝜇 non nuls sont les Γ𝑗44 , égaux aux composantes
𝑔 𝑗 de l’accélération de la pesanteur, supposées indépendantes de la position. Mais rien
n’empêche de donner une description plus précise de la pesanteur réelle, par exemple
en ajoutant des termes Γ𝑗4𝑘 = Γ𝑗𝑘4 = −Ω𝑗𝑘 , spécifiques de la rotation de la Terre. La loi
𝑇 𝐷 = 0, avec cette nouvelle valeur de 𝐷, inclut automatiquement la pesanteur dans tous
les modèles de la mécanique.
Voici par exemple ce que deviennent les équations d’Euler (3.8) :
𝜕𝑉 𝑘
𝜕𝑗 Θ + 𝜌 𝑉 𝜕𝑗 𝑉 +
𝜕𝑡
(︁
)︁
𝜕𝜌
𝜕𝑗 𝜌𝑉 𝑗 +
=0
𝜕𝑡
(︃
𝑗𝑘
𝑗
𝑘
)︃
(︁
= 𝜌 𝑔 𝑘 + 2Ω𝑘𝑗 𝑉 𝑗
)︁
(3.11)
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
47
On obtient de même les équations du mouvement du pendule de Foucault, ou de tout
autre mécanisme soumis à l’action de la pesanteur. Et en particulier les équations de la
statique pesante.
Exercice 3.9. Soit 𝑀 une variété munie d’une connexion linéaire symétrique. On appelle
divergence d’un champ de vecteurs 𝑋 et on la note div 𝑋, la trace de ∇ 𝑋. Cette définition
s’étend sans difficultés à un champ de tenseur 𝑇 , 𝑝-fois contravariant symétrique.
1. Soit 𝜔 une forme volume sur 𝑀 telle que ∇ 𝜔 = 0. Montrer que :
𝑑 (𝑖𝑋 𝜔) = (div 𝑋) 𝜔.
2. Montrer que si 𝑇 est un 2-tenseur contravariant symétrique, 𝑍 un covecteur et 𝑇 𝑍
désigne la contraction de ces deux tenseurs alors :
div(𝑇 𝑍) = (div 𝑇 )𝑍 + (1/2)𝑇 𝐷𝑍.
3.4
Collisions et assemblages
La situation que nous avons étudié dans la section 3.1 peut être étendue à la « chute »
de plusieurs points matériels. Si 𝑇1 et 𝑇2 représentent l’inertie de deux points matériels
libres alors 𝑇 = 𝑇1 + 𝑇2 vérifie également l’équation 𝑇 𝐷 = 0. 𝑇 suffit à décrire à la fois
les deux chutes et les deux masses. Mais il peut également arriver que deux particules se
rencontrent et subisse une collision. Pour décrire cette rencontre, nous prenons un tenseur
𝑇 dont le support est constitué de quatre courbes régulières se rencontrant au point 𝑝0 à
l’instant 𝑡0 . Nous écrivons donc après le choix d’un paramétrage de chacune de ces courbes
4 ˆ 𝑏𝑘
∑︁
𝑇𝑘𝜇𝜈 𝐺𝜇𝜈 𝑑𝑠 .
𝑇𝐺 =
𝑘=1
𝑎𝑘
En travaillant avec des covecteurs tests nuls sauf sur une seule des quatre courbes, on
montre, comme dans la section précédente, que
𝑇𝑘𝜇𝜈 (𝑠) = 𝜙𝑘 (𝑠) 𝑥˙ 𝜇𝑘 𝑥˙ 𝜈𝑘 ,
𝑘 = 1, 2, 3, 4,
et que de plus on a
)︁
𝑑 (︁
𝜙𝑘 𝑥˙ 4𝑘 = 0, 𝑘 = 1, 2, 3, 4,
𝑑𝑠
4
c’est à dire 𝜙𝑘 𝑥˙ 𝑘 = 𝑚𝑘 = 𝐶𝑠𝑡𝑒. Comme on cherche à décrire la rencontre de points
matériels, on supposera que les constantes 𝑚𝑘 sont toutes non nulles. On peut donc, pour
chacune des courbes, prendre 𝑥4 = 𝑡 comme paramètre et on écrit
4 ˆ 𝑡𝑘
∑︁
𝑇𝐺 =
𝜀𝑘 𝑚𝑘 𝑥˙ 𝜇𝑘 𝑥˙ 𝜈𝑘 𝐺𝜇𝜈 𝑑𝑡, (𝜀𝑘 = ±1) .
𝑘=1
𝑡0
En écrivant à nouveau l’équation 𝑇 𝐷𝑍 = 0 avec maintenant des covecteurs tests dont
le support est contenu dans un tout petit voisinage de l’événement (𝑝0 , 𝑡0 ), on obtient
(︃
)︃
4 ˆ 𝑡𝑘
∑︁
𝜌 𝑑𝑍𝜌
𝜇 𝜈
𝜌
𝑇 𝐷𝑍 =
𝜀𝑘 𝑚𝑘 𝑥˙ 𝑘
+ 𝜀𝑘 𝑚𝑘 𝐷𝜇𝜈 𝑥˙ 𝑘 𝑥˙ 𝑘 𝑍𝜌 𝑑𝑡,
𝑑𝑠
𝑡
0
𝑘=1
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
48
ce qui, après une intégration par partie et étant donné que 𝑍 est arbitraire, nous donne :
4
∑︁
𝜀𝑘 𝑚𝑘 𝑥˙ 𝜌𝑘 (𝑡0 ) = 0,
𝜌 = 1, 2, 3, 4.
𝑘=1
La première de ces quatre équations s’écrit
4
∑︁
𝜀𝑘 𝑚𝑘 = 0.
(3.12)
𝑘=1
Il n’est donc pas possible que les quatre constantes 𝜀𝑘 soient toutes de même signe.
Plusieurs scénarios sont alors possibles :
– Une particule arrive et se désintègre en trois particules,
– Trois particules fusionnent pour n’en donner qu’un seule,
– Deux particules entre en collision et deux en sortent.
Dans tous les cas, la relation précédente exprime la conservation de la masse totale du
système. Les trois autres équations
4
∑︁
𝜀𝑘 𝑚𝑘 𝑥˙ 𝑗𝑘 (𝑡0 ) = 0,
𝑗 = 1, 2, 3,
(3.13)
𝑘=1
traduisent la conservation de la quantité de mouvement du système. Dans le cas particulier d’une collision sans fusion ni désintégration ces relations correspondent aux lois des
collisions qui ont été découvertes au 17𝑒𝑚𝑒 siècle par Galilée, Mariotte et Huygens.
Remarque 3.10. Le calcul précédent a également son analogue en statique (cas où 𝑀 = R3
et ∇ est la connexion canonique de R3 ). L’équivalent de la relation (3.13) se traduit ici
par le fait que la somme des tensions un un point de jonction est nul.
3.5
Second gradient
En prenant une distribution 𝑇 qui fait intervenir les dérivées secondes du covecteur
test 𝑍 et donc les dérivée premières de 𝐺, on peut décrire des propriétés plus fines de la
matière. On se limitera ici à l’étude d’une distribution supportée par une courbe.
Considérons donc un tenseur distribution 𝑇 , supportée par une courbe Σ (non compacte sans bord) mais donnée cette fois par une intégrale dite de « second gradient »
ˆ 𝑏
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 + 𝑆 𝜇𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 𝑑𝑠,
𝑎
où
𝑇 𝜇𝜈 = 𝑇 𝜈𝜇 ,
𝑆 𝜇𝜈𝜌 = 𝑆 𝜈𝜇𝜌 .
Lemme 3.11. Si 𝑇 𝐷 = 0 alors il existe des fonctions 𝑃 𝜈 , 𝑆 𝜈𝜌 de 𝑠 (avec 𝑆 𝜈𝜌 = −𝑆 𝜌𝜈 )
telles que
ˆ 𝑏
𝑇𝐺 =
𝑥˙ 𝜇 (𝑃 𝜈 𝐺𝜇𝜈 + 𝑆 𝜈𝜌 𝐺𝜇𝜈;𝜌 ) 𝑑𝑠.
𝑎
où
𝐺𝜇𝜈;𝜌 = 𝜕𝜌 𝐺𝜇𝜈 +
)︁
1 (︁ 𝜆
𝜆
𝐷𝜌𝜇 𝐺𝜆𝜈 + 𝐷𝜌𝜈
𝐺𝜇𝜆 .
2
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
49
Démonstration. Soient 𝑢 et 𝑣 des fonctions 𝐶 ∞ nulles sur la courbe Σ et 𝑍 un covecteur
à support compact. En écrivant 𝑇 𝐷(𝑢𝑣𝑍) = 0, on obtient, après quelques calculs
ˆ
𝑏
(𝑆 𝜇𝜈𝜌 + 𝑆 𝜌𝜈𝜇 ) 𝜕𝜇 𝑢 𝜕𝜌 𝑣 𝑍𝜈 𝑑𝑠 = 0,
𝑎
pour tout 𝑍 ∈ Ω1𝑐 (𝑀 ). Ce qui nous donne
(𝑆 𝜇𝜈𝜌 + 𝑆 𝜌𝜈𝜇 ) 𝜕𝜇 𝑢 𝜕𝜌 𝑣 = 0,
pour toutes les fonctions 𝑢, 𝑣 nulles sur la courbe. Posons
𝐾 𝜇𝜈𝜌 = 𝑆 𝜇𝜈𝜌 + 𝑆 𝜌𝜈𝜇 .
Une variante de l’exercice 3.2 montre alors qu’il existe des fonctions 𝐴𝜈𝜌 telles que
𝐾 𝜇𝜈𝜌 = 𝑥˙ 𝜇 𝐴𝜈𝜌 + 𝑥˙ 𝜌 𝐴𝜈𝜇 .
En effectuant la somme alternée des trois permutation circulaires de l’équation
𝐾 𝜇𝜈𝜌 = 𝑆 𝜇𝜈𝜌 + 𝑆 𝜌𝜈𝜇 ,
on obtient
𝑆 𝜇𝜈𝜌 =
1
(𝐾 𝜇𝜈𝜌 − 𝐾 𝜈𝜌𝜇 + 𝐾 𝜌𝜇𝜈 ) ,
2
et donc finalement
𝑆 𝜇𝜈𝜌 =
1 𝜇 𝜈𝜌
{𝑥˙ (𝐴 − 𝐴𝜌𝜈 ) + 𝑥˙ 𝜈 (𝐴𝜇𝜌 − 𝐴𝜌𝜇 ) + 𝑥˙ 𝜌 (𝐴𝜇𝜈 + 𝐴𝜈𝜇 )} .
2
Posons 𝑆 𝜈𝜌 = 𝐴𝜈𝜌 − 𝐴𝜌𝜈 et 𝐵 𝜇𝜈 = 𝐴𝜇𝜈 + 𝐴𝜈𝜇 . Après une intégration par partie, on trouve
que pour tout tenseur symétrique 𝐺 à support compact
ˆ 𝑏
1 𝑑
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 −
(𝐵 𝜇𝜈 )𝐺𝜇𝜈 + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 𝑑𝑠.
2
𝑑𝑠
𝑎
Par conséquent, quitte à redéfinir les fonctions 𝑇 𝜇𝜈 , on peut supposer que 𝑇 est de la
forme
ˆ 𝑏
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 𝑑𝑠.
𝑎
Écrivons à nouveau 𝑇 𝐷(𝑢𝑍) = 0 où 𝑢 est un fonction 𝐶 ∞ nulle sur le support de 𝑇 . Il
vient finalement :
}︃
ˆ 𝑏 {︃
𝑑
𝜈𝜌
𝜇𝜈
𝜇 𝜆𝜌 𝜈
𝑇 𝐷(𝑢𝑍) =
2𝑇 𝜕𝜇 𝑢 𝑍𝜈 + 𝑥˙ 𝑆 𝐷𝜇𝜆 𝜕𝜌 𝑢 𝑍𝜈 −
(𝑆 ) 𝜕𝜌 𝑢 𝑍𝜈 𝑑𝑠,
𝑑𝑠
𝑎
ce qui nous donne
{︃
}︃
2𝑇 𝜇𝜈
𝑑
𝜈
+ 𝑥˙ 𝜌 𝑆 𝜆𝜇 𝐷𝜌𝜆
−
(𝑆 𝜈𝜇 ) 𝜕𝜇 𝑢 = 0,
𝑑𝑠
𝜈 = 1, 2, 3, 4,
50
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
pour toute fonction 𝑢 nulle sur la courbe. Le résultat de l’exercice 3.2 nous montre alors
qu’il existe des fonctions 𝑃 𝜈 de 𝑠 telles que
𝑇 𝜇𝜈 +
1 𝑑
1 𝜌 𝜆𝜇 𝜈
𝑥˙ 𝑆 𝐷𝜌𝜆 −
(𝑆 𝜈𝜇 } = 𝑥˙ 𝜇 𝑃 𝜈 ,
2
2 𝑑𝑠
soit
𝑇 𝜇𝜈 = 𝑥˙ 𝜇 𝑃 𝜈 −
1 𝜌 𝜆𝜇 𝜈
1 𝑑
𝑥˙ 𝑆 𝐷𝜌𝜆 +
(𝑆 𝜈𝜇 } .
2
2 𝑑𝑠
Comme de plus
1 𝑑
(𝑆 𝜈𝜇 } 𝐺𝜇𝜈 = 0,
2 𝑑𝑠
on a donc finalement
ˆ 𝑏 {︂
𝜇
𝜈
𝑥˙ 𝑃 𝐺𝜇𝜈
𝑇𝐺 =
𝑎
ˆ
1
𝜈
− 𝑥˙ 𝜌 𝑆 𝜆𝜇 𝐷𝜌𝜆
𝐺𝜇𝜈 + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 𝑑𝑠
2
}︂
𝑏
(𝑥˙ 𝜇 𝑃 𝜈 𝐺𝜇𝜈 + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝐺𝜇𝜈;𝜌 ) 𝑑𝑠
=
𝑎
Quand 𝑀 = R3 , le modèle précédent conduit à la description d’un fil de torsion.
Exercice 3.12. Montrer dans ce cas que les fonctions 𝑃 𝑖 , 𝑆 𝑖𝑗 vérifient les 6 équations
suivantes
𝑃 𝑖 = 𝐶𝑠𝑡𝑒
𝑆 𝑖𝑗 + 𝑃 𝑖 𝑥𝑗 − 𝑃 𝑗 𝑥𝑖 = 𝐶𝑠𝑡𝑒
♠
La transposition quadri-dimensionnelle du modèle des fils de torsions conduit à une
description classique, non quantique, des particules à spin. Cette notion a d’abord été
introduite pour l’électron, par Uhlenbeck et Goudsmit en 1925, afin d’expliquer certaines
particularités des spectres atomiques, notamment l’apparition de raies supplémentaires en
présence de champ magnétiques. Une particule chargée possède un moment magnétique
colinéaire à son spin, ce qui confère à ce dernier un rôle dynamique dans les phénomènes
électromagnétiques, comme l’effet Zeeman. Le spin est donc une propriété de la matière
au même titre que la masse.
Cependant, l’analogie entre le spin et le moment cinétique propre utilisé en mécanique
du solide est trompeuse. C’est pourquoi on a considéré longtemps le spin comme un
concept essentiellement quantique. Ce n’est qu’en 1966 que Souriau et Bacry ont proposé,
indépendamment, des modèles classiques de particules à spin.
Conclusion
Nous avons dans ce chapitre introduit l’équation universelle 𝑇 𝐷 = 0, formulée par
Jean-Marie Souriau, à travers quelques exemples. Cette équation est très générale, elle
décrit aussi bien l’équation du mouvement d’une particule dans un champ de gravitation
que le mouvement de la matière, étendue ou distribuée : c’est une équation universelle
de la mécanique. Comme nous l’avons remarqué cependant, elle ne suffit pas, bien sûr,
CHAPITRE 3. UN PRINCIPE DE COVARIANCE GÉNÉRAL
51
pour décrire complètement un problème de mécanique ; il faut lui adjoindre les lois de
comportement de l’objet considéré.
L’intérêt fondamental de cette équation vise surtout à éclaircir les structures fondamentales sous-jacente de la mécanique. Le sens profond de cette équation ne peut être
précisé sans référence à la relativité générale, qui sera l’objet du prochain chapitre. On y
explicitera le lien entre 𝑇 et la métrique de l’univers. L’équation 𝑇 𝐷 = 0 apparaîtra alors
naturellement. Il faudra alors justifier pourquoi elle est encore valable dans l’approximation newtonienne de la gravitation et dans le modèle tridimensionnel de la statique.
Chapitre 4
Relativité générale
Ce chapitre est une introduction à la relativité générale. On y définit le tenseur
énergie-impulsion. On montre alors que l’équation 𝑇 𝐷 = 0 est un simple
corollaire du principe de relativité générale. On établit l’équation d’Einstein à
partir d’un principe variationnel. On étudie ensuite la « limite newtonienne »
de la gravitation einsteinienne et le « principe des géodésiques ».
4.1
Introduction
Dans le chapitre précédent, nous avons introduit l’équation universelle 𝑇 𝐷 = 0. Nous
avons pu vérifier sur des exemples, qu’on pouvait en déduire les principales équations de
la mécanique. Le sens profond de cette équation ne peut être révélé que dans le cadre de
la relativité générale d’Einstein, dont ce chapitre est une introduction.
Née en 1915, afin d’introduire les phénomènes de gravitation dans la toute récente
théorie de la relativité (1905), elle représente l’Univers 1 par une variété différentielle 𝑀 ,
munie d’une métrique pseudo-riemannienne 𝑔 de signature (− − −+) (métrique lorentzienne).
Comme nous l’avons déjà évoqué, le principe de relativité générale stipule que les
lois physiques sont indépendantes d’un système particulier de coordonnées sur la variété
𝑀 (objectivité physique). Ce principe va se traduire, comme l’a fait remarquer Souriau,
par l’invariance des grandeurs mathématiques décrivant la physique par le groupe des
difféomorphismes de 𝑀 à support compact.
Ainsi, notre univers sera décrit, non pas par une métrique lorentzienne, mais par
la classe de cette métrique modulo le groupe des difféomorphismes à support compact
– ces difféomorphismes sont par conséquent inobservables. L’espace quotient correspondant, Souriau l’appelle la Physis. Un univers physique, c’est donc une classe de métrique
lorentzienne modulo le groupe des difféomorphismes à support compact.
Cette métrique, permet de mesurer les durées et les longueurs. Un vecteur 𝑋 en un
point est dit de type temporel si
𝑔(𝑋, 𝑋) > 0,
et de type spatial si
𝑔(𝑋, 𝑋) < 0.
1. L’Univers est dénommé parfois à tord « espace-temps », ce qui réduit ce nouveau concept au paradigme newtonien classique : 𝑢𝑛𝑖𝑣𝑒𝑟𝑠 = 𝑒𝑠𝑝𝑎𝑐𝑒 + 𝑡𝑒𝑚𝑝𝑠.
52
53
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Plus généralement, une courbe paramétrée 𝑥(𝑠) dans 𝑀 est dite de type temporelle si
𝑔(𝑥(𝑠),
˙
𝑥(𝑠))
˙
> 0,
et de type spatiale si
𝑔(𝑥(𝑠),
˙
𝑥(𝑠))
˙
< 0.
On pourra vérifier que ces définitions sont indépendantes du paramétrage.
Cette métrique décrit également les phénomènes gravitationnels. Au chapitre précédent, nous avons utilisé une connexion linéaire symétrique pour décrire la gravitation
galiléenne. Ici, c’est la connexion de Lévi-Civita de la métrique 𝑔 qui va décrire ces phénomènes. On pourra alors établir que la gravitation galiléenne ∇𝐺𝑎𝑙 est une approximation
de la gravitation d’Einstein ∇𝐸𝑖𝑛 .
Dans la théorie newtonienne classique, la gravitation est décrite par « une force en
2
1/𝑟 ». Vers 1812, Poisson a précisé cette description en représentant le phénomène gravitationnel par un champ E sur R3 , dérivant d’un potentiel 𝑈 . La loi en 1/𝑟2 est alors
remplacée par l’équation de champ
△𝑈 = 4𝜋𝐺𝜌
(4.1)
où 𝐺 est la constante de Newton et 𝜌 est la densité de masse.
Exercice 4.1. Montrer que l’équation de Poisson conduit à la formule de Newton si on
fait l’hypothèse que la fonction 𝜌 est invariante par le groupe des rotations de l’espace.
Pas analogie, Einstein a cherché à relier la métrique 𝑔 à la distribution d’énergiematière de l’univers. C’est en 1915, qu’il propose sa célèbre équation
𝑅𝜇𝜈 −
1 𝜇𝜈
8𝜋𝐺
𝑔 𝑅 = − 4 𝑇 𝜇𝜈
2
𝑐
(4.2)
où 𝑅𝜇𝜈 et 𝑅 sont des contractions du tenseur de courbure de la connexion riemannienne
de 𝑔 et 𝑇 𝜇𝜈 est le tenseur d’impulsion-énergie qui décrit comme son nom l’indique la
distribution d’énergie-matière de l’univers – objet qui joue ici le rôle que joue 𝜌 dans
l’équation de Poisson.
Le plan de ce chapitre le suivant. Dans une première section, on établit quelques
formules de calcul tensoriel. Une deuxième section est consacré à la définition du tenseur
énergie-impulsion et du tenseur-distribution 𝑇 qui apparaît dans l’équation de Souriau. On
montre que l’équation 𝑇 𝐷 = 0 est un simple corollaire du principe de relativité générale.
La troisième section est consacrée à l’équation d’Einstein ; on la déduit d’une formulation
variationnelle. On étudie ensuite la « limite newtonienne » de la gravitation einsteinienne.
La dernière section est consacrée au principe des géodésiques et à la justification du
principe universel 𝑇 𝐷 = 0.
4.2
Notations et résultats préliminaires
Dans la suite, on considère une variété différentielle 𝑀 de classe 𝐶 ∞ munie d’une
métrique riemannienne (ou pseudo-riemannienne) 𝑔.
54
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Forme volume. Dans toute carte locale, on définit une forme volume en posant
Ω=
√︁
|det(𝑔)| 𝑑𝑥1 ∧ · · · ∧ 𝑑𝑥𝑛 .
Si la variété est orientable, cette expression définit une forme volume sur la variété tout
entière.
Exercice 4.2. On note ∇, la connexion de Lévi-Civita associée à la métrique 𝑔. Montrer
que ∇ Ω = 0.
Notations covariantes. Si 𝑇 désigne un tenseur quelconque de type (𝑝, 𝑞), alors ∇ 𝑇
est un tenseur de type (𝑝 + 1, 𝑞). Dans une carte locale, désignons ses composantes par
𝑖 ...𝑖
𝑇𝑗11...𝑗𝑝𝑞 . On notera alors
𝑖 ...𝑖
𝑇𝑗11...𝑗𝑝𝑞 ;𝑘
les composantes de ∇ 𝑇 . Cette opération commute avec le procédé qui consiste à faire
« monter » ou « descendre » un indice à l’aide de la métrique comme l’illustre l’exercice
suivant.
Exercice 4.3. Soit 𝑇 un tenseur 𝑝 fois covariant et Γ le tenseur de type (𝑝 − 1, 1) défini
par
𝑇 (𝑋1 , . . . , 𝑋𝑝 ) = ⟨Γ(𝑋1 , . . . , 𝑋𝑝−1 ), 𝑋𝑝 ⟩ .
Montrer que
(∇𝐴 𝑇 )(𝑋1 , . . . , 𝑋𝑝 ) = ⟨(∇𝐴 Γ)(𝑋1 , . . . , 𝑋𝑝−1 ), 𝑋𝑝 ⟩ .
En déduire l’expression locale
Γ𝑠𝑖1 ...𝑖𝑝−1 ;𝑘 = 𝑔 𝑠𝑖𝑝 𝑇𝑖1 ...𝑖𝑝 ;𝑘 .
♠
Plus généralement, la dérivée covariante du tenseur ∇ 𝑇 , notée ∇2 𝑇 est un tenseur
de type (𝑝 + 2, 𝑞) et on notera
𝑖 ...𝑖
𝑇𝑗11...𝑗𝑝𝑞 ;𝑘𝑙
ses composantes.
Gradient, divergence, laplacien. Soit 𝑓 une fonction de classe 𝐶 ∞ sur 𝑀 . Notons 𝑓𝑖 ,
les composantes de sa différentielle 𝑑𝑓 dans un système de coordonnées. On notera 𝑓 𝑖 , les
composantes du champ de vecteurs obtenu en faisant « descendre l’indice » de 𝑑𝑓 . C’est
le gradient de 𝑓 . La divergence de ce champ de vecteur, on l’appelle de Laplacien 2 de 𝑓 .
On le note △𝑓
△𝑓 = div grad 𝑓 = 𝑓;𝑖𝑖 = 𝑔 𝑖𝑗 𝜕𝑖 𝜕𝑗 𝑓 − Γ𝑘𝑖𝑗 𝑔 𝑖𝑗 𝜕𝑘 𝑓.
2. On parle de D’Alembertien quand la structure est pseudo-riemannienne de signature (− − −+)
55
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Identité de Ricci. Soit 𝑋 un champ de vecteurs. L’application qui associe à 𝑋 le
champ de vecteurs (∇2 𝑋)(𝐵, 𝐴) est un opérateur différentiel du second ordre que l’on
notera 𝑄(𝐴, 𝐵). Un calcul simple nous donne
𝑄(𝐴, 𝐵)𝑋 = ∇𝐴 ∇𝐵 𝑋 − ∇∇𝐴 𝐵 𝑋.
Noter la relation
𝑄(𝐴, 𝐵)𝑋 − 𝑄(𝐵, 𝐴)𝑋 = R(𝐴, 𝐵)𝑋
où R est le tenseur de courbure de la connexion riemannienne. L’opérateur 𝑄 s’étend
bien entendu aux tenseurs 𝑇 quelconques et la formule précédente peut être généralisée,
donnant naissance à l’identité dite de Ricci. Cette identité relie le tenseur de courbure
associé à la dérivée covariante sur les champs de vecteurs au tenseur de courbure associé
à la dérivée covariante sur les champs de tenseurs d’un type donné
R(𝐴, 𝐵)𝑇 = ∇𝐴 ∇𝐵 𝑇 − ∇𝐵 ∇𝐴 𝑇 − ∇[𝐴,𝐵] 𝑇.
L’exercice qui suit en propose la démonstration dans le cas d’un tenseur 𝑝 fois covariant.
Exercice 4.4 (Identité de Ricci). Soit 𝑇 un tenseur 𝑝 fois covariant. Montrer l’identité
de Ricci
[𝑄(𝐴, 𝐵)𝑇 − 𝑄(𝐵, 𝐴)𝑇 ] (𝑋1 , . . . , 𝑋𝑝 )
=−
𝑝
∑︁
𝑇 (𝑋1 , . . . , R(𝐴, 𝐵)𝑋𝑖 , . . . , 𝑋𝑝 ) .
♠
𝑖=1
Symétries du tenseur de courbure. Le tenseur de courbure d’une connexion linéaire
symétrique possède les propriétés suivantes :
(1) R(𝐴, 𝐵) = −R(𝐵, 𝐴),
(2) R(𝐴, 𝐵)𝐶 + R(𝐵, 𝐶)𝐴 + R(𝐶, 𝐴)𝐵 = 0 (Bianchi).
Si cette connexion provient d’une métrique riemannienne, on peut définir un tenseur
4 fois covariant en posant
R(𝐴, 𝐵, 𝐶, 𝐷) = ⟨R(𝐴, 𝐵)𝐶, 𝐷 ⟩ .
Noter alors les relations
(1)
(1)
(1)
(1)
R(𝐴, 𝐵, 𝐶, 𝐷) = −R(𝐵, 𝐴, 𝐶, 𝐷),
R(𝐴, 𝐵, 𝐶, 𝐷) = −R(𝐴, 𝐵, 𝐷, 𝐶),
R(𝐴, 𝐵, 𝐶, 𝐷) = R(𝐶, 𝐷, 𝐴, 𝐵),
R(𝐴, 𝐵, 𝐶, 𝐷) + R(𝐵, 𝐶, 𝐴, 𝐷) + R(𝐶, 𝐴, 𝐵, 𝐷) = 0.
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
56
Courbure de Ricci. Revenons au cas d’une connexion linéaire quelconque. On peut
extraire de son tenseur de courbure, R trois traces que nous noterons respectivement 𝑐1 ,
𝑐2 , 𝑐3 et données dans une carte locale par :
𝑐1 (𝐴, 𝐵) =
𝑛
∑︁
𝑑𝑥𝑖 (R(𝑒𝑖 , 𝐴)𝐵) ,
𝑖=1
𝑐2 (𝐴, 𝐵) =
𝑛
∑︁
𝑑𝑥𝑖 (R(𝐴, 𝑒𝑖 )𝐵) ,
𝑖=1
𝑐3 (𝐴, 𝐵) =
𝑛
∑︁
𝑑𝑥𝑖 (R(𝐴, 𝐵)𝑒𝑖 .) ,
𝑖=1
Du fait des symétries du tenseur de courbure, ces traces ne sont pas indépendantes ; les
deux premières sont opposées et leur somme totale est nulle. On nomme la deuxième trace
le tenseur de Ricci et on le note Ric(𝐴, 𝐵). En désignant par
𝑙
𝑅𝑖𝑗𝑘
les composantes du tenseur de courbure R dans une carte locale, on a
𝑙
Ric𝑖𝑗 = 𝑅𝑖𝑗 = 𝑅𝑖𝑘𝑗
Exercice 4.5. Montrer que dans le cas riemannien ou pseudo-riemannien, le tenseur de
Ricci est symétrique.
Courbure scalaire. Dans le cas riemannien, il est possible de contracter une seconde
fois le tenseur de courbure en faisant monter un des indices du tenseur de Ricci. On défini
ainsi la courbure scalaire
𝑅 = 𝑅𝑖𝑖 = 𝑔 𝑖𝑘 𝑅𝑖𝑘
Exercice 4.6. Montrer que si 𝑀 est une surface de R3 et 𝐾 est la courbure de Gauss de
la surface alors 𝑅 = 2𝐾.
4.3
Tenseur d’énergie-impulsion
L’équation d’Einstein, que nous avons évoqué dans l’introduction relie la courbure
de la métrique 𝑔 à la densité d’énergie-matière de l’univers, généralisant l’équation de
Poisson. Mais, la relativité restreinte ayant établi l’équivalence entre la masse et l’énergie,
une généralisation cohérente de l’équation de Poisson doit tenir compte de ce nouveau
principe. L’objet qui va remplacer la densité de masse 𝜌 qui apparaît dans l’équation de
Poisson est de nature tensorielle et non plus scalaire, il s’agit du tenseur énergie-impulsion
𝑇 𝜇𝜈 .
Remarque 4.7. Au 𝑋𝑉 𝐼𝐼 𝑒`𝑚𝑒 siècle, l’inertie de la matière est décrite par un scalaire 𝑚
qu’on appelle la masse. Au début du 𝑋𝐼𝑋 𝑒`𝑚𝑒 siècle, alors qu’apparaît la mécanique des
milieux continus, ce scalaire est remplacé par une densité 𝜌 qui est plus appropriée pour
modéliser l’inertie de la matière étendue comme un solide ou un fluide. Pour décrire la matière distribuée (sur une surface ou une courbe), on peut remplacer cette fonction-densité
𝜌 par une mesure 𝜇 ( éventuellement à support compacte). Après 1905 et la découverte
57
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
de l’équivalence entre la masse et l’énergie, l’« objet mathématique qui décrit la matière »
doit tenir compte de cette évolution : ce sera le tenseur énergie-impulsion 𝑇 𝜇𝜈 . Cet objet, ou plus correctement la description qu’on en donne est de nature phénoménologique.
Souriau en a fait un tenseur-distribution 𝑇 , objet très générale qui permet de décrire la
matière distribuée et redonne comme cas particulier les modèles précédents – nous en
avons vu des exemples au chapitre 3.
4.3.1
Le tenseur énergie-impulsion
En mécanique des milieux continus, on décrit les efforts intérieurs (responsables de la
cohésion) d’un corps par un 2-tenseur contravariant symétrique : le tenseur des contraintes.
L’interprétation mécanique est assez claire : un élément de surface « infinitésimal » 𝑑𝑠
orienté par le vecteur unitaire normal 𝑛 subit une force 𝑓 = 𝜎.𝑛 𝑑𝑠 3 . La tension 𝜎𝑛 dans
la direction 𝑛 est donc donnée par 𝜎𝑛 = 𝜎.𝑛. En statique, un corps est à l’équilibre si la
résultante des efforts qui s’exerce sur lui ainsi que le moment résultant de ces efforts sont
nuls.
Exercice 4.8. Montrer que la première condition d’équilibre se traduit par
(div 𝜎)𝑗 = 𝜕𝑖 𝜎 𝑖𝑗 = 0,
𝑗 = 1, 2, 3
et que la deuxième condition d’équilibre exige la symétrie du tenseur 𝜎 𝑖𝑗 .
En dynamique des milieux continus, nous avons vu que les équations du mouvement
d’un fluide et l’équation de continuité (conservation de la masse) pouvait s’écrire
(div 𝑇 )𝜈 = 𝜕𝜇 𝜎 𝜇𝜈 = 0,
où 4
(︃
𝑇 =
𝜈 = 1, 2, 3, 4
𝜎 𝑗𝑘 + 𝜌𝑉 𝑗 𝑉 𝑘 𝜌𝑉 𝑗
𝜌𝑉 𝑘
𝜌
)︃
Remarque 4.9. Noter que la « dimension » du tenseur 𝜎 est celle d’une force par unité de
surface ou ce qui revient au même d’une énergie par unité de volume. Mais la « dimension »
du tenseur 𝑇 écrit ci-dessus n’est pas bien définie. Les coefficients du bloque central 3 × 3
ont pour dimension celle de 𝜎 à savoir une énergie par unité de volume. Les trois premiers
éléments de la dernière colonne et de la dernière ligne ont la dimension d’une quantité de
mouvement alors que le coefficient 𝑇 44 à la dimension d’une masse par unité de volume.
En relativité générale, le tenseur 𝑇 𝜇𝜈 doit décrire au mieux, la distribution énergétique
de l’univers. C’est un tenseur 2-fois contravariant symétrique qui possède la propriété
div 𝑇 = 0
que l’on assimile parfois au principe de conservation de l’énergie. On verra, un peu plus
loin, le sens profond de cette relation. Son support (là où ce tenseur est non-nul) porte le
nom de domaine intérieur (intérieur à la matière). Le complémentaire de son support (là
où il est nul) porte le nom de domaine extérieur (extérieur à la matière).
3. On a fait descendre un indice de 𝜎 à l’aide de la métrique euclidienne pour faire de 𝜎 une application
linéaire
4. Comme nous l’avons déjà fait dans les chapitres précédent, nous utiliserons une lettre grec pour
désigner un indice dont la valeur appartient à {1, 2, 3, 4} et une lettre latine pour désigner un indice dont
la valeur appartient à {1, 2, 3}.
58
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
4.3.2
Les schémas énergétiques
La connaissance de 𝑇 est de nature phénoménologique. On se limite en générale au
cas de distributions énergétiques pouvant être shématisées sous forme de fluides relativistes doués de propriétés diverses, mécaniques, thermodynamiques, électromagnétique.
La donnée d’une forme particulière pour 𝑇 porte le nom de schéma énergétique [19] :
schéma de matière pure, schéma de fluide parfait, schéma de fluide thermodynamique,
schéma de champ électromagnétique, etc... Se donner un schéma énergétique, c’est choisir
parmi les « sources potentielles d’énergie » de l’Univers, celles que l’on considère comme
prédominantes pour un problème donné et négliger les autres.
Soit 𝑇𝜇𝜈 la forme covariante du tenseur 𝑇 . En un point donné 𝑥, si 𝑇𝜇𝜈 est défini
positif, il est possible de diagonaliser simultanément les formes quadratiques 𝑇𝜇𝜈 et 𝑔𝜇𝜈 .
Autrement dit, on peut trouver une base 𝑉 (𝛼) de 𝑇𝑥 𝑀 dans laquelle on a
𝑔(𝑋, 𝑋) =
˜ 𝑖 )2 − (𝑋
˜ 4 )2 ,
(𝑋
∑︁
𝑖
𝑇 (𝑋, 𝑋) =
∑︁
˜ 𝑖 )2 − 𝑠4 (𝑋
˜ 4 )2 .
𝑠𝑖 ( 𝑋
𝑖
Revenant alors dans la base initiale 𝜕𝜇 on en déduit les expressions
𝑉𝜇(𝑖) 𝑉𝜈(𝑖) − 𝑉𝜇(4) 𝑉𝜈(4) ,
(4.3)
𝑠𝑖 𝑉𝜇(𝑖) 𝑉𝜈(𝑖) − 𝑠0 𝑉𝜇(4) 𝑉𝜈(4) ,
(4.4)
∑︁
𝑔𝜇𝜈 =
𝑖
𝑇𝜇𝜈 =
∑︁
𝑖
𝑉𝜇(𝛼) désignant les composantes covariantes du vecteur 𝑉 (𝛼) .
Supposons pour commencer, que 𝑇𝜇𝜈 soit défini positif partout dans son domaine
intérieur. La construction précédente définit un champ de vecteur
𝑢𝛼 = 𝑉𝛼(0)
de type temps, que l’on interprète comme champ des vitesses unitaires du fluide relativiste.
Comme 𝑇 est défini positif, les 𝑠𝑖 sont négatifs et 𝑠0 et positif. On pose
𝜌 = 𝑠0 ,
𝑝𝑖 = −𝑠𝑖
où 𝜌 et 𝜎𝑖 sont des scalaires positifs. Avec ces notations on a
𝑔 𝜇𝜈 = 𝑢𝜇 𝑢𝜈 −
∑︁
𝜇𝜈
∑︁
𝑉 (𝑖)𝜇 𝑉 (𝑖)𝜈 ,
𝑖
𝑇
𝜇 𝜈
= 𝜌𝑢 𝑢 +
𝑝𝑖 𝑉 (𝑖)𝜇 𝑉 (𝑖)𝜈 .
𝑖
On traduit ce résultat en disant qu’un schéma défini positif peut être interprété comme
un fluide relativiste quelconque : 𝑢𝜇 est la vitesse unitaire du fluide, 𝜌 sa densité propre
et les 𝑝𝑖 sont les contraintes (ou pressions) principales du fluide.
Le schéma « fluide parfait » correspond au cas particulier
𝑝1 = 𝑝2 = 𝑝3 = 𝑝.
On a dans ce cas
𝑇 𝜇𝜈 = (𝜌 + 𝑝) 𝑢𝜇 𝑢𝜈 − 𝑝 𝑔 𝜇𝜈 .
(4.5)
59
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
En fait, pour obtenir les expressions (4.3) et (4.4), l’hypothèse que 𝑇 soit défini positif
est superflue. On peut la remplacer par celle moins contraignante que 𝑇 possède un vecteur
propre réel de type temps. On dit alors que le tenseur 𝑇 est normal. Le schéma dit « matière
pure » s’obtient de cette façon. Il correspond au cas particulier
𝑠0 = 𝜌 > 0,
𝑠𝑖 = 0.
On a alors
𝑇 𝜇𝜈 = 𝜌 𝑢𝜇 𝑢𝜈 .
(4.6)
Ce schéma est celui où l’on considère que la source d’énergie dominante de l’univers
provient de la « matière » et où l’on néglige les autres, ce qui revient à dire que 𝜌 est
grand devant les 𝑝𝑖 . Attention cependant, les unité employées ici sont telles que la vitesse
de la lumière 𝑐 = 1 (voire plus loin pour une écriture de 𝑇 avec les unités usuelles).
4.3.3
Le tenseur-distribution 𝑇
Comme il peut être utile de remplacer une densité de masse 𝜌 par une mesure pour
pouvoir décrire la matière distribuée (sur des surfaces, des courbes), il est fructueux de
généraliser le tenseur énergie-impulsion par un tenseur distribution 𝑇 , c’est à dire une
forme linéaire sur les 2-tenseurs covariants symétriques. C’est ce qu’à fait Souriau. Dans
cette généralisation, le tenseur énergie-impulsion joue le même rôle que la densité 𝜌 pour
une mesure de masse : il correspond au cas particulier où le tenseur distribution est
absolument continu par rapport au volume riemannien Ω.
Mais il y a dans cette description de l’énergie-matière quelque chose de plus conceptuel.
La nature profonde du tenseur-distribution 𝑇 introduit par Souriau est à rechercher sur
la Physis, l’espace quotient de l’espace des métriques sur 𝑀 par le groupe des difféomorphismes à support compact. Cet espace n’est pas, à proprement parlé, une variété mais
possède une structure d’espace difféologique 5 sur lequel il est possible de faire du calcul
différentiel et en particulier de définir des formes différentielles. Ainsi 𝑇 est le relèvement
à l’espace des métrique au point 𝑔 (notre métrique) d’une 1-forme 𝜃 définie sur la Physis.
Ces distributions particulières que Souriau appelle distributions euleriennes possèdent
une propriété particulière donnée par le théorème suivant.
Theorème 4.10. Soit 𝑇 une fonctionnelle eulerienne. Alors
𝑇 𝐷 = 0.
Démonstration. Commençons par remarquer que l’équation 𝑇 𝐷 = 0 qui signifie 𝑇 (𝐷𝑍) =
0 pour toute 1-forme 𝑍 à support compact est équivalente à l’équation 𝑇 (𝐿𝑋 𝑔) = 0 pour
tout champ de vecteur 𝑋 à support compact. En effet, si ∇ est la connexion riemannienne
de 𝑔, alors
𝐷𝑍(𝐴, 𝐵) = (∇𝐴 𝑍)(𝐵) + (∇𝐵 𝑍)(𝐴) = 𝐿𝑋 𝑔(𝐴, 𝐵),
si 𝑍 et 𝑋 sont reliés par la formule 𝑍(𝐴) = 𝑔(𝑋, 𝐴).
Mais l’équation
𝑇 (𝐿𝑋 𝑔) = 0,
est une conséquence directe de l’invariance par les difféomorphismes à support compact
(principe de relativité général).
5. Ces structures on été introduites indépendamment par Chen (1975) et Souriau (1980) et développée
par Iglesias (voire http ://www.umpa.ens-lyon.fr/ iglesias/)
60
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Remarque 4.11. L’équation 𝑇 𝐷 = 0, qui définie les distributions euleriennes n’apparaît
plus que comme une caractérisation des 1-formes qui relèvent celles de la Physis (voire
l’exercice 4.13 pour un résultat analogue en dimension finie).
Remarque 4.12. Comme nous l’avons vu dans le chapitre précédent, si 𝑇 possède une
densité 𝑇 𝜇𝜈 , alors l’équation 𝑇 𝐷 = 0 conduit directement à l’équation
div 𝑇 = 0,
ce qui permet de considérer cette dernière comme un corollaire du principe de relativité
général.
Exercice 4.13. Soit 𝑀 une variété de dimension finie et 𝐺 un groupe de Lie agissant
librement et proprement sur 𝑀 . Montrer que l’espace cotangent à l’orbite 𝑥¯ ∈ 𝑀/𝐺 d’un
point 𝑥 ∈ 𝑀 est canoniquement isomorphe à
{𝜃 ∈ 𝑇𝑥* 𝑀 ;
𝜃(𝑍𝐴 (𝑥)) = 0,
∀𝐴 ∈ g} ,
𝑍𝐴 étant le champ de vecteurs sur 𝑀 défini par l’élément 𝐴 de l’algèbre de Lie de 𝐺.
Exercice 4.14. Cet exercice a pour but de justifier un point évoqué à plusieurs reprises
dans ce texte, à savoir que l’invariance d’un objet mathématique par changement de
coordonnées se traduit par l’invariance par les difféomorphismes à support compact. Soit
𝑀 une variété de classe 𝐶 ∞ et 𝜙, 𝜓 deux cartes locales au voisinage d’un point 𝑥0 de
𝑀 . Montrer qu’il existe un voisinage 𝑊 de 𝑥0 et un difféomorphisme 𝑓 de 𝑀 à support
compact tel que 𝑓 = 𝜙 ∘ 𝜓 −1 sur 𝑊 .
4.4
4.4.1
L’équation d’Einstein
La fonctionnelle de Hilbert-Einstein
Sur la Physis 6 , il existe une fonction antisymétrique à deux points qui se relève sur
l’espace des métriques par la formule :
ˆ
ℋ(𝑔1 , 𝑔2 ) =
[(𝑎 𝑅 + 𝑏) Ω]𝑔𝑔21
(4.7)
𝑀
si les deux métriques 𝑔1 et 𝑔2 ne diffèrent que sur un compact et qui est nulle sinon. Cette
fonction a la propriété remarquable d’être « seule de son espèce » ; elle est invariante par
le groupe des difféomorphismes à support compact.
On peut calculer les dérivées directionnelles de cette fonction par rapport à chacune
des variables de la façon suivante. Détaillons le calcul pour la dérivée par rapport à la
première variable et pour commencer, posons
𝐿(𝑔) = (𝑎 𝑅(𝑔) + 𝑏) Ω𝑔 .
Soit 𝑔1 et 𝑔2 deux métriques qui coïncident en dehors d’un compact 𝐾. Soit 𝑔1 (𝑠) une
famille à 1 paramètre de métriques de 𝑀 telle que :
6. C’est à dire le quotient de l’espace de toutes les métriques sur 𝑀 par le groupe des difféomorphismes
à support compact.
61
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
1. 𝑔1 (𝑠) = 𝑔1 en dehors de 𝐾 pour tout 𝑠,
2. 𝑔1 (0) = 𝑔1 ,
3. 𝑔˙ 1 (0) = 𝐺1 .
On pourra constater que le champ de tenseur 𝐺1 est nulle en dehors de 𝐾 ainsi que toutes
ses dérivées. On peut donc écrire
⃒
⃒
ˆ
𝑑 ⃒⃒
𝑑 ⃒⃒
⃒
ℋ(𝑔1 (𝑠), 𝑔2 ) = −
⃒
(𝐿(𝑔1 (𝑠)))
𝐷1 ℋ(𝑔1 , 𝑔2 ).𝐺1 =
⃒
𝑑𝑠 ⃒𝑠=0
𝑀 𝑑𝑠 𝑠=0
car
⃒
⃒
𝑑 ⃒⃒
𝑑 ⃒⃒
⃒
(𝐿(𝑔1 (𝑠))) =
⃒
(𝐿(𝑔1 (𝑠)) − 𝐿(𝑔1 ))
𝑑𝑠 ⃒𝑠=0
𝑑𝑠 ⃒𝑠=0
est nulle en dehors de 𝐾.
Comme la fonction ℋ est antisymétrique, on trouve en un point (𝑔, 𝑔) de la diagonale :
𝐷1 ℋ(𝑔, 𝑔).𝐺1 = −𝐷2 ℋ(𝑔, 𝑔).𝐺2
où 𝐺1 et 𝐺2 sont deux champs de tenseurs covariants symétriques à support compact. On
posera alors
⃒
ˆ
𝑑 ⃒⃒
⃒
(𝐿(𝑔(𝑠))) ,
𝑆(𝑔).𝐺 = 𝐷1 ℋ(𝑔, 𝑔).𝐺 =
⃒
𝑀 𝑑𝑠 𝑠=0
où 𝑔(𝑠) est une famille à 1 paramètre de métriques de 𝑀 telle que :
1. 𝑔(𝑠) = 𝑔 en dehors d’un compact 𝐾 pour tout 𝑠,
2. 𝑔(0) = 𝑔,
3. 𝑔(0)
˙
= 𝐺.
Lemme 4.15. 𝑆(𝑔) est un fonctionnelle eulerienne.
Démonstration. En fait c’est évident puisque 𝑆(𝑔) est le relèvement en 𝑔 d’une 1-forme
sur la Physis mais comme nous n’avons pas défini les structures difféologiques nous en
donnons une preuve directe.
Soient 𝑋 et 𝑌 deux champs de vecteurs à support compact et 𝜙(𝑠) et 𝜓(𝑠) leur flot
respectif. On a :
ℋ(𝜙* 𝑔1 , 𝜓 * 𝑔2 ) = ℋ(𝑔1 , 𝑔2 ),
et donc en dérivant cette relation par rapport à 𝑠 on obtient :
𝐷1 ℋ(𝑔1 , 𝑔2 ).𝐿𝑋 𝑔1 + 𝐷2 ℋ(𝑔1 , 𝑔2 ).𝐿𝑌 𝑔2 = 0.
En prenant alors 𝑔1 = 𝑔2 = 𝑔 et en utilisant la définition de 𝑇 = 𝑆(𝑔), on obtient
𝑇 (𝐿𝑋 𝑔) = 𝑇 (𝐿𝑌 𝑔),
pour tous champs de vecteurs 𝑋, 𝑌 à support compact, ce qui nous donne
𝑇 (𝐿𝑋 𝑔) = 0,
pour tout champ 𝑋 à support compact.
62
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
L’équation d’Einstein s’écrit
𝑇 = 𝑆(𝑔)
(4.8)
Quand la métrique est de classe 𝐶 2 au moins, elle fournit, comme on le verra dans la
section suivante, le systèmes des dix équations d’Einstein avec constante cosmologique :
𝑅𝜇𝜈 −
1
(𝑅 − 2Λ)𝑔 𝜇𝜈 = −𝜒 𝑇 𝜇𝜈
2
où 𝜒 = 8𝜋𝐺/𝑐4 est la constante d’Einstein et Λ est la constante cosmologique 7 . Ces deux
constantes sont reliées à 𝑎 et 𝑏 par les formules suivantes :
1
𝜒=− ,
𝑎
Λ=−
𝑏
.
2𝑎
Remarque 4.16. L’équation d’Einstein qui suppose implicitement que la métrique est au
moins de classe 𝐶 2 , conduit à définir 𝑇 comme une distribution à densité
ˆ
𝑇 (𝐺) = 𝑇 𝜇𝜈 𝐺𝜇𝜈 Ω.
Avec le point de vue des espaces difféologiques, ces hypothèses ne sont plus vraiment
nécessaires, 𝑇 est toujours définie comme distribution eulerienne mais elle ne possède
plus forcément une densité 𝑇 𝜇𝜈 .
Dans le « vide », c’est-à-dire quand 𝑇 𝜇𝜈 = 0, l’équation d’Einstein (4.2) se réduit à
𝑅𝜇𝜈 = Λ 𝑔 𝜇𝜈 .
On a pris l’habitude, d’appeler les solutions de cette équation, les « solutions extérieures »
(c’est l’équation vérifiée par la métrique 𝑔 à « l’extérieur » de la matière).
Cette équation provient d’un problème variationnel sur l’espace des métriques – ces
solutions sont les extrémales de l’intégrale d’action suivante
ˆ
𝒜(𝑔) = (𝑅(𝑔) − 2Λ) Ω𝑔 ,
où 𝑅(𝑔) et Ω𝑔 sont respectivement la courbure scalaire et la forme volume associée à la
métrique 𝑔.
Remarque 4.17. Si la définition d’un point critique « pour tout domaine 𝐷 » ne pose pas
de problème, il n’en est pas de même de la définition de 𝑇 comme la dérivée variationnelle
d’une intégrale qui dépend du domaine d’intégration 𝐷. L’introduction par Souriau d’une
fonction à deux points définie globalement et non plus seulement à partir d’un domaine
d’intégration 𝐷 permet de résoudre le problème.
Pour finir cette section et avant de passer au calcul explicite de la dérivée variationnelle
𝑆(𝑔), on récapitulera les relations qui relient les trois objets mathématiques fondamentaux
7. Historiquement, Einstein a d’abord écrit son équation sans cette constante. Il l’a introduit plus
tard quand il est apparu que l’équation de champ dans le vide conduisait à un modèle d’univers non
stationnaire, ce qui paraissait aberrant. Quand Hubble a découvert l’expansion de l’Univers, on est donc
revenu au modèle initial sans constante et ce n’est que récemment que son intérêt est réapparu.
63
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
de la relativité générale, la métrique 𝑔, la connexion 𝐷 et l’inertie 𝑇 , par un diagramme
qu’on pourrait appeler le « triangle de la relativité générale » :
Lévi-Civita
𝑔
𝑇 =𝑆(𝑔) (Einstein)
𝑇

/
𝐷
𝑇 𝐷=0 (Souriau)
Exercice 4.18 (Théorème de Gauss-Bonnet). Soit 𝑀 une surface compacte sans bord et
𝑔 une métrique sur 𝑀 . Montrer que l’intégrale
ˆ
𝑅(𝑔) Ω𝑔
𝑀
est indépendante de la métrique et qu’elle vaut 𝜋 𝜒(𝑀 ) où 𝜒(𝑀 ) est la caractéristique
d’Euler de cette surface.
4.4.2
Calcul de la dérivée variationnelle
Pour calculer la dérivée variationnelle partielle 𝑆(𝑔), il nous reste à calculer
⃒
ˆ
𝑑 ⃒⃒
⃒
(𝐿(𝑔(𝑠)))
⃒
𝑀 𝑑𝑠 𝑠=0
où 𝑔(𝑠) est une famille à 1 paramètre de métriques de 𝑀 telle que :
1. 𝑔(𝑠) = 𝑔 en dehors d’un domaine relativement compact 𝐷 pour tout 𝑠,
2. 𝑔(0) = 𝑔,
3. 𝑔(0)
˙
= 𝐺.
Remarquer que 𝐺 est un 2-tenseur covariant symétrique, nul ainsi que ses dérivées, en
dehors de 𝐷. Il vient
⃒
ˆ
𝑑 ⃒⃒
𝑆(𝑔).𝐺 = −
⃒
{(𝑎 𝑅(𝑠) + 𝑏) Ω(𝑠)}
⃒
𝐷 𝑑𝑠 𝑠=0
ce qui s’écrit encore
ˆ {︁
}︁
˙
𝑆(𝑔).𝐺 = −
𝑎 𝑅(0)Ω
+ (𝑎 𝑅(0) + 𝑏) Ω̇(0) .
𝐷
Exercice 4.19. Soit Ω(𝑠) la forme volume riemannienne correspondant à la métrique
𝑔(𝑠) et Ω̇ la dérivée de Ω en 0. Montrer que :
Ω̇ =
1 𝜇𝜈
𝑔 𝐺𝜇𝜈 Ω.
2
˙ L’espace des connexions linéaires est naturellement
Passons maintenant au calcul de 𝑅.
munie d’une structure d’espace affine associé à l’espace vectoriel des champs de tenseurs de
type (2, 1) (2 fois covariant et 1 fois covariant). En effet, si ∇1 et ∇2 sont deux connexions
linéaires alors
Γ(𝑋, 𝑌 ) = ∇1𝑋 𝑌 − ∇2𝑋 𝑌
64
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
est un champ de tenseurs sur 𝑀 . La connexion de Lévi-Civita est définie par une application
𝛾 : 𝑔 ↦→ ∇
qui à toute métrique 𝑔 associe une connexion linéaire symétrique unique vérifiant
∇ 𝑔 = 0.
Cette application est définie localement par les symboles de Christoffel
1 𝜌𝛼
𝑔 {𝜕𝜇 𝑔𝜈𝛼 − 𝜕𝛼 𝑔𝜇𝜈 + 𝜕𝜈 𝑔𝛼𝜇 } .
2
𝜌
𝛾𝜇𝜈
(𝑔) =
(4.9)
𝜌
Nous noterons 𝛾(𝑠) = 𝛾(𝑔(𝑠)) la famille à 1 paramètre de connexions associée à 𝑔(𝑠), 𝛾𝜇𝜈
𝜌
𝜌
𝜌
les composante de 𝛾(0) et Γ𝜇𝜈 les composantes de 𝛾(0).
˙
Contrairement aux 𝛾𝜇𝜈 , les Γ𝜇𝜈
sont les composantes d’un champ de tenseurs.
Exercice 4.20. Montrer que
Γ𝜌𝜇𝜈 =
1 𝜌𝛼
𝑔 {𝐺𝜈𝛼;𝜇 − 𝐺𝜇𝜈;𝛼 + 𝐺𝛼𝜇;𝜈 } .
2
Soit R(𝑠) le tenseur de courbure de la connexion 𝛾(𝑠), on a
𝜆
𝜆
𝜆
𝛼 𝜆
𝛼 𝜆
𝑅𝜇𝜈𝜌
(𝑠) = 𝜕𝜇 𝛾𝜈𝜌
− 𝜕𝜈 𝛾𝜇𝜌
+ 𝛾𝜈𝜌
𝛾𝜇𝛼 − 𝛾𝜇𝜌
𝛾𝜈𝛼 .
𝜆
𝜆
les composantes de Ṙ(0).
les composantes de R(0) et 𝑅˙ 𝜇𝜈𝜌
On note 𝑅𝜇𝜈𝜌
Exercice 4.21. Montrer que
𝜆
𝑅˙ 𝜇𝜈𝜌
= Γ𝜆𝜈𝜌;𝜇 − Γ𝜆𝜇𝜌;𝜈 .
De cet exercice, on tire :
𝑅˙ 𝜇𝜌 = Γ𝜆𝜆𝜌;𝜇 − Γ𝜆𝜇𝜌;𝜆 .
Mais
𝑅˙ = 𝑔˙ 𝜇𝜌 𝑅𝜇𝜌 + 𝑔 𝜇𝜌 𝑅˙ 𝜇𝜌 .
Or
𝑔˙ 𝜇𝜌 = −𝑔 𝜇𝜖 𝑔 𝜌𝛿 𝐺𝜖𝛿
car 𝑔 𝛼𝜌 (𝑠)𝑔𝛼𝛽 (𝑠) = 𝛿𝛽𝜌 . Par suite :
(︁
)︁
𝑅˙ = −𝑔 𝜇𝜖 𝑔 𝜌𝛿 𝐺𝜖𝛿 𝑅𝜇𝜌 + 𝑔 𝜇𝜌 Γ𝜆𝜆𝜌;𝜇 − Γ𝜆𝜇𝜌;𝜆 .
Posons
𝑋 𝜇 = 𝑔 𝜇𝜌 Γ𝜆𝜆𝜌
𝑌 𝜆 = 𝑔 𝜇𝜌 Γ𝜆𝜇𝜌 .
Il vient :
𝑅˙ = −𝑅𝜇𝜌 𝐺𝜇𝜌 + (div 𝑋 − div 𝑌 )
où
𝑅𝜇𝜈 = 𝑔 𝛼𝜇 𝑔 𝛽𝜈 𝑅𝛼𝛽 .
Mais les vecteurs 𝑋 et 𝑌 sont nuls sur le bord de 𝐷 et disparaissent lors de l’intégration
sur 𝐷. Par suite
ˆ (︂
)︂
1
𝜇𝜈
𝜇𝜈
𝑆(𝑔).𝐺 =
𝑎 𝑅 − (𝑎 𝑅 + 𝑏) 𝑔
𝐺𝜇𝜈 Ω .
2
𝐷
65
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Remarque 4.22. L’expression précédente est unique dans le sens suivant : les champs de 2tenseurs, de divergence nulle, qui sont des fonctions de la métrique 𝑔, ne faisant intervenir
que ses dérivées jusqu’au deuxième ordre et dépendant linéairement de ses dernières, sont
tous de la forme :
1
𝑅𝑖𝑐 − (𝑅 + 𝑐)𝑔
2
où 𝑐 est une constante [2].
4.5
La limite newtonienne
Dans cette section, nous allons calculer la « limite newtonienne » de la gravitation
d’Einstein et détailler le calcul du passage de l’équation d’Einstein à l’équation de Poisson.
La première chose à faire est de mettre en relation les objets de la théorie d’Einstein
avec ceux de la théorie newtonienne. On va donc supposer que l’Univers 𝑀 n’est autre
que l’espace-temps newtonien
R4 = R3 ⊕ R
avec son temps absolu. On va également faire l’hypothèse que la métrique de cet univers
respecte cette structure géométrique, stratifié par l’espace à des dates données et on
prendra a priori pour expression de la métrique la forme [31], dite stationnaire
𝑔 = 𝑓 2 𝑑𝑡2 − 𝜎 2
où 𝑓 est une fonction indépendante de 𝑡 et 𝜎 2 = (𝜎𝑖𝑗 ) est une métrique définie positive
sur l’espace R3 . Avec ce choix, on a
𝑔44 = 𝑓 2 ,
𝑔4𝑖 = 𝑔𝑖4 = 0,
𝑔𝑖𝑗 = −𝜎𝑖𝑗 .
On en déduit alors l’expression des symboles de Christoffel Γ𝜌𝜇𝜈 de la métrique 𝑔 :
Γ444 = 0,
Γ𝑖44 = 𝑓 𝑓 𝑖 ,
Γ44𝑖 = Γ4𝑖4 =
𝑓𝑖
,
𝑓
Γ4𝑖𝑗 = Γ𝑘4𝑗 = 0,
Γ𝑘𝑖𝑗 = 𝛾𝑖𝑗𝑘 ,
où 𝛾𝑖𝑗𝑘 sont les symboles de Christoffel de la métrique tridimensionnelle 𝜎𝑖𝑗 et où l’on a
posé
𝜕𝑓
, 𝑓 𝑖 = 𝜎 𝑖𝑘 𝑓𝑘 .
𝑓𝑖 =
𝜕𝑥𝑖
Le calcul des coefficients du tenseur de courbure ne pose pas de problème non plus.
On trouve que tous les termes sont nuls sauf
𝑙
𝑙
𝑅𝑖𝑗𝑘
= 𝑟𝑖𝑗𝑘
,
𝑙
𝑙
𝑅𝑖44
= −𝑅4𝑖4
= 𝑓 𝑓;𝑖𝑙 ,
4
𝑅4𝑗𝑘
=
−1
𝑓𝑗;𝑘 ,
𝑓
𝑙
où 𝑟𝑖𝑗𝑘
désigne le tenseur de courbure de la métrique 𝜎, 𝑓;𝑗𝑙 sont les composantes de la
dérivé covariante du gradient de 𝑓 par rapport à la métrique 𝜎 et 𝑓𝑗;𝑘 les composantes de
66
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
la dérivée covariante de la différentielle de 𝑓 par rapport à la métrique 𝜎. On en déduit
alors que toutes les composantes du tenseur de Ricci de 𝑔 sont nulles sauf
𝑅𝑖𝑗 = 𝑟𝑖𝑗 +
1
𝑓𝑖;𝑗 ,
𝑓
𝑅44 = −𝑓 △𝜎 𝑓.
où 𝑟𝑖𝑗 est le tenseur de Ricci de la métrique 𝜎 et △𝜎 𝑓 est le laplacien de 𝑓 par rapport à
la métrique 𝜎. Quand à la courbure scalaire, elle s’écrit simplement 𝑅, elle est égale à la
courbure scalaire 𝑟 de la métrique 𝜎.
Nous allons maintenant faire l’hypothèses que les effets gravitationnels sont « relativement faibles », ce qui signifie que la métrique considérée est une petite perturbation de
la métrique « plate » de Lorentz. Nous traduirons ceci mathématiquement en disant que
l’on peut trouver des coordonnées 𝑥, 𝑦, 𝑧, 𝑡 dans lesquelles on a
𝑈
+ 𝑂(𝑐−2 ),
𝑐
𝜎𝑖𝑗 = 𝛿𝑖𝑗 + 𝑂(𝑐−1 )
𝑓 =𝑐+
où 𝑐 est paramètre amené à tendre vers l’infini et 𝛿𝑖𝑗 désigne le symbole de Kronecker.
Avec ces définitions, on trouve que :
𝑈𝑖
+ 𝑂(𝑐−2 ),
𝑐
1
𝑓 𝑖 = 𝛿 𝑖𝑘 𝜕𝑘 𝑈 + 𝑂(𝑐−2 ),
𝑐
𝑘
𝛾𝑖𝑗 = 𝑂(𝑐−1 ),
1
𝑓;𝑗𝑖 = 𝛿 𝑖𝑘 𝜕𝑗 𝜕𝑘 𝑈 + 𝑂(𝑐−2 ).
𝑐
𝑓𝑖 =
Si l’on fait tendre 𝑐 vers l’infini, on remarque d’abord que la métrique 𝑔 diverge. Par
contre son inverse 𝑔 𝜇𝜈 converge vers un 2-tenseur contravariant symétrique dégénéré
𝑔 44 = 0,
𝑔 4𝑖 = 𝑔 𝑖4 = 0,
𝑔𝑖𝑗 = −𝛿 𝑖𝑗 .
Ensuite on voit que la connexion associé à la métrique 𝑔 converge bien vers une connexion
linéaire ∇𝐺𝑎𝑙 dont les symboles de Christoffel sont tous nuls sauf
Γ𝑖44 = 𝛿 𝑖𝑘 𝜕𝑘 𝑈 = −𝑔 𝑖 .
Pour cette connexion, les seules composantes non nulles du tenseur de courbure et du
tenseur de Ricci sont
𝑙
𝑙
𝑅𝑖44
= −𝑅4𝑖4
= 𝛿 𝑙𝑘 𝜕𝑖 𝜕𝑘 𝑈 = −𝜕𝑖 𝑔 𝑙
et
𝑅44 = −𝛿 𝑖𝑘 𝜕𝑖 𝜕𝑘 𝑈 = −△𝑈.
Afin de déterminer la limite newtonienne de l’équation d’Einstein, il nous faut faire le
choix d’un schéma énergétique, c’est à dire décider quelle est la source d’énergie que nous
considérons dominante. Nous prendrons le schéma matière pure (4.6) défini par :
𝑇 𝜇𝜈 = 𝜌𝑐2 𝑢𝜇 𝑢𝜈 .
67
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Ici, on interprète 𝑢 comme la vitesse unitaire d’une particule fluide dont la ligne d’univers
est donnée avec notre choix de coordonnées par :
𝑥1 = 𝑥(𝑠),
𝑥2 = 𝑦(𝑠),
𝑥3 = 𝑧(𝑠),
𝑥4 = 𝑐𝑡(𝑠),
En introduisant la vitesse « classique » 𝑉 𝑖 = 𝑑𝑥𝑖 /𝑑𝑡, on obtient d’abord
𝑑𝑠 √︁ 2
= 𝑐 − 𝑉 2 + 𝑂(𝑐−1 ) = 𝑐 + 𝑂(𝑐−1 )
𝑑𝑡
d’où l’on déduit que les termes dominants du tenseur d’énergie-impulsion 𝑇 𝜇𝜈 sont
⎛
⎜
⎜
⎝
𝜌⎜
𝑉 1𝑐
𝑉 2𝑐
𝑉 3𝑐
𝑐2
1 1
1 2
1 3
𝑉 𝑉 𝑉 𝑉 𝑉 𝑉 𝑉 1𝑐
𝑉 2𝑉 1 𝑉 2𝑉 2 𝑉 2𝑉 3 𝑉 2𝑐
𝑉 3𝑉 1 𝑉 3𝑉 2 𝑉 3𝑉 3 𝑉 3𝑐
Dans le système de coordonnées 𝑥, 𝑦, 𝑧, 𝑡
tenseur 𝑇 s’écrivent
⎛
𝑉1
𝑉2
⎜ 𝑉 1𝑉 1 𝑉 1𝑉 2
⎜
𝜌⎜ 2 1
⎝ 𝑉 𝑉
𝑉 2𝑉 2
𝑉 3𝑉 1 𝑉 3𝑉 2
⎞
⎟
⎟
⎟
⎠
et non plus 𝑥, 𝑦, 𝑧, 𝑐𝑡 les composantes du
𝑉3
1
1 3
𝑉 𝑉 𝑉1
𝑉 2𝑉 3 𝑉 2
𝑉 3𝑉 3 𝑉 3
⎞
⎟
⎟
⎟
⎠
qui correspondent à celles du tenseur énergie-impulsion de la mécanique classique. Au
départ, nous avons fait l’hypothèse que la métrique était indépendante de 𝑡 : la matière
au repos crée un champ de gravitation statique. Nous choisissons donc 𝑉 𝑖 = 0, et par suite
la seule composante non nulle de 𝑇 est 𝑇 44 = 𝜌. Nous considérerons l’équations d’Einstein
sans constante cosmologique
𝑅𝜇𝜈 −
1 𝜇𝜈
𝑔 𝑅 = −𝜒 𝑇 𝜇𝜈
2
que nous pouvons réécrire
1
𝑅 = −𝜒 𝑇 − 𝛿 𝜇𝜈 𝑇
2
𝜇
4
où 𝑇 = 𝑇𝜇 . Alors, à l’ordre dominant, on a 𝑇4 = 𝑇 = 𝜌𝑐2 et 𝑅44 = −△𝑈/𝑐2 , ce qui nous
donne
−△𝑈
1
= −𝜒 𝜌𝑐2 .
2
𝑐
2
Pour retrouver l’équation de Poisson, il faut donc que :
𝜇𝜈
(︂
𝜒=
𝜇𝜈
)︂
8𝜋𝐺
,
𝑐4
ce qui fixe également la constante d’Einstein.
4.6
Le principe des géodésiques
Comme il ressort de l’étude précédente, la matière-énergie de l’Univers subit la gravitation comme elle en est la source. Il n’est donc théoriquement pas possible de distinguer
l’ « œuf » de la « poule ». Et pourtant, afin de rendre opérationnelle la théorie de la
68
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
gravitation et faire explicitement des calculs, on réalise souvent artificiellement cette dichotomie. Par exemple, dans le problème de Kepler, on considère que le soleil est la source
du champ de gravitation et que la terre est un corps d’épreuve subissant ce champ. Dans
les calculs explicites de la relativité générale, c’est également ce qu’on fait. On décompose
artificiellement 𝑇 (le tenseur-distribution de Souriau) en écrivant :
𝑇 = 𝑇𝑠 + 𝑇𝑒
où 𝑇𝑠 constitue la « source du champ » et 𝑇𝑒 , le « corps d’épreuve ». On fait donc l’hypothèse que la contribution de 𝑇𝑒 au champ de gravitation est négligeable devant celle de
𝑇𝑠 et on écrit :
𝑆(𝑔) = 𝑇 ≃ 𝑇𝑠
L’équation universelle 𝑇 𝐷 = 0 peut alors s’écrire :
𝑇𝑒 𝐷 + 𝑇𝑠 𝐷 = 0
qui nous donne à la fois :
𝑇𝑒 𝐷 = 0 ,
𝑇𝑠 𝐷 = 0 ,
si les supports sont disjoints. On appelle habituellement la partie de l’Univers constituée
par le support de 𝑇𝑠 , la « région intérieure » et son complémentaire, la « région extérieure ».
C’est le point de départ de l’étude de la « chute des corps » en relativité générale.
Supposons à présent que le support de 𝑇𝑒 soit une sous-variété Σ, de dimension 1 et
que pour tout tenseur d’essai 𝐺 dont le support est contenu dans une carte on ait :
ˆ
𝑇𝑒 𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 𝑑𝑠 ,
Σ
où 𝑠 est un paramétrage quelconque de la courbe. Le calcul que nous avons fait au chapitre
3 reste valable. Nous avons établi que l’équation 𝑇𝑒 𝐷 = 0 conduisait à l’existence d’une
fonction 𝜙 définie sur Σ telle que
𝑇 𝜇𝜈 = 𝜙 𝑥˙ 𝜇 𝑥˙ 𝜈 .
En écrivant à nouveau 𝑇𝑒 𝐷 = 0, nous en avons alors déduit que :
−2
𝑑
𝜌 ˙𝜇 ˙𝜈
𝑥 𝑥 = 0,
(𝜙 𝑥˙𝜌 ) + 𝜙 𝐷𝜇𝜈
𝑑𝑠
𝜌 = 1, 2, 3, 4.
𝜌
En posant 𝑃 = 𝜙𝑥˙ et en notant que 𝐷𝜇𝜈
= −2Γ𝜌𝜇𝜈 , on obtient :
𝐷𝑃
= 0,
𝐷𝑠
(4.10)
et en particulier
⟨𝑃, 𝑃 ⟩ = 𝜙2 ⟨𝑥,
˙ 𝑥˙ ⟩ = 𝐶𝑠𝑡𝑒 .
Exercice 4.23. Montrer que si la fonction 𝜙 s’annule en un point, elle est identiquement
nulle.
69
CHAPITRE 4. RELATIVITÉ GÉNÉRALE
Supposons pour commencer que cette constante soit non nulle et même positive. Dans
ce cas, il en résulte que la courbe Σ est de type temps ; elle possède un paramétrage dit
normal tel que
⟨𝑥,
˙ 𝑥˙ ⟩ = 1.
Avec ce nouveau paramétrage on voit que 𝜙 = 𝑚 = 𝐶𝑠𝑡𝑒 et l’équation (4.10), nous donne
𝐷𝑥˙
= 0.
𝐷𝑠
La courbe Σ est donc une géodésique temporelle.
Si ⟨𝑃, 𝑃 ⟩ = 0, on peut donc considérer que la fonction 𝜙 est partout non nulle (sinon,
𝑇𝑒 = 0 et le problème n’a pas d’intérêt). On va donc reparamétrer notre courbe Σ en
posant
𝑑𝜏 = 𝜙(𝜏 ) 𝑑𝑠 .
Avec ce nouveau paramétrage, la densité de 𝑇 s’écrit
𝑇 𝜇𝜈 (𝑠) = 𝑥˙ 𝜇 (𝑠)𝑥˙ 𝜈 (𝑠) ,
La courbe Σ est donc une géodésique isotrope. Nous résumerons l’étude précédente sous
la forme d’un théorème.
Theorème 4.24 (Principe des géodésiques). Le mouvement d’un « point matériel libre »
de masse 𝑚 > 0 est une géodésique de (𝑀, 𝑔) de type temps. Les rayons lumineux de
l’Univers sont des géodésiques isotropes.
Ce principe n’est toutefois, qu’un cas très particulier de l’équation universelle 𝑇 𝐷 = 0.
Nous terminerons ce chapitre par une remarque dont la justification rigoureuse sera laissée
de côté. Au chapitre 3 nous avons montré comment l’équation 𝑇 𝐷 = 0 conduisait aux
principales équations de la mécanique. Dans les exemples traités, nous avons utilisés pour
𝐷, soit la connexion plate canonique de R4 , soit la connexion décrivant la gravitation newtonienne. Il resterait donc à justifier que l’équation 𝑇 𝐷 = 0 « passe à la limite » lorsque
l’on approxime la connexion einsteinienne par la connexion newtonienne. Un deuxième
point reste également à justifier ; c’est le passage à la statique. Il s’avère que, là encore
l’équation 𝑇 𝐷 = 0 où 𝐷 est la connexion canonique de R3 fournit les principales équations de la statiques des milieux continus. Il resterait donc à montrer rigoureusement que
l’équation de la dynamique 𝑇 𝐷 = 0 dans R4 se réduit à la même équation dans R3 quand
le problème est stationnaire.
Exercice 4.25. Reprenons les notations de la section 4 et considérons la métrique stationnaire
𝑔 = 𝑓 2 𝑑𝑡2 − 𝜎 2
où
𝑓 =𝑐+
𝑈
+ 𝑂(𝑐−2 ),
𝑐
Montrer que
ˆ
𝒜=𝑐
où 𝐾 = 1/2𝑣 2 .
𝜎𝑖𝑗 = 𝛿𝑖𝑗 + 𝑂(𝑐−1 ).
𝑑𝑠 = 𝑐2 − (𝐾 − 𝑈 ) + 𝑂(𝑐−1 )
Chapitre 5
Trois solutions particulières de la
relativité générale
On introduit la notion de groupe d’isométries et de champs de vecteurs de
Killing d’une variété riemannienne (ou pseudo-riemannienne). On présente
ensuite trois solutions particulières de l’équation d’Einstein : la relativité restreinte, la métrique de Schwarzschild et le modèle de Friedmann.
5.1
Introduction
Dans le chapitre précédent, nous avons introduit les concepts fondamentaux de la
relativité générale d’Einstein. De cette étude, nous avons fait émerger les deux objets
mathématiques principaux qui caractérisent « notre univers », la métrique 𝑔 et le tenseurdistribution 𝑇 (énergie-impulsion).
Récapitulons les idées essentielles. Le groupe des difféomorphismes à support compact
Diff 𝑐 (𝑀 ) agit sur l’espace de toutes les métriques lorentziennes de 𝑀 . On appelle Physis,
l’espace quotient associé. L’inertie 𝑇 , qui est une forme linéaire sur l’espace des 2-tenseurs
covariants symétriques, est reliée à la métrique 𝑔 par l’équation d’Einstein
𝑇 = 𝑆(𝑔),
où 𝑆 est la dérivée variationnelle d’une fonction définie sur la Physis. Comme tel, le
tenseur-distribution 𝑇 vérifie l’équation fondamentale
𝑇 𝐷 = 0,
(5.1)
qui est la traduction mathématique du principe de relativité générale (invariance par le
groupe des difféomorphismes).
Plus généralement, nous avons appelé distribution eulerienne, un tenseur-distribution
𝑇 vérifiant l’équation
𝑇 (𝐿𝑋 𝑔) = 0,
∀𝑋 ∈ 𝒳𝑐 (𝑀 ),
qui est une autre formulation de l’équation (5.1).
Pour comprendre la signification géométrique de l’équation (5.1), considérons l’action
propre et libre, d’un groupe de Lie 𝐺 sur une variété de dimension finie ℳ. Alors, l’espace
quotient ℳ/𝐺 est une variété et la projection canonique
𝑝 : ℳ → ℳ/𝐺
70
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
71
est une submersion. Un covecteur 𝜃𝑥 ∈ 𝑇𝑥* ℳ est dit basique, s’il existe un covecteur
𝜃𝑝(𝑥) ∈ 𝑇𝑥* (ℳ/𝐺) tel que
𝜃𝑥 (𝑋𝑥 ) = 𝜃𝑝(𝑥) (𝑇𝑥 𝑝 . 𝑋𝑥 )
pour tout 𝑋𝑥 ∈ 𝑇𝑥 ℳ. On peut montrer qu’un covecteur 𝜃𝑥 est basique si et seulement si
il vérifie l’équation
𝜃𝑥 (𝑍𝐴 (𝑥)) = 0,
pour tout 𝐴 ∈ g.
Ces résultats restent valables dans le cas où ℳ et l’espace des métriques lorentziennes
de 𝑀 et 𝐺 et le groupe des difféomorphismes à support compact de 𝑀 , à condition
d’utiliser la notion d’espace difféologique. Dans ce contexte, une distribution eulerienne
n’est rien d’autre qu’un covecteur basique au point 𝑔, puisque l’action infinitésimale du
groupe des difféomorphismes à support compact sur les métriques s’écrit 𝐿𝑋 𝑔.
Une métrique 𝑔 étant donnée, une isométrie de 𝑀 est un difféomorphisme 𝜙 qui
préserve la métrique 𝑔, c’est-à-dire tels que 𝜙* 𝑔 = 𝑔. Le sous-groupe des isométries de 𝑀 ,
noté Isom(𝑀, 𝑔), agit sur les covecteurs tangents à l’espace des métriques au point 𝑔 de
la façon suivante :
(𝜙 · 𝑇 )(𝐺) = 𝑇 (𝜙* 𝐺).
Comme de plus
𝜙* (𝐿𝑋 𝑔) = 𝐿𝜙* 𝑋 (𝜙* 𝑔) ,
pour tout difféomorphisme 𝜙, l’action de Isom(𝑀, 𝑔) sur les covecteurs tangents à l’espace
des métriques au point 𝑔 préserve le sous-espace des distributions euleriennes.
Dans beaucoup de problèmes de physique, on idéalise une situation, en supposant
qu’elle possède beaucoup de « symétries », afin de résoudre explicitement un problème.
Nous présenterons dans ce chapitre, trois solutions particulières de l’équation d’Einstein
correspondant à des groupes d’isométries bien précis : la relativité restreinte ou physique
du laboratoire, la métrique de Schwarzschild ou physique du système solaire, et le modèle
de Friedmann ou modèle cosmologique.
Le plan de ce chapitre est le suivant. Dans une première section, on présente quelques
résultats fondamentaux sur les groupes isométries et les champs de vecteurs de Killing.
La deuxième section est consacrée à la relativité restreinte. Dans la troisième section, on
présente la métrique de Schwarzschild et les premiers tests expérimentaux de la relativité
générale et dans la dernière section on traite du modèle de Friedmann.
5.2
5.2.1
Isométries et champs de Killing
Isométries
Soit (𝑀, 𝑔) une variété riemannienne ou pseudo-riemannienne.
Définition 5.1. Un difféomorphisme 𝜙 de (𝑀, 𝑔) est une isométrie si il préserve la métrique 𝑔, autrement dit si :
𝜙* 𝑔 = 𝑔.
(5.2)
On note Isom(𝑀, 𝑔) le sous-groupe de Diff(𝑀 ) et on l’appelle groupe des isométries
ou groupe des déplacements de la variété riemannienne ou pseudo-riemannienne (𝑀, 𝑔).
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
72
Exemple 5.2. Si 𝑀 = R3 muni de la métrique euclidienne canonique alors son groupe
d’isométrie est le groupe des déplacements euclidiens 𝒟3 .
Kobayashi [17] a montré que Isom(𝑀, 𝑔) est une sous-variété fermée du fibré des repères
orthonormés 𝑂(𝑀 ) de 𝑀 , le plongement de Isom(𝑀, 𝑔) dans 𝑂(𝑀 ) étant donné par
l’application orbite
𝑝̂︀ : 𝜙 ∈ Isom(𝑀, 𝑔) ↦→ 𝜙(𝑝).
Cette construction permet de redémontrer d’une manière élégante et de préciser un résultat établi pour la première fois en 1939 par Myers et Steenrod [21].
Theorème 5.3. Le groupe d’isométrie d’une variété riemannienne ou pseudo-riemannienne
(𝑀, 𝑔) de dimension 𝑛 est un groupe de Lie de dimension au plus 𝑛(𝑛 + 1)/2.
5.2.2
Champs de vecteurs de Killing
Une isométrie locale est un difféomorphisme local, défini sur un ouvert 𝑈 de 𝑀 et qui
vérifie l’équation 5.2 sur 𝑈 .
Définition 5.4. Un champ de vecteur X sur 𝑀 est un champ de vecteurs de Killing si
chaque élément 𝜙𝑡 de son flot est une isométrie locale.
Theorème 5.5. Soit X un champ de vecteur sur 𝑀 . On a l’équivalence suivante :
1. X est un champ de Killing
2. 𝐿X 𝑔 = 0
3. 𝐿X ⟨𝐴, 𝐵 ⟩ = ⟨𝐿X 𝐴, 𝐵 ⟩ + ⟨𝐴, 𝐿X 𝐵 ⟩ (𝐿X est une dérivation)
4. ⟨∇𝐴 𝑋 , 𝐵 ⟩ + ⟨∇𝐵 𝑋 , 𝐴 ⟩ = 0 ( ∇𝑋 est antisymétrique)
De la propriété bien connue 𝐿[𝑋,𝑌 ] = 𝐿𝑋 𝐿𝑌 − 𝐿𝑌 𝐿𝑋 et du théorème précédent, il
résulte que :
Corollaire 5.6. Le sous-espace Kill(𝑀, 𝑔) des champs de Killing de 𝑀 est une sousalgèbre de Lie de Vect(𝑀 )
Désignons par g, l’algèbre de Lie du groupe de Lie 𝐺 = Isom(𝑀, 𝑔). Alors il est clair
que g est une sous-algèbre de Lie de Kill(𝑀, 𝑔) et ces deux algèbres de Lie sont égales si
la variété est complète (voire [17]) mais peuvent être différentes dans le cas général.
Exemple 5.7. Si 𝑀 = R3 ∖ {0} alors Isom(𝑀, 𝑔) = SO(3) alors que tout champ de
vecteurs de Killing de R3 induit un champ de Killing sur 𝑀 = R3 ∖ {0} par restriction.
Dans cet exemple (cas d’une variété riemannienne non complète), l’inclusion est stricte.
Lemme 5.8. Soit 𝑋 un champ de vecteurs. Alors 𝑋 est un champ de Killing si et seulement si pour toute géodésique 𝛼 on a
⟨𝑋 ∘ 𝛼, 𝛼′ ⟩ = 𝐶𝑠𝑡𝑒
(5.3)
Démonstration. Pour établir la nécessité, il suffit de dériver l’équation (5.3), ce qui nous
donne :
𝑑
⟨𝑋 ∘ 𝛼, 𝛼′ ⟩ = ⟨∇𝛼′ 𝑋 , 𝛼′ ⟩ + ⟨𝑋, ∇𝛼′ 𝛼′ ⟩ = 0.
𝑑𝑡
Inversement, si l’équation (5.3) est satisfaite pour toute géodésique alors ⟨∇𝐴 𝑋 , 𝐴 ⟩ = 0
pour tout champ de vecteurs 𝐴. Donc 𝑋 est bien un champ de Killing.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
73
Exemple 5.9. Quand 𝑀 = R𝑛 , et 𝛼(𝑡) = 𝑡𝐵 + (1 − 𝑡)𝐴, la relation précédente s’écrit
−→
−→
X(𝐴) · 𝐴𝐵 = X(𝐵) · 𝐴𝐵,
et caractérise les champs de vecteurs équiprojectifs de R𝑛 , qui sont utilisés dans les cours
de mécanique du solide.
On peut donner une formulation covariante de l’équation 𝐿𝑋 𝑔 = 0, définissant les
champs de vecteurs de Killing. Soit 𝑍 la forme covariante du champ de vecteur 𝑋 (i.e
𝑍 = ⟨𝑋, · ⟩), alors
𝐿𝑋 𝑔 (𝐴, 𝐵) = (∇𝐴 𝑍 )(𝐵) + (∇𝐵 𝑍 )(𝐴).
Par suite :
Lemme 5.10. Un champ de vecteur 𝑋 appartient à Kill(𝑀, 𝑔) si et seulement si la 1forme 𝑍 correspondant à 𝑋 vérifie l’équation :
𝐷𝑍 (𝐴, 𝐵) = (∇𝐴 𝑍 )(𝐵) + (∇𝐵 𝑍 )(𝐴) = 0.
Remarque 5.11. Ce qui est remarquable dans cette dernière formulation, c’est que l’équation 𝐷𝑍 = 0 a un sens dans le cas d’une variété muni d’une connexion linéaire (𝑀, ∇), et
ceci, indépendamment de l’existence d’une métrique, contrairement à la définition contravariante.
5.2.3
Difféomorphismes affines
Il existe également une notion de champ de vecteur de Killing sur une variété munie
d’une connexion linéaire symétrique ∇.
Définition 5.12. Un difféomorphisme 𝜙 de (𝑀, ∇) est dit affine si il préserve la connexion
∇, autrement dit si :
(︁
)︁
(𝜙* ∇)𝑋 𝑌 = (𝜙−1 )* ∇𝜙* (𝑋) 𝜙* (𝑌 ) = ∇𝑋 𝑌 ,
(5.4)
pour tout 𝑋, 𝑌 ∈ Vect(𝑀 ).
On note Aff(𝑀, ∇) le sous-groupe de Diff(𝑀 ) des difféomorphismes affines de (𝑀, ∇).
Supposons que ∇ soit la connexion métrique d’une variété riemannienne ou pseudoriemannienne (𝑀, 𝑔). On peut montrer que si 𝜙 est une isométrie alors 𝜙* ∇ = ∇ et
donc :
Isom(𝑀, 𝑔) ⊂ Aff(𝑀, ∇).
La construction de Kobayashi [17] permet de démontrer également que le groupe des
difféomorphismes affines de 𝑀 , Aff(𝑀, ∇), est un groupe de Lie 1 de dimension au plus
𝑛(𝑛 + 1).
1. plongé cette fois dans le fibré de tous les repères 𝐿(𝑀 ) de 𝑀 .
74
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
5.2.4
Champs de vecteurs affines
C’est la version infinitésimale d’un difféomorphisme affine. Un champ de vecteur X
sur (𝑀, ∇) est un champ affine si chaque élément 𝜙𝑡 de son flot est un difféomorphisme
affine locale.
Theorème 5.13. Soit X un champ de vecteur sur 𝑀 . On a l’équivalence suivante :
1. X est un champ affine,
2. 𝐿𝑋 ∇𝐴 𝐵 = ∇𝐿𝑋 𝐴 𝐵 + ∇𝐴 𝐿𝑋 𝐵 , pour tout 𝐴, 𝐵,
3. 𝑄(𝐴, 𝐵)𝑋 = 𝑅(𝐴, 𝑋)𝐵, pour tout 𝐴, 𝐵.
où 𝑄(𝐴, 𝐵)𝑋 = ∇𝐴 ∇𝐵 𝑋 − ∇∇𝐴 𝐵 𝑋 et 𝑅 et le tenseur de courbure de la connexion.
Démonstration. Commençons par établir que (1) et (2) sont équivalentes ; pour cela notons 𝜙𝑡 le flot de 𝑋. Si (1) est vrai, alors
𝜙𝑡 (∇𝐴 𝐵 ) = ∇𝜙𝑡 𝐴 𝜙𝑡 𝐵 ,
∀𝑡
et donc en dérivant en 𝑡 = 0, on obtient (2). Inversement supposons (2) vrai et posons :
𝑉 (𝑡) = 𝜙−𝑡 (∇𝜙𝑡 𝐴 𝜙𝑡 𝐵 ).
En dérivant cette équation, en remarquant que 𝐿𝑋 et 𝜙𝑡 commutent et en utilisant (2),
on constate que 𝑉˙ (𝑡) = 0 et donc que 𝑉 (𝑡) = 𝑉 (0), ce qui signifie que (1) est vrai. Pour
montrer l’équivalence entre (2) et (3), il suffit de remarquer que (2) est équivalent à :
∇[𝑋,𝐴 ] 𝐵 = [𝑋, ∇𝐴 𝐵 ] − ∇𝐴 [𝑋, 𝐵 ]
= ∇𝑋 ∇𝐴 𝐵 − ∇∇𝐴 𝐵 𝑋 − ∇𝐴 ∇𝑋 𝐵 + ∇𝐴 ∇𝐵 𝑋 .
Corollaire 5.14. Le sous-espace Kill(𝑀, ∇) des champs affines sur 𝑀 est une sousalgèbre de Lie de Vect(𝑀 ).
Démonstration. Il suffit d’utiliser la 2ème propriété du théorème 5.13.
L’algèbre de Lie du groupe Aff(𝑀, ∇) est une sous-algèbre de Lie de l’algèbre de Lie
des champs de Killing affines. Ces deux algèbres sont égales si la variété est complète
mais peuvent être différentes dans le cas général. Si 𝑔 est une métrique sur 𝑀 compatible
avec ∇ (c’est à dire ∇ 𝑔 = 0), alors bien évidement nous avons Kill(𝑀, 𝑔) ⊂ Kill(𝑀, ∇).
Une propriété remarquable des champs affines est le fait qu’ils sont reliés à l’équation de
Jacobi, introduite au chapitre 2.
Corollaire 5.15. Soit 𝑋 un champ de vecteur affine, alors sa restriction 𝑋(𝑡) = 𝑋(𝛼(𝑡)),
le long de toute géodésique 𝛼 vérifie l’équation de Jacobi
𝐷2 𝑋
= 𝑅(𝛼,
˙ 𝑋)𝛼.
˙
𝐷𝑡2
(5.5)
Démonstration. Supposons que 𝑋 soit un champ de vecteurs affine. Alors en posant 𝐴 =
𝐵 = 𝛼˙ dans la troisième équation du théorème 5.13, on en déduit que 𝑋(𝑡) = 𝑋(𝛼(𝑡)) est
un champ de Jacobi le long de 𝛼.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
75
Remarque 5.16. On peut également montrer que la réciproque de ce théorème est vrai.
Si la restriction d’un champ de vecteur 𝑋 le long de toute géodésique est un champ de
Jacobi, alors 𝑋 est un champ affine [18].
Theorème 5.17. Soit 𝑀 une variété connexe et 𝑎 un point de 𝑀 . Alors l’application :
𝑎̂︀ : 𝑋 ↦→ (𝑋(𝑎), (∇𝑋)(𝑎)),
de Kill(𝑀, ∇) dans 𝑇𝑎 𝑀 × End(𝑇𝑎 𝑀 ) est injective. En particulier, Kill(𝑀, ∇) est de
dimension inférieure ou égale à 𝑛(𝑛 + 1).
Démonstration. Soit
𝒵 = {𝑚 ∈ 𝑀 ;
𝑋(𝑚) = 0 et (∇𝑋)(𝑚) = 0} .
Nous allons montré que 𝒵 est à la fois ouvert et fermé ce qui achèvera la démonstration.
La fermeture est évidente. Pour montrer que 𝒵 est ouvert, choisissons un point 𝑚0 dans
𝒵 et un voisinage ouvert 𝑈 de 𝑚0 tel que tout point de 𝑈 puisse être joint à 𝑚0 par
une géodésique. Si 𝑚 est dans 𝑈 , alors nécessairement, 𝑋(𝑚) = 0 puisque 𝑋(𝑚) est
l’extrémité d’une courbe 𝑋(𝛼(𝑡)), solution de l’équation (5.5) avec pour conditions initiales
𝑋(𝑚0 ) = 0 et 𝐷𝑋/𝐷𝑡(𝑚0 ) = 0. Par suite, 𝑋 est nul sur sur l’ouvert 𝑈 , donc ∇𝑋 aussi
et 𝑈 ⊂ 𝒵.
Remarque 5.18. Si 𝑋 ∈ Kill(𝑀, 𝑔), (∇𝑋)(𝑎) est un endomorphisme antisymétrique. En
particulier, Kill(𝑀, 𝑔) est de dimension inférieure ou égale à 𝑛(𝑛 + 1)/2. Si 𝑀 = R𝑛 ,
muni de la métrique euclidienne, on appelle 𝑋(𝑎) et ∇ 𝑋 (𝑎), les éléments de réduction
du champ 𝑋 au point 𝑎.
5.2.5
Torseurs
Soit 𝐺 un groupe de Lie et g, son algèbre de Lie. Les éléments du dual g* de g ont
été appelés les torseurs 2 du groupe 𝐺 par Souriau [25]. Ce concept de torseurs vient
de la mécanique du solide. Il a été formalisé par Bamberger et Bourguignon [23] dans
le cadre d’un espace affine. Si on muni cet espace d’une structure euclidienne (i.e une
forme quadratique non dégénérée), alors l’espace des torseurs (au sens de Bamberger et
Bourguignon) coïncide avec le dual de l’algèbre de Lie du groupe des isométries affines.
Dans R𝑛 muni de la connexion linéaire canonique, les solutions de l’équation
𝐷𝑍 = 0
sont toutes de la forme
𝑍𝑋 = 𝑍0 + 𝑖𝑋 Ω
où 𝑋 ∈ R𝑛 et Ω est une 2-forme constante. On dit habituellement que ces 1-formes sont
équiprojectives car elles vérifient l’identité remarquable suivante
𝑍𝑋 (𝑌 − 𝑋) = 𝑍𝑌 (𝑌 − 𝑋),
2. Il existe également une autre définition de ce mot qui n’a rien à voir avec celle-ci et que nous
n’utiliserons pas dans ce cours. Un espace de torseurs d’un groupe 𝐺 est un ensemble 𝑋 sur lequel le
groupe agit simplement transitivement.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
76
pour tout 𝑋, 𝑌 dans R𝑛 . Cette définition est de nature purement affine. On pourra
d’ailleurs vérifier que l’image d’une 1-forme équiprojective par une transformation affine
est encore équiprojective. Toutefois, si l’on muni R𝑛 d’une forme quadratique non dégénérée (structure euclidienne), l’espace des 1-formes équiprojectives s’identifie avec l’algèbre
de Lie du groupe des déplacements de (R𝑛 , 𝑞) et l’action (à gauche) du groupe des déplacements sur les 1-formes équiprojectives correspond à l’action adjointe sur l’algèbre de
Lie du groupe.
Parallèlement à cette définition, on peut introduire la notion d’équiprojectivité pour
les champs de 2-vecteurs sur l’espace affine R𝑛 . Soit 𝑆 ∈ Ω2 (R𝑛 ) un champ de 2-vecteurs
contravariants antisymétriques. On dit que 𝑆 est équiprojectif si il existe un champ de
vecteurs constant 𝑃 tel que
𝑆𝑋 = 𝑆0 + 𝑋 ∧ 𝑃.
On peut vérifier également que cette propriété est équivalente à la suivante :
(𝑌 − 𝑋) ∧ 𝑆𝑋 = (𝑌 − 𝑋) ∧ 𝑆𝑌
pour tout 𝑋, 𝑌 dans R𝑛 . Le groupe affine préserve également ces champs de 2-vecteurs
équiprojectifs.
Il existe une forme bilinéaire qui relie l’espace des 1-formes équiprojectives et celui des
champs de 2-vecteurs équiprojectifs. Cette dualité est donnée par l’expression
(𝑆, 𝑍) = 𝑍𝑋 (𝑃 ) − Ω(𝑆𝑋 )
qui est indépendante du point 𝑋. Cette forme bilinéaire est également invariante sous
l’action du groupe affine. Dans le cas euclidien, l’espace des 2-champs de vecteurs équiprojectifs est donc isomorphe à l’espace des torseurs du groupe des déplacements et l’action
(à gauche) du groupe des déplacements correspond à l’action coadjointe du groupe sur
ses torseurs.
Remarque 5.19. Étant donné un produit scalaire 𝑞 sur R𝑛 , on peut transformer tout
champ de 2-vecteurs antisymétrique 𝑆 en un champ d’endomorphismes anti-adjoints 𝐹 .
Si le champ 𝑆 est équiprojectif alors, le champ d’endomorphisme 𝐹 l’est également, c’est
à dire :
𝐹𝑋 = 𝐹0 + (𝑃 𝑋 * − 𝑋𝑃 * )
où 𝑋 * = 𝑋 𝑡 𝐺, 𝐺 étant la matrice de Gram de la forme quadratique 𝑞.
En mécanique du solide, le champ des vitesses d’un solide est un champ de vecteurs
équiprojectif et les efforts sur ce solide sont représentés par une forme linéaire sur l’espace
des champs de vitesses, la puissance. On a donc une représentation de ces efforts par un 2champ de vecteur équiprojectif dans R3 , qu’on appelle un torseur. Mais dans R3 euclidien,
un 2-champ de vecteurs est la même chose qu’un champ de vecteurs. Ce champ, c’est celui
des moments des efforts en un point 𝑀 et le vecteur constant 𝑅 c’est la résultante des
efforts.
5.3
La relativité restreinte
Nous avons vu dans un chapitre antérieur, qu’il est possible en tout point 𝑥0 d’une
variété riemannienne ou pseudo-riemannienne 𝑀 , de choisir un système de coordonnées
77
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
dans lequel les symboles de Christoffel en 𝑥0 sont nuls. On conçoit donc que si l’on ne
s’écarte « pas trop » de ce point alors les fonctions Γ𝜌𝜇𝜈 seront proches de 0 et qu’on pourra
faire l’approximation qui consiste à les supposer nuls. C’est à peu près ce qu’on fait dans
un laboratoire de physique des particules ; les mesures d’énergie, d’impulsion, de moments
cinétiques,... ont lieu dans un endroit localisé et dans un espace de temps très bref. C’est
ce cadre qu’on appelle « laboratoire » dans ce contexte 3 . La courbure de la métrique peut
alors être considérée comme nulle. C’est ce modèle d’univers que nous étudions dans cette
deuxième section.
5.3.1
L’espace de Minkowski et le groupe de Poincaré
On appelle espace de Minkowski, l’espace R4 munie de la forme quadratique
− 𝑑𝑥21 − 𝑑𝑥22 − 𝑑𝑥23 + 𝑑𝑥24
(5.6)
Avec le système d’« unités » usuelles dite CGS, on pose en générale 𝑥4 = 𝑐𝑡 où 𝑐 est
la vitesse de la lumière.
R4 muni de cette forme quadratique est bien entendu une solution particulière de
l’équation d’Einstein dans le vide. C’est le cadre géométrique de la relativité restreinte.
La donnée d’un système de coordonnées (𝑥𝜇 ) défini un référentiel (𝜕𝜇 ), autrement dit
une section du fibré des repères. Lorsque ce repère est orthonormé on parle de référentiel
d’inertie. Il en existe sur l’espace de Minkowski mais pas sur une variété riemannienne en
générale si la courbure n’est pas nulle. Dans un tel système de coordonnées, la métrique
a pour expression la forme (5.6).
On appelle groupe de Lorentz, le groupe orthogonal 𝑂(3, 1) de l’espace de Minkowski.
Il est constitué des matrices 𝑀 qui vérifient
𝑀 *𝑀 = 1
où 𝑀 * = 𝐺 𝑀 𝑡 𝐺 est la matrice adjointe de 𝑀 relativement à la forme de Lorentz, 𝑀 𝑡
désigne la transposé de 𝑀 et 𝐺 est la matrice de Gram de la forme de Lorentz. C’est
un groupe de Lie de dimension 6 qui possède 4 composantes connexes (voire [25]). En
utilisant le théorème de décomposition de Cartan, on peut montrer [25] que tout élément
de la composante connexe de l’identité du groupe de Lorentz se met sous la forme
(︃
𝐿 = exp
0 𝐵
𝐵𝑡 0
)︃ (︃
·
𝐴 0
0 1
)︃
où 𝐴 ∈ SO(3) et 𝐵 ∈ R3 (décomposition « boost-rotation »).
On appelle groupe de Poincaré (ou groupe de Lorentz non homogène), le groupe des
isométries de l’espace de Minkowski. Il admet la représentation matricielle suivante
(︃
𝑎=
𝐿 𝐶
0 1
)︃
où 𝐿 ∈ 𝑂(3, 1) et 𝐶 ∈ R4 , opérant sur l’espace de Minkowski de la façon suivante
𝑎(𝑋) = 𝐿 𝑋 + 𝐶.
3. Pour être exact, il faudrait parler de laboratoire en chute libre.
78
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Il est clair que 2 référentiels d’inertie se déduisent l’un de l’autre par une transformation
du groupe de Poincaré, qu’on interprète ainsi comme un changement de référentiel.
La composante connexe de l’identité du groupe de Poincaré est appelé groupe de Poincaré restreint. Ce sous-groupe est engendré par les translations dans les quatre directions
𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , par les rotations euclidiennes
(︃
cos 𝜃 − sin 𝜃
sin 𝜃 cos 𝜃
)︃
dans le plans 𝑥𝑖 𝑥𝑗 au nombre de trois et par les rotations hyperboliques
(︃
cosh 𝜙 sinh 𝜙
sinh 𝜙 cosh 𝜙
)︃
dans le plans 𝑥𝑖 𝑥4 également au nombre de trois. Ce sont ces rotations hyperboliques qu’on
′
appelle habituellement les transformations de Lorentz. En effet, si 𝑥𝜇 sont les coordonnées
déduites de 𝑥𝜇 par une rotation hyperbolique dans le plan 𝑥1 𝑥4 , on a
′
𝑥1 = 𝑥1 cosh 𝜙 + 𝑥4 sinh 𝜙,
′
𝑥4 = 𝑥1 sinh 𝜙 + 𝑥4 cosh 𝜙.
Ces formules s’interprètent comme décrivant un repère en mouvement rectiligne uniforme
par rapport à un autre ( le « train d’Einstein » ), avec une vitesse 𝑣 = tanh 𝜙 (donc
inférieur à la vitesse de la lumière)
𝑣
1
𝑥1 + √
𝑥4 ,
2
1−𝑣
1 − 𝑣2
𝑣
1
′
√
𝑥4 = √
𝑥
+
𝑥4 ,
1
1 − 𝑣2
1 − 𝑣2
′
𝑥1 = √
(5.7)
(5.8)
formules qui conduisent aux notions populaires de « retard des horloges » et de « contraction de Lorentz ».
Remarque 5.20. Ces dernières formules nous amènent à constater que la notion de simultanéité absolue n’existe plus en relativité restreinte. Deux évenements considéré comme
simultanés (qui ont la même date 𝑡) dans une référentiel donné ne le sont plus forcément
dans un autre référentiel, comme le montre les formules précédentes. Par conséquent, la
notion de « solide » issue de la mécanique classique est incompatible avec la relativité
restreinte (puisque la notion de distance entre deux points nécessite la simultanéité).
Lorsque le choix des unités est tel que 𝑐 ̸= 1 et qu’on a posé 𝑥4 = 𝑐𝑡, les formules de
Lorentz doivent être remplacées par les suivantes
′
𝑥 = 𝛾 (𝑥 + 𝑣𝑡) ,
𝑣
𝑡 =𝛾 2 𝑥+𝑡 ,
𝑐
′
(︂
)︂
où 𝛾 = (1 − 𝑣 2 /𝑐2 )−1 . Lorsque l’on fait tendre 𝑐 vers l’infini, ces formules nous ramène à
la transformation de Galilée
′
′
𝑥 = 𝑥 + 𝑣𝑡,
𝑡 = 𝑡.
Souriau a montré que ce calcul est un cas particulier d’un résultat plus général qui montre
que le groupe de Galilée est une approximation à l’ordre 𝑂(𝑐−2 ) du groupe de Poincaré.
79
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Theorème 5.21. Tout élément du groupe de Lorentz restreint se met sous la forme
(︃
𝑎=
𝐴 𝑉
0 1
)︃
(︃
+𝑐
où
(︃
−2
𝐴 𝑉
0 1
𝑘(𝑉 𝑉 𝑡 )𝐴 0
𝑉𝑡𝐴
𝑘𝑣 2
)︃
)︃
√︁
est un élément du groupe de Galilée homogène et 𝑘 = ( 1 + 𝑣 2 /𝑐2 + 1).
Démonstration. En utilisant l’ expression des éléments du groupes de Lorentz donné précédemment, on peut montrer que les éléments du groupe spécial orthogonal SO(𝑞) de la
forme quadratique
𝑞 = −𝑑𝑥2 − 𝑑𝑦 2 − 𝑑𝑧 2 + 𝑐2 𝑑𝑡2
se mettent sous la forme
(︃
𝑎=
𝐴 + 𝛽(𝐵𝐵 𝑡 )𝐴
𝑐𝛼𝐵
−1
𝑡
𝑐 𝛼𝐵 𝐴
1 + 𝛽𝐵 𝑡 𝐵
)︃
où 𝐴 ∈ SO(3), 𝐵 ∈ R3 et
𝑏 = ‖𝐵‖ ,
𝛼=
sinh(𝑏)
,
𝑏
𝛽=
cosh(𝑏) − 1
.
𝑏2
√︁
Par suite, en posant 𝛼𝐵 = 𝑉 /𝑐, 𝑣 = ‖𝑉 ‖ et 𝑘 = 𝛽/𝛼2 = ( 1 + 𝑣 2 /𝑐2 + 1), il vient :
(︃
𝑎=
5.3.2
𝐴 𝑉
0 1
)︃
(︃
+𝑐
−2
𝑘(𝑉 𝑉 𝑡 )𝐴 0
𝑉𝑡𝐴
𝑘𝑣 2
)︃
Les particules élémentaires
Une fonctionnelle eulerienne dont le support est une courbe et qui est de la forme
ˆ
𝑇𝐺 =
𝑇 𝜇𝜈 𝐺𝜇𝜈 𝑑𝑠
Σ
décrit le mouvement d’un point matériel, éventuellement de masse nul. La « trajectoire »
de ce point matériel, assimilée au support de 𝑇 est alors nécessairement une géodésique.
Ces fonctionnelles euleriennes nous ont permis d’établir en relativité générale, le principe dit des géodésiques. C’est à l’aide de cette construction que l’on peut définir assez
rigoureusement le « mouvement du point matériel » dans le cadre de la relativité générale.
Dans cette section, nous allons reprendre cette construction, dans le cas particulier de
l’espace de Minkowski en considérant une classe de distributions euleriennes un peu plus
générale, dites de second gradient :
ˆ
𝑇𝐺 =
(𝑇 𝜇𝜈 𝐺𝜇𝜈 + 𝑆 𝜇𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 ) 𝑑𝑠,
Σ
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
80
où Σ est une courbe.
Comme nous l’avons montré au chapitre 3, l’équation 𝑇 𝐷 = 0 conduit à l’existence,
le long de la courbe Σ, d’un champ de vecteur 𝑃 et d’un champ de tenseurs 2-fois contravariants antisymétriques 𝑆 tel que
ˆ
(𝑥˙ 𝜇 𝑃 𝜈 𝐺𝜇𝜈 + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 ) 𝑑𝑠,
𝑇𝐺 =
Σ
où
𝑆
𝜇𝜈
𝑃 𝜇 = 𝐶𝑠𝑡𝑒,
+ 𝑃 𝜇 𝑥𝜈 − 𝑃 𝜈 𝑥𝜇 = 𝑆0𝜇𝜈 = 𝐶𝑠𝑡𝑒.
(5.9)
(5.10)
Ce système contient 10 équations pour les 14 fonctions inconnues 𝑥𝜇 , 𝑃 𝜇 , 𝑆 𝜇𝜈 . Il est
donc sous-déterminé. Afin de résoudre complètement le problème, nous nous limiterons
aux distributions eulériennes dont les composantes 𝑃 𝜇 , 𝑆 𝜇𝜈 vérifient l’équation d’état
𝑆 𝜇𝜈 𝑃𝜇 = 0.
(5.11)
Introduisons sur R4 , le champ de 2-vecteurs équiprojectif défini par
𝑆𝑋 = 𝑆0 + 𝑋 ∧ 𝑃.
L’équation (5.10) se traduit alors par le fait que
𝑆(𝑠) = 𝑆𝑋(𝑠) ,
∀𝑠.
On peut donc associer à 𝑇 un torseur du groupe de Poincaré que nous noterons 𝐽(𝑇 )
et que nous appellerons le moment de 𝑇 . Le groupe de Poincaré agit d’une part sur les
fonctionnelles eulériennes et d’autre part sur les torseurs du groupe de Poincaré (action
coadjointe).
Theorème 5.22. Pour toute transformation 𝑎 appartenant au groupe de Poincaré, on a :
𝐽(𝑎𝑇 ) = Ad*𝑎−1 𝐽(𝑇 ).
Démonstration. Soit
(︃
𝑎=
𝐿 𝐶
0 1
)︃
une transformation du groupe de Poincaré. Elle transforme la distribution eulérienne 𝑇
en une autre 𝑎𝑇 qui s’écrit
ˆ
(𝑎𝑇 )(𝐺) =
(𝑥˙ 𝜇 𝑃 𝜈 (𝑎𝐺)𝜇𝜈 (𝑥(𝑠)) + 𝑥˙ 𝜇 𝑆 𝜈𝜌 𝜕𝜌 (𝑎𝐺)𝜇𝜈 (𝑥(𝑠))) 𝑑𝑠
Σ
ce qui nous donne, en posant 𝑥˜(𝑠) = 𝑎 ∘ 𝑥(𝑠)
ˆ
(︁
)︁
(𝑎𝑇 )(𝐺) =
𝑥˜˙ 𝜇 𝑃̃︀ 𝜈 𝐺𝜇𝜈 + 𝑥˜˙ 𝜇 𝑆̃︀𝜈𝜌 𝜕𝜌 𝐺𝜇𝜈 𝑑𝑠
𝑎(Σ)
où
𝑃̃︀ 𝜈 = 𝐿𝜈𝛽 𝑃 𝛽 ,
𝑆̃︀𝜈𝜌 = 𝐿𝜈𝛽 𝐿𝜌𝛾 𝑆 𝛽𝛾
Cette distribution est donc associée au 2-champ de vecteur 𝑎−1 𝑆 et le théorème s’ensuit.
81
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
5.3.3
Torseurs du groupe de Poincaré
En désignant par Λ* la matrice adjointe de Λ par rapport à la forme de Lorentz, les
éléments de l’algèbre de Lie 𝑠𝑜(3, 1) du groupe de Lorentz sont caractérisés par l’équation
Λ* = −Λ.
Ils s’écrivent donc
(︃
Λ=
𝑗(𝜔) 𝛽
𝛽𝑡 0
)︃
où 𝛽 ∈ R3 et 𝑗(𝜔) ∈ 𝑠𝑜(3) désigne la matrice de l’endomorphisme de R3 défini par
< 𝑗(𝜔)𝑋, 𝑌 >= det(𝜔, 𝑋, 𝑌 ).
Un élément 𝐴 de l’algèbre de Lie du groupe de Poincaré se met sous la forme
(︃
𝐴=
Λ Γ
0 0
)︃
où Λ ∈ 𝑠𝑜(3, 1) et Γ ∈ R4 . On peut munir cet espace d’un produit scalaire 4 en posant
−1
tr(ΛΛ′ ) − Γ* Γ′ ,
2
ce qui permet de représenter tout torseur 𝜇 du groupe de Poincaré par un élément (𝑀, 𝑃 )
où 𝑀 ∈ 𝑠𝑜(3, 1), 𝑃 ∈ R4 et
< 𝐴, 𝐴′ >=
−1
tr(𝑀 Λ) − 𝑃 * Γ.
2
Avec ces variables, l’action coadjointe du groupe de Poincaré s’écrit
𝜇(𝐴) =
{︃
𝑀 ′ = 𝐿𝑀 𝐿* + 𝐶𝑃 * 𝐿* − 𝐿𝑃 𝐶 *
𝑃 ′ = 𝐿𝑃
(5.12)
où 𝑎 = (𝐿, 𝐶) est un élément du groupe de Poincaré.
En écrivant
(︃
)︃
𝑗(𝜔) 𝛽
Λ=
𝛽𝑡 0
et Γ = (𝛾, 𝜖) ∈ R3 × R on aura donc
𝜇(𝐴) =< 𝑙, 𝜔 > − < 𝑔, 𝛽 > + < 𝑝, 𝛾 > −𝐸𝜖.
Cette décomposition arbitraire d’un torseur quelconque du groupe de Poincaré, fait apparaître 4 grandeurs 𝑙, 𝑔, 𝑝, 𝐸 qu’on désigne habituellement par le moment cinétique, le
passage, l’impulsion et l’énergie.
Remarque 5.23. Dans un laboratoire (supposé être un référentiel d’inertie), un expérimentateur mesure des grandeurs observables 𝑙, 𝑔, 𝑝, 𝐸 qu’il interprète comme décrivant
le « mouvement d’une particule ». Un autre expérimentateur dans un second référentiel
d’inertie obtient une autre série de mesure 𝑙′ , 𝑔 ′ , 𝑝′ , 𝐸 ′ . Si ces deux séries de mesures sont
reliées entre elles par l’action coadjointe du groupe de Poincaré, ils conviendront tous deux
qu’ils ont observé la « même particule ». On est donc naturellement amené à représenter
les « particules élémentaires » par les orbites coadjointes du groupe de Poincaré.
4. Attention, ce produit scalaire n’est pas invariant par l’action adjointe du groupe, ce n’est pas la
forme de Killing. Son utilité consiste à représenter les torseurs du groupe de Poincaré par des éléments
de son algèbre de Lie.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
82
On appellera 𝑃 = (𝑝, 𝐸), le quadri-vecteur impulsion-énergie. A un torseur 𝜇 =
(𝑀, 𝑃 ), correspond un champ équiprojectif d’endomorphismes auto-adjoints sur R4
𝑀𝑋 = 𝑀 + 𝐿(𝑃, 𝑋),
où 𝐿(𝑃, 𝑋) = 𝑃 𝑋 * − 𝑋𝑃 * .
L’opérateur de Hodge, est défini pour une 2-forme 𝛼 ∧ 𝛽 par l’équation
*(𝛼 ∧ 𝛽) = Ω(𝛼♯ , 𝛽 ♯ , ·, ·)
où Ω est la forme volume et 𝛼♯ , 𝛽 ♯ sont les versions contravariantes des covecteurs 𝛼 et
𝛽. En dimension 4 une 2-forme est transformée en une 2-forme et l’opérateur de Hodge
induit une application linéaire sur l’espace des opérateurs anti-adjoints.
En dimension 4, on ne peut pas parler du produit vectoriel de 2 vecteurs mais de celui
de 3 vecteurs. C’est le vecteur 𝑗(𝑋1 )(𝑋2 )(𝑋3 ) défini par :
< 𝑗(𝑋1 )(𝑋2 )(𝑋3 ), 𝑋4 >= Ω(𝑋1 , 𝑋2 , 𝑋3 , 𝑋4 ).
Cette définition est à compléter par celle de l’endomorphisme anti-adjoint 𝑗(𝑋1 )(𝑋2 ) défini
par
𝑗(𝑋1 )(𝑋2 ).𝑋3 = 𝑗(𝑋1 )(𝑋2 )(𝑋3 ).
Exercice 5.24.
1. Montrer que si 𝜔 = 𝛼∧𝛽 alors l’endomorphisme anti-adjoint associé
𝑀 s’écrit 𝑀 = −𝐿(𝛼♯ , 𝛽 ♯ ).
2. Montrer que *𝐿(𝐴, 𝐵) = 𝑗(𝐴)(𝐵)
3. Montrer que < 𝑋, (*𝑀 )𝑌 >= (−1/2) tr(𝑗(𝑋)(𝑌 )𝑀 ).
4. Montrer que si
(︃
𝑗(𝜔) 𝛽
𝛽𝑡 0
(︃
𝑗(−𝛽) 𝜔
𝜔𝑡
0
𝑀=
alors
*𝑀 =
)︃
)︃
Remarquer que le vecteur
𝑊 = (*𝑀𝑋 )𝑃
est indépendant du point 𝑋 et orthogonal à 𝑃 . On l’appelle le vecteur polarisation du
torseur 𝜇 = (𝑀, 𝑃 ).
Exercice 5.25. Sur l’espace de Minkowski, on considère un endomorphisme anti-adjoint
𝑀 et un vecteur 𝑃 . Montrer que les conditions suivantes
𝑃 * 𝑃 > 0,
𝑀 𝑃 = 0,
(*𝑀 )𝑃 = 0,
entraînent 𝑀 = 0. En déduire que si 𝑀𝑋 est le champ d’endomorphisme anti-adjoint
associé à un torseur 𝜇 = (𝑀, 𝑃 ) du groupe de Poincaré avec 𝑃 * 𝑃 > 0, et si 𝑋, 𝑌 sont
deux vecteurs solutions de 𝑀𝑋 𝑃 = 0 alors les champs 𝑀𝑋 et 𝑀𝑌 sont égaux.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
83
Par l’action coadjointe, le vecteur 𝑊 se transforme en 𝑊 ′ = 𝐿𝑊 comme le vecteur
𝑃 . Par conséquent les nombres
𝐶2 = 𝑃 * 𝑃,
𝐶4 = 𝑊 * 𝑊,
appelés nombres de Casimir, sont des invariants scalaires de chaque orbite coadjointe.
La classification suivante des orbites coadjointes du groupe de Poincaré est faite suivant
le genre de ces deux vecteurs. Il s’agit d’un résumé de l’étude complète qui se trouve
dans [25]. On pourra également consulter [6].
La particule sans spin. On appelle particule sans spin ou point matériel relativiste
une particule dont l’impulsion-énergie 𝑃 et la polarisation 𝑊 vérifient
𝑃 * 𝑃 > 0,
Dans ce cas, le nombre
𝑚=
√
𝑊 = 0.
𝑃 * 𝑃 𝑠𝑖𝑔𝑛𝑒(𝐸)
ne dépend pas de l’action du groupe de Poincaré restreint ; on l’appelle la masse de la
particule.
De l’équation d’état 𝑀𝑋(𝑠) 𝑃 = 0 et de l’hypothèse 𝑊 = (*𝑀𝑋(𝑠) )𝑃 = 0, on en déduit,
en utilisant l’exercice 5.25 que 𝑀𝑋(𝑠) = 0, pour tout 𝑠. On est donc ramené à un problème
de distribution de premier gradient qu’on a déjà traité lorsqu’on à établi le principe des
géodésiques dans le chapitre 4. Il s’agit du mouvement du point matériel (relativiste) de
masse non nul.
Si la trajectoire 𝑥(𝑠) est paramétré de telle sorte que < 𝑥,
˙ 𝑥˙ >= 1 et que 𝑥˙ 4 > 0 alors
𝑃 = 𝑚𝑥.
˙ En posant 𝑣 = 𝑝/𝐸 qu’on interprète comme la vitesse de la particule on a donc
𝑚
,
𝐸 = √︁
1 − ‖𝑣‖2
et la vitesse reste toujours inférieure à celle de la lumière.
La particule à spin. On appelle ainsi une particule dont l’impulsion-énergie 𝑃 et la
polarisation 𝑊 vérifient
𝑃 * 𝑃 > 0,
𝑊 ̸= 0 .
On commence par remarquer que dans l’espace de Minkowski, tout vecteur non nul,
orthogonal à un vecteur de type temps est un vecteur de type espace (𝑊 * 𝑊 < 0). On
pose alors
√︃
√
−𝑊 * 𝑊
𝑚 = 𝑃 * 𝑃 𝑠𝑖𝑔𝑛𝑒(𝐸),
𝑠=
.
𝑃 *𝑃
Ces nombres ne dépendent que de l’orbite coadjointe du torseur 𝜇 = (𝑀, 𝑃 ) sous l’action
du groupe de Poincaré restreint. On les appellent respectivement la masse et le spin de
la particule.
L’équation 𝑀𝑋 𝑃 = 0 a pour solution
𝑋=
𝑀𝑃
+ 𝜆𝑃 .
𝑃 *𝑃
84
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Par conséquent, en vertu de l’équation d’état (5.11), le support de 𝑇 – interprété comme
la trajectoire de la particule – est une droite.
Nous allons à présent rechercher la forme normale 5 de l’orbite coadjointe, c’est à dire
un torseur 𝜇 = (𝑀, 𝑃 ) dans cette orbite qui a la forme la plus simple possible. On peut
supposer, quitte à faire agir le groupe de Poincaré que
𝑃 = 𝑚𝑒4 ,
𝑊 = 𝑠𝑚𝑒3
et que la trajectoire Σ passe par 0. Dans cette situation on a
𝑀 𝑃 = 0,
(*𝑀 )𝑃 = 𝑊
et l’exercice 5.25 nous permet d’établir que
𝑀 = 𝑠 𝑗(𝑒4 )(𝑒3 ).
On a donc finalement
⎛
⎜
⎜
⎝
𝑃 =⎜
0
0
0
𝑚
⎞
⎟
⎟
⎟,
⎠
⎛
⎜
⎜
⎝
𝑀 =⎜
0
−𝑠
0
0
𝑠
0
0
0
0
0
0
0
0
0
0
0
⎞
⎟
⎟
⎟
⎠
Le photon. On donne ce nom à une particule dont l’impulsion-énergie 𝑃 et la polarisation 𝑊 vérifient
𝑃 * 𝑃 = 0,
𝑊 *𝑊 = 0 ,
𝑃 et 𝑊 n’étant pas nuls.
Le groupe de Poincaré restreint préserve le signe de la quatrième composante d’un
vecteur isotrope non nul. Les nombres
𝜂 = 𝑠𝑖𝑔𝑛𝑒(𝐸) = 𝑠𝑖𝑔𝑛𝑒(𝑃4 ),
𝜒 = 𝑠𝑖𝑔𝑛𝑒(𝑊4 )𝑠𝑖𝑔𝑛𝑒(𝑃4 )
sont donc des invariants de l’orbite. On appelle 𝜒 l’hélicité du photon. 𝜂 est le signe de
l’énergie ; mais on ne connaît que des photons d’énergie positive. On peut vérifier que, dans
l’espace de Minkowski, deux vecteurs isotropes non nuls et orthogonaux sont colinéaires.
On pose alors
𝑊 = 𝜒𝑠𝑃
où 𝑠 > 0 est appelé le spin du photon. Ce nombre est bien entendu indépendant de l’action
du groupe de Poincaré restreint. Dans le cas du photon « réel », 𝑠 est égale à la constante
de Planck réduite.
Quitte à faire agir le groupe de Poincaré, on peut supposer que 0 appartient à Σ et
donc que 𝑀 𝑃 = 0. Dans ces conditions, l’équation 𝑀𝑋 𝑃 = 0 se réduit à < 𝑃, 𝑋 >= 0
qui définit un hyperplan passant par 0. On l’appelle le plan d’onde du photon.
Posons
(︃
)︃
(︃
)︃
𝑗(𝜔) 𝛽
𝑝
,
𝑃 =
𝛽𝑡 0
𝐸
5. Ceci revient à choisir un référentiel d’inertie adapté au mouvement de la particule.
85
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Comme 𝑀 𝑃 = 0, on a 𝛽 = 𝑝 × 𝜔/𝐸. On en déduit que
(︃
𝑀 = 𝑗(𝑃 )(𝑌 ),
𝑌 =
𝜔/𝐸
0
)︃
Comme 𝑊 = (*𝑀 )𝑃 = 𝜒𝑠𝑃 , on a
𝑊 = −(𝑃 𝑌 * − 𝑌 𝑃 * )𝑃 = − < 𝑌, 𝑃 > 𝑃 =
(︂
𝜔·𝑝
= 𝜒𝑠.
𝐸
)︂
On peut donc choisir 𝑌 isotrope en lui ajoutant un multiple de 𝑃 . En posant alors 𝐼 = 𝜂𝑃
et 𝐽 = 𝜒𝜂𝑠𝑌 , on a
𝐼𝐼 * = 0,
𝐽𝐽 * = 0,
𝐼𝐽 * = −1.
A l’aide d’une transformation de Poincaré, on peut envoyer 𝐼 sur (𝑒3 + 𝑒4 )/2 et 𝐽 sur
(𝑒3 − 𝑒4 )/2 et dans ce nouveau référentiel, on a :
⎛
⎜
𝑀 =⎜
⎜
⎝
0 −𝜒𝑠 0 0
𝜒𝑠
0
0 0
0
0
0 0
0
0
0 0
⎞
⎟
⎟
⎟,
⎠
⎛
⎜
⎜
⎝
𝑃 =⎜
0
0
𝜂/2
𝜂/2
⎞
⎟
⎟
⎟
⎠
qui représente la forme normale.
5.4
La métrique de Schwarzschild
La métrique de Schwarzschild est une solution particulière de l’équation d’Einstein
découverte en 1919 et qui décrit, le plus simplement possible 6 , le champ gravitationnel
créé par un corps à symétrie sphérique, le soleil par exemple. C’est pourquoi, on appelle
parfois ce modèle le problème de Kepler relativiste.
On est donc amené à rechercher une métrique 𝑔 qui va traduire cette symétrie sphérique. Par un choix de cartes appropriées, on peut montrer que la forme la plus générale
de cette métrique est :
𝑔 = −𝐴(𝑟, 𝑡)𝑑𝑟2 + 𝐵(𝑟, 𝑡)(𝑑𝜃2 + sin2 𝜃 𝑑𝜙2 ) + 𝐶(𝑟, 𝑡) 𝑑𝑡2 + 𝐷(𝑟, 𝑡) 𝑑𝑟𝑑𝑡 .
En fait, on peut faire des changements de coordonnées du type
𝑟 = 𝑓1 (𝑟′ , 𝑡′ )
𝑡 = 𝑓2 (𝑟′ , 𝑡′ )
de façon à éliminer le terme en 𝑑𝑟𝑑𝑡 et à obtenir 𝐵(𝑟′ , 𝑡′ ) = −𝑟′2 , ce qui nous donne :
𝑔 = −𝐴(𝑟, 𝑡)𝑑𝑟2 − 𝑟2 (𝑑𝜃2 + sin2 𝜃 𝑑𝜙2 ) + 𝐶(𝑟, 𝑡) 𝑑𝑡2
(5.13)
où 𝑟, 𝜃, 𝜙 sont des coordonnées de type spatial et 𝑡 est une coordonnée de type temps.
6. Un modèle un peu plus complexe prenant en compte la rotation de l’étoile sur-elle même est donnée
par la solution de Kerr.
86
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Définition 5.26. Un univers (𝑀, 𝑔) est dite stationnaire si il existe un vecteur de Killing
𝑋, de type temporel. Si, de plus, ce vecteur est proportionnel au gradient d’une fonction
𝜑, l’univers est dit statique 7 .
On peut montrer que, dans un univers stationnaire, il est toujours possible de trouver,
au voisinage de chaque point, une carte (𝑥𝜇 ) dans laquelle :
𝜕4 𝑔𝜇𝜈 = 0,
𝑔44 > 0
Si l’univers est stationnaire, cette carte peut être de choisie de façon à avoir en plus
𝑔𝑖4 = 0,
𝑖 = 1, 2, 3.
Dans l’expression (5.13), les seules composantes non nulles sont les composantes diagonales. On a
𝑔11
𝑔22
𝑔33
𝑔44
= −𝐴(𝑟, 𝑡)
= −𝑟2
= −𝑟2 sin2 𝜃
= 𝐶(𝑟, 𝑡)
Il en est donc de même de 𝑔 −1 et
𝑔 𝜇𝜈 =
1
𝑔𝜇𝜈
Dans la suite de cette section, on va chercher à déterminer une solution extérieure de
l’équation d’Einstein sans constante cosmologique, c’est à dire vérifiant
𝑆𝜇𝜈 = 𝑅𝜇𝜈 −
1
𝑔𝜇𝜈 𝑅 = 0.
2
Symboles de Christoffel.
Γ𝜌𝜇𝜈 =
1 𝜌𝛼
𝑔 {𝜕𝜇 𝑔𝜈𝛼 − 𝜕𝛼 𝑔𝜇𝜈 + 𝜕𝜈 𝑔𝛼𝜇 } .
2
Les seules composantes non nulles sont
𝐶˙
2𝐶
𝐶′
=
2𝐴
−𝑟
=
𝐴
= − sin 𝜃 cos 𝜃
𝐶′
2𝐶
𝐴˙
= Γ114 =
2𝐴
𝑟 sin2 𝜃
=−
𝐴
3
= Γ23 = cot 𝜃
𝐴˙
2𝐶
𝐴′
=
2𝐴
Γ444 =
Γ414 = Γ441 =
Γ411 =
Γ144
Γ141
Γ111
Γ122
Γ233
Γ133
Γ332
Γ212 = Γ313 =
1
𝑟
où 𝐴˙ désigne la dérivée par rapport à 𝑡 et 𝐴′ désigne la dérivée par rapport à 𝑟.
7. Dans ce cas, la distribution orthogonale à 𝑋 est intégrable.
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
87
Composantes du tenseur de Ricci.
𝑅𝜇𝜈 = 𝜕𝛼 Γ𝛼𝜇𝜈 − 𝜕𝜈 Γ𝛼𝜇𝛼 + Γ𝛽𝛼𝛽 Γ𝛼𝜇𝜈 − Γ𝛽𝛼𝜈 Γ𝛼𝜇𝛽 .
Les seules composantes non nulles sont
𝐶 ′2
𝐴′
𝐴¨
𝐴˙ 2
𝐴˙ 𝐶˙
𝐶 ′′
𝐴′ 𝐶 ′
+
+
+
−
−
+
2𝐶 4𝐶 2 4𝐴𝐶 𝑟𝐴 2𝐶 4𝐴𝐶 4𝐶 2
1
𝑟𝐴′
𝑟𝐶 ′2
+
1
−
=
−
2𝐴2 2𝐴𝐶
𝐴
2
= 𝑅22 sin 𝜃
𝐶 ′′
𝐶 ′2
𝐴′ 𝐶 ′
𝐴¨
𝐴˙ 2
𝐶′
𝐴˙ 𝐶˙
=
+
−
−
+
+
+
2𝐴 4𝐴𝐶
4𝐴2
𝑟𝐴 2𝐴 4𝐴2 4𝐴𝐶
𝐴˙
= 𝑅41 =
𝑟𝐴
𝑅11 = −
𝑅22
𝑅33
𝑅44
𝑅14
Courbure scalaire.
𝑅 = 𝑔 𝜇𝜈 𝑅𝜇𝜈 =
𝐶 ′′
𝐶 ′2
2𝐴′
2𝐶 ′
𝐴¨
𝐴˙ 2
𝐴˙ 𝐶˙
2
2
−
−
+
−
+
+
+ 2 − 2
2
2
2
2
𝐴𝐶 2𝐴𝐶
𝑟𝐴
𝑟𝐴𝐶 𝐴𝐶 2𝐴 𝐶 2𝐴𝐶
𝑟 𝐴 𝑟
Composantes du tenseur de Ricci.
𝑆𝜇𝜈 = 𝑅𝜇𝜈 −
1
𝑔𝜇𝜈 𝑅
2
Les seules composantes non nulles sont
𝐶′
𝐴
1
− 2+ 2
𝑟𝐶(︃ 𝑟
𝑟
)︃
′2
′ ′
′
′
′′
¨
˙2
˙ 𝐶˙
𝐶
𝐴
𝐶
𝐴
𝐶
𝐴
𝐴
𝐴
𝐶
−
−
−
+
−
+
+
= 𝑟2
2𝐴𝐶 4𝐴𝐶 2 4𝐴2 𝐶 4𝑟𝐴 2𝑟𝐴𝐶 2𝐴𝐶 4𝐴2 𝐶 4𝐴𝐶 2
= 𝑆22 sin2 𝜃
𝐴′ 𝐶
𝐶
𝐶
=
− 2 + 2
2
𝑟𝐴
𝑟 𝐴 𝑟
𝐴˙
= 𝑆41 =
𝑟𝐴
𝑆11 =
𝑆22
𝑆33
𝑆44
𝑆14
Calcul de 𝐴 et 𝐶. On peut montrer que l’équation 𝑆22 = 0 est une conséquence des
autres. Par conséquent, il reste
𝐶′
𝐴
1
− 2 + 2 =0
𝑟𝐶 𝑟
𝑟
𝐴′ 𝐶
𝐶
𝐶
− 2 + 2 =0
2
𝑟𝐴
𝑟 𝐴 𝑟
𝐴˙
=0
𝑟𝐴
On a donc 𝐴˙ = 0 donc 𝐴 ne dépend pas de 𝑡 et on pose 𝐴 = 𝑓 (𝑟). En écrivant
1
1
𝑆11 + 𝑆44 = 0,
𝐴
𝐶
88
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
on obtient
𝐴′
𝐶′
=0
+
𝑟𝐴2 𝑟𝐴𝐶
soit
𝐴′ 𝐶 ′
+
=0
𝐴
𝐶
donc 𝐴′ 𝐶 + 𝐴𝐶 ′ = 0. Par conséquent, 𝐴𝐶 ne dépend que de 𝑡. On pose 𝐴𝐶 = ℎ(𝑡), d’où
ℎ(𝑡)
𝑓 (𝑟)
𝐶=
On peut faire un changement de coordonnées 𝑡1 = 𝑔(𝑡) de telle sorte que 𝑔 ′2 (𝑡) = ℎ(𝑡).
Dans ces nouvelles coordonnées, on donc
𝐶=
1
,
𝑓 (𝑟)
𝐶 ne dépend pas de 𝑡, de même que 𝐴. Le champ est statique. Il reste alors à déterminer
𝑓 (𝑟). L’équation 𝑆11 = 0 nous donne
𝑓′
1
1
−
+ = 0.
2
𝑓
𝑟𝑓
𝑟
En posant
𝑣(𝑟) =
il vient
𝑟
,
𝑓 (𝑟)
𝑣′ 1
+ = 0,
𝑟
𝑟
soit 𝑣 ′ = 1 et donc finalement
𝐴(𝑟) = 𝑓 (𝑟) =
𝑟
,
𝑟+𝑎
𝐶(𝑟) = 1 +
𝑎
.
𝑟
Détermination de 𝑎. Pour cela, on va passer à la limite newtonienne. En mécanique
newtonienne, la trajectoire d’une particule test de masse 𝑚 dans un champ newtonien est
une extrémale de l’action
ˆ
𝑠 = 𝐿 𝑑𝑡
où
1
𝑚𝑣 2 − 𝑚𝑈 − 𝑚𝑐2 ,
2
𝑚𝑐2 étant une constante que l’on ajoute pour obtenir des résultats cohérents avec la
relativité restreinte et qui n’intervient pas dans le calcul des extrémales. On suppose
𝑣 << 𝑐 et que 𝑈 << 𝑐2 , c’est à dire que l’on se place loin des corps qui produisent le
champ.
En relativité générale, la trajectoire d’une particule test de masse 𝑚 est une géodésique
de la métrique 𝑔 (principe des géodésiques). C’est donc une extrémale de l’action
ˆ
𝑆 = −𝑚𝑐 𝑑𝑠 .
𝐿=
89
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Notre métrique est statique. Après avoir substitué
𝑡 ↦→ 𝑐𝑡,
𝑎 ↦→
𝑎
,
𝑐2
elle et se met sous la forme
(︂
𝑑𝑠2 = 𝑐2 +
𝑎
𝑎
𝑑𝑡2 − 1 + 2
𝑟
𝑐𝑟
)︂
(︂
)︂−1
(︁
)︁
𝑑𝑟2 − 𝑟2 𝑑𝜃2 + sin2 𝜃 𝑑𝜙2 .
Par conséquent, en prenant 𝑡 comme paramètre et en introduisant la vitesse 𝑣 𝑖 = 𝑑𝑥𝑖 /𝑑𝑡,
il vient :
ˆ √︃
(𝑎/𝑟) − 𝑣 2
𝑆 = −𝑚𝑐2
1+
+ 𝑂(𝑐−3 ),
𝑐2
ce qui nous donne
ˆ
𝑚𝑎 𝑚𝑣 2
+
+ 𝑂(𝑐−1 ).
𝑆 = −𝑚𝑐2 −
𝑟
2
Par identification, on en déduit
𝑎 = −2𝐺𝑀
où 𝐺 est la constante de Newton et 𝑀 la masse de l’étoile. On a donc finalement
𝑑𝑠2𝑒𝑥𝑡
2𝐺𝑀 2 2
2𝐺𝑀
= 1− 2
𝑐 𝑑𝑡 − 1 − 2
𝑐𝑟
𝑐𝑟
(︂
)︂
(︂
)︂−1
(︁
𝑑𝑟2 − 𝑟2 𝑑𝜃2 + sin2 𝜃 𝑑𝜙2
)︁
Remarque 5.27. Il apparaît une discontinuité si 𝑟 = 𝑎 = 2𝐺𝑀/𝑐2 . Cette valeur s’appelle le
rayon de Schwarzschild. Pour le soleil, le rayon de Schwarzschild est de l’ordre de grandeur
du kilomètre donc bien inférieur au rayon du soleil (∼ 105 km). En fait, cette singularité
provient du choix des coordonnées utilisées. Elle n’est pas intrinsèque. Il faudrait prendre
une carte complémentaire pour obtenir la métrique dans tous les cas. Il apparaît par
contre, un singularité de nature géométrique pour 𝑟 = 0 puisque, pour cette valeur la
courbure scalaire 𝑅 = −𝑎2 /2𝑟3 (𝑟 + 𝑎) devient infinie.
Remarque 5.28. On a supposé a priori seulement que la métrique possédait la symétrie
sphérique. Il s’est avéré, après les calculs que la métrique était statique. C’est le célèbre
théorème de Birkhoff. Par conséquent, le champ gravitationnel engendré par un corps à
symétrie sphérique ne peut pas engendré d’ondes gravitationnelles.
5.4.1
L’avance du périhélie de Mercure.
Dans le modèle newtonien, le champ gravitationnel créé par un corps à symétrie sphérique est un champ central. L’étude des mouvements d’un point matériel dans un tel
champ est connu sous le nom de problème de Kepler. De la conservation du moment cinétique, il résulte que le mouvement est plan. Dans le système de coordonnées polaire 𝑟, 𝜃,
les équations du mouvement d’un point matériel de masse 𝑚 = 1 s’obtiennent à partir du
Lagrangien
)︁
1 (︁ 2
𝑟˙ + 𝑟2 𝜙˙ 2 − 𝑈 (𝑟).
𝐿=𝐾 −𝑈 =
2
où 𝑈 (𝑟) = −𝑘/𝑟 est le potentiel. Les équations d’Euler-Lagrange pour 𝜙 nous donne
𝑟2 𝜙˙ = 𝐻 = 𝐶𝑠𝑡𝑒,
90
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
ce qui traduit la loi des aires. L’énergie totale
𝐸=
)︁
1 (︁ 2
𝑟˙ + 𝑟2 𝜙˙ 2 + 𝑈 (𝑟)
2
est conservée. On en déduit
(︃
𝑘
𝑟˙ = 2 𝐸 +
𝑟
)︃
2
𝐻2
− 2
𝑟
Si on étudie les mouvements pour lesquels 𝑟 est borné, c’est à dire
2𝐸𝐻 2 + 𝑘 2 > 0
ˆ
alors on a :
𝜙=
𝐻/𝑟2 𝑑𝑟
√︁
2(𝐸 − 𝑈 (𝑟)) − 𝐻 2 /𝑟2
.
qui s’intègre pour donner
(︃
𝑝/𝑟 − 1
𝜙 = arccos
𝑒
où
)︃
√︃
2𝐸𝐻 2
𝐻2
,
𝑒= 1+
𝑝=
𝑘
𝑘2
qui est l’équation d’une ellipse d’excentricité 𝑒, de paramètre 𝑝 et dont le foyer est à
l’origine. La variation de 𝜙 entre deux périhélies successifs (lieu où 𝑟 est minimal) est
donnée par
ˆ 𝑟𝑚𝑎𝑥
𝐻/𝑟2 𝑑𝑟
√︁
Δ𝜙 = 2
𝑟𝑚𝑖𝑛
2(𝐸 − 𝑈 (𝑟)) − 𝐻 2 /𝑟2
qui vaut bien sûr 2𝜋. Or les résultat expérimentaux donnent pour un siècle
– Δ𝜙 = 2𝜋𝑛 + 42′′ 56 pour Mercure,
– Δ𝜙 = 2𝜋𝑛 + 3′′ 08 pour la Terre.
Il faut remarquer que l’écart est faible mais inexpliqué par le modèle newtonien. On a
alors essayé de mettre sur pied des théories expliquant cette avance du périhélie :
– Théories de type newtonien
– influence de la non sphéricité du soleil,
– action perturbatrice d’autres planètes,
– existence d’une planète encore inobservée (baptisée Vulcain) entre le soleil et
Mercure,
mais toutes ces théories ont donné des résultats négatifs.
– Théories extra-newtoniennes
– Loi centrale en 1/𝑟𝑛 au lieu de 1/𝑟2 , mais alors 𝑛 varie avec chaque planète.
– Loi centrale en 1/𝑟2 + force perturbatrice,
mais toutes ces théories n’ont rien expliqué.
Il est apparu alors les théories d’Einstein, supérieures du point de vue épistémologique
puisque issues de théories générales.
On va donc maintenant résoudre complètement le problème avec le modèle de Schwarzschild. On part du principe des géodésiques. La trajectoire d’un point matériel (corps
91
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
d’épreuve) est une géodésique de la métrique. Les équations du mouvement sont obtenues
à partir des équations d’Euler-Lagrange pour le Lagrangien
(︂
𝐿= 1−
𝑎 2 ˙2
𝑎
𝑐 𝑡 − 1−
𝑟
𝑟
)︂
(︂
)︂−1
(︁
𝑟˙ 2 − 𝑟2 𝜃˙2 + sin2 𝜃 𝜙˙ 2
)︁
où on a posé 𝑎 = 2𝐺𝑀/𝑐2 . Pour 𝜃, 𝜙 et 𝑡 on obtient
𝑑 (︁ 2 ˙)︁
𝑟 𝜃 = 𝑟2 sin 𝜃 cos 𝜃 𝜙˙ 2 ,
𝑑𝑠
𝑑 (︁ 2 2 )︁
𝑟 sin 𝜃 𝜙˙ = 0,
𝑑𝑠 [︂(︂
)︂ ]︂
𝑎 ˙
𝑑
1−
𝑡 = 0.
𝑑𝑠
𝑟
(5.14)
(5.15)
(5.16)
On n’utilisera pas l’équation d’Euler Lagrange pour la variable 𝑟. On préfère utiliser la
conservation de l’élément de longueur
(︂
𝑎 2 ˙2
𝑎
1−
𝑐 𝑡 − 1−
𝑟
𝑟
)︂
(︂
)︂−1
(︁
)︁
𝑟˙ 2 − 𝑟2 𝜃˙2 + sin2 𝜃 𝜙˙ 2 = 1
(5.17)
Pour avoir une solution unique des équations différentielles, il faut se donner des conditions
initiales. En prenant 𝜙 = 𝜋/2 et 𝜙˙ = 0 en un point, on a alors 𝜙 = 𝜋/2 pour tout 𝑠.
Cette condition n’est pas restrictive, il suffit de modifier le système de coordonnées pour
ramener n’importe quel mouvement à cette condition. Avec ce choix de conditions initiales,
les équations (5.15) et (5.16) se simplifient et s’écrivent :
(︂
2
𝑟 𝜙˙ = ℎ = 𝐶𝑠𝑡𝑒,
𝑎 ˙
1−
𝑡 = 𝑙 = 𝐶𝑠𝑡𝑒,
𝑟
)︂
et l’équation (5.17) nous donne
(︂
1−
𝑎 2 ˙2
𝑎
𝑐 𝑡 − 1−
𝑟
𝑟
)︂
(︂
)︂−1
𝑟˙ 2 − 𝑟2 𝜙˙ 2 = 1
Comme dans le problème de Kepler, il est préférable de considérer 𝑟 comme une
fonction de 𝜙 plutôt que du paramètre 𝑠. En notant alors la dérivation par rapport à 𝜙
par un prime, on obtient
𝑟˙
𝑟′ =
𝜙˙
puis
ℎ
𝑟˙ = 𝜙𝑟
˙ ′ = 2 𝑟′
𝑟
et enfin
(︂
)︂
(︂
)︂
ℎ2 ′2 ℎ2
𝑎
𝑎
2 2
𝑐 𝑙 − 4 𝑟 − 2 1−
= 1−
𝑟
𝑟
𝑟
𝑟
−1
En posant alors 𝑢 = 𝑟 on a donc
𝑎
𝑐2 𝑙 2 − 1
𝑢 =
+ 2 𝑢 − 𝑢2 + 𝑎𝑢3
2
ℎ
ℎ
′2
92
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
qui s’intègre pour donner
ˆ
𝑢
𝜙 = 𝜙0 +
𝑑𝑢
√︁
𝑢0
𝑐2 𝑙2 −1
ℎ2
+
𝑎
ℎ2
𝑢 − 𝑢2 + 𝑎𝑢3
Lorsqu’on fait tendre 𝑐 vers l’infini, on retrouve la limite newtonienne. En effet, on a
d’abord
(︃
𝑑𝑡
𝑑𝑠
)︃2
[︃
)︃
(︃
]︃
1
1 𝑘
= 2 1+ 2
+ 𝑣 2 + 𝑂(𝑐−4 )
𝑐
𝑐 𝑟
[︂
]︂
1
1
= 2 1 + 2 (2𝐸 + 3𝑘𝑢) + 𝑂(𝑐−4 )
𝑐
𝑐
et par suite :
𝑐2 𝑙 2 − 1
1
= 2 (2𝐸 + 𝑘𝑢) + 𝑂(𝑐−2 ),
2
ℎ
𝐻
𝑎
𝑘
= 2 + 𝑂(𝑐−2 ).
2
ℎ
𝐻
On peut donc considérer la fonction 𝜙(𝑢) ainsi que sa réciproque 𝑢(𝜙) comme des
perturbations des fonctions correspondantes pour le problème de Kepler.
Les extrema de la fonction 𝑢(𝜙) s’obtiennent en résolvant l’équation
(︃
𝑑𝑢
𝑑𝜙
)︃2
= 𝑎𝑢3 − 𝑢2 +
𝑎
𝑐2 𝑙 2 − 1
𝑢
+
= 0,
ℎ2
ℎ2
(5.18)
que l’on considère comme une perturbation singulière de l’équation
−𝑢2 +
2𝐸
2𝑘
𝑢 + 2 = 0.
2
𝐻
𝐻
L’équation (5.18) possède trois racines que nous noterons 𝑢1 , 𝑢2 , 𝑢3 et telles que
1
𝑢1 + 𝑢2 + 𝑢3 = .
𝑎
La méthode des perturbations singulières nous permet de calculer des développements
asymptotiques de ces trois solutions en fonction du paramètre 𝑎 = 𝑘/𝑐2 . On trouve
𝑢1 = 𝑢01 + 𝑂(𝑎),
𝑢2 = 𝑢02 + 𝑂(𝑎),
𝑢3 =
1
− (𝑢01 + 𝑢02 ) + 𝑂(𝑎),
𝑎
où 𝑢01 et 𝑢02 sont les racines de l’équation (5.4.1). D’où
(︃
𝑑𝑢
𝑑𝜙
)︃2
= (𝑢 − 𝑢1 )(𝑢2 − 𝑢)𝑎(𝑢3 − 𝑢)
= (𝑢 − 𝑢1 )(𝑢2 − 𝑢) [1 − 𝑎(𝑢1 + 𝑢2 ) − 𝑎𝑢]
[︃
𝑎𝑢
= (𝑢 − 𝑢1 )(𝑢2 − 𝑢) [1 − 𝑎(𝑢1 + 𝑢2 )] 1 −
1 − 𝑎(𝑢1 + 𝑢2 )
ce qui nous donne au premier ordre en 𝑎
[︁
𝑑𝜙 =
]︁ [︁
1 + 𝑎2 (𝑢1 + 𝑢2 ) 1 +
√︁
(𝑢 − 𝑢1 )(𝑢2 − 𝑢)
𝑎𝑢
2
]︁
𝑑𝑢
]︃
93
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
Soit
]︂ ˆ 𝑢2
𝑎
𝜙2 − 𝜙1 = 1 + (𝑢1 + 𝑢2 )
2
[︂
1+
√︁
𝑢1
𝑎𝑢
2
(𝑢 − 𝑢1 )(𝑢2 − 𝑢)
𝑑𝑢
𝑎
𝑎
= 1 + (𝑢1 + 𝑢2 ) 1 + (𝑢1 + 𝑢2 ) 𝜋
2
4
]︂
[︂
3𝑎 0
= 1 + (𝑢1 + 𝑢02 ) 𝜋 + 𝑂(𝑎2 )
4
]︂ [︂
[︂
Or
𝑢01 + 𝑢02 =
]︂
2𝑘
4 |𝐸|
2
.
= =
2
𝐻
𝑝
𝑘(1 − 𝑒2 )
Entre deux périhélies successifs on a donc
Δ𝜙 ≈ 2𝜋 +
3𝜋𝑎
3𝜋 |𝐸|
3𝜋𝑎 0
(𝑢1 + 𝑢02 ) = 2𝜋 +
= 2𝜋 + 2
2
2
2𝑐 (1 − 𝑒2 )
Le calcul numérique nous donne, pour un siècle, une avance de 43′′ 03 pour Mercure alors
que la valeur observée est de 42′′ 56 ± 0′′ 94 et de 3′′ 84 pour la Terre alors que la valeur
observée est de 3′′ 08 ± 0′′ 0. Mercure réalise donc les conditions optimums.
5.4.2
La déviation des rayons lumineux.
Avec le l’interprétation de l’avance du périhélie de Mercure, la déviation des rayons
lumineux provenant d’un étoile lointaine et rasant le soleil constitue la seconde vérification
de la Relativité Générale.
Afin de traiter ce problème on suppose que les trajectoire des « photons » sont des
géodésiques isotropes. Comme dans le problème précédent, on montre que l’on ne change
rien à la généralité du problème en supposant
𝜃=
𝜋
,
2
𝜃˙ = 0,
ce qui entraîne que le mouvement est plan. Nous avons comme précédemment
(︂
2
𝑟 𝜙˙ = ℎ = 𝐶𝑠𝑡𝑒,
𝑎 ˙
1−
𝑡 = 𝑙 = 𝐶𝑠𝑡𝑒,
𝑟
)︂
(5.19)
mais au lieu de (5.17), nous obtenons
𝑛2 𝑐2 𝑡˙2 −
où 𝑛 =
√︁
1 2
𝑟˙ − 𝑟2 𝜙˙ 2 = 0
2
𝑛
1 − 𝑎/𝑟 joue ici le rôle d’un indice de réfraction. En effet, si on interprète
𝑣=
⎯
⎸(︃ )︃2
⎸ 𝑑𝑟
⎷
𝑑𝑡
(︃
+
𝑟2
comme la vitesse du photon, alors on a
𝑣 = 𝑛𝑐,
𝑑𝜙
𝑑𝑡
)︃2
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
94
𝑛 étant inférieur à 1 (tant qu’on reste à l’extérieur de la sphère de Schwarzschild) et 𝑣 < 𝑐.
On doit donc assister en principe à un effet de mirage gravitationnel lorsqu’on observe
des objets au ras du soleil. En pratique, on ne peut observer de déviation des rayons lumineux que pendant les éclipses de soleil ; les étoiles fixes qui se trouvent au voisinage sont
alors visibles. Il devrait alors être possible d’observer des étoiles normalement occultées.
En comparant des plaques photographiques de constellations prises lors de diverses
éclipses solaires avec des plaques des ces mêmes constellations prises sans interposition
du champ gravitationnel du soleil, on a pu vérifier ce nouvel effet prévu par la Relativité
Générale. il semble qu’il y ait bien une déformation de la figure des constellations due
à la déviation des rayons lumineux par un champ de gravitation et l’effet mesuré a bien
l’ordre de grandeur prévu (1′′ 75) par la théorie d’Einstein.
Les premières observations ont été effectuées par Eddington le 29 Mai 1919, lors de
l’expédition Principe. Il observa la constellation des Hyades qui se trouvaient alors dans
le voisinage apparent du Soleil. Il trouva pour la déviation une valeur de 1′′ 61 ± 0′′ 30.
Cette excellente vérification avait provoquée, à l’époque, l’enthousiasme dans les milieux
scientifiques. Par la suite, d’autres mesures, effectuées pendant des éclipses sont venues
confirmer ces résultats. Des expériences plus récentes, consistant à étudier, cette fois le
retard de l’écho radar d’un signal émis en direction d’une sonde spatiale artificielle, ont
permis d’affiner ces mesures.
On va maintenant déterminer l’équation des rayons lumineux. Comme précédemment,
on introduit
1
𝑢=
𝑟
et on note avec un prime la dérivation par rapport à la variable 𝜙. En différenciant
l’équation (5.19) et en simplifiant par 𝑢′ , on a
𝑢′′ + 𝑢 =
3𝑎 2
𝑢.
2
(5.20)
Le terme 𝜀 = 3𝑎/2 est petit dans les applications pratiques. On va donc traiter ce problème comme une perturbation de l’équation des rayons lumineux en l’absence de champ
gravitationnel (𝑎 = 0) :
𝑢′′ + 𝑢 = 0.
On choisit comme solution particulière
𝑢0 =
1
cos 𝜙
𝑅
où 𝑅 est une constante. Il s’agit de l’équation polaire de la droite 𝑥 = 𝐶𝑠𝑡𝑒 dans le plan
𝑥, 𝑦. On recherche alors la solution de (5.20) sous la forme
𝑢 = 𝑢0 + 𝜀𝑢1 + 𝜀2 𝑢2 + . . .
En regroupant les termes d’ordre 1 en 𝜀, on obtient :
𝑢′′1 + 𝑢1 = 𝑢20 .
qui est une équation linéaire du second ordre avec second membre :
𝑢20 =
1
(cos 2𝜙 + 1)
2𝑅2
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
95
Une solution particulière de cette équation est :
𝑢1 =
1
(cos2 𝜙 + 2 sin2 𝜙).
3𝑅2
On en déduit que l’unique approximation au premier ordre en 𝜀 de (5.20) vérifiant :
𝑢(0) =
1
,
𝑅
𝑢′ (0) = 0,
s’écrit
𝐺𝑀
1
cos 𝜙 + 2 2 (cos2 𝜙 + 2 sin2 𝜙).
𝑅
𝑐𝑅
Le second terme représente une légère déviation du rayon lumineux par rapport à la droite
𝑥 = 𝑅. Cette courbe est symétrique par rapport à l’axe 𝑦 = 0 et possède deux asymptotes
pour 𝜙 = ±𝜙0 où
𝜋
𝜙0 = + 𝛿.
2
𝛿 est très petit et se détermine en écrivant 𝑢(𝜙0 ) = 0, ce qui nous donne
𝑢=
𝛿≈
2𝐺𝑀
.
𝑅𝑐2
Pour des rayons lumineux passant en incidence rasante sur le bord du Soleil, on prend
𝑅 = 𝑅⊙ le rayon du Soleil et on trouve 2𝛿 ≈ 1′′ 75.
5.5
Le modèle de Friedmann
L’observation nous a montré que l’univers lointain a les mêmes propriétés dans toutes
les directions – on dit qu’il est isotrope. Nous ne savons pas comment apparaît l’univers
vue d’une galaxie lointaine, mais il est raisonnable de penser que tous les points de vue
se valent – on dit qu’il est homogène. Cette dernière hypothèse porte parfois le nom de
principe cosmologique. En 1922, Alexandre Friedmann a proposé une solution particulière
de l’équation d’Einstein (𝑀 4 , 𝑔), représentant un modèle d’univers homogène et isotrope.
Ce modèle conduit à l’existence d’une expansion de l’univers ce qui a été vérifié quelques
années plus tard par Hubble.
L’homogénéité et l’isotropie se traduisent ici pas l’existence d’un groupe d’isométries
𝐺 de dimension 6 – le groupe cosmologique. On suppose que chaque orbite de ce groupe est
une sous-variété tridimensionnelle de type spatial simplement connexe. Le stabilisateur
𝐻 de chaque point 𝑥 est un sous-groupe de dimension 3. Le quotient de 𝐺 par 𝐻 est de
dimension 3, on l’appelle l’espace co-mobile.
Les variétés de dimension 3 simplement connexes, homogènes et isotropes, sont au
nombre de trois. Ce sont la sphère 𝑆 3 , l’espace euclidien R3 et l’espace hyperbolique H3 .
Par conséquent, la restriction de la métrique à chaque orbite se met sous la forme
𝑑𝜌2 + sin2 𝜌 𝑑Ω2 , dans le cas 𝑆 3 ;
dans le cas R3 ;
−𝑎2 𝑑𝜎 2 = −𝑎2 𝑑𝜌2 + 𝜌2 𝑑Ω2 ,
⎪
⎩
2
𝑑𝜌2 + sinh 𝜌 𝑑Ω2 , dans le cas H3 .
⎧
⎪
⎨
où
𝑑Ω2 = 𝑑𝜃2 + sin2 𝜃𝑑𝜙2
96
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
et 𝑎2 est un facteur d’échelle.
L’espace quotient, c’est-à-dire l’ensemble des orbites, est une variété de dimension 1
(qu’on supposera difféomorphe à R), et la projection naturelle
𝑝 : 𝑀4 → 𝑇
est une fibration. On montre alors qu’on peut choisir un paramétrage 𝑡 de 𝑇 telle que la
métrique de 𝑀 4 se mette sous la forme
(︁
)︁
𝑑𝑠2 = 𝑐2 𝑑𝑟2 − 𝑎2 𝑑𝜎 2 .
On appelle 𝑡 le temps cosmique. Il permet de définir « l’espace » à une date donnée.
Afin de procéder au calcul explicite de la métrique, il est plus commode d’introduire
une nouvelle coordonnée temporelle 𝑠 définie par
𝑐𝑑𝑡 = 𝑎𝑑𝑠
ce qui permet de mettre la métrique sous la forme
(︁
)︁
𝑑𝑠2 = 𝑎2 𝑑𝑠2 − 𝑑𝜎 2 .
Posons
𝑑𝑎
,
𝑑𝑠
et 𝑏 = sin 𝜌, 𝜌 ou sinh 𝜌 suivant les cas. Les symboles de Christoffel non nuls s’écrivent
𝑎′ =
𝑎′
𝑎
𝑎′
Γ𝜌𝑠𝜌 =
𝑎
′
𝑎
Γ𝜃𝑠𝜃 =
𝑎
′
𝑎
Γ𝜙𝑠𝜙 =
𝑎
Γ𝑠𝑠𝑠 =
Γ𝑠𝜌𝜌 =
𝑎′
𝑎
Γ𝑠𝜃𝜃 =
Γ𝜌𝜃𝜃 = −𝑏𝑏′
𝑎′ 𝑏 2
𝑎
Γ𝑠𝜙𝜙 =
𝑎′ 𝑏2 sin2 𝜃
𝑎
Γ𝜌𝜙𝜙 = −𝑏𝑏′ sin2 𝜃
𝑏′
𝑏
𝑏′
=
𝑏
Γ𝜃𝜌𝜃 =
Γ𝜃𝜙𝜙 = − sin 𝜃 cos 𝜃
Γ𝜙𝜌𝜙
Γ𝜙𝜃𝜙 = cot 𝜃
Le calcul du tenseur de Ricci et de la courbure scalaire nous donne dans le cas (𝑆 3 ),
𝑅𝑟𝑟 =
3 ′2
(𝑎 − 𝑎𝑎′′ ),
𝑎4
𝑅=−
6
(𝑎 + 𝑎′′ ),
𝑎3
Afin de décrire les galaxies, on choisit un schéma fluide parfait
𝑇 𝛼𝛽 = (𝜇𝑐2 + 𝑝)𝑢𝛼 𝑢𝛽 − 𝑝𝑔 𝛼𝛽
où le champ des vitesses de la matière est triviale 𝑢 = (1, 0, 0, 0), du fait de l’isotropie.
Posons 𝑇𝑠𝑠 = 𝜀. Alors les équation d’Einstein se réduisent à
1
𝑅𝑠𝑠 − 𝑅 + Λ = 𝜒𝑇𝑠𝑠 .
2
Dans le cas 𝑆 3 on en déduit
3
𝑎′2 + 𝑎2
= 𝜒𝜀 + Λ
𝑎4
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
97
La relation
div 𝑇 = 0,
nous donne alors, pour chacun des trois cas 𝑆 3 , R3 et H3
−
𝑎′
𝜀′
=3 .
𝑝+𝜀
𝑎
La connaissance de l’équation d’état, 𝑝 = 𝑝(𝜀) nous permet alors de résoudre complètement le problème. Dans la suite, on va envisager un schéma de matière pure (𝑝 = 0).
Alors 𝜀 = 𝜇𝑐2 et on a
𝜇𝑎3 = 𝑀 = 𝐶𝑠𝑡𝑒,
ce qui nous donne
𝑎′2 = 𝑃 (𝑎) =
puis
𝜒𝑀
Λ 4
𝑎 − 𝑎2 +
𝑎
3
3
ˆ
𝑎
𝑠 − 𝑠0 =
𝑑𝑎
√︁
𝑎0
(5.21)
.
𝑃 (𝑎)
Le décalage vers le rouge. Commençons par rechercher les géodésiques isotropes. On
peut supposer, sans perte de généralité, que
𝜃=
𝜋
,
2
𝜃˙ = 0,
𝜙 = 0,
𝜙˙ = 0.
Ce sont donc les courbes qui vérifient l’équation 𝑠˙ 2 − 𝜌˙ 2 = 0 ce qui nous donne
𝑠 = 𝜌 + 𝐶𝑠𝑡𝑒,
ou
𝑠 = −𝜌 + 𝐶𝑠𝑡𝑒.
Considérons à présent un train d’ondes se déplaçant à la vitesse 𝑐 le long d’une géodésique isotrope, composé de 𝑁 crêtes émis par une source lumineuse (quasar lointain par
exemple) dont la ligne d’univers est représentée par la courbe 𝜌 = 𝜌0 . On suppose que ce
signal est capté par un observateur dont la ligne d’univers est la courbe 𝜌 = 𝜌1 .
La durée d’émission du signal par la source est 𝛿𝑡0 et la durée de reception par l’observateur est 𝛿𝑡1 . En désignant par 𝜆0 et 𝜆1 , les longueurs d’ondes respectives à la source
et à la reception, on a
𝑐𝛿𝑡1
𝑐𝛿𝑡0
𝜆0 =
,
𝜆1 =
.
𝑁
𝑁
Par ailleurs, le trajet s’effectuant le long d’une géodésique isotrope, on a
ˆ 𝜌1
ˆ 𝑡1
ˆ 𝑡1 +𝛿𝑡1
𝑐
𝑐
𝑑𝜌 =
=
,
𝜌0
𝑡0 𝑎
𝑡0 +𝛿𝑡0 𝑎
Ce qui nous donne, au premier ordre en 𝛿𝑡0 et 𝛿𝑡1
𝑐
𝑐
𝛿𝑡1 −
𝛿𝑡0 = 0.
𝑎(𝑡1 )
𝑎(𝑡0 )
CHAPITRE 5. TROIS SOLUTIONS PARTICULIÈRES
98
En introduisant le décalage spectral 𝑧 = 𝛿𝜆/𝜆, on a donc
1+𝑧 =
𝑎(𝑡1 )
.
𝑎(𝑡0 )
Le décalage spectral 𝑧 d’un objet lointain est une donnée directement observable. Cette
grandeur est reliée à la distance spatiale de cet objet par rapport à l’observateur. En effet,
la distance spatiale 𝐷 entre nous et cet objet est donnée par
𝑎1 (𝜌1 − 𝜌0 ) = 𝑎1 (𝑠1 − 𝑠0 ).
où 𝑎1 = 𝑎(𝑡1 ). Par conséquent, le changement de variables 𝑎 = 𝑎1 𝑟 dans l’équation (5.21)
nous donne
ˆ 1
𝑑𝑟
2
√︁
𝐷(𝑧) = 𝑎1
1
𝑝(𝑟)
1+𝑧
où 𝑝(𝑟) = 𝑃 (𝑎1 𝑟). En pratique, on utilise un développement limité au premier ordre de
cette fonction. On trouve
𝑎2
𝐷(𝑧) = 1′ 𝑧
𝑎1
C’est cette relation qui a été proposée par Hubble en 1929 pour interpréter les observations
de Humason. La grandeur
⃒
𝑎˙ ⃒⃒
𝑐𝑎′1
𝐻= 2 = ⃒
𝑎1
𝑎 𝑡=𝑡1
s’appelle la constante de Hubble. Elle caractérise l’échelle de l’univers à notre époque.
Pour en savoir plus sur l’histoire de l’univers, une très bonne référence est le petit livre
de Weinberg [30].
Bibliographie
[1] R. Adler, M. Bazin et M. Schiffer – Introduction to general relativity, McGrawHill Book Co., New York, 1965.
[2] É. Cartan – « Sur les équations de la gravitation d’Einstein », J. Math. pures et
appliquées 1 (1922), p. 141–203.
[3] — , « Sur les variétés à connexion affine et la théorie de la relativité généralisée
(première partie) », Ann. Ecole Normal. Sup. 40 (1923), p. 325–412.
[4] — , « Sur les variétés à connexion affine et la théorie de la relativité généralisée
(deuxième partie) », Ann. Ecole Normal. Sup. 42 (1925), p. 17–88.
[5] — , On manifolds with an affine connection and the theory of general relativity,
Monographs and Textbooks in Physical Science, vol. 1, Bibliopolis, Naples, 1986,
Translated from the French by Anne Magnon and Abhay Ashtekar, With a foreword
by Andrzej Trautman.
[6] R. Cushman et W. van der Kallen – « Adjoint and coadjoint orbits of the
Poincaré group », Acta Appl. Math. 90 (2006), no. 1-2, p. 65–89.
[7] R. Deheuvels – Tenseurs et spineurs, Mathématiques., Presses Universitaires de
France, Paris, 1993.
[8] B. Doubrovine, S. Novikov et A. Fomenko – Géométrie contemporaine. Méthodes et applications. 1re partie, Traduit du Russe : Mathématiques. [Translations
of Russian Works : Mathematics], “Mir”, Moscow, 1985.
[9] — , Géométrie contemporaine. Méthodes et applications. 2e partie, Traduit du Russe :
Mathématiques. [Translations of Russian Works : Mathematics], “Mir”, Moscow,
1985.
[10] M. Dubois-Violette et M. Henneaux – « Tensor fields of mixed Young symmetry type and 𝑁 -complexes », Comm. Math. Phys. 226 (2002), no. 2, p. 393–418.
[11] A. Einstein – The meaning of relativity, Princeton University Press, Princeton, NJ,
1988.
[12] R. Feynman – Feynman lectures on gravitation, 1st edition éd., Westview Press,
2002.
[13] M. Göckeler et T. Schücker – Differential geometry, gauge theories, and gravity, Cambridge Monographs on Mathematical Physics, Cambridge University Press,
Cambridge, 1987.
[14] R. S. Hamilton – « The inverse function theorem of Nash and Moser », Bull. Amer.
Math. Soc. (N.S.) 7 (1982), no. 1, p. 65–222.
[15] P. Iglésias – « Heat, cold and geometry », 3 (1983), p. 37–68.
99
BIBLIOGRAPHIE
100
[16] F. Klein – Le programme d’Erlangen, Gauthier-Villars éditeur, Paris-BrusselsMontreal, Que., 1974.
[17] S. Kobayashi – Transformation groups in differential geometry, Classics in Mathematics, Springer-Verlag, Berlin, 1995.
[18] S. Lang – Fundamentals of differential geometry, Graduate Texts in Mathematics,
vol. 191, Springer-Verlag, New York, 1999.
[19] A. Lichnerowicz – Théories relativistes de la gravitation et de l’électromagnétisme.
Relativité générale et théories unitaires, Masson et Cie, Paris, 1955.
[20] P. Malliavin – Géométrie différentielle intrinsèque, Hermann, Paris, 1972, Collection Enseignement des Sciences, No. 14.
[21] S. B. Myers et N. E. Steenrod – « The group of isometries of a Riemannian
manifold », Ann. of Math. (2) 40 (1939), no. 2, p. 400–416.
[22] P. M. Quan – Introduction à la géométrie des variétés différentiables, Préface de A.
Lichnerowicz. Monographies Universitaires de Mathématiques, No. 29, Dunod, Paris,
1969.
[23] L. Schwartz – « Les tenseurs », p. i+203, Hermann, Paris, second éd., 1981.
[24] J.-M. Souriau – Géométrie et relativité, Enseignement des Sciences, VI, Hermann,
Paris, 1964.
[25] — , Structure des systèmes dynamiques, Maîtrises de mathématiques, Dunod, Paris,
1970 (French).
[26] — , « Thermodynamique et géométrie », 676 (1978), p. 369–397 (French).
[27] — , « Milieux continus de dimension 1,2 ou 3 : Statique et dynamique », Congré
Français de Mécanique, Poitiers, 1997.
[28] — , Structure of dynamical systems, Progress in Mathematics, vol. 149, Birkhäuser
Boston Inc., Boston, MA, 1997, A symplectic view of physics, Translated from the
French by C. H. Cushman-de Vries, Translation edited and with a preface by R. H.
Cushman and G. M. Tuynman.
[29] S. Sternberg – Group theory and physics, Cambridge University Press, Cambridge,
1994.
[30] S. Weinberg – Les trois premières minutes de l’univers, Coll. Sciences, Seuil, Paris,
1978.
[31] H. Weyl – Temps, Espace, Matière. Leçons sur la théorie de la relativité générale.,
A. Blanchard, Paris, 1958, Traduction de la quatrième édition allemande par G. Juvet
et R. Leroy.