Bertrand Berche - Groupe de Physique Statistique

Transcription

Bertrand Berche - Groupe de Physique Statistique
Master Sciences Physiques et Matériaux
M1 Physique
Interactions fondamentales et
Cosmologie
Bertrand Berche
Groupe de Physique Statistique
Université Henri Poincaré, Nancy 1
2
Interactions fondamentales et Cosmologie
i
Interactions fondamentales
et Cosmologie
Sommaire
Chap. 1 : Définir la cosmologie . . . . . . . . . . . . . . . . . . . . . .
1
Cosmologie relativiste .
. . . . . . . . . . . . . . . . . . . . .
5
Chap. 2 : Bases empiriques de la cosmologie . . . . . . . . . . . . . .
Introduction
Isotropie et homogénéité de l’Univers à grande échelle
Récession des galaxies, hypothèse de Hubble
7
Chap. 3 : Parenthèse : notions de relativité . . . . . . . . . . . . . .
Quadrivecteurs
Tenseurs
Définition des grandeurs physiques et expression covariante des lois physiques
Formulation covariante de l’électromagnétisme
19
Chap. 4 : Relativité générale et Cosmologie . . . . . . . . . . . . . .
Préambule
Gravitation relativiste
Application à la cosmologie
Histoire sommaire de l’Univers
29
Chap. 5 : Le modèle Lambda-CDM . . . . . . . . . . . . . . . . . . .
Les éléments essentiels du modèle ΛCDM
Paramètres mesurables
L’inventaire cosmique
55
ii
Le rôle particulier de Λ
Chap. 6 : Les “problèmes” cosmologiques . . . . . . . . . . . . . . .
La matière sombre
Le “problème” de la constante cosmoλogique ou de l’énergie sombre
Le problème de la platitude
Le problème de l’horizon
Autres difficultés
71
Théories des champs
. . . . . . . . . . . . . . . . . . . . . . .
95
Chap. 7 : Théories quantiques relativistes . . . . . . . . . . . . . . .
Equation de Schrödinger
Equation de Pauli
Equation de Klein-Gordon
Equations de Weyl
Equation de Dirac
Equation relativiste pour le photon
97
Chap. 8 : Classical gauge field theory . . . . . . . . . . . . . . . . . . 117
Introduction
Abelian U (1) gauge theory
Non-Abelian (Yang-Mills) SU (2) gauge theory
Chap. 9 : Spontaneous symmetry breaking . . . . . . . . . . . . . . . 133
Spontaneous breaking of global gauge symmetries
Spontaneous breaking of local symmetries
The Anderson mechanism
Gauge symmetric electroweak SU (2)W × U (1)Y theory
The Higgs mechanism
L’Univers primordial .
. . . . . . . . . . . . . . . . . . . . . . 145
Chap. 10 : L’inflation cosmologique . . . . . . . . . . . . . . . . . . . 147
Introduction
Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann associées
Equation de mouvement de l’inflaton
La phase de de Sitter
Solutions à certains problèmes cosmologiques
Les scenarios-type
Chap. 11 : Cosmologies alternatives . . . . . . . . . . . . . . . . . . . 159
Interactions fondamentales et Cosmologie
iii
Motivations
Les ingrédients du modèle cosmologique standard
Théories alternatives de la gravitation
Modification de la géométrie, la théorie conforme de Weyl
Chap. 12 : Vers la cosmologie quantique . . . . . . . . . . . . . . . . 169
Formulation lagrangienne et hamiltonienne des équations de Friedmann
Quantification canonique des équations de Friedmann et équation de WheelerDeWitt
Bibliographie
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Chap. Eléments de bibliographie . . . . . . . . . . . . . . . . . . . . . 175
Incontournables...
Pour prolonger la réflexion. . .
Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . .
Des ouvrages et articles sur la théorie des champs. . .
Des articles pédagogiques sur des sujets ponctuels
Cours en ligne
1
Définir la cosmologie
La cosmologie est l’étude de l’Univers dans son ensemble à très grande échelle,
lorsque la composition et la nature précise du contenu matériel de l’Univers
importent peu et que ce contenu peut être remplacé par un milieu continu ayant
des propriétés moyennes.
Plutôt que de chercher à définir davantage ce dont il s’agit, je cite ci-dessous deux
ouvrages récents, en français. Tout d’abord un extrait des pages d’introduction du
livre de Peter et Uzan (1) qui permet de comprendre les enjeux de la cosmologie et
sa place particulière parmi les théories physiques :
Malgré (. . . ) l’abondance des observations, la cosmologie garde (. . . ) un statut
différent comparé aux autres sciences. En effet nous n’observons qu’un seul
Univers et qui plus est à partir d’une position unique de l’espace et du temps.
La plupart des observations sont donc cantonnées à notre cône de lumière passé.
La cosmologie ne fait donc pas l’économie d’hypothèses invérifiables comme par
exemple le Principe Cosmologique qui a des implications fortes concernant les
symétries des espace-temps cosmologiques.
La construction d’un modèle cosmologique repose principalement sur trois
hypothèses : (1) le choix d’une théorie de la gravitation, (2) des hypothèses sur
la nature de la matière présente dans notre Univers et (3) une hypothèse de
symétrie.
Il faut souligner que les observations cosmologiques ne peuvent être interprétées
indépendamment de ces hypothèses théoriques. Ainsi on ne cherche pas à prouver
la validité d’un modèle, mais à établir un accord entre les observations et
le cadre théorique dans lequel elles sont interprétées. Ceci n’empêche pas la
cosmologie d’exclure les modèles dont les prédictions sont incompatibles avec
les observations, comme dans tout autre domaine de la physique.
(1)
P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005.
1
2
Mis à jour le 14 Décembre 2012
Paru récemment également, un ouvrage collectif (2) comprend une contribution
de F. Bouchet intitulée Cosmologie dont je recommande vivement la lecture :
La cosmologie a pour objet les propriétés globales de l’Univers. Elle ne s’intéresse
pas aux objets de l’Univers en tant que tels, et cherche à ne retenir que ce qui
n’appartient à aucun d’entre eux en particulier. C’est une science physique, au
sens où on utilise la démarche, les méthodes et les lois de la physique. Mais les
investigations cosmologiques doivent utiliser les méthodes de l’astronomie, qui
est une science naturelle d’observation. Les systèmes observés sont à prendre
“comme ils sont”, sans pouvoir modifier à volonté leur environnement pour
en comprendre les mécanismes et valider les modèles qui les décrivent. La
validation scientifique est donc toujours plus délicate, puisqu’elle n’a pas accès à
l’expérience directe dans des conditions contrôlées ; d’autant plus que dans le cas
de la cosmologie, nous n’avons par définition qu’un seul système, qui de surcroı̂t
ne peut être observé que de l’intérieur !
La cosmologie moderne pose les principes suivants :
1. Une cosmologie scientifique a un sens. En d’autres termes il existe
effectivement des propriétés d’ensemble, à découvrir.
2. Les lois de la physique sont bien des lois universelles, qui doivent être valables
en tous temps et en tous lieux.
3. L’Univers est globalement identique partout, aucun lieu d’observation n’est
privilégié.
Tous ces postulats seront jugés à leurs fruits. A commencer par l’intelligibilité
de l’Univers en tant que tel. Le deuxième principe nous enjoint d’appliquer à
distance les lois validées dans notre environnement. La difficulté est que les lois de
la physique sont établies, pour un certain domaine d’échelle, de temps, d’énergie,
d’accélération, etc., par des expériences multiples dans ce domaine-là. Or, la
cosmologie contemporaine est précisément une entreprise où l’on considère des
conditions jamais rencontrées auparavant et qui risque de requérir une modification
de nos lois communes dans ces conditions extrêmes. C’est une difficulté, mais c’est
aussi une chance de forger une meilleure approximation de la réalité. Le troisième
principe, connu sous le nom de principe cosmologique, énonce l’homogénéité et
l’isotropie de l’espace. Néanmoins notre environnement immédiat est à l’évidence
très inhomogène. On entend donc par homogénéité de l’espace que les propriétés
moyennes d’un morceau d’Univers de suffisamment grand volume seront identiques
à celles de tout autre morceau de l’Univers. L’isotropie est l’identité des propriétés
dans toutes les directions autour de l’observateur.
L’objet de la cosmologie étant défini, il me semble utile de déflorer dès
maintenant le sujet ! Pendant longtemps, la cosmologie a été un champ scientifique
essentiellement spéculatif, en raison des difficultés inhérentes au sujet, notamment
en termes d’observations. Depuis une dizaine d’année s’est imposé un modèle
cosmologique standard. Derrière ce terme on entend qu’un consensus s’est dégagé
au sein de la communauté des cosmologistes. Ce consensus est fondé en grande
partie sur les mesures très fines des propriétés du fond de rayonnement cosmologique
(notamment ses “irrégularités”) et sur les campagnes d’observations de supernovæ
très lointaines. On a pu en déduire avec une précision remarquable les valeurs
des paramètres cosmologiques qui déterminent la composition et la dynamique de
l’Univers. Le modèle cosmologique standard est encore appelé modèle ΛCDM BBN et on précise en général qu’il est interprété dans le cadre du paradigme de
l’inflation. Ces termes techniques cachent les propriétés essentielles de l’Univers : il
(2)
M. Leduc et M. Le Bellac eds., Einstein aujourd’hui, CNRS Editions, Paris 2005.
Cosmologie
3
est dominé par la constante cosmologique Λ et la matière froide (c’est-à-dire non
relativiste), mais celle-ci est invisible (cold dark matter), les abondances relatives
des éléments légers dans l’Univers sont conformes aux prédictions du Big Bang
(Big Bang Nucleosynthesis) et enfin les théories cadre de l’inflation apportent des
réponses à un certain nombre de difficultés fondamentales qu’on appelle couramment
les “problèmes cosmologiques”, le problème de l’horizon, le problème de l’Univers
plat, le problème des reliques, . . .
On se propose de donner dans ce cours quelques notions de cosmologie afin de
comprendre en partie le modèle cosmologique standard. Les lecteurs intéressés par
davantage de physique sont encouragés, ne serait-ce que pour butiner, à se reporter
à la bibliographie (3) .
(3)
Notamment les ouvrages (mentionnés dans la bibliographie) de Kenyon, de Berry, de Liddle ou
de Longair, mais aussi le remarquable Harrisson ou encore à un niveau plus élevé, Peebles, Peacock
ou Rich, ou encore Kolb et Turner.
4
Mis à jour le 14 Décembre 2012
Cosmologie
Cosmologie relativiste
5
6
Mis à jour le 14 Décembre 2012
Cosmologie
7
2
Bases empiriques de la cosmologie
Introduction
La cosmologie est l’étude de l’Univers dans son ensemble. C’est un champ
disciplinaire qui a été initié par Einstein lorsqu’il s’est penché sur les implications
de la relativité générale à très grande échelle. D’autres noms sont associés à la
naissance de la cosmologie, de Sitter, Friedmann, Lemaı̂tre, Robertson, Walker,
Eddington, Gamow, Hoyle et d’autres, mais c’est encore Einstein qui a joué un
rôle précurseur, même s’il a assez rapidement abandonné ce domaine d’étude. J.P.
Luminet résume l’évolution de la cosmologie de la façon suivante : . . . Friedmann
et Lemaı̂tre sont de plus en plus reconnus comme des novateurs s’inscrivant dans
la lignée de Ptolémée, Copernic, Kepler, Galilée, Newton et Einstein. (. . . ) Les
contributions respectives des hommes de science ayant participé à l’élaboration du
nouveau paradigme cosmologique se clarifient enfin : Einstein a créé la théorie
de la relativité générale et écrit les équations gouvernant les propriétés physicogéométriques de l’univers ; Friedmann a découvert les solutions non statiques de
ces équations, décrivant la variation temporelle de l’espace, et entrevu son possible
commencement par une singularité ; Lemaı̂tre a relié l’expansion théorique de
l’espace au mouvement observé des galaxies, et jeté les bases physiques du Bing
Bang ; Hubble, enfin, a démontré la nature extragalactique des nébuleuses spirales et
confirmé expérimentalement la loi de proportionnalité entre leur vitesse de récession
et leur distance. in A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P.
Luminet, Seuil, Paris 1997.
Le fait que ce soit la relativité générale qui soit pertinente à l’échelle de l’Univers
provient de ce que la gravitation est la seule interaction effective entre constituants
de l’Univers dans cette limite. Le programme consiste en principe à extraire des
équations d’Einstein la géométrie et la dynamique de l’Univers (4) . Il faut pour
(4)
La discussion qui suit est empruntée à A.K. Raychaudhuri, S. Banerji and A. Banerjee, General
Relativity, Astrophysics, and Cosmology Springer-Verlag, New-York 1992.
8
Mis à jour le 14 Décembre 2012
Figure 2.1 La voie lactée observée à diverses fréquences électromagnétiques.
cela connaı̂tre les sources des champs, soit les composantes de T µν de même que
certaines conditions aux limites. La difficulté réside dans le fait que l’on ignore à peu
près tout de la distribution de matière et d’énergie, des contraintes et des vitesses
dans l’Univers. Il est vrai qu’à l’époque actuelle, les observations astronomiques
nous renseignent en partie sur ces distributions, mais elles semblent si irrégulières et
discontinues à première vue qu’une description mathématique s’avère horriblement
compliquée.
De plus les observations sont limitées au cône de lumière, elles sont donc très
locales. Deux hypothèses peuvent ici être avancées : celle d’un Univers hiérarchique
(discontinu et imbriqué à toute les échelles (5) ) et celle d’un Univers continu à des
échelles extrêmement grandes, au-delà des amas et super-amas galactiques, de l’ordre
(5)
Les galaxies sont un peu les unités de base, ce sont les plus grandes structures bien comprises
dans l’Univers. Au voisinage de notre galaxie (la voie lactée), une quinzaine d’autres galaxies dont
celle d’Andromède forment le groupe local dans un volume d’environ 1 Mpc3 . Au-delà on trouve
l’amas de la Vierge (Virgo) à 10 Mpc et dans une échelle de quelques dizaines de Mpc plusieurs amas
forment le superamas local de Virgo. L’Univers se structure en de tels superamas de taille typique
de l’ordre de 20 Mpc. Ces superamas semblent parfois reliés par des “ponts” de matière et entre
eux se trouvent d’immenses espaces apparemment vides de matière (comme dans la constellation
du Bouvier, à 150 Mpc, un vide d’une trentaine de Mpc). Il semblerait qu’à une échelle encore plus
grande un grand “mur” formé de feuillets se dessine sans qu’on ait la moindre idée pour le moment
sur son origine. Ces éléments sont empruntés à M. Lachièze-Rey.
Cosmologie
9
de quelques centaines de millions d’années-lumière. A cette échelle, la description
“hydrodynamique” prévaut (les galaxies sont l’analogue des molécules d’un liquide
pour lequel à une échelle assez grande devant l’échelle moléculaire, une description
continue en termes de densité ρ(r), de champs et d’équations différentielles
est valide). C’est cette vision hydrodynamique qui convainct actuellement la
communauté.
Le problème des conditions aux limites est aussi assez particulier. En
électromagnétisme en général, on résoud un problème en supposant une distribution
de charge finie et en imposant aux champs de s’annuler à l’infini. Il serait étrange
de considérer ici que toute la distribution de matière et d’énergie de l’Univers est
concentrée dans notre “voisinage” et baigne dans un grand vide, ce qui donne au
problème des conditions aux limites une importance particulière.
Isotropie et homogénéité de l’Univers à grande échelle
En fondant la cosmologie moderne en 1917, Einstein a introduit des hypothèses
naturelles, mais assez arbitraires pour résoudre ces difficultés. L’absence de
conditions aux limites est compensée en supposant un Univers homogène et isotrope.
L’idée d’un Univers homogène (c’est le principe cosmologique) est guidée par le souci
de ne pas être anthropique en attribuant une place privilégiée à la Terre. Par ailleurs
on sait maintenant, notamment grâce aux observations fines du fond de rayonnement
cosmique que l’Univers est essentiellement isotrope et s’il doit être isotrope partout,
il est alors également homogène. Einstein a également supposé un Univers statique,
ce en quoi il avait tort, mais cela l’a conduit à introduire la constante cosmologique
Λ qui se révèle maintenant indispensable dans tous les modèles cosmologiques. Les
anecdotes autour de cette constante sont d’ailleurs très instructives. Einstein a
tout d’abord introduit la constante cosmologique comme la simplification la plus
simple qu’il puisse faire aux équations de la gravitation (respectant les symétries du
problème, mais introduisant une nouvelle constante fondamentale de la physique) de
sorte que l’Univers soit statique. Il a d’ailleurs combattu les solutions non statiques
de Friedmann. Quelques années plus tard, les observations, notamment de Hubble,
mettaient en évidence l’évolution de l’Univers (en l’occurrence son expansion), ce qui
a pour un temps laissé penser à Einstein que la constante cosmologique était la “plus
grosse erreur de sa vie” (6) . Cette constante est de nos jours une pièce maı̂tresse des
modèles d’évolution de l’Univers, même si sa détermination précise est un problème
ouvert, notamment l’interprétation de la valeur mesurée reste problématique et à
l’origine d’un spectaculaire désaccord théorie-expérience (7) .
Les observations de l’Univers à des échelles de plusieurs centaines de millions
d’années-lumière font état d’une distribution de matière et de rayonnement
remarquablement isotropes. A des échelles inférieures, l’Univers apparaı̂t composé
de structures complexes, étoiles, galaxies (les galaxies sont séparées les unes des
(6)
La littérature fait état du terme anglais “blunder”, c’est-à-dire “bévue”, rapporté par G.
Gamow, voir cependant à ce sujet A. Harvey and E. Schucking, Einstein’s mistake and the
cosmological constant, Am. J. Phys. 68, 723 (2000) ou A. Pais (‘Subtle is the Lord...’: The
Science and the Life of Albert Einstein, Oxford University Press, New-York 1982) qui cite une
lettre d’Einstein à Weyl dans laquelle après avoir pris connaissance des données astronomiques en
faveur de l’expansion de l’Univers, il s’exprime ainsi “If there is no quasi-static world, then away
with the cosmological term!”.
(7)
La constante cosmologique a mis du temps à s’imposer. Encore assez récemment, elle ne
faisait pas l’unanimité ; Feynman en 1963 par exemple écrivait dans R.P. Feynman, Lectures
on gravitation, Penguin Books, 1995, qu’elle lui semblait inutile et Landau non plus n’était pas
favorable à l’introduction de cette constante cosmologique, pas plus qu’à aucune modification de
la théorie de la relativité générale qu’il considérait “la plus magnifique des théories physiques
existantes” cité par V.L. Ginzburg, Physics Today May 1989, p.54.
10
Mis à jour le 14 Décembre 2012
Figure 2.2 Les échelles de longueur dans la nature, du noyau à l’Univers. A
l’échelle de la cosmologie, le système solaire est vu comme le noyau atomique à
notre échelle !
Cosmologie
11
Figure 2.3 Distribution de matière visible à grande échelle dans l’Univers.
L’intensité lumineuse en termes de niveaux de gris révèle la densité de matière
“baryonique”. Certaines grandes structures filamentaires sont encore perceptibles,
mais la figure est grossièrement isotrope.
autres de 1 Mpc en moyenne, leur densité est de l’ordre de 2.10−24 kg.m−3 ), amas
de galaxies, super-amas,. . . , mais au-delà, il semble qu’une certaine description de
nature hydrodynamique devienne valide, dans laquelle l’Univers est vu comme un
fluide isotrope caractérisé par une densité, une pression et une équation d’état. Si
l’on admet que la Terre n’occupe aucune position privilégiée, l’isotropie doit être
admise pour tout autre observateur, ce qui entraı̂ne également l’homogénéité de
l’Univers.
Figure 2.4 Le photographie de la zone “la plus grande jamais observée”. Chacun
des 9325 points est une galaxie analogue à la notre qui contient quelques centaines
ou milliers de milliards d’étoiles comme le soleil (tiré du serveur sur les puissances
de 10 au CERN, http://microcosm.web.cern.ch/Microcosm/p10/french/
12
Mis à jour le 14 Décembre 2012
Le rayonnement fossile à 3 K ou fond de rayonnement cosmique (8) est
également remarquablement isotrope (les fluctuations relatives sont de l’ordre de
10−5 seulement), une fois effectuées les corrections Doppler dues à la vitesse de la
Terre, ou celle du satellite d’observation par rapport au référentiel propre du CBR (9)
.
Figure 2.5 Le rayonnement électromagnétique émis par l’Univers en échelle loglog.
Cette observation confirme l’hypothèse que la distribution d’énergie ou de
matière dans l’Univers, quelle que soit sa nature, est isotrope. Il semble même que
les fluctuations observables dans le fond de rayonnement cosmique puissent être
corrélées aux fluctuations de la distribution de matière visible.
(8)
On rencontre les acronymes anglais CMB pour Cosmic Microwave Background, CBR pour
Cosmic Backgroung Radiation ou MBR pour Microwave Backgroung Radiation.
(9)
Le satellite COBE est animé d’une vitesse de 8 km.s−1 par rapport à la Terre, le mouvement
saisonnier de la Terre autour du Soleil est de 30 km.s−1 , le système solaire se déplace à 220 km.s−1
autour de centre galactique, la voie lactée à 80 km.s−1 par rapport au groupe local et le groupe
local de galaxies a une vitesse de 630 km.s−1 dans la direction de la constellation Hydra.
Cosmologie
13
Figure 2.6 L’isotropie du fond diffus de rayonnement cosmique, une fois effectuées
les corrections relatives aux mouvements locaux des satellites d’observation.
Figure 2.7 Distribution essentiellement isotrope du fond de rayonnement
cosmique (CMB pour Cosmic Microwave Background ou CBR pour Cosmic
Backgroung Radiation) dans l’Univers. La figure du dessus provient du satellite
COBE et celle du dessous, de résolution nettement meilleure, de WMAP.
14
Mis à jour le 14 Décembre 2012
Récession des galaxies, hypothèse de Hubble
La mesure du déplacement vers le rouge par effet Doppler de raies caractéristiques
émises par des sources lointaines (galaxies, quasars. . . ) est la preuve d’un Univers
en expansion, et donne un moyen de mesurer la vitesse de récession de ces
objets éloignés. En faisant appel à des modèles cosmologiques, on peut tirer des
informations sur la distance de ces sources à la Terre et même une estimation de
l’âge de l’Univers depuis le Big Bang.
On mesure le déplacement vers le rouge des raies d’un spectre connu dont les
longueurs d’onde propres (mesures et émission effectuées sur Terre) sont λ0 , et celles
émises par la source et détectées sur Terre, λ′ . Cette mesure est caractérisée par le
paramètre
z=
λ′ − λ0
.
λ0
(2.1)
Si la vitesse d’éloignement de la source par rapport à la Terre n’est pas trop
grande, cz est une bonne approximation de la vitesse de récession radiale |v|. En
effet au premier ordre en |v|/c,
λ′ ≃ λ0 (1 + |v|/c),
′
0
soit λ λ−λ
= z = |v|/c
0
Doppler,
λ′ = λ0
(10)
s
(2.2)
. On pourrait utiliser ici les expressions exactes de l’effet
1 + |v|/c
,
1 − |v|/c
d’où l’on tire
|v| = c
(z + 1)2 − 1
.
(z + 1)2 + 1
Les mesures de distances sont beaucoup plus délicates à réaliser. Les distances les
plus courtes, dans notre voisinage immédiat jusqu’à quelques centaines de pc, sont
obtenues par parallaxe (différence angulaire entre des observations faites à 6 mois
d’intervalle). Ensuite il faut faire appel à des calibrations successives. On identifie
un type d’étoile brillante (en fonction de l’abondance d’éléments chimiques et des
raies spectrales qui les caractérisent) qui sert d’étalon. Connaissant la distance d’un
tel objet (étoile, puis galaxie) par mesure de parallaxe et mesurant sa luminosité
apparente Lapp. on en déduit sa luminosité absolue L0 = 4πd2 Lapp . Il faut ensuite
identifier dans des galaxies plus éloignées (puis dans les amas plus lointains) des
objets de même nature et de la mesure de leur luminosité apparente on déduit
leur distance. Ces étalons (candles) sont d’abord des étoiles ordinaires (jusqu’à
0.2 Mpc), puis les Céphéides (jusqu’à 2 Mpc), les amas globulaires (jusqu’à 50 Mpc)
et les galaxies brillantes (jusqu’à 1000 Mpc). Il est évident qu’une telle méthode de
calibrations successives est très délicate et la précision est incertaine.
(10)
S’il s’agissait d’un mouvement de rapprochement, le signe de |v|/c serait opposé.
Cosmologie
15
Figure 2.8 Déplacement des raies spectrales émises par diverses étoiles. On en
déduit le décalage spectral z, puis la vitesse d’éloignement.
16
Mis à jour le 14 Décembre 2012
Figure 2.9 Les raies spectrales émises par le soleil. Chaque étoile ou galaxie a
une “signature” propre.
Des mesures spectrales faites dans le cas de la galaxie NGC7619 donnent
par exemple z = 0.0126. La valeur approchée de la vitesse radiale |v| donne
cz ≃ 3779 km.s−1 alors que la valeur exacte est 3756 km.s−1 . Des mesures effectuées
indépendamment par d’autres méthodes basées sur la luminosité donnent une
distance de d = 65 Mpc (1Mpc vaut 3.26 a.l. et le terme “parsec” provient de parallax
second) entre la Terre et NGC7619. Partant du modèle du Big Bang (hypothèse qu’à
l’origine, tous les objets cosmiques se trouvaient en un même point, donc que leurs
distances relatives étaient nulles), et admettant que la vitesse de récession radiale
est et a toujours été uniforme, on peut estimer que cette distance est d = |v|t où
t est une estimation de l’âge de l’Univers. On obtient ainsi t ≃ 16.9 × 109 ans, soit
de l’ordre de grandeur de la dizaine de milliards d’années, proche des estimations
couramment admises actuellement. Notons que selon les modèles de dynamique de
l’Univers, l’expression d = |v|t est changée, mais d/|v| donne toujours un ordre de
grandeur dimensionné de l’âge de l’Univers.
Le modèle du Big Bang a pour origine les nombreuses observations faites par
Edwin Hubble (11) à partir de 1929 : le calcul précédent, répété pour de nombreuses
sources cosmiques donne toujours, aux erreurs expérimentales près, le même résultat.
Une des conséquences du modèle est que plus la source est éloignée, plus sa vitesse
de récession par rapport à la Terre est grande, et que la relation entre cette distance
d et la vitesse radiale |v| est linéaire :
|v| = Hd.
(2.3)
Le coefficient de proportionnalité H est en fait une fonction du temps, et est appelé
constante de Hubble (12) . La valeur numérique précédente donne H = |v|/d ≃
(11)
En fait la première apparition de la loi de Hubble est due à Lemaı̂tre en 1927, mais son article,
publié en français, est longtemps resté méconnu et sa traduction en anglais par Eddington ne
comporte pas ce passage où la loi de proportionnalité distance-vitesse est établie. Les données
étudiées par Hubble en 1929 provenaient d’observations faites par Slipher. Récemment, la sincérité
de Hubble a été mise en doute dans cette affaire de traduction de la contribution de Lemaı̂tre. Voir
à ce sujet Nature, July 11, 2011 , le papier original , sa traduction et le papier qui soulève la
polémique.
(12)
La dénomination de constante de Hubble est justifiée dans le sens où la variation dans le temps
est extrêmement faible aux échelles du système solaire et par ailleurs la valeur est la même en tout
point de l’espace à un instant donné. L’image classique du ballon de baudruche donne un sens à la
dépendance temporelle.
Cosmologie
17
57.8 km.s−1 Mpc−1 , compatible avec la fourchette admise actuellement de
40 < H < 100 km.s−1 Mpc−1 .
(2.4)
Notons par ailleurs que la Terre ne devant pas occuper de position privilégiée dans
l’espace, on devra s’attacher à retrouver une loi de même forme en choisissant une
origine arbitraire.
Figure 2.10 Les données analysées par Hubble en 1929 (à gauche) et celles issues
d’observations actuelles (à droite).
Les résultats analysés à l’origine par Hubble étaient relativement peu convaincants, comme le montre la figure ci-dessus, mais les données accumulées depuis sont
sans ambigüité. On peut noter à propos des données de 1929 que les distances mises
en jeu sont probablement encore assez faibles par rapport aux échelles de longueur
typiques de la cosmologie. La dispersion observée sur la figure historique peut donc
provenir de l’imprécision des mesures de l’époque, mais aussi simplement du fait
qu’elles mettent encore en jeu des mouvements locaux (13) et pas uniquement le
mouvement de récession générale. Les mesures plus récentes en revanche valident
sans doute possible la loi de Hubble.
Plutôt que le diagramme de Hubble, on reporte maintenant la brillance effective
d’un certain type d’objet bien identifié (par exemple les SNIa) en fonction de leur
redshift z. La première quantité varie comme l’inverse de la distance au carré (le
flux ou la brillance effective d’une classe d’objets de luminosité L vaut L/(4πd2 ) et
la seconde est proportionnelle à la vitesse (v ≃ cz).
(13)
Le groupe local auquel appartient la voie lactée est par exemple animé d’une vistesse de
630 km.s−1 par rapport au référentiel du rayonnement cosmique.
18
Mis à jour le 14 Décembre 2012
Figure 2.11 Représentation dans un diagramme de Hubble des données issues
de observations récentes de supernova de type Ia.
Cosmologie
19
3
Parenthèse : notions de relativité
Quadrivecteurs
La théorie de la relativité repose sur l’expression d’un invariant quadridimensionnel,
ds2 = c2 dt2 − dx2 − dy2 − dz 2 ,
analogue à l’expression du théorème de Pythagore qui donne la distance (ici
infinitésimale) entre deux points de l’espace euclidien. Les signes − qui apparaissent
traduisent la nature un peu différente de l’espace-temps de la relativité (on parle de
métrique de Minkowski). Pour permettre une généralisation de cet invariant à des
espaces quelconques (ou simplement en restant dans l’espace de Minkowski, mais
en travaillant avec les coordonnées locales et non plus cartésiennes), on introduit
la notion de tenseur ou plus simplement d’abord de quadrivecteur contravariant
(ou tenseur de rang 1 contravariant). En coordonnées cartésiennes, les composantes
contravaraintes du quadrivecteur sont simplement les composantes ordinaires, par
exemple dxµ = (c dt, dx, dy, dz) et le jeu de 4 composantes (14) xµ , µ = 0, 1, 2, 3
forme un quadrivecteur si ces 4 composantes obéissent par changement de référentiel
inertiel (15) à la transformation de Lorentz :
x′µ = Λµν xν ,
(14)
Un indice grec, µ par exemple, court sur quatre valeurs, de 0 à 3. La composante 0 est aussi
appelée composante temporelle et les trois autres composantes sont les composantes spatiales (on
utilise parfois un indice latin, i par exemple, qui court alors de 1 à 3, ou bien la notation vectorielle).
(15)
Par défaut, le changement de référentiel inertiel est toujours tel que le référentiel R′ se déplace
à la vitesse u = βc parallèlement à l’axe 1 (axe Ox, commun à Ox′ ) par rapport au référentiel R.
20
Mis à jour le 14 Décembre 2012
où la matrice de transformation de Lorentz est définie par


γ
−βγ 0 0
 −βγ
γ
0 0
[Λµν ] =  0
0
1 0.
0
0
0 1
Il est très important de noter quelques règles de lecture de la transformation cidessus : Lorsqu’un même indice apparaı̂t comme c’est le cas ici en position haute
et basse (on parle de positions contravariante et covariante), cela signifie qu’une
somme sur les quatre valeurs permises pour cet indice est sous-entendue. C’est la
convention de sommation des indices muets d’Einstein qui allège considérablement
l’écriture. On dit que l’indice est contracté, il a donc explicitement disparu de
l’expression considérée après sommation. Pour le reste, on doit voir apparaı̂tre des
deux côtés de l’égalité les mêmes indices non contractés dans les mêmes positions,
contravariantes ou covariantes. L’introduction de la matrice de transformation
Λµν est une commodité d’écriture. Si l’on note de manière très générale qu’au
quadrivecteur xν exprimé dans R, il correspond un quadrivecteur x′µ exprimé dans
R′ , et que celui-ci est une fonction de xν , alors, si la transformation de l’un à l’autre
est linéaire, le développement de Taylor de x′µ (xν ) ne laisse subsister que le terme
du premier ordre,
x′µ =
∂x′µ ν
x .
∂xν
Pour que l’indice ν soit en bonne position (covariante), on écrit aussi
∂
= ∂ν ,
∂xν
∂ ~
ce qui définit la dérivée covariante, ∂ν = 1c ∂t
, ∇ . La justification d’un indice “en
bas” est la suivante : une grandeur scalaire Q fonction des coordonnées d’espace∂Q
µ
temps varie d’une quantité δQ = ∂x
si les coordonnées varient. Pour assurer
µ δx
∂Q
que δQ soit un scalaire, il faut contracter l’indice µ et donc le terme ∂x
µ doit avoir
un indice covariant, c’est-à-dire s’écrire comme ∂µ Q.
L’origine de la transformation de Lorentz est à chercher dans la nécessité de
trouver une loi de transformation des composantes spatio-temporelles qui généralise
celle de Galilée,
ct′ = ct
x′ = −βct + x
y′ = y
z′ = z
devenue inacceptable car elle ne préserve pas la forme des équations de Maxwell
et n’assure donc pas l’invariance des phénomènes liés à l’électromagnétisme par
changement de référentiel inertiel. La généralisation cherchée doit être linéaire afin
d’assurer que si le principe d’inertie est satisfait dans un référentiel donné, il le soit
Cosmologie
21
automatiquement dans tout autre référentiel en translation uniforme par rapport
au premier. De plus les composantes transverses doivent être inchangées dans la
transformation (16) , on écrit donc en toute généralité
ct′ = Dct − Ex
x′ = −Aβct + Bx
ce qui conduit à la transformation des vitesses sous la forme v ′ /c = Bv−Aβc
Dc−Ev .
′
′
′
Appliquée à l’origine de R (v = 0 et v = u), à l’origine de R (v = −u et v = 0) et
à la lumière (v ′ = v = c), on obtient trois contraintes soit,
ct′ = A(u)(ct − βx)
x′ = A(u)(−βct + x)
La quatrième contrainte est assurée par la condition A(−u) = A(u) (le signe de la
vitesse est pris en compte dans β), ce qui fait qu’en combinant cette transformation
à la transformation inverse on obtient
1 −β
ct
ct′ = A(u)
−β
1
x
x′
1 β
1 −β
ct′ ,
ct′ = 1 0
= A(u)A(−u)
′
0 1
β 1
−β
1
x′
x
qui impose A(u) = γ ≡ (1 − β 2 )−1/2 .
Ayant maintenant défini un quadrivecteur contravariant comme la donnée
de 4 composantes qui se transforment par changement de référentiel inertiel
conformément à la transformation linéaire de Lorentz, on peut construire une norme
à ce quadrivecteur, qui s’avère invariante par changement de référentiel inertiel, ce
qui lui confère un rôle privilégié dans la théorie de la relativité. Reprenons le cas de
l’intervalle. On a défini dxµ = (c dt, dr) et ds2 = (c dt)2 − | dr|2 . Introduisant les
composantes covariantes associées à dxµ , soit
dxµ = (c dt, − dr),
on peut écrire
ds2 = dxµ dxµ = (c dt)2 − | dr|2 .
On introduit encore le tenseur métrique qui fait passer des composantes
contravariantes aux composantes covariantes,
gµν dxµ = dxν ,
(16)
ds2 = gµν dxµ dxν

1 0
 0 −1
[gµν ] =  0 0
0 0
0
0
−1
0

0
0 
0 
−1
On note r⊥ les coordonnées transverses à u. La seule transformation acceptable est de la forme
r′⊥ = K(u)r⊥ avec K(0) = 1 et K(−u) = K(u) (ce sont des coordonnées transverses). On a donc
r′⊥ = K(u)r⊥ = K(−u)K(u)r′⊥ , soit K(−u)K(u) = K 2 (u) = 1, ou en définitive K(u) = 1.
22
Mis à jour le 14 Décembre 2012
en coordonnées cartésiennes. On joue avec gµν ou g µν pour élever ou abaisser des
indices, par exemple pour transformer les composantes covariantes
x′µ = Λµν xν =
∂x′µ
x
∂xν ν
avec Λµν = gµσ g τ ν Λστ , ce qui revient à préserver la composante si l’on élève ou l’on
abaisse une composante temporelle et à changer le signe s’il s’agit d’une composante
spatiale. Il est clair que toute contraction (norme) d’un quadrivecteur, Aµ Aµ définit
un scalaire invariant par transformation de Lorentz.
Tenseurs
On généralise les notions précédentes à des objets ayant davantage de composantes.
Ainsi par exemple, le jeu de 16 composantes Aµν obéissant par changement de
référentiel inertiel à la transformation
A′
µν
= Λµσ Λν τ Aστ
définit un tenseur de rang 2 deux fois contravariant. De manière équivalente, le
tenseur deux fois covariant associé se transforme comme
A′ µν = Λµσ Λν τ Aστ
et un tenseur mixte, comme
ν
A ′ µ = Λ µσ Λ ν τ A σ τ .
Il est bon de noter que tout objet muni d’indices ne forme pas nécessairement un
tenseur. Par exemple Λµν caractérise un changement de référentiel, mais pas une
quantité physique dans un référentiel donné. De même, la loi de transformation
étant linéaire si un objet n’a que des composantes nulles dans un référentiel inertiel,
il doit en être de même dans tous s’il s’agit d’un tenseur.
Définition des grandeurs physiques et expression covariante des lois
physiques
Pour définir une quantité physique dans le formalisme tensoriel, il est naturel
de partir d’une expression classique, par exemple vectorielle, puis d’en chercher
la généralisation évidente sous forme de quadrivecteur. On peut ensuite écrire
explicitement les composantes du quadrivecteur pour leur donner un sens. On obtient
du même coup la loi de transformation des composantes et des invariants (par
contraction) qui peuvent s’avérer très utiles. Prenons le cas de la vitesse,
v=
dr
dt
−→
vµ =
dxµ
.
dτ
Le temps n’étant plus un invariant, on a choisi de paramétrer la trajectoire (on parle
de ligne d’univers) par le temps propre, tel qu’il s’écoule dans le référentiel propre
de l’objet d’étude, défini par
ds2 = dxµ dxµ = c2 dτ 2 ,
p
dτ = dt 1 − |v|2 /c2
Cosmologie
23
La quadrivitesse v µ est bien un tenseur de rang 1 car xµ en est un et τ est un
dt
dr
invariant. Ses composantes, c dτ
et dτ
ou encore
v µ = (γc, γv),
γ ≡ (1 − |v|2 /c2 )−1/2
se transforment comme v ′ µ = Λµν v ν , ce qui conduit notamment à la loi habituelle
de composition des vitesses qui remplace celle de Galilée. L’invariant associé est
µ
dx
2
vµ v µ = dτµ dx
dτ = c .
On peut maintenant généraliser p = mv pour définir le quadrivecteur énergieimpulsion,
pµ = mv µ = (γmc, γmv)
dont la première composante est homogène à une énergie divisée par c, p0 = E/c et
de sorte que l’on ait d’une part la loi de transformation, p′µ = Λµν pν et d’autre part
l’invariant très important (17) ,
pµ pµ ≡ E 2 /c2 − |p|2 = m2 c2 .
Cette quantité est utile en particulier dans l’étude des collisions, où la quadriimpulsion totale se conserve.
Exprimées à l’aide des tenseurs, les lois physiques prennent une forme dite
manifestement covariante car leur validité est assurée dans tout référentiel inertiel,
moyennant les règles de transformation des tenseurs. Un exemple est fourni par la
généralisation de la loi fondamentale de la dynamique que l’on écrit
m
dv µ
= Φµ
dτ
d
où Φµ définit la quadri-force, Φµ = γ dt
(E/c, p), soit Φ0 =
La loi de transformation s’ensuit également, Φ′µ = Λµν Φν .
γ dE
c dt
~ =γ
et Φ
dp
dt
= γF.
Formulation covariante de l’électromagnétisme
Les lois de l’électromagnétisme prennent également une forme plus élégante et
compacte à l’aide de la notation tensorielle. Commençons par la loi de conservation
de la charge,
div j +
∂ρ
= 0.
∂t
Si elle vaut pour un système donné étudié dans un certain référentiel, on souhaite
évidemment qu’elle soit vraie aussi pour tout autre observateur. La forme de cette
équation suggère l’introduction du quadrivecteur j µ = (ρc, j), qui n’est rien d’autre
que la généralisation de j = ρv de sorte que
∂µ j µ =
(17)
1 ∂ρc
+ div j = 0.
c ∂t
Attention, ici p = γmv et non pas mv.
24
Mis à jour le 14 Décembre 2012
Le fait que cette expression soit une contraction nous assure de sa validité dans
tous les référentiels inertiels. C’est une expression manifestement covariante. Pour
les potentiels on procède de manière analogue. On sait que les équations de Maxwell
dans le vide,
div E = ρ/ε0
div B = 0
rot E = −
∂B
∂t
∂E
∂t
et la relation entre champs et potentiels,
rot B = µ0 j + ε0 µ0
~ −
E = −∇φ
∂A
∂t
B = rot A.
entraı̂nent les équations de propagation des potentiels,
2
~ 2A − 1 ∂ A = − 1 j
∇
c2 ∂t2
ε0 c2
2
~ 2 φ − 1 ∂ φ = −ρ/ε .
∇
0
c2 ∂t2
si l’on impose la jauge de Lorenz-Lorentz
(18)
1 ∂φ
= 0.
c2 ∂t
La forme même de la jauge de Lorenz suggère l’introduction d’un quadripotentiel
div A +
Aµ = (φ/c, A)
de sorte qu’elle apparaisse comme une contraction invariante,
1 ∂ φ
µ
∂µ A =
+ div A = 0.
c ∂t c
Les équations de propagation s’obtiennent de même de manière covariante au moyen
de l’opérateur d’Alembertien,
1 ∂ ~
, ∇)
c ∂t
1 ∂
~
, −∇)
∂µ = (
c ∂t
∂µ = (
∂µ ∂ µ = (
(18)
1 ∂2
~ 2)
, −∇
c2 ∂t2
Cette relation, très importante puisqu’il s’agit d’une jauge covariante, est due au danois
Ludvig Valentin Lorenz, mais elle fut popularisée par un quasi-homonyme, le physicien hollandais
incontournable, Hendrik Antoon Lorentz, auquel l’usage en a attribué la paternité.
Cosmologie
25
soit
∂µ ∂ µ Aν = µ0 j ν ,
µ0 = 1/ε0 c2 .
On cherche ensuite à définir un tenseur représentant le champ électromagnétique
(qu’on appelle souvent tenseur de Faraday). On sait que Aµ est un 4-vecteur. Par
ailleurs la relation B = rot A contient des termes de la forme
Bx =
∂Ay
∂Az
−
∂y
∂z
qui suggèrent de définir un tenseur de rang 2 antisymétrique
F µν = ∂ µ Aν − ∂ ν Aµ .
On a trivialement des zéros sur la diagonale, F 00 = F ii = 0 et F µν = −F νµ ou encore
Fµν = −Fνµ . Les composantes non nulles du tenseur deux fois contravariant (19)
s’expriment explicitement en fonction des champs E et B.
F µν = ∂ µ Aν − ∂ ν Aµ =

0

E
x /c
[F µν ] = 
 Ey /c
Ez /c
∂Aµ
∂Aν
−
.
∂xµ
∂xν
−Ex /c −Ey /c
0
−Bz
Bz
0
−By
Bx

−Ez /c
By 

−Bx  .
0
On définit également un tenseur champ électromagnétique dual
(19)
(20)
.
Le tenseur deux fois covariant
Fµν = gµσ gντ F στ
s’en déduit en conservant le signe de F00 = F 00 et des composantes purement spatiales, Fij = F ij
et en changeant le signe des composantes mixtes F0j = −F 0j :

0
−Ex /c
[Fµν ] = 
−Ey /c
−Ez /c
(20)
Ex /c
0
Bz
−By
Ey /c
−Bz
0
Bx

Ez /c
By 
.
−Bx
0
Celui-ci est formé au moyen du tenseur de Levi-Civita
ǫµνστ =
+1
−1
0
si µ, ν, σ, τ = 0, 1, 2, 3 et permutations paires
si permutations impaires
si deux indices ou plus sont égaux
En particulier on a ǫµνστ = −ǫµνστ . On définit le tenseur dual F̄ µν par la contraction
F̄ µν =
1 µνστ
ǫ
Fστ .
2
26
Mis à jour le 14 Décembre 2012
Utilisant les règles de transformation des tenseurs, on obtient aisément les
transformations des champs électromagnétiques par changement de référentiel
inertiel. F µν étant un tenseur de rang deux, deux fois contravariant, il se transforme
par définition selon
F′
µν
= Λµσ Λν τ F στ ,
et sous forme condensée on écrit :
E′k = Ek ,
B′k = Bk ,
E′⊥ = γu (E⊥ + βu c ∧ B⊥ )
B′⊥ = γu (B⊥ − (βu /c) ∧ E⊥ ).
En réalisant des contractions sur tous les indices, on obtient les invariants du
champ électromagnétique :
1
− F µν Fµν = E2 /c2 − B2 ,
2
1
− F̄ µν Fµν = E · B/c.
4
Construisons les contractions du tenseur champ électromagnétique, par exemple
∂µ F µν . Pour ν = 0, on a
∂µ F µ0 = ∂0 F 00 + ∂1 F 10 + ∂2 F 20 + ∂3 F 30
=0+
=
∂
∂
∂
(Ex /c) +
(Ey /c) +
(E /c)
∂x
∂y
∂z z
1
1
div E =
ρc
c
ε0 c2
= µ0 j 0 .
Pour ν = 1, on a de même
∂µ F µ1 = ∂0 F 01 + ∂1 F 11 + ∂2 F 21 + ∂3 F 31
=
∂
∂
1 ∂
(−Ex /c) + 0 +
Bz +
(−By )
c ∂t
∂y
∂z
=−
1 ∂Ex
+ (rot B)ux
c2 ∂t
= µ0 j 1 ,
Ses composantes s’obtiennent à partir de celles de F µν en changeant E/c en B et B en −E/c :

0
Bx
µν

[F̄ ] =
By
Bz
−Bx
0
−Ez /c
Ey /c
−By
Ez /c
0
−Ex /c

−Bz
−Ey /c 
Ex /c
0.
Cosmologie
27
et les deux dernières composantes spatiales s’en déduisent par permutation. On a
donc
∂µ F µν = µ0 j ν ,
(3.1)
expression qui regroupe les deux équations de Maxwell avec sources,
div E =
ρ
ε0
1 ∂E
= µ0 j.
rot B − 2
c ∂t
(3.2)
Le second couple d’équations de Maxwell s’obtient plus aisément après
l’introduction du tenseur champ électromagnétique dual. Examinons la contraction
∂µ F̄ µν . Pour ν = 0, on a
∂µ F̄ µ0 = ∂0 F̄ 00 + ∂1 F̄ 10 + ∂2 F̄ 20 + ∂3 F̄ 30
=0+
∂By
∂Bx
∂Bz
+
+
∂x
∂y
∂z
= div B.
Pour ν = 1, on a de même
∂µ F̄ µ1 = ∂0 F̄ 01 + ∂1 F̄ 11 + ∂2 F̄ 21 + ∂3 F̄ 31
=
∂
∂
1 ∂
(−Bx ) + 0 +
(−Ez /c) +
(E /c)
c ∂t
∂y
∂z y
=−
1 ∂Bx
1
− (rot E)ux .
c ∂t
c
On en déduit l’expression unifiée du second couple d’équations de Maxwell, les
équations sans second membre,
∂µ F̄ µν = 0.
(3.3)
Les équations de Maxwell manifestement covariantes s’écrivent donc :
∂µ F µν = µ0 j ν ,
∂µ F̄ µν = ∂µ F νλ + ∂ν F λµ + ∂λ F µν = 0.
(3.4)
28
Mis à jour le 14 Décembre 2012
Cosmologie
29
4
Relativité générale et Cosmologie
On se propose de donner dans ce chapitre quelques éléments de cosmologie
relativiste. Il faut pour cela tout d’abord disposer d’une théorie relativiste de la
gravitation, la plus célèbre étant la théorie de la relativité générale dont on présentera
les ingrédients avant de passer à son application à la cosmologie. Les lecteurs
intéressés par davantage de physique sont encouragés, ne serait-ce que pour butiner,
à se reporter à la bibliographie (21) .
Préambule
Rappelons succintement quelques notions sur les tenseurs qui seront utiles à la
compréhension de ce qui suit. On repère un événement de l’espace-temps par ses
coordonnées, e.g. xµ = (ct, r, θ, ϕ) et l’intervalle élémentaire entre deux événements
voisins s’écrit
ds2 = gµν dxµ dxν
où gµν est le tenseur métrique, tel que gµν g µν = 1. Placé “en haut”, l’indice
µ = 0, 1, 2, 3 est appelé contravariant. En position basse, il est dit covariant et
l’on passe de l’un à l’autre au moyen du tenseur métrique,
xµ = gµν xν .
La répétition des indices (“en haut” et “en bas”) s’appelle une contraction, et
elle signifie que l’indice en question est sommé sur ses quatre valeurs. De manière
(21)
Notamment les ouvrages de Kenyon, de Berry ou de Longair, mais aussi le remarquable
Harrisson ou encore à un niveau plus élevé, Peacock, Peebles, Kolb et Turner ou Rich.
30
Mis à jour le 14 Décembre 2012
générale, un tenseur obéit à une loi de transformation linéaire par changement de
référentiel inertiel (représenté par la loi Λµν ) et peut avoir autant d’indices que
nécessaire, chaque indice induisant la loi de transformation, e.g.
µ
µ
x′ = Λµν xν ,
Λ µν =
∂x′
∂xν
R′ µν = Λµρ Λνσ Rρσ ,
λ
R′ µνo = Λλρ Λµσ Λντ Λoυ Rρστ υ .
On introduira de nombreux tenseurs par construction à partir de tenseurs existants,
comme v µ = dxµ / dτ où τ est le temps propre, ds2 = c2 dτ 2 , et on rencontrera
également des objets qui ne sont pas des tenseurs, mais portent des indices, comme
les symboles de Christoffel. Dans ce cas cependant, les “règles pour monter ou
descendre les indices” sont les mêmes que pour les tenseurs.
Gravitation relativiste
Nous allons tout d’abord établir le cas particulier de la métrique de Schwarzschild
avant de donner quelques justifications aux équations d’Einstein.
⊲ Le décalage spectral gravitationnel. En , Einstein a montré, à partir
du principe d’équivalence, que les radiations électromagnétiques sont affectées par
la présence d’un champ gravitationnel(22) .
Le raisonnement utilise simplement l’effet Doppler et le principe d’équivalence
qui stipule en particulier que la lumière se propage à la vitesse c dans un référentiel
tangent au référentiel en chute libre (i.e. dans le référentiel animé d’une vitesse
uniforme coı̈ncidant à l’instant donné avec la vitesse du référentiel en chute libre, et
ceci à condition que la durée de l’expérience soit suffisamment brève et que l’étendue
spatiale du référentiel soit petite). Considérons une capsule de longueur dr en chute
(23)
libre dans le champ de gravitation g = − GM
. Une
r 2 ur créé par une masse M
source lumineuse placée au bas de la capsule émet une onde électromagnétique captée
ensuite par un détecteur situé au plafond de la capsule.
Conformément au principe d’équivalence, la vitesse de propagation de l’onde, c,
est constante dans toutes les directions dans la capsule en chute libre. Le pulse de
lumière émis par la source atteint le détecteur après une durée dt = dr/c. Pour un
observateur extérieur, immobile par rapport à la source du champ de gravitation,
l’onde est détectée avec un décalage Doppler dû à l’éloignement de la source à la
vitesse instantanée v = g dt. Au premier ordre en vc , la variation de fréquence vaut(24)
dν
v
g dr
dν
g
= − = − 2 , ou
= − 2 ν.
ν
c
c
dr
c
A l’altitude r+ dr, un observateur externe mesure une fréquence modifiée ν(r+ dr) =
ν(r) + dr dν
dr :
g dr
GM
ν(r + dr) = ν(r) 1 − 2
= ν(r) 1 − 2 2 dr .
c
r c
(22)
A. Einstein, Principe de Relativité et Gravitation, §V, op. cit., pp. 115-119.
I.R. Kenyon, General Relativity (Oxford University Press, Oxford 1990), p. 15.
(24)
Il s’agit de l’effet
:si la
source S s’éloigne à la vitesse v de l’observateur
q Doppler longitudinal
(23)
O, on a νO = νS
1−v/c
1+v/c
≃ νS
1−
v
c
+O
v2
c2
redonne le résultat classique de l’effet Doppler.
. Au premier ordre en
v
,
c
la relativité restreinte
Cosmologie
31
D
g
t(r+dr)
dr
S
v
t(r)
Figure 4.1 Le temps propre dépend du champ de gravitation. Pour le mettre
en évidence, on considère une capsule en chute libre dans le champ de gravitation
g supposé uniforme. Une source située sur le sol de la capsule émet une onde
électromagnétique détectée par un récepteur placé au plafond. On compare les
fréquences mesurées par un observateur lié à la capsule et un observateur fixe par
rapport à la source de gravitation.
Si chaque “pulse” de l’onde est utilisé comme unité de temps, les horloges situées
1
tels que :
aux distances r et r + dr indiquent des temps t(r) ∼ ν(r)
GM
t(r + dr) = t(r) 1 + 2 2 dr
r c
au premier ordre. Avec t(r + dr) = t(r)+
dt
dr
dr, on en déduit l’équation différentielle
GM
dt
= 2 2 dr
t
r c
que l’on intègre de l’infini, où le champ de gravitation n’est plus sensible, jusqu’à r,
soit :
∞
t(∞)
GM
1
GM
ln
= 2 −
=
t(r)
c
r r
rc2
(4.1)
2
GM
t(r) = t(∞) × e−GM/rc ∼ t(∞) 1 −
.
rc2
Cette expression est parfois écrite en fonction du potentiel gravitationnel ψ(r) =
−GM/r :
ψ(r)
t(r) = t(∞) 1 + 2
c
.
Comme ψ(r) est toujours négatif, t(∞) > t(r), les horloges sont accélérées par le
champ de gravitation.
32
Mis à jour le 14 Décembre 2012
L’équation précédente a été obtenue en partant de l’effet Doppler au premier
ordre en vc . A cet ordre, les résultats classique et relativiste coı̈ncident, ce qui suppose
que la vitesse d’éloignement de la source reste faible par rapport à c, ou encore, que
le champ de gravitation n’est pas trop important (ce qui légitime le développement
au premier ordre.
Il est commode d’introduire ici la notation propre à la notion d’intervalle. t(r)
représente le temps propre local, plus généralement noté τ . Dans la limite des faibles
champs de gravitation, on a donc au premier ordre :
2GM
,
(4.2)
dτ 2 = dt2 1 −
rc2
qui fournit la composante g00 du tenseur métrique.
⊲ Courbure de l’espace-temps dans un champ de gravitation statique
et isotrope. La courbure de l’espace-temps au voisinage d’une source de champ
gravitationnel s’obtient facilement grâce à la déviation géodésique (La déviation
géodésique exprime le fait que deux corps lancés avec une même vitesse initiale d’un
même point, dans deux directions distinctes, voient leur distance relative croı̂tre
selon une loi non linéaire si l’espace-temps n’est pas plat. De ce point de vue,
l’effet d’un champ de gravtitation est localement équivalent à une courbure.). Une
géodésique de l’espace-temps plat est une ligne droite, c’est-à-dire la trajectoire d’une
particule libre dans un référentiel inertiel. Les lignes géodésiques de l’espace-temps
courbe doivent être, par extension, les trajectoires de particules tests en chute libre.
FB
Α
t
r
FA
ξ
α
M
r
FB
Β
Figure 4.2 On calcule la courbure de l’espace-temps grâce à la déviation
géodésique. On considère pour cela deux masses tests attirées par une même source
de gravitation M et l’on calcule l’accélération relative des deux corps d’épreuve.
Considérons deux objets A et B, de masses identiques m (on néglige leur
interaction gravitationnelle mutuelle), en chute libre dans le champ de gravitation
d’une même masse M située à l’origine des coordonnées. Nous allons éliminer le
champ de gravitation créé par M et le remplacer par un effet de géométrique de
courbure. Du fait de leur mouvement, les deux corps A et B se rapprochent l’un
de l’autre et on se propose de calculer leur accélération relative, dans une direction
perpendiculaire à la géodésique (direction tangentielle),
Ft = m
d2 ξ
,
dt2
Cosmologie
33
où ξ = αr est l’abscisse curviligne dans la direction tangentielle. Dans le référentiel
en chute libre A, la force apparente(25) s’exerçant sur A, projetée dans la direction
tangentielle t s’écrit Ft = −FB sin α ≃ −FB α. En écrivant
FB =
GM m
,
r2
α=
ξ
,
r
on obtient l’accélération différentielle
GM
d2 ξ
=− 3 ξ
2
dt
r
qui ne peut disparaı̂tre que si le champ de gravitation est uniforme. Pour un
mouvement supposé non relativiste, ds2 = c2 dτ 2 ≃ c2 dt2 , on obtient
d2 ξ
1 d2 ξ
GM
= 2 2 = − 3 2 ξ = Kξ
2
ds
c dt
r c
(4.3)
par définition de la courbure K dans un continuum hyperbolique (on modifie
simplement le signe pour tenir compte de la signature des coordonnées spatiales
dans l’équation métrique(26) ) :
K =−
GM
.
r 3 c2
(4.4)
Cette quantité représente la courbure de l’espace-temps en présence d’un champ de
gravitation statique et à symétrie sphérique. On constate que c’est la distribution de
matière, à l’origine des champs gravitationnels, qui est responsable de la courbure
de l’espace-temps.
Figure 4.3 La distribution de matière est à l’origine de la courbure de l’espacetemps (tiré de Gamow, op. cit., p. 106).
(25)
On néglige l’interaction entre les corps A et B, cette force apparente résulte donc de l’existence
d’une accélération relative entre A et B.
(26)
Il s’agit en fait de la composante Kφt du tenseur de courbure car l’accélération est transverse
par rapport au mouvement de A qui se fait au cours du temps.
34
Mis à jour le 14 Décembre 2012
⊲ La métrique de Schwarzschild.
− Tenseur métrique pour un champ statique à symétrie sphérique : Le “redshift
gravitationnel” nous donne la partie temporelle de l’équation métrique au voisinage
d’un objet massif. Si l’on considère un champ de gravitation à symétrie sphérique,
la partie angulaire est également connue et l’on a
2GM
2
2
2
2
ds = c dτ = c 1 −
dt2 + grr dr 2 − r 2 dΩ2
rc2
2GM
2
= c 1−
dt2 + grr dr 2 − r 2 dθ2 − r 2 sin2 θ dϕ2 ,
rc2
il manque néanmoins une information sur la partie radiale.
Dans le cas d’une répartition de matière à symétrie sphérique, l’espace-temps doit
être isotrope, c’est-à-dire que la courbure obtenue au paragraphe précédent doit être
la même dans toutes les directions. De plus, celle-ci détermine la partie radiale du
tenseur métrique par l’intermédiaire de l’“excellent théorème de Gauss”(27) . On a
donc ici, en ne considérant que l’espace tridimensionnel, donc en ignorant les signes
négatifs dans les composantes du tenseur métrique (cela signifie que l’on pose ici
′
′
′
ds2 = grr
dr 2 + gθ′ dθ2 + gϕϕ
dϕ2 , avec gij
= −gij où les gij sont finalement les
composantes cherchées)
′
GM
1 dgrr
=− 3 2,
′2 dr
2rgrr
r c
K=
′
soit, par intégration entre le point courant et l’infini où grr
= 1 (espace euclidien),
′
2GM dr
dgrr
,
2 = − c2
′
r2
grr
r
r
1
2GM
− ′
=
,
grr ∞
rc2 ∞
1−
2GM
1
,
=
′
grr
rc2
et finalement
′
=
grr
1
1−
2GM
rc2
.
(4.5)
La métrique purement spatiale est donc de la forme
ds2espace =
(27)
dr 2
+ r 2 dΩ2 .
1 − 2GM
2
rc
Le Theorema Egregium (“théorème remarquable” en latin) est un important théorème énoncé
par Carl Friedrich Gauss et portant sur la courbure des surfaces. Il dit que celle-ci peut être
entièrement déterminée en mesurant les angles et les distances d’une surface, c’est-à-dire qu’elle
ne dépend pas de la manière dont la surface peut être plongée dans l’espace tridimensionnel
(wikipedia).
Cosmologie
35
On en déduit, en rétablissant les signes, l’équation métrique et le tenseur métrique
de Schwarzschild(28) :
2GM
dr 2
2
2
2
2
2
− r 2 dΩ2 ,
(4.6a)
ds = c dτ = 1 −
c
dt
−
rc2
1 − 2GM
rc2


gµν = 

1−
2GM
rc2
0
0
0
0
− 1−
2GM −1
rc2
0
0
0
0
−r 2
0
0


0
.

0
2
2
−r sin θ
(4.6b)
qui redonnent bien les expressions de Minkowski dans les limites r → ∞ ou M = 0.
Si l’on introduit le potentiel gravitationnel ψ(r) = −GM/r, les composantes du
tenseur métrique s’écrivent
g00 = −
2ψ(r)
1
.
=1+
g11
c2
Les effets de courbure (donc de relativité générale) sont importants si
pas négligeable devant 1. La quantité
2GM
rc2
n’est
2GM
c2
donne l’ordre de grandeur des distances auxquelles les effets relativistes sont
sensibles. A titre indicatif, à la surface de la Terre ou du Soleil, on a respectivement
rg =
Terre :
rg⊕ /R⊕ = 1.4 · 10−9 ,
Soleil :
rg⊙ /R⊙ = 4.2 · 10−6 .
− Equation géodésique dans la métrique de Schwarzschild : Dans le cadre de la
relativité restreinte, on sait que l’action de la particule libre est proportionnelle à la
longueur de la géodésique(29) , soit, avec la métrique de Minkowski :
Z
Z
S = −mc ds = L dλ,
1/2
dxµ dxν
ds = ηµν dx dx
= ηµν
dλ,
dλ dλ
1/2
dxµ dxν
L = −mc ηµν
,
dλ dλ
µ
(28)
ν 1/2
(4.7)
La métrique en présence d’un champ de gravitation statique à symétrie sphérique a été
obtenue par la résolution des équations d’Einstein, moins de deux mois après la parution de
l’article d’Einstein, par K. Schwarzschild, On the Gravitational Field of a Point Mass According
to Einstein’s theory, Sitzber. Preuss. Akad. Wiss., Physik-Math. K1, 189 (1916) 189, traduit dans
Black Holes, Selected Reprints, Am. Ass. Physics Teachers, december 1982, p.19 ou encore dans
arXiv:physics/9905030.
(29)
F. Rohrlich, Classical Charged Particles (Addison-Wesley, Redwood City 1990), p. 277,
P.J.E. Peebles, Principles of Physical Cosmology (Princeton University Press, Princeton 1993), p.
244.
36
Mis à jour le 14 Décembre 2012
où λ est un paramètre arbitraire permettant de paramétrer la trajectoire de la
1/2
2
si λ est le temps
particule libre. On retrouve bien entendu L = −mc2 1 − |v|
2
c
t mesuré par un observateur.
En présence d’une énergie potentielle U (r), l’observateur fixe pourra définir un
lagrangien par l’expression(30)
2
L = −mc
|v|2
1− 2
c
1/2
− U (r),
et les équations du mouvement découlent des équations d’Euler-Lagrange appliquées
à ce lagrangien, mais en gravitation relativiste, l’énergie potentielle sera automatiquement incluse dans les composantes gµν du tenseur métrique, et l’étude du mouvement d’un corps d’épreuve se réduit à un problème purement géométrique.
Tandis que, chez Newton, les équations des trajectoires doivent être
postulées à part, tout à fait indépendamment de la structure de l’espace, le
principe géodésique édicte ici, d’une manière extraordinairement naturelle, que
les trajectoires des particules d’épreuve ne sont rien d’autre que les géodésiques
de l’espace(∗) . L’espace une fois esquissé, après que les équations de champ
ont été résolues, les trajectoires sont toutes et totalement définies, contenues,
tracées, creusées dans la structure même de l’espace qui va s’en trouver précisé.
(. . .) Qui plus est, le principe géodésique s’appuie sur le principe d’inertie qu’il
généralise. A tel point que l’expression de l’un s’applique à l’autre : un corps
abandonné à lui-même persiste dans son état de mouvement. Mais tandis que,
pour Galilée, cet état se réduit au mouvement rectiligne uniforme, il couvre
désormais l’ensemble des mouvements purement gravitationnels possibles. Ainsi
les corps sont-ils abandonnés à eux-mêmes, libérés de toute contrainte sinon
de celle que leur trace l’espace lui-même. L’espace qui n’est guère plus que
l’ensemble des mouvements possibles (31) .
(∗) Il ne s’agit ici que des particules d’épreuve et non pas des trajectoires des corps participant
au champ gravitationnel dans lequel ils naviguent.
La généralisation de l’action en relativité générale conduit naturellement à la
définir par l’élément curviligne le long de la courbe géodésique. Celle-ci est bien
invariante par changement arbitraire de système de coordonnées(32) .
Z
Z
µ
ν 1/2
S = −mc ds, ds = gµν dx dx
, δ
ds = 0.
(4.8)
On peut alors effectuer le calcul variationnel en conservant le formalisme covariant.
On note pour cela que
δ( ds2 ) = δ(gµν dxµ dxν ) = 2 ds δ( ds) = dxµ dxν δgµν + 2gµν dxµ δ( dxν ).
On obtient
δ( ds) =
(30)
1 dxµ ν ∂gµν ρ
dxµ
dx
δx
+
g
d(δxν ).
µν
2 ds
∂xρ
ds
L. Brillouin, L’atome de Bohr (Presses Universitaires de France, Paris 1931), p. 105.
J. Eisenstaedt, Trajectoires et Impasses de la Solution de Scwarzschild, Arch. Hist. Exact Sci.
37 (1988) 275, p.283.
(32)
P.J.E. Peebles, op. cit., p. 245.
(31)
Cosmologie
37
µ
µν
, ce qui conduit à
et gµν,ρ = ∂g
∂xρ
1 µ ν
ρ
µ d
ν
δ( ds) =
ẋ ẋ gµν,ρ δx + gµν ẋ
(δx ) ds
2
ds
dx
ds
On pose ẋµ =
dont l’intégrale sur la ligne d’univers doit s’annuler,
Z
Z
Z
1 µ ν
ν
ρ
µ d
ds =
δ
ẋ ẋ gµν,ρ δx ds +
(δx ) ds
gµν ẋ
ds
Ligne 2
Ligne
Ligne
|
}
R{z d
[gµν ẋµ δxν ]∂L −
=
Z
Ligne
(gµν ẋ
L ds
µ )δxν
ds
1 µ ν
d
µ
ẋ ẋ gµν,ρ −
(g ẋ ) δxρ ds.
2
ds µρ
Comme d’habitude, on a annulé le terme de bords aux extrémités de la ligne
d’univers. La variation est arbitraire, de sorte que l’intégrant doit être nul, soit
1 µ ν
ẋ ẋ gµν,ρ − gµρ ẍµ − gµρ,ν ẋµ ẋν = 0.
2
On arrange les termes en multipliant par g σρ et en notant que dans le dernier
terme ci-dessus on peut permuter les indices contractés µ et ν, soit gµρ,ν ẋµ ẋν =
1
µ ν
ν µ
2 (gµρ,ν ẋ ẋ + gνρ,µ ẋ ẋ ), d’où
1
1
σρ
µ
σρ 1
gµν,ρ − gµρ,ν − gνρ,µ ẋµ ẋν .
g gµρ ẍ = g
2
2
2
| {z }
ẍσ
En définissant le symbole de Christoffel ou connexion affine
Γσµν =
(33)
(contraction sur ρ),
1 σρ
g [gµρ,ν + gνρ,µ − gµν,ρ ],
2
on obtient l’équation de mouvement
(34)
(33)
Ce n’est pas un tenseur car il est identiquement nul dans un référentiel localement inertiel et
la loi linéaire de transformation des tenseurs exigerait sinon qu’il soit identiquement nul dans tout
référentiel.
(34)
On peut noter à ce sujet que la notion de dérivée covariante permet d’écrire directement
l’équation géodésique. La dérivée covariante est donnée par
dq σ
dxν
Dq σ
=
+ Γσµν q µ
.
Ds
ds
ds
En présence d’un champ de force F µ , l’équation de mouvement devient
Dpσ
= Fσ
Dτ
soit dans le cas du mouvement de chute libre
0=
d2 xσ
dxµ dxν
Dpσ
σ
=m
+
mΓ
.
µν
Dτ
dτ 2
dτ dτ
Précisons également des notations anciennes pournles connexions
affines (symboles de Christoffel
o
ρ
ρ
ρσ
de 1ère et 2ème espèces) : Γµν,ρ = [µν, ρ], Γ µν = µν = g [µν, σ].
38
Mis à jour le 14 Décembre 2012
d2 xσ
dxµ dxν
σ
=
−Γ
.
µν
ds2
ds ds
(4.9)
On peut introduire la dérivée covariante (au sens des théories de jauge cette fois)
Dκ qσ = ∂κ qσ + Γσµκ qµ
et la propriété
D
D ∂xκ
=
Ds
Dxκ ∂s
pour retrouver l’équation de déviation géodésique
∂xκ
Dqσ
= Dκ q σ
Ds
∂s
∂xκ
∂xκ
= ∂κ q σ
+ Γσµκ qµ
∂s
∂s
κ
σ
∂x
∂q
+ Γσµκ qµ
,
=
∂s
∂s
ou encore
D ẋσ
= Dκ ẋσ ẋκ = ẍσ + Γσµν ẋµ ẋκ .
Ds
⊲ Les équations d’Einstein. On présente dans cette section la forme générale
des équations d’Einstein. Il ne s’agit pas de démontrer les expressions mises en jeu,
mais de pousser encore un peu le formalisme.
− Sur la difficulté d’une analogie avec l’électromagnétisme : Les équations
d’Einstein constituent une généralisation de l’équation de Poisson pour le potentiel
gravitationnel ψ(r),
~ 2 ψ(r) = 4πGρ(r),
∇
défini en fonction de la densité de masse locale ρ(r). Cette équation est analogue à
celle que l’on rencontre en électromagnétisme où les équations de Maxwell relient le
tenseur de Faraday F µν aux sources, les densités de charges et de courant électrique
sous la forme ∂µ F µν = µ0 j ν où j ν = (ρc, j). La partie temporelle de cette équation
conduit à l’équation de Poisson une fois utilisée la définition du tenseur de Faraday
F µν = ∂ µ Aν − ∂ ν Aµ et celle du quadri-potentiel Aµ = (φ/c, A),
~ 2 φ(r) = − 1 ρ(r).
∇
ε0
L’analogie avec le potentiel gravitationnel est évidente et il est tentant de
chercher une généralisation des équations de Maxwell (on parle d’équations
gravitomagnétiques). Il faut pour cela un 4−courant gravitationnel j µ et un tenseur
Cosmologie
39
analogue au tenseur de Faraday, [−−]µν qui soient reliés par une équation de la forme
∂µ [−−]µν = const×j ν . La densité de masse ρ(r) serait déterminée par la composante
j 0 . Nous allons voir que cette définition n’est pas possible, car la densité de masse
n’a pas les bonnes propriétés. En effet, elle se transforme comme on va le voir un peu
plus loin comme la composante d’un tenseur de rang 2 et doit donc être identifiée à la
composante 00 d’un tenseur plus général. Pour remplacer les équations de Maxwell,
il faut donc une équation tensorielle de rang 2, écrite symboliquement
Géométrie µν = Matière µν .
Le rôle du potentiel ψ(r) est joué par le tenseur métrique (rappelons par exemple
dans le cas de la métrique de Schwarzschild que g00 = −1/g11 = 1 + 2ψ/c2 ) et celui
de la densité de masse par le tenseur énergie impulsion (35) . Le contenu matériel,
par l’intermédiaire de ρ(r) intervient dans l’objet Matière µν , le tenseur énergieimpulsion T µν et détermine de ce fait les propriétés spatio-temporelles données en
termes de la métrique g µν qui intervient dans l’objet Géométrie µν .
L’équation d’Einstein est donc une équation différentielle pour les composantes
du tenseur métrique, dont les sources sont données par le tenseur énergie impulsion.
Une équation plausible serait de la forme ∂σ Γσµν = Tµν . Elle possède bien deux
indices explicites, et la géométrie apparaı̂t par une dérivée de la connexion affine,
c’est-à-dire qu’elle contient des dérivées secondes du tenseur métrique, indispensables
pour explorer l’écart au comportement minkowskien. Nous verrons cependant que
les équations d’Einstein sont plus complexes que cela.
− Tenseur de Riemann : On cherche tout d’abord à caractériser la courbure
d’un espace arbitraire (l’espace-temps) au moyen d’un tenseur. Rappelons qu’il est
toujours possible de trouver en un point quelconque un référentiel localement tangent
qui soit inertiel (le référentiel en chute libre), c’est-à-dire tel que
gµν = ηµν
∂gµν
= 0.
∂xρ
Ici, ηµν est le tenseur métrique de Minkowski ηµν = diag(1, −1, −1, −1).
L’information sur la courbure provient donc des dérivées d’ordre supérieur du tenseur
métrique. Ce qui distingue notamment un espace courbe d’un espace plat, c’est que
dans le premier, les référentiels localement tangents en x et en x + ∆x diffèrent,
de sorte que les variations du tenseur métrique sont du second ordre. L’information
cherchée réside dans un tenseur de rang 4 contenant des termes comme gµν,ρσ , le
tenseur de Riemann Rµνρσ , défini par les connexions affines (36) ,
Rµνρσ = Γµνσ,ρ − Γµνρ,σ + Γµλρ Γλνσ − Γµλσ Γλνρ .
Dans un référentiel localement inertiel, les connexions affines sont nulles mais pas
nécessairement leurs dérivées et il vient Rµνρσ = Γµνσ,ρ − Γµνρ,σ . On définit aussi la
forme totalement covariante Rµνρσ = gµλ Rλνρσ telle que dans un référentiel inertiel
2Rµνρσ = gµσ,νρ − gνσ,νρ + gνρ,µσ − gµρ,νσ . Notons que le tenseur de Riemann
(35)
(36)
Dans les ouvrages en anglais on utilise en général le terme de stress energy tensor.
On rappelle que Γσµν = 21 g σρ [gµρ,ν + gνρ,µ − gµν,ρ ].
40
Mis à jour le 14 Décembre 2012
possède 256 composantes dont en fait seulement 20 sont indépendantes en raison
des symétries.
− Tenseur énergie impulsion : Energie et impulsion sont deux aspects d’un
même objet, la 4-impulsion pµ telle que E 2 − c2 |p|2 = m2 c4 . Voyons maintenant
comment construire le tenseur énergie impulsion en généralisant la densité de masse
ρ. Considérons un nuage de poussière. Dans le référentiel R dans lequel il est au
repos, il possède une densité d’énergie ρc2 = mnc2 = E/V s’il est constitué de
grains de masses m et de densité n (dans R). Ici V est le volume occupé par le
gaz et E son énergie. Dans un autre référentiel R′ , on aura une augmentation de
l’énergie E → E ′ = γE et une contraction du volume, V → V ′ = γ −1 V à cause
de la transformation des longueurs longitudinales, rk → rk′ = γ −1 rk de sorte que
ρ → ρ′ = γ 2 ρ. Il est donc évident que ρc2 ne peut ni être un scalaire ni une
composante de quadrivecteur, mais doit être la composante d’un tenseur de rang
2 (37) . On définit ainsi le tenseur énergie impulsion T µν pour un gaz dilué,
T µν = ρv µ v ν .
Dans le référentiel R, on a la quantité cherchée T 00 = ρc2 . Si l’on prend la pression
en compte, l’expression devient
T µν = (ρ + p/c2 )v µ v ν − g µν p.
Une définition qui s’applique à des systèmes plus complexes que le nuage de poussière
considéré ici est que T µν représente le flux de la composante µ du 4-vecteur énergie
impulsion pµ le long de la direction ν. Il obéit à une loi de conservation (38) ,
T µν,ν = 0.
Finalement, on retiendra que T µν
- est un tenseur de rang 2,
- s’annule en l’absence de matière,
- a toutes ses divergences nulles,
- est symétrique.
− Tenseur d’Einstein : Einstein a identifié le tenseur énergie impulsion comme
la source de la courbure de l’espace-temps et a ainsi suggéré la forme la plus simple
possible de relation entre l’énergie Tµν et la courbure Gµν , soit KTµν = Gµν où
K est une constante à déterminer pour restaurer la limite newtonienne et Gµν , le
tenseur d’Einstein, décrit la courbure. Gµν est de rang 2 et de divergence nulle (à
cause de ces mêmes propriétés satisfaites par Tµν ). Il doit être construit à partir du
tenseur de Riemann. Celui-ci est de rang 4, il faut donc une double contraction (39)
, c’est le tenseur de Ricci
Rµν = Rρµρν = g ρσ Rσµρν .
(37)
Revenant à la discussion évoquée plus haut sur la forme des équations d’Einstein, c’est pour cette
raison que l’on ne peut pas construire une théorie de la gravitation calquée sur l’électromagnétisme,
car la densité de charge se transformant avec un seul facteur γ, elle est la composante d’un 4vecteur, la 4-densité de courant j µ et le tenseur de Faraday obéit à ∂µ F µν = µ0 j ν . Dans une
théorie analogue de la gravitation, le second membre est nécessairement un tenseur de rang 2, ce
qui complique l’équation cherchée.
(38)
En relativité générale, cette loi de conservation est étendue à un référentiel arbitraire en passant
à la dérivée covariante, T µν;ν = 0.
(39)
On peut montrer que d’autres contractions donnent des résultats équivalents.
Cosmologie
41
Le tenseur de Ricci n’est pas de divergence nulle, ce que l’on rétablit par soustraction
1
Gµν = Rµν − gµν R,
2
où R = g µν Rµν est le scalaire de Ricci. L’équation d’Einstein peut maintenant
s’écrire
Gµν =
8πG
T .
c4 µν
Une généralisation apportée par Einstein lors d’applications en cosmologie consiste
en l’introduction d’une nouvelle constante fondamentale, la constante cosmologique
Λ, de sorte que l’équation d’Einstein devient alors
Gµν − Λgµν =
8πG
T .
c4 µν
Cette constante a pour effet de produire une courbure de l’espace-temps même en
l’absence de toute forme de matière ou de radiation (40) . Elle joue un rôle central
en cosmologie et dans la compréhension actuelle de l’Univers.
⊲ Action d’Einstein - Hilbert. Une formulation alternative de l’équation
d’Einstein repose sur la définition d’une action, proposée initialement par Hilbert.
Il faut tout d’abord exprimer un élément d’intégration invariant dans un système de
coordonnées arbitraire. Dans l’espace de Minkowski l’élément d4 x = dx0 dx1 dx2 dx3
est un invariant en raison de la compensation des facteurs γ qui interviennent dans
c dt et dans drk . Si l’on cherche à former un élément d’intégration invariant dans un
système de coordonnées quelconque, il apparait le déterminant du tenseur métrique.
Considérons les systèmes de coordonnées x et x′ . On a
∂x 4 ′
d x = ′ d x
∂x
4
∂x où le jacobien de la transformation, ∂x
′ , est le déterminant de la matrice des
∂xµ
dérivées partielles ∂x′ν . De la loi de transformation
′
=
gµν
∂xρ ∂xσ
g
∂x′µ ∂x′ν ρσ
(on rappelle que g ′ µν = Λµρ Λν σ g ρσ et g ′ µν = Λµρ Λν σ g ρσ avec Λµρ = ∂x′ µ /∂xρ
2
et Λ ρ = ∂xρ /∂x′ µ ) on déduit que g ′ = g ∂x′ où g est le déterminant (négatif)
µ
(40)
∂x
C’est pour cette raison d’ailleurs qu’Eddington argumentait sur le rôle indispensable de la
constante cosmologique. C’est la seule façon, d’après lui, d’introduire en physique une longueur
intrinsèque, le rayon de courbure de l’Univers dans la limite d’un Univers vide, comme c est une
constante fondamentale de la physique, la vitesse de propagation de particules non massives dans
le vide. (A. Eddington, The Expanding Universe, Cambridge University Press, Cambridge 1933,
chap. IV.).
42
Mis à jour le 14 Décembre 2012
de gµν , soit pour l’élément d’intégration d4 x =
invariant est donné par
p
√
−g d4 x = −g ′ d4 x′ .
p
g ′ /g d4 x′ et finalement l’élément
√
L’action d’Einstein-Hilbert est formée en intégrant sur −g d4 x un scalaire
invariant décrivant la courbure de l’espace-temps. Nous avons vu que le scalaire
de Ricci est défini par contractions successives du tenseur de Riemann, il forme
donc le bon lagrangien et l’action est donnée par
Z
√
c4
SEH = −
R −g d4 x.
16πG
Omettant pour un instant la constante inessentielle à ce niveau, on cherche à
minimiser l’action(41)
Z
√
S = R −g d4 x
avec δgµν = 0 sur une 3−surface envoyée à l’infini. Comme R est fonction des gµν
et de leurs dérivées premières et secondes, les équations d’Euler-Langrange sont
formellement données par
∂ √
∂ √
∂ √
−gR − ∂κ
−gR + ∂κ ∂λ
−gR = 0.
∂gµν
∂gµν,κ
∂gµν,κλ
Cette forme est nénamoins difficilement exploitable. On a défini antérieurement
R = g µν Rµν ,
Rµν = g ρσ Rρµνσ
= Γρµσ Γσρν − Γρµν Γσρσ + Γρµρ,ν − Γρµν,ρ .
Il vient alors pour δS
δS = 0 =
Z
√ √
√
d4 x δRµν g µν −g + Rµν δg µν −g + Rµν g µν δ −g .
R
√
Le premier terme s’annule par intégration par parties (il apparaı̂t d3 xRµν g µν −g
nul car le tenseur de Ricci est
R nul à l’infini
√ et le terme restant disparaı̂t grâce
à des propriétés difficiles de d4 xRµν δ(g µν −g)). Par ailleurs, on a la propriété
(également difficile à montrer !)
δg = −ggµν δg µν
√
qui permet d’écrire δ −g = − 12 (−g)−1/2 δg et d’obtenir
Z
√
1
4
ρσ
δS =
d x Rµν − Rρσ g gµν δg µν −g = 0
2
(41)
On pourra consulter wikipedia http://en.wikipedia.org/wiki/Einstein-Hilbert action.
Cosmologie
43
pour une variation arbitraire de la métrique si
1
Rµν − Rgµν = 0.
2
Gµν = Rµν − 12 gµν R est bien le tenseur d’Einstein. Lorsque la gravité interagit avec la
matière il faut ajouter un nouveau terme invariant décrivant les champs de matière
et de radiation dont la variation par rapport aux composantes du tenseur métrique
fait apparaı̂tre le tenseur énergie impulsion.
S=
Z
√
−g d4 x
Lm −
c4
R ,
16πG
et la forme précise de Lm dépend du problème considéré, mais définit le tenseur
énergie impulsion par (42) la définition
Z
Z
µν
√
√
δ
4
1
d4 x −gTµν δg µν ,
δSmat. =
d x µν
−gLmat δg ≡ 2
δg
d’où l’on déduit
Tµν
2
= √
−g
√
√
∂( −gLm )
∂ ∂( −gLm )
.
−
∂g µν
∂xρ ∂g µν,ρ
La variation de l’action conduit à
Z
√
1
c4
1
4
µν
T −
(R − g R) ,
δS =
−g d x δg
2 µν 16πG µν 2 µν
et il vient
1
8πG
Rµν − Rgµν = 4 Tµν .
2
c
L’introduction de la constante cosmologique nécessite un terme supplémenatire
dans l’action,
Z
√
−g d4 x,
Λ
et la variation conduit cette fois à
8πG
1
Rµν − Rgµν − gµν Λ = 4 Tµν .
2
c
(42)
voir par exemple S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972, chap. 12 ;
P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press, Princeton 1993,
p.259 ; A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics, and
Cosmology Springer-Verlag, New-York 1992, p.47.
44
Mis à jour le 14 Décembre 2012
Application à la cosmologie
⊲ Le modèle de Friedmann, Robertson et Walker. Le modèle de Robertson
et Walker, ou encore de Friedmann, Robertson et Walker (FRW) donne la forme
générale de la métrique, puis établit les équations de Friedmann régissant la
dynamique de l’Univers par application des équations d’Einstein.
− La métrique de Robertson et Walker : Cherchons la métrique d’un Univers
homogène, isotrope, et dont la courbure (qui pourra être positive, négative ou nulle),
K(t) = k/a2 (t) est la même en tout point en vertu du principe cosmologique et ne
dépend que du temps cosmique t. a(t) est un facteur d’échelle qui fixe l’amplitude
de la courbure et k définit le signe, k = +1, 0 ou −1. La métrique cherchée est a
priori de la forme
ds2 = c2 dt2 − dl2
où dl2 est la métrique tridimensionnelle de l’espace ordinaire, éventuellement courbe.
Lorsque k est positif, on obtient un espace à courbure positive et dans ce cas, par
analogie avec la surface de la sphère, plongée dans IR3 , on introduit une coordonnée
supplémentaire, w, pour plonger l’espace tridimensionnel à courbure positive dans
IR4 ,
x2 + y2 + z 2 +w2 = a2 (t).
{z
}
|
r2
On a donc r 2 + w2 = a2 (t), soit (r dr)2 = (w dw)2 à un instant donné, ou encore
dw2 =
r2
dr 2 .
a2 (t) − r 2
Deux points voisins sont distants de
dl2 = dr 2 + r 2 dΩ2 + dw2
=
a2 (t)
dr 2 + r 2 dθ2 + r 2 sin2 θ dϕ2 .
a2 (t) − r 2
On a bien un espace homogène (la courbure est la même partout) et isotrope
(dépendance angulaire de la métrique en r 2 dΩ2 ). On introduit en général une
variable sans dimension σ = r/a(t), de sorte que
dσ 2
2
2
.
+
σ
dΩ
dl2 = a2 (t)
1 − σ2
On en déduit la métrique de Robertson et Walker, introduite indépendamment
par ces deux auteurs en 1936, mais déjà connue de Friedmann, en généralisant
à
√
des courbures éventuellement nulles ou négatives en remplaçant a par a/ k et en
incorporant la coordonnée temporelle,
dσ 2
2
2
2
2
2
2
+ σ dΩ .
(4.10)
ds = c dt − a (t)
1 − kσ 2
Cosmologie
45
On en déduit la forme du tenseur métrique, dxµ = (c dt, dσ, dθ, dϕ), et
ds2 = gµν dxµ dxν , soit

1
0
[gµν ] = 
0
0
02
a
− 1−kσ
2
0
0
0
0
−a2 σ 2
0

0
0
0
−a2 σ 2 sin2 θ

.
(4.11)
g µν et gµν ne sont plus représentés par la même matrice. En effet, comme dxµ =
gµν dxν et dxµ = g µν dxν l’intervalle s’écrit
ds2 = dxµ dxµ = gµν g µν dxν dxν ,
| {z }
ds2
soit gµν g µν = 1 d’où l’on déduit
g µν =
1 µν
G
g
où g est le déterminant de gµν et Gµν la matrice de ses cofacteurs (gµν étant
symétrique, il n’est pas nécessaire de transposer la matrice des cofacteurs) (43) .
On a donc


1
0 2
0
0

 0 − 1−kσ
0
0
a2
.
[g µν ] = 

0
0
− a21σ2
0
1
0
0
0
− a2 σ2 sin2 θ
− Référentiel comobile : Les coordonnées intervenant dans la métrique de
Robertson-Walker sont xµ = (ct, σ, θ, ϕ) où t est le temps cosmique et σ la
coordonnée spatiale radiale ramenée au facteur d’échelle de l’Univers. Tout point
se déplaçant dans l’Univers de sorte que ses coordonnées spatiales xi = σ, θ, ϕ soient
constantes suit une ligne d’Univers particulière. En effet on a dans ce cas xi = const.,
soit
d2 xi
dxi
=
= 0,
ds
ds2
et comme la métrique est diagonale, les connexions affines
Γσµν =
1 σρ
g [gµρ,ν + gνρ,µ − gµν,ρ ]
2
spatio-temporelles deviennent
Γi 00 =
1 iρ
1
g (2∂0 g0ρ − ∂ρ g00 ) = g ii (2∂0 g0i −∂i g00 ) = 0.
2
2
|{z}
|{z}
0
(43)
1
On pourrait plus simplement ici utiliser le fait qu’il s’agit de matrices diagonales, les éléments
de la matrice produit sont alors les produits des éléments diagonaux.
46
Mis à jour le 14 Décembre 2012
On en déduit automatiquement que le point en question obéit à l’équation
dxµ dxν
d2 xi
i
+
Γ
=0
µν
2
{z } |{z} | ds{z ds}
| ds
0
c’est-à-dire
nul si
µν=00
nul si µν6=00
Dpi
= 0.
Ds
(4.12)
Les coodonnées σ, θ, ϕ sont appelées coordonnées comobiles et le référentiel dans
lequel elles restent constantes est le référentiel comobile. L’origine du référentiel
comobile obéit à l’équation de la particule libre dans un référentiel inertiel, le
référentiel comobile est donc un référentiel en chute libre. Par ailleurs, dans ce
référentiel la métrique de Robertson-Walker se réduit à ds2 = c2 dt2 c’est-à-dire
que le temps cosmique est le temps propre du référentiel comobile.
− Dynamique : les équations de Friedmann : Pour obtenir les équations de
Friedmann (44) qui régissent la dynamique de l’Univers, on part du tenseur énergie
impulsion du fluide cosmique,
Tµν = (ρ + p/c2 )vµ vν − pgµν
(4.13)
et de la métrique de Robertson-Walker pour écrire les équations d’Einstein.
Les composantes du tenseur métrique valent
g00 = g 00 = 1,
g11 = 1/g 11 = −a2 /(1 − kσ 2 ),
g22 = 1/g 22 = −a2 σ 2 ,
g33 = 1/g 33 = −a2 σ 2 sin2 θ.
Les sources sont définies par Tµν . Dans le référentiel comobile, v µ = (c, 0, 0, 0)
et le tenseur énergie impulsion se simplifie en composantes diagonales,
T00 = ρc2 ,
T11 = pa2 /(1 − kσ 2 ),
T22 = pa2 σ 2 ,
T33 = pa2 σ 2 sin2 θ.
La géométrie est déterminée par le tenseur d’Einstein. Les connexions affines se
déduisent de gµν ,
Γσµν =
1 σρ
1
g (gµρ,ν + gνρ,µ − gµν,ρ ) = g σσ (gµσ,ν + gνσ,µ − gµν,σ )
2 |{z}
2
diag
(44)
Pour un commentaire sur l’orthographe de Friedmann, voir la note 11 p. 83 dans A. Friedmann,
G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil, Paris 1997.
Cosmologie
47
soit en particulier
Γ101 =
∂g
1 1 − kσ 2 2aȧ
ȧ
1
1 11
g (g01,1 +g11,0 − g01,1 ) = g 11 110 =
=
2
2
2
2
∂x
2c
a
1
−
kσ
ac
|{z}
|{z}
=0
=0
et on calcule également
Γ011 = c−1 aȧ/(1 − kσ 2 ),
Γ022 = c−1 σ 2 aȧ,
Γ033 = c−1 σ 2 sin2 θaȧ,
Γ101 = Γ110 = c−1 ȧ/a,
Γ111 = kσ/(1 − kσ 2 ),
Γ133 = −σ(1 − kσ 2 ) sin2 θ,
Γ122 = −σ(1 − kσ 2 ),
Γ202 = c−1 ȧ/a,
Γ212 = 1/σ,
Γ303 = c−1 ȧ/a,
Γ313 = 1/σ,
Γ233 = − sin θ cos θ,
Γ323 = cot θ.
La composante R1010 du tenseur de Riemann est donnée par
R1010
=
−Γ101,0
−
Γ110 Γ101
∂Γ101
=−
−
∂x0
ȧ
ac
2
= (ȧ2 /a2 c2 − ä/ac2 ) − ȧ2 /a2 c2 = −ä/ac2 .
De même les autres composantes valent R2020 = R3030 = −ä/ac2 et R0000 = 0. On
en déduit la composante 00 du tenseur de Ricci,
R00 = R0000 + R1010 + R2020 + R3030 = −3ä/ac2
et de même R11 = R0101 + R1111 + R2121 + R3131 = T /(1 − kσ 2 ) avec T =
2k + aä/c2 + 2ȧ2 /c2 . Les autres composantes diagonales valent R22 = T σ 2 et
R33 = T σ 2 sin2 θ. Cela permet de calculer le scalaire de Ricci,
R = g µν Rµν
= g 00 R00 + g 11 R11 + g 22 R22 + g 33 R33
= −6S/a2
avec S = k + aä/c2 + ȧ2 /c2 . Finalement, le tenseur d’Einstein,
Gµν = Rµν − 12 gµν R,
a pour composantes 00 et 11
G00 = 3ȧ2 /a2 c2 + 3k/a2 ,
G11 = −
k + 2aä/c2 + ȧ2 /c2
.
1 − kσ 2
48
Mis à jour le 14 Décembre 2012
On en déduit les composantes correspondantes des équations d’Einstein,
3
ȧ2 (t)
c2
+ 3k 2
− c2 Λ = 8πGρ(t),
2
a (t)
a (t)
c2
ä(t) ȧ2 (t)
− 2
−k 2
+ c2 Λ = 8πGp(t)/c2 .
−2
a(t) a (t)
a (t)
(4.14)
Les autres composantes n’apportent pas d’information supplémentaire. Ces
équations ont été découvertes par Friedmann en 1922 dans le cas p = 0 puis
généralisées à pression non nulle par Lemaı̂tre en 1927. On réserve parfois le terme
d’équation de Friedmann à la première équation seulement aussi appelée équation
de l’énergie, la seconde étant alors appelée équation de Raychaudhuri ou équation
de l’accélération.
Il est remarquable de noter que les équations de Friedmann prennent une forme
identique à celle des équations obtenues dans le cadre purement newtonien (45) . Les
deux équations ci-dessus peuvent effectivement être écrites
1 2
4
1
1
ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2
2
3
6
2
1
4
ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t).
3
3
La première exprime la conservation de l’énergie totale et la seconde la loi
fondamentale de la dynamique. Ces équations montrent que le paramètre de
courbure k est analogue (au signe près) à la densité d’énergie totale et que la
(45)
Rappelons les grandes lignes du raisonnement : Considérons une sphère comobile avec le fluide
cosmique, de rayon σa. Si la courbure et les vitesses locales sont faibles, la dynamique newtonienne
et la gravitation newtonienne peuvent s’appliquer, de sorte que l’énergie cinétique par unité de
masse d’un point de la sphère vaut 12 (σ ȧ)2 . De même, la densité d’énergie gravitationnelle due au
contenu de la sphère vaut −M (σa)G/σa avec M (σa) = 43 πρσ 3 a3 la masse de la sphère comobile
(ce qui est à l’extérieur ne contribue pas en symétrie sphérique en raison du théorème de Gauss,
ou plutôt du théorème de Birkhoff dans le contexte de la relativité générale). La conservation
de l’énergie totale locale s’écrit 21 σ 2 ȧ2 − 34 πGρσ 2 a2 = const. Si l’on choisit d’écrire la constante
2
2
const. = − 21 kσ 2 c2 , on obtient 3 ȧ
+ 3k ac 2 = 8πGρ. On voit que k détermine le signe de la courbure
a2
de l’Univers, mais dans la limite newtonienne, c’est également k qui détermine le signe de l’énergie
totale de la matière dans l’Univers.
Tableau 4.1 Courbure et énergie totale de l’Univers pour des modèles à pression
nulle et sans constante cosmologique.
k
courbure
énergie totale
+1
0
−1
positive
plate
négative
négative
nulle
positive
Si l’on multiplie cette dernière équation par a3 et que l’on différentie par rapport à t, il vient
d
6äȧa + 3ȧ3 + 3kc2 ȧ = dt
(8πGρa3 ), soit, en utilisant aussi la seconde équation de Friedmann
qui montre que le membre de gauche s’annule,
d
dt
4πGρa3
3
= 0. Cette équation exprime que la
masse totale dans la sphère comobile est constante. En d’autres termes, les équations de Friedmann
à pression nulle et sans constante cosmologique sont équivalentes, dans la limite newtonienne, à la
conservation de l’énergie et à l’équation de continuité.
Cosmologie
49
constante cosmologique joue le rôle d’une force répulsive (“énergie potentielle” dont
le minimum est rejeté en a → ∞), comme on l’obtient facilement dans un traitement
newtonien.
Il reste à résoudre le problème de la dépendance de la pression avec la densité
et pour cela il faut encore une équation d’état p = p(ρ) qui suppose une forme
particulière de matière dominant l’Univers ou la connaissance des diverses formes
possibles d’énergie dans l’Univers.
On obtient alors (cf. l’histoire sommaire de l’Univers ci-après) les évolutions
en a(t) ∼ t2/3 pour le modèle MDU (Matter Dominated Universe), en a(t) ∼ t1/2
pour le modèle RDU (Radiation Dominated Universe), et en exponentielle pour le
modèle “ΛDU” (cf. ci-dessous). On définit la densité critique ρc (t) dans l’Univers
à un instant donné comme celle qui correspond à une énergie totale (ou courbure)
nulle (cas limite entre un Univers fermé (cette énergie totale serait négative) et un
Univers ouvert (elle serait positive)), en l’absence de constante cosmologique, soit
ρc (t) = 3H 2 (t)/8πG, H(t) ≡ ȧ(t)/a(t).
Pour obtenir l’équation de conservation, on peut dériver la première des deux
équations ci-dessus, on obtient un terme en ȧä que l’on divise par aȧ pour pouvoir
utiliser la seconde équation de Friedmann dans laquelle le terme en ȧ2 /a2 est ensuite
éliminé à l’aide de la première équation de Friedmann. Il reste finalement l’équation
de continuité
ρ̇(t) + 3(ρ(t) + p(t)/c2 )
ȧ(t)
= 0.
a(t)
Histoire sommaire de l’Univers
⊲ Univers dominé par la matière (MDU). Dans le cas d’un Univers “de
poussière”, c’est-à-dire composé de matière non relativiste uniquement, la relation
de continuité devient
d
(ρ(t)a3 ) = ρ̇(t)a3 + 3ρ(t)a2 ȧ = 0.
dt
Cette expression traduit la conservation de la masse contenue dans la sphère en
expansion. Elle permet de donner une forme asymptotique simplifiée de l’évolution
temporelle de a. Supposons une forme a(t) ∼ tα , la compatibilité des deux termes
dans l’expression de conservation de l’énergie, avec la dépendance ρ(t) ∼ a−3 déduite
de la loi de conservation, conduit à une énergie cinétique en t2(α−1) et une énergie
potentielle en t−3α+2α . On en déduit α = 2/3,
a ∼ t2/3 .
Cette expression est satisfaite par les modèles d’Univers dominés par la matière,
c’est-à-dire lorsque ρ(t) = ρM (t) est la densité de matière (non relativiste comme on
le verra un peu plus loin). La puissance α < 1 traduit la décélération de l’expansion
de l’Univers (les courbes a(t) ont une courbure négative).
50
Mis à jour le 14 Décembre 2012
Figure 4.4 Diverses dynamiques d’univers permises (Harrisson).
Cosmologie
51
⊲ Dynamique d’un Univers dominé par le rayonnement (RDU). En
négligeant la matière non relativiste, on peut considérer le cas d’un Univers ne
comportant comme énergie que celle associée au rayonnement électromagnétique
(ce
p
cas décrit également la matière ultra-relativiste pour laquelle E = |p2 |c2 + m2 c4 ≃
|p|c.). Dans ce cas, la densité d’énergie est donnée par la loi de Stefan ρR c2 = σT 4
(l’indice R est ici pour rayonnement ou pour relativiste) et l’équation d’état du fluide
de photons par
p=
1 4 1
σT = ρR (t)c2 .
3
3
L’équation de continuité tenant compte de la pression devient
ρ̇R (t) = −4ρR (t)
ȧ
a
d’où l’on déduit une variation ρR (t) ∼ a−4 , différente de ρM (t) ∼ a−3 pour la densité
de matière non relativiste. Dans les deux cas, l’expansion conduit à une dilution de
la densité d’énergie. Le comportement asymptotique de a(t) se déduit de nouveau
de la compatibilité de la conservation de l’énergie avec une loi en tα qui demande
cette fois que les deux termes en t2(α−1) et t−4α+2α soient comparables, soit α = 1/2
et
a ∼ t1/2 .
Un Univers dominé par le rayonnement voit également son expansion décélérer, mais
la dynamique est différente de celle de l’Univers dominé par la matière.
⊲ Le rôle de la constante cosmologique (ΛDU). Ce qu’Einstein a
initialement conçu comme une difficulté des modèles cosmologiques est le fait
qu’ils soient non statiques. Il a alors introduit la constante cosmologique. La limite
newtonienne des équations d’Einstein conduit ainsi à l’équation de Poisson modifiée
~ 2 ψ(a) = 4πGρ(a) − Λc2 .
∇
La contribution ψΛ (a) de la constante cosmologique au potentiel gravitationnel est
d2
2
alors solution de a1 da
2 (aψΛ (a)) = −Λc , soit encore
1
ψΛ (a) = − Λc2 |a|2 .
6
Il correspond à ce potentiel un champ de gravitation répulsif si Λ > 0, GΛ (a) =
(c’est aussi la force par unité de masse). La constante Λ joue ainsi le rôle
d’une force source d’expansion qui peut s’opposer à la gravitation et permet de
restaurer un Univers statique. En effet, pour une énergie totale nulle (Univers plat),
la conservation de l’énergie devient
+ 13 Λc2 a
1 2 4πGρa2
1
ȧ −
− Λc2 a2 = 0,
2
3
6
de sorte que la constante
de Hubble peut être nulle si l’on impose la valeur de
p
8πGρ/3(1 + Λc2 /8πGρ)1/2 = 0. Une dizine d’années après
Λ, ȧ/a = H =
52
Mis à jour le 14 Décembre 2012
l’introduction par Einstein de la constante cosmologique (1917), l’observation
montrera que l’Univers n’est pas statique, mais en expansion (Slipher 1925, Lemaı̂tre
1927, Hubble 1929) et la condition ci-dessus deviendra caduque.
⊲ Histoire de l’Univers. Les quelques éléments fournis dans les sections
précédentes permettent de discuter en termes simples de l’histoire de l’Univers. Dans
le cas k ≤ 0 qui nous intéresse davantage car on verra que les observations favorisent
ce scénario pour notre Univers, le facteur d’échelle a(t) est une fonction monotone,
croissante, mais dont la vitesse diminue (on peut définir un paramètre de décélération
q = −äa/ȧ2 ∼ −(α−1)/α > 0 si α < 1 (46) .). Dans le passé, a(t) était donc plus petit
que sa valeur actuelle. L’Univers actuel est dominé par la matière, mais lorsqu’on
remonte dans le passé, comme ρR (t) a décru plus rapidement que ρM (t), l’Univers a
été dominé par le rayonnement.
Il y a eu un moment particulier qu’on appelle découplage matière-rayonnement
ou recombinaison où les deux formes de densité d’énergie ont été du même ordre (47)
. L’Univers a donc été plus dense, plus chaud, d’abord gouverné par une expansion
en a ∼ t1/2 à l’époque où le rayonnement et les particules relativistes étaient
responsables de la dynamique de l’Univers, puis par une expansion un peu plus
rapide en a ∼ t2/3 après la recombinaison lorsque c’est la matière non relativiste qui
a joué un rôle dominant pour la dynamique.
Notons que lors de la phase dominée par le rayonnement, la vitesse d’expansion a
divergé à l’origine, puisque ȧ ∼ (2t)−1/2 → ∞ lorsque t → 0. Ce serait une difficulté
essentielle dans une interprétation newtonienne car dans la phase primordiale de
l’Univers, la vitesse relative des objets aurait dépassé celle de la lumière, en
contradiction avec la causalité relativiste. On est alors amené à supposer que la
validité du modèle ne s’étend pas, en remontant le temps, aux instants initiaux.
Cette difficulté précise est levée dans le cadre relativiste car la vitesse en question
est celle de l’expansion du facteur d’échelle qui caractérise la dynamique de l’espacetemps, mais cela ne permet pas de communiquer entre différentes régions spatiales à
des vitesses supérieures à c. Notons que cela soulèvera un autre problème appelé
problème de l’horizon. En revanche on se heurtera toujours à une impossibilité
d’étendre la théorie à t → 0, mais cette fois pour des raisons d’invalidité des théories
quantiques, non testées à ces énergies, davantage que de causalité.
⊲ Paramétrisation Ω. Si l’on rejette le terme cosmologique du côté matière
(au second membre de l’équation d’Einstein), on peut l’écrire comme dû à un fluide
équivalent de densité ρΛ et de pression pΛ tel que
Λg µν =
8πG
[(ρΛ + pΛ /c2 )v µ v ν − pΛ g µν ]
c4
à condition de poser l’équation d’état
pΛ = −ρΛ c2 ,
ρΛ =
Λc2
.
8πG
Il est alors possible d’écrire les équations de Friedmann et l’équation de continuité
(cette dernière étant d’ailleurs inchangée) en faisant uniquement intervenir les
(46)
Nous verrons cependant que des mesures récentes montrent que q < 0 pour notre Univers.
Ici encore en toute rigueur on doit distinguer la recombinaison, c’est-à-dire la disparition
des électrons libres et la formation d’états liés avec les noyaux (les atomes !) et le moment
de la transition d’un Univers dominé par la rayonnement à un Univers dominé par la matière.
Cependant ces deux phases de l’Univers sont très proches (environ 105 ans après le Big Bang) et
donc assimilables en première approximation.
(47)
Cosmologie
53
densités, soit
1 2
4
1
ȧ (t) − πG(ρ(t) + ρΛ )a2 (t) = − kc2
2
3
2
4
ä(t) = − πG(ρ(t) + ρΛ + 3(p(t) + pΛ )/c2 )a(t),
3
ȧ(t)
= 0.
ρ̇(t) + 3(ρ(t) + p(t)/c2 )
a(t)
Figure 4.5 Evolution de l’Univers.
On peut maintenant exprimer la première équation de Friedmann en termes
de la paramétrisation en Ω qui ramène les densités à leur valeur critique, avec
la densité critique de référence à l’époque actuelle ρc0 = ρc (t0 ) = 3H02 /8πG. On
écrit la première équation de Friedmann comme ȧ2 (t) = (8πG/3)[(ρM (t) + ρR (t) +
ρΛ (t))a2 (t) − 3kc2 /8πG] où la densité ordinaire a été décomposée en matière et
rayonnement, puis on exprime ces densités comme ρM (t) = ρM (t0 )(a(t0 )/a(t))3 =
ρc (t0 )ΩM (t0 )(a(t0 )/a(t))3 , ρR (t) = ρR (t0 )(a(t0 )/a(t))4 = ρc (t0 )ΩR (t0 )(a(t0 )/a(t))4 ,
ρΛ (t) = ρΛ (t0 ) = ρc (t0 )ΩΛ (t0 ). On peut également définir un paramètre Ωk associé à
la courbure, de sorte que −3kc2 /8πGa2 (t) = ρc (t0 )Ωk (t0 )(a(t0 )/a(t))2 . Finalement,
on pose
ΩM (t0 ) =
8πGρM (t0 )
,
3H02
ΩR (t0 ) =
8πGρR (t0 )
,
3H02
Ωk (t0 ) = −
k
,
H02 a20
ΩΛ (t0 ) =
Λc2
,
3H02
et l’équation de Friedmann devient
a40
a20
a30
2
2
+ ΩR (t0 ) 4
+ Ωk (t0 ) 2
+ ΩΛ (t0 ) .
H (t) = H0 ΩM (t0 ) 3
a (t)
a (t)
a (t)
54
Mis à jour le 14 Décembre 2012
Une conséquence immédiate de cette équation est qu’elle s’écrit comme une “règle
de somme cosmique” à l’instant présent, ΩM (t0 ) + ΩR (t0 ) + Ωk (t0 ) + ΩΛ (t0 ) = 1.
Les cosmologistes établissent une classification des divers modèles possibles
d’univers en fonction des valeurs prises par les paramètres caractéristiques,
notamment la courbure et la constante cosmologique. C’est la comparaison entre
les éléments dynamiques issus de l’observation (constante de Hubble et paramètre
de décélération notamment) et les prédictions déduites des divers modèles qui permet
ensuite de valider tel modèle et par conséquent tel contenu énergétique de l’Univers.
Cosmologie
55
5
Le modèle Lambda-CDM
On se propose ici de montrer comment les paramètres de l’Univers sont mesurables
et de souligner le rôle particulier joué par la constante cosmologique, puis d’insister
sur la situation singulière de l’Univers actuel.
Les éléments essentiels du modèle ΛCDM
Le modèle d’Univers est essentiellement gouverné par les paramètres
– de courbure, k,
– de densité de matière, ρ, pour laquelle on distingue en général la matière
relativiste ou rayonnement (on parle également de matière chaude, hot
matter, ρHM ), et la matière non relativiste (on parle également de matière
froide, cold matter, ρCM ),
– de constante cosmologique, Λ.
On choisit en général d’écrire la constante cosmologique sous la forme d’une
densité ρΛ = Λ/8πG de sorte qu’il apparaı̂t trois contributions essentielles à la
densité, chacune obéissant à une équation d’état différente,
ρ(t) = ρHM (t) + ρCM (t) + ρΛ (t),
1
ρ c2 ,
3 HM
= 0,
pHM =
pCM
pΛ = −ρΛ c2 .
Pour chaque modèle d’Univers (c’est-à-dire des proportions relatives des trois types
de matière), on calcule la dynamique que l’on compare aux mesures pour sélectionner
les caractéristiques de l’Univers actuel.
56
Mis à jour le 14 Décembre 2012
Paramètres mesurables
On considère une étoile située en σ dans le référentiel comobile, observée depuis la
Terre à σ = 0. La métrique est celle de FLRW,
ds2 = c2 dt2 − a2 (t)
dσ 2
2
2
.
+
σ
dΩ
1 − kσ 2
L’axe Terre-étoile est choisi comme référence de sorte que θ = ϕ = 0 et l’intervalle
devient
ds2 = c2 dt2 − a2 (t)
dσ 2
.
1 − kσ 2
⊲ Les distances. Une première notion de distance est la distance propre dp (t).
Comme en relativisté restreinte, c’est la distance entre deux points “mesurée” au
dσ 2
même instant, soit ds2 = −a2 (t) 1−kσ
2 . La distance propre définie positive (disons à
t0 ) entre l’étoile et la Terre vaut
Z σ
Z p
dσ
√
= a(t0 )Ak (σ)
− ds2 = a(t0 )
dp (t0 ) =
1 − kσ 2
0
où
Ak (σ) =
(
Arcsin σ
σ
Argsinh σ
si k = 1
si k = 0
si k = −1
On peut ensuite en déduire la loi de Hubble de la manière suivante :
d˙p (t0 ) = ȧ(t0 )Ak (σ) = H0 dp (t0 )
avec H0 = ȧ(t0 )/a(t0 ). On en déduit notamment la distance de Hubble qui mesure
l’Univers observable, comme la distance dH (t0 ) au-delà de laquelle la vitesse de
récession des galaxies dépasse c, soit dH (t0 ) = c/H0 . Avec la valeur H0 = 70 ±
7 km.s−1 .Mpc−1 , on obtient
dH (t0 ) = 4300 ± 430 Mpc.
Une autre expression de la distance propre peut être obtenue en considérant
maintenant que l’étoile en σ émet un signal lumineux à t = tém. reçu sur Terre à t0 .
dσ 2
Il s’agit d’une trajectoire radiale du genre lumière, soit ds2 = c2 dt2 −a2 (t) 1−kσ
2 = 0
ou encore
c dt
dσ
=√
.
a(t)
1 − kσ 2
R σ dσ
= Ak (σ) et dp (t0 ) = a(t0 )Ak (σ), on peut ré-exprimer
Comme par ailleurs 0 √1−kσ
2
dp (t0 ) = a(t0 )
Z
t0
tém.
c dt
.
a(t)
Cosmologie
57
Il est conventionnel de donner un nom aux premiers coefficients du
développement de Taylor du facteur d’échelle,
a(t) = a(t0 ) + (t − t0 )ȧ(t0 ) + 12 (t − t0 )2 ä(t0 ) + . . .
= a(t0 )(1 + H0 (t − t0 ) − 21 q0 H02 (t − t0 )2 + . . .)
en ajoutant des indices 0 aux valeurs présentes. q0 est le paramètre (sans dimension)
de décélération,
q0 ≡ −ä(t0 )a(t0 )/ȧ2 (t0 ) = −ä(t0 )/H02 a(t0 ).
(5.1)
On peut effectuer
R t0 c dt un développement de Taylor de l’inverse du facteur d’échelle pour
exprimer t a(t) en puissances de t0 − tém. ,
ém.
a−1 (t) = a−1 (t0 )(1 − H0 (t − t0 ) + (1 +
q0 2
)H0 (t − t0 )2 + . . .)
2
On en déduit
1
q
1
dp (t0 ) = c(t0 − tém. ) + cH0 (t0 − tém. )2 + (1 + 0 )cH02 (t0 − tém. )3 + . . .
2
3
2
La valeur du “redshift” z est également accessible à l’expérience,
z=
λobs − λém
λém
et sa forme en fonction de tobs − tém fait intervenir des paramètres fondamentaux.
Pour montrer cela, considérons comme précd́edemmant que nous sommes à l’origine
du référentiel comobile, σ = 0, et qu’un signal lumineux issu d’une galaxie située
en σém (fixé) émis à l’instant tém nous parvient à tobs . Le signal émis à la période
suivante est émis à l’instant tém +∆tém et nous arrive à tobs +∆tobs . Ces deux signaux
parcourent des intervalles de genre lumière,
0 = dt2 − a2 (t) dσ 2 /c2 (1 − kσ 2 )
de sorte qu’il vient les deux égalités
Z
tobs
tém
dt
1
=−
a(t)
c
Z
0
σém
dσ
√
1 − kσ 2
et
Z
tobs +∆tobs
tém +∆tém
dt
1
=−
a(t)
c
Z
0
σém
dσ
√
.
1 − kσ 2
On voit que cela entraı̂ne l’égalité des deux premiers membres, et comme les
intervalles ∆t sont arbitrairement petits, on peut négliger la dépendance temporelle
du facteur d’échelle dans les intégrales et il vient simplement
tobs
t
t + ∆tobs
t + ∆tém
− ém = obs
− ém
a(tobs ) a(tém )
a(tobs )
a(tém )
58
Mis à jour le 14 Décembre 2012
soit
∆tobs
∆tém
−
= 0.
a(tobs ) a(tém )
En multipliant les ∆t par c pour avoir les longueurs d’onde, on obtient le redshift
z = (λobs − λém )/λém ,
z = a(tobs )/a(tém ) − 1.
(5.2)
On peut ainsi réexprimer le redshift
z = H0 (t0 − tém ) + (1 + 12 q0 )H02 (t0 − tém )2 .
En formant également z 2 , cette expression est inversible, pour donner
t0 − tém = H0−1 z(1 − (1 +
q0
)z) + O(z 3 )
2
soit finalement la distance propre exprimée en fonction du redshift
dp (t0 ) =
1 + q0
cz
1−
z + O(z 2 ) .
H0
2
On constate que la relation linéaire dp ∼ z vaut uniquement dans la limite où les
2
.
redshifts sont faibles, typiquement z ≪ 1+q
0
Les observations astronomiques ne permettent pas la détermination directe de
la distance propre qui nous sépare d’une étoile ou d’une galaxie. On mesure la
luminosité apparente ℓ, luminosité par unité de surface vue depuis la Terre, ce qui
permet de définir une quantité homogène à une longueur, la distance de luminosité,
dl , par la relation
L = 4πd2l ℓ
à condition de connaı̂tre une estimation de la luminosité absolue ou intrinsèque,
L. Cette estimation est possible pour les chandelles
standard, que nous discuterons
p
au paragraphe suivant. La quantité dl = L/4πℓ prend effectivement le sens de
distance à laquelle un objet de luminosité absolue L produit une luminosité par
unité de surface de ℓ dans un espace euclidien statique. Dans le cas d’un espace
éventuellement courbe et en expansion, deux corrections sont nécessaires. D’une part
l’effet de courbure, qui produit une correction géométrique et d’autre part l’effet de
l’expansion. Pour exprimer la correction géométrique, considérons le cas d’une sphère
de rayon a sur laquelle on trace un cercle autour de l’axe des pôles. Le périmètre de
ce cercle est donné par 2πa sin σ si σ est l’angle d’un point du cercle par rapport à
l’axe des pôles, soit en fonction du “rayon” r = aσ mesuré sur la surface sphérique,
2πa sin(r/a). Ce résultat vaut pour un espace de courbure positive. Dans le cas
général, on a un périmètre de 2πrSk (σ) avec Sk (σ) = σ −1 sin σ pour k = 1, 1 pour
k = 0 et σ −1 sinh σ pour k = −1. On peut généraliser cette relation à une relation
similaire entre distance de luminosité et distance propre, dl (t0 ) = dp (t0 )Sk (σ). Une
seconde correction provient de l’expansion de l’Univers. Il y a tout d’abord un effet
d’augmentation des longueurs d’onde, puisqu’un photon de longueur d’onde λém
Cosmologie
59
émis lorsque le facteur d’échelle de l’Univers est a(tém ) à tém est mesuré à t0 avec
une longueur d’onde λ0 telle que λ0 /a(t0 ) = λém /a(tém ), soit λ0 = (1 + z)λém . Les
énergies hc/λ varient dans les proportions inverses, soit E0 = Eém /(1 + z). Un
deuxième effet de l’expansion vient s’ajouter si l’on tient compte du changement de
distances entre l’émission et la reception de deux photons successifs. Supposons deux
photons émis par la galaxie lointaine à des instants séparés de ∆tém . Il correspond
à ces deux instants un intervalle dsém = c∆tém qui, comme la longueur d’onde, sera
augmenté par l’expansion par un facetur 1 + z au moment de la réception à t0 , soit
ds0 = c∆tém (1 + z). Cela signifie que les deux photons sont absorbés sur Terre à des
intervalles ∆tém (1 + z). Lorsque l’on combine les deux effets liés à l’expansion, on
voit que la luminosité apparente est diminuée d’un facteur (1 + z)2 par rapport à sa
valeur en l’absence d’expansion. Courbure et expansion permettent donc d’écrire la
luminosité apparente comme
ℓ(t0 ) =
L
L
=
2
2
2
4πdl (t0 )
4πdp (t0 )Sk (σ)(1 + z)2
et finalement, il vient entre la distance de luminsoité et la distance propre la relation
dl (t0 ) = dp (t0 )Sk (σ)(1 + z).
Connaissant le développement de la distance propre en fonction du redshift, on a
dl (t0 ) =
cz
1 − q0
1+
z + O(z 2 ) .
H0
2
Les deux distances coı̈ncident aux z petits.
⊲ Magnitudes. La magnitude est définie par
m = −2.5 log10
ℓ
ℓx
où ℓx = 2.53 10−8 W.m−2 est une luminosité de référence. Le choix des facteurs
numériques dans cette expression permet de classer les étoiles visibles à l’œil nu sur
une échelle de 1 à 6, comme cela avait été imaginé par Ptolémée et Hipparcos sur la
base de l’observation d’un millier d’étoiles. Si l’on passe à une expression en fonction
de la distance de luminosité, on obtient
m = 2.5 log10
4π 2.53 10−8
cz
1 − q0
+ 5 log10 dl + 5 log10
z)
+ 5 log10 (1 +
L
H0
2
de sorte que la courbe de m en fonction de z donne accès, pour peu que l’on connaisse
la luminosité intrinsèque L, aux paramètres cosmioques H0 et q0 .
A titre d’exemple; les SNIa ont un luminosité intrinsèque de L = 12.1 1035 W
(soit 4.109 L⊙ ). Une SNIa de redshift z = 0.2 a une luminosité apparente de
ℓ = 1.328 10−16 W.m−2 . Cela correspond dans un espace plat à d = l = 871 Mpc,
dp = 725 Mpc, m = 20.7. Pour une SNIa de redshift z = 1 a une luminosité apparente
de ℓ = 3.041 10−18 W.m−2 . Cela correspond à d = l = 5760 Mpc, dp = 2880 Mpc,
m = 24.8.
60
Mis à jour le 14 Décembre 2012
⊲ Chandelles standard. Les chandelles standard sont des “objets” (étoiles,
galaxies) dont la luminosité intrinsèque est calibrée, de sorte que de la mesure de leur
luminosité apparente on peut déduire leur distance. Les Céphéı̈des sont des étoiles
variables géantes ou supergéantes jaunes (4 M⊙ − 15 M⊙ , 100 L⊙ − 30 000 L⊙ ). Leur
éclat varie de 0.1 à 2 magnitudes de manière périodique en raison de variations de
surface et de température de surface (période comprise entre 1 et 135 jours) et la
période est directement corrélée à la luminosité. La distance des Céphéı̈des les plus
proches est accessible à des mesures de parallaxe, de sorte que l’on peut calibrer la
luminosité intrinsèque sur la la périodicité de l’éclat.
Figure 5.1
gauche).
Variation de luminosité apparente d’une Céphéı̈de (δ−Céphéı̈de à
Figure 5.2 Relation période-luminosité pour les Céphéı̈des du super amas de la
Vierge.
Les campagnes d’observations de SNe Ia sont basées sur le fait que ce sont
des chandelles incroyablement lumineuses. Leur signature spectrale est parfaitement
caractérisée et même à des distances extrêmement grandes, elles sont suffisamment
brillantes pour être observables.
Cosmologie
61
Figure 5.3 L’étude des supernovæ Ia résulte de campagnes d’observation
systématique du ciel (figure extraite des Images de la Physique 2008).
Figure 5.4 Les supernovæ Ia sont des objets extrêmement lumineux et qui ont
des signatures spectrales caractéristiques comme en atteste la figure (extraite des
Images de la Physique 2008).
Les supernovæ Ia sont formées à partir d’étoiles doubles associant une naine
blanche d’une masse de l’ordre de la masse solaire, qui “aspire” de la matière de son
compagnon de sorte que la naine blanche atteint la limite de Chandrasekhar, 1.3M⊙ ,
où elle se transforme en supernova selon un mécanisme suffisamment connu pour que
la luminosité intrinsèque soit appréciée convenablement à 4.109 L⊙ , c’est-à-dire à peu
près aussi brillante qu’une petite galaxie !
62
Mis à jour le 14 Décembre 2012
Figure 5.5 Une supernova presque aussi lumineuse que sa galaxie.
A des échelles intermédiaires entre les Céphéı̈des et les SNIa, certaines galaxies
servent également de chandelles standard et leur calibration est assurée au moyen
d’une relation connue comme loi de Tully-Fisher.
⊲ Paramètres mesurés. Plutôt que les courbes v vs d de Hubble, les
astronomes reportent en général aujourd’hui la magnitude effective m(z),
m = 2.5 log10
4π 2.53 10−8
cz
1 − q0
+ 5 log10 dl + 5 log10
z),
+ 5 log10 (1 +
L
H0
2
pour les chandelles standard en fonction du redshift. H0 dL (z) est donné par une
intégrale (48) déterminée par la métrique FRW, soit
1+z
Sk
H0 dL (z) = p
|Ωk |
"Z
p
|Ωk | dz ′
z
0
p
(1 + z ′ )2 (1 + z ′ ΩM ) − z ′ (2 + z ′ )ΩΛ
#
avec la fonction Sk (x) = x si k = 0, sin x si k = +1 et sinh x si k = −1 et où
ΩM =
8πGρM
,
3H02
ΩΛ =
Λ
,
3H02
Ωk = −
k
,
a20 H02
en négligeant complètement la contribution du rayonnement. De la mesure des
magnitudes, on peut par consq́uent déduire les paramètres cosmologiques H0 et
q0 .
(48)
cf. hep-ph/0004188.
Cosmologie
63
Figure 5.6 Illustration de la loi de Hubble déduite de l’observation des Céphéı̈des
dans le cadre du “Hubble Key Project” et comparaison avec d’autres chandelles
standard.
64
FAINTER
(Farther)
(Further back in time)
Mis à jour le 14 Décembre 2012
Perlmutter, et al. (1998)
24
effective mB
22
Flat
Supernova
Cosmology
Project
Λ=0
(ΩΜ,ΩΛ) =
( 0, 1 )
(0.5,0.5) (0, 0)
( 1, 0 ) (1, 0)
(1.5,–0.5) (2, 0)
26
20
18
Calan/Tololo
(Hamuy et al,
A.J. 1996)
16
14
0.02
0.05
0.1
redshift z
0.2
0.5
1.0
MORE REDSHIFT
(More total expansion of universe
since the supernova explosion)
In flat universe: ΩM = 0.28 [± 0.085 statistical] [± 0.05 systematic]
Prob. of fit to Λ = 0 universe: 1%
Figure 5.7 Diagramme de Hubble en 1998.
Il est à noter que l’estimation de ces paramètres a beaucoup évolué au cours du
XXème siècle.
Cosmologie
65
Figure 5.8 Evolution de l’estimation de la constante de Hubble.
Les paramètres H0 , q0 , de même que la courbure k, la valeur du rapport Ω de la
densité de l’Univers à la densité critique et la valeur de la constante cosmologique
Λ sont les paramètres qui définissent l’Univers. Précisons les valeurs présentes,
actuellement admises (49) :
H0 = 72 ± 8 km s−1 Mpc−1
Hubble Key Project
− 0.02 ≤ kc2 /a20 H02 ≤ 0.02
fluctuations du rayonnement cosmique à 3 K
τ0 = H0−1 = 1.36 ± 0.15 1010 années
ΩM = Ω0 = 8πGρ0 /3H02 = 0.3 ± 0.1
ΩΛ = λ0 = Λ/3H02 = 0.7 ± 0.2
structures à grande échelle
supernovæ Ia
Nous avons déjà précisé le rôle des campagnes de mesures basées sur l’observation
de supernovæ distantes dans la détermination des paramètres caractérisant la
dynamique de l’Univers et en particulier la qualité de la valeur obtenue pour
la constante cosmologique. On peut se reporter aux articles suivants : Cosmic
Concordance, [astro-ph/9505066], puis First Year Wilkinson Microwave Anisotropy
Probe (WMAP) Observations: Determination of Cosmological Parameters, [astroph/0302209] et plus récemment, Wilkinson Microwave Anisotropy Probe (WMAP)
Three Year Results: Implications for Cosmology, [astro-ph/0603449].
Les campagnes de mesures précises des paramètres Ω sont essentiellement basées,
outre l’analyse fine du fond de rayonnement cosmique, sur l’étude des grandes
structures et l’étude des supernovæ Ia a fort “redshift”. De ces mesures combinées,
il ressort les valeurs admises des paramètres de densité
ΩM = 0.275 ± 0.033
ΩR = 0.0010 ± 0.0005
ΩΛ = 0.72 ± 0.03
Ωk = 0.000025 ± 0.006500
d’où l’appellation de modèle Λ-CDM
(49)
Tirées de M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford 2004.
Nous reviendrons sur ces paramètres.
66
Mis à jour le 14 Décembre 2012
Figure 5.9 Les zones de confiance dans le plan ΩΛ − ΩM d’après les campagnes
de mesures de supernovæIa.
Figure 5.10 Les zones de confiance dans le plan ΩΛ −ΩM d’après les campagnes de
mesures combinées des supernovæIa, les fluctuations du fond diffus de rayonnement
cosmique et l’étude des grandes structures.
Cosmologie
67
L’inventaire cosmique
On a indiqué précédemment les valeurs expérimentales présentes, soit k ≃ 0,
ΩHM ≃ 0, ΩCM ≃ 0.3, ΩΛ ≃ 0.7. L’Univers est ainsi actuellement dominé par
la constante cosmologique et la matière froide. Comme la valeur de ΩCM est très
largement supérieure à la quantité visible de matière froide, on considère que
cette matière froide est sombre (ne rayonne pas) et on parle de cold dark matter
(cf. le chapitre sur les problèmes cosmologiques). Les candidats à cette matière
froide invisible sont hypothétiques (naines brunes, WIMPS (weakly interacting
massive particles), MACHOS (Massive Compact Halo Objects), . . . ). L’origine de
la constante cosmologique étant également sujette à interrogations, on parle souvent
d’énergie sombre (dark energy) car d’autres formes d’énergie qu’une simple constante
cosmologique Λ peuvent produire l’effet voulu (par exemple la quintessence). Le
modèle d’Univers qui prévaut actuellement est ainsi appelé modèle ΛCDM.
On reproduit ci-dessous certains de résultats obtenus par les analyses fines du
fond de rayonnement cosmologique extraits de astro-ph/0603449.
Tableau 5.1 Définition des paramètres cosmologiques [astro-ph/0603449].
Parameter
Description
Definition
H0
ωb
ωc
fν
P
Hubble expansion factor
Baryon density
Cold dark matter density
Massive neutrino fraction
Total neutrino mass (eV)
Effective number of relativistic neutrino species
Spatial curvature
Dark energy density
Matter energy density
Dark energy equation of state
H0 = 100h Mpc−1 km s−1
ωb = Ωb h2 = ρb /1.88 × 10−26 kg m−3
ωc = Ωc h2 = ρc /18.8 yoctograms/ m−3
fν = Ων /Ωc
P
mν = 93.104Ων h2
mν
Nν
Ωk
ΩDE
Ωm
w
For w = −1, ΩΛ = ΩDE
Ωm = Ωb + Ωc + Ων
w = pDE /ρDE
Tableau 5.2 ΛCDM Model.
WMAP+
SDSS
WMAP+
LRG
WMAP+
SNLS
WMAP +
SN Gold
WMAP+
CFHTLS
2.233+0.062
−0.086
0.1329+0.0056
−0.0075
2.242+0.062
−0.084
0.1337+0.0044
−0.0061
2.233+0.069
−0.088
0.1295+0.0056
−0.0072
2.227+0.065
−0.082
0.1349+0.0056
−0.0071
2.255+0.062
−0.083
0.1408+0.0034
−0.0050
0.085+0.028
−0.032
0.950+0.015
−0.019
0.079+0.028
−0.034
0.946+0.015
−0.019
0.088+0.026
−0.032
0.953+0.015
−0.019
Parameter
100Ωb h2
Ωm h2
0.709+0.024
−0.032
0.813+0.042
−0.052
0.723+0.021
−0.030
0.808+0.044
−0.051
τ
ns
0.079+0.029
−0.032
0.948+0.015
−0.018
0.709+0.016
−0.023
0.816+0.042
−0.049
σ8
Ωm
0.772+0.036
−0.048
0.266+0.026
−0.036
0.781+0.032
−0.045
0.267+0.018
−0.025
0.758+0.038
−0.052
0.249+0.024
−0.031
h
A
0.082+0.028
−0.033
0.951+0.014
−0.018
0.701+0.020
−0.026
0.827+0.045
−0.053
0.784+0.035
−0.049
0.276+0.023
−0.031
0.687+0.016
−0.024
0.846+0.037
−0.047
0.826+0.022
−0.035
0.299+0.019
−0.025
68
Mis à jour le 14 Décembre 2012
Tableau 5.3 The Cosmic Energy Inventory (beginning)d’après M. Fukugita et
P. J. E. Peebles, arXiv:astro-ph/0406095.
Content
Componentsa
dark sector
dark energy
dark matter
primeval gravitational waves
0.72 ± 0.03
0.23 ± 0.03
< 10−10
primeval thermal remnants
electromagnetic radiation
neutrinos
prestellar nuclear binding energy
10−4.3±0.0
10−2.9±0.1
−10−4.1±0.0
baryon rest mass
warm intergalactic plasma
intracluster plasma
main sequence stars (spheroids and bulges)
(disks and irregular)
white dwarfs
neutron stars
black holes
substellar objects
HI + HeI
molecular gas
planets
condensed matter
sequestered in massive black holes
0.040 ± 0.003
0.0018 ± 0.0007
0.0015 ± 0.0004
0.00055 ± 0.00014
0.00036 ± 0.00008
0.00005 ± 0.00002
0.00007 ± 0.00002
0.00014 ± 0.00007
0.00062 ± 0.00010
0.00016 ± 0.00006
10−6
10−5.6±0.3
10−5.4 (1 + ǫn )
primeval gravitational binding energy
virialized halos of galaxies
clusters
large-scale structure
binding energy from gravitational settling
baryon-dominated parts of galaxies
main sequence stars and substellar objects
white dwarfs
neutron stars
stellar mass black holes
galactic nuclei (early type)
(late type)
poststellar nuclear binding energy
main sequence stars and substellar objects
diffuse material in galaxies
white dwarfs
clusters
intergalactic
poststellar radiation
resolved radio-microwave
far infrared
optical
X-γ ray
gravitational radiation (stellar mass binaries)
(massive black holes)
a Based
on Hubble parameter h = 0.7.
Totalsa
0.954 ± 0.003
0.0010 ± 0.0005
0.045 ± 0.003
−10−6.1±0.1
−10−7.2
−10−6.9
−10−6.2
−10−4.9
−10−8.8±0.3
−10−8.1
−10−7.4
−10−5.2
−10−4.2 ǫs
−10−5.6 ǫn
−10−5.8 ǫn
−10−5.2
−10−5.8
−10−6.5
−10−5.6
−10−6.5
−10−6.2±0.5
10−5.7±0.1
10−10.3±0.3
10−6.1
10−5.8±0.2
10−7.9±0.2
10−9±1
10−7.5±0.5
Cosmologie
69
Tableau 5.4 The Cosmic Energy Inventory (end).
Componentsa
Content
Totalsa
10−5.5
stellar neutrinos
nuclear burning
white dwarf formation
core collapse
10−6.8
10−7.7
10−5.5
+0.6
−8.3−0.3
cosmic rays and magnetic fields
10
kinetic energy in the intergalactic medium
10−8.0±0.3
a Based
on Hubble parameter h = 0.7.
Tableau 5.5 Joint Data Set Constraints on Geometry and Vacuum Energy.
Data Set
ΩK
ΩΛ
WMAP + h = 0.72 ± 0.08
−0.003+0.013
−0.017
−0.037+0.021
−0.015
−0.0057+0.0061
−0.0088
−0.010+0.011
−0.015
−0.015+0.020
−0.016
−0.017+0.022
−0.017
0.758+0.035
−0.058
WMAP + SDSS
WMAP + 2dFGRS
WMAP + SDSS LRG
WMAP + SNLS
WMAP + SNGold
0.650+0.055
−0.048
0.739+0.026
−0.029
0.728+0.020
−0.028
0.719+0.021
−0.029
0.703+0.030
−0.038
Le rôle particulier de Λ
Revenons sur les solutions dans les cas simples et sur le succès de l’approche
newtonienne. A l’époque actuelle, la dynamique de l’Univers est dominée par la
matière froide, sans pression, et par la constante cosmologique. Les équations de
Friedmann et la loi de continuité prennent la forme générale
1 2
4
1
1
ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2
2
3
6
2
4
1
ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t),
3
3
a(t)
+ 3(ρ(t) + p(t)/c2 ) = 0.
ρ̇(t)
ȧ(t)
Nous avons vu que les valeurs admises des paramètres cosmologiques sont en
faveur d’un Univers plat k = 0 avec une constante cosmologique positive. Dans ce
cas, la première équation s’écrit encore
a30
2
2
+ ΩΛ (t0 ) .
H (t) = H0 ΩM 0 3
a (t)
a3
0
≫ ΩΛ0 dans l’Univers MDU soit
Aux instants t ≪ t0 , ΩM 0 a3 (t)
a(t)3 H(t)2 ≡ ȧ2 (t)a30 = H02 ΩM 0 a30
qui admet comme on l’a vu une solution de la forme
2/3
t
a(t) = a0
,
4/9t20 = H02 ΩM 0 .
t0
70
Mis à jour le 14 Décembre 2012
a3
0
En revanche aux temps t ≫ t0 , ΩM 0 a3 (t)
≪ ΩΛ0 , l’équation de Friedmann devient
H 2 (t) = H02 ΩΛ0
soit ȧ(t)/a(t) = H0
p
ΩΛ0 qui admet comme solution
a(t) = a0 exp H0
p
ΩΛ0 t.
Il est important de noter que le rôle de Λ est de produire tôt ou tard (dès que
la constante cosmologique l’emporte sur les formes ordinaires de gravitation) une
accélération de l’expansion de l’Univers. Le paramètre de décélération q doit donc
passer d’une valeur positive à une valeur négative et il est particulièrement singulier
de noter que ce changement dans notre Univers se produit précisément à notre
époque !
Etant donnée l’incertitude sur les valeurs des paramètres cosmologiques,
les ouvrages de cosmologie établissent en général une classification (appelée
Friedmanologie par Rich) des modèles d’Univers et de leur dynamique (modèles
plats (k = 0), modèles sans constante cosmologique (Λ = 0), modèles vides (ρ = 0),
etc). Nous nous limitons ici à un Univers plat avec constante cosmologique positive
et densité de matière sous-critique.
Cosmologie
71
6
Les “problèmes” cosmologiques
Il reste de nombreux problèmes et controverses en suspens en cosmologie
(notamment concenant le contenu de l’Univers - voir figure ci-dessous) et les
hypothèses pour y apporter des réponses sont parfois hardies. Nous évoquons dans
ce chapitre quelques-uns de ces problèmes.
72
Mis à jour le 14 Décembre 2012
Figure 6.1 Evolution du contenu de l’Univers dans le modèle ΛCDM (Hiranya
V. Peiris).
La matière sombre
La quantité de matière non relativiste compatible avec la dynamique de l’Univers
est de l’ordre de
ΩM ≃ 0.30.
Or on n’en observe qu’une infime partie sous forme d’étoiles ou de galaxies,
Ωvisible ≃ 0.003.
L’essentiel de la matière non relativiste est donc sombre (dark matter), mais reste à
être identifiée. La présence de matière sombre (c’est-à-dire non visible par des moyens
directs d’observation) dans les galaxies est attestée par les anomalies de courbes de
rotation des étoiles périphériques. En effet, les étoiles (brillantes) très périphériques
ont une vitesse essentiellement indépendante de leur distance au centre galactique.
Si l’essentiel de la masse d’une galaxie était concentré au voisinage de son centre,
on attendrait de la relation fondamentale de la dynamique v 2 (r)/r = GM (r)/r 2
qu’elle implique une loi de variation en inverse de la racine carrée de la distance
au centre, v(r) ≃ r −1/2 . Ce n’est pas du tout conforme à l’observation, et pour
rendre compatibles les observations avec la distribution de masse dans les galaxies,
on est amené à supposer l’existence de halos galactiques composés de matière sombre
distribuée suivant une loi empirique de la forme ρ(r) = const/(r 2 + r02 ).
Figure 6.2 Courbe de vitesse des étoiles périphériques.
Il reste encore à chercher (et à trouver) la matière dont ces halos sont constitués.
Parmi les candidats, les naines brunes sont des étoiles en fin de vie qui ont brulé leur
“carburant nucléaire” et sont donc à peine visibles dans le spectre électromagnétique.
Ces étoiles peuvent toutefois être mises en évidence de manière indirecte par les
Cosmologie
73
mirages gravitationnels qu’ils peuvent produire(50) . Une estimation réaliste de la
densité de matière associée à ces MACHOS (Massive Halo Compact Objects) reste
cependant très en-dessous de ce qui manque,
ΩMACHOS ≃ 0.04.
Finalement, il existe une autre façon d’estimer la quantité totale de matière non
relativiste dans l’Univers, à partir des modèles de nucléosynthèse primordiale (BBN
pour Bing Bang Nucleosynthesis) qui conduisent à des abondances relatives pour
les éléments légers paramétrés par la densité baryonique totale. Les abondances
observées sont compatibles avec
Ωbaryons ≃ 0.045.
Au total, on constate que la matière baryonique constitue à peine plus de 10%
de la matière froide qu’il semble nécessaire d’introduire dans l’Univers pour rendre
compte de sa dynamique à très grande échelle. Les physiciens, rarement à court
d’idées, ont alors émis l’hypothèse que d’autre particules, de nature non baryonique,
doivent peupler l’Univers en nombre. On les appelle des WIMPS (Weakly Interacting
Massice ParticleS), mais là encore; il reste à les trouver !
(50)
Si une étoile brune passe sur la ligne de visée depuis la Terre d’un rayon lumineux issu d’une
galaxie plus lointaine, elle est susceptible de courber la trajectoire suivie par les photons
74
Mis à jour le 14 Décembre 2012
Figure 6.3 Abondances relatives des éléments légers en fonction de la densité
baryonique de l’Univers.
Le “problème” de la constante cosmoλogique ou de l’énergie sombre
On s’intéresse à nouveau dans cette section à l’histoire de la constante
cosmologique,(51) évoquée précédemment. On pose tout d’abord les éléments factuels,
puis on donne les estimations quantitatives d’un désaccord maintenant célèbre (52) .
Rappelons qu’Einstein a modifié les équations de la gravitation relativiste,
Gµν =
8πG
T ,
c4 µν
par l’introduction au premier membre d’un terme −Λgµν qui respecte la covariance
relativiste(53) et compense l’effet de gravitation (si Λ > 0) permettant ainsi de
trouver des solutions pour un Univers statique à condition de fixer pour Λ une
valeur bien précise dépendant de la densité de l’Univers. La constante cosmologique
est homogène à l’inverse d’une longueur au carré et fixe une échelle universelle de
longueurs : la courbure d’un Univers vide de matière (la solution de de Sitter).
Rapidement, Friedmann puis Lemaı̂tre établiront que l’Univers statique d’Einstein
est instable. Au contraire, les équations d’Einstein admettent (avec ou sans Λ) des
solutions dynamiques pour un Univers en expansion ou en contraction. L’observation
de l’expansion (à partir du décalage systématique vers le rouge des galaxies éloignées)
par Slipher et Hubble fera dire à Einstein que la constante cosmologique est inutile.
Après Einstein, de nombreux physiciens théoriciens adopteront la même attitude
à l’égard de la constante cosmologique et s’en désintéresseront. Les astronomes
et cosmologistes seront en revanche attachés à l’existence du terme cosmologique,
notamment Eddigton, car sans sa présence les modèles conduisent à un Univers
trop jeune, plus jeune même que la Terre, et seule l’introduction du paramètre
supplémentaire Λ peut “vieillir” suffisamment l’Univers.
Récemment (1997) des mesures effectuées sur des supernovae lointaines
(supernova cosmology project) ont montré sans doute possible que l’expansion
de l’Univers s’accélère. Pour rendre compte d’une telle expansion accélérée, il est
indispensable d’avoir recours à la constante cosmologique, ce qui a suscité un regain
d’intérêt pour ce Λ, sa détermination expérimentale et son interprétation théorique.
Le terme cosmologique −Λgµν peut être rejeté au second membre sous la forme
+Λgµν =
8πG
2
c4 ρΛ c gµν
Gµν =
avec ρΛ =
Λc2
8πG
pour donner aux équations d’Einstein la forme
8πG
(Tµν + ρΛ c2 gµν ).
c4
Nous sommes en mesure d’estimer facilement une borne supérieure de ρΛ en notant
que la gravitation newtonienne est une très bonne approximation à l’échelle du
système solaire. Comme les effets de la constante cosmologique sont susceptibles de
(51)
S. Weinberg, The cosmological constant problem, Rev. Mod. Phys. 61, 1 (1989), P.J.E.
Peebles and B. Ratra, The cosmological constant and dark energy, Rev. Mod. Phys. 75, 559
(2003), N. Straumann, On the cosmological constant problems and the astronomical evidence for
a homogeneous energy density with negative pressure, astro-ph/0203330.
(52)
Je conseille également le site http://super.colorado.edi/~michaele/Lambda pour une très
agréable présentation des problèmes suscités par la constante cosmologique.
(53)
A l’origine, Einstein a utilisé la notation λ.
Cosmologie
75
se faire sentir aux grandes distances, on aura une valeur maximale en écrivant que
l’effet de ρΛ est négligeable devant celui de l’attraction gravitationnelle du Soleil
à l’échelle de Pluton par exemple. Le champ de gravitation exercé par le Soleil
au niveau de l’orbite de Pluton, rP = 5.9 · 1012 m, vaut G⊙ (rP ) = GM⊙ /rP2 . Celui
qu’exercerait une masse volumique uniforme ρΛ à cette même distance s’exprime par
GΛ (rP ) = GMΛ (rP )/rP2 = 4πρΛ GrP /3. En écrivant que cette seconde contribution
est négligeable devant la première, on obtient la borne supérieure suivante à la
densité de masse associée à la constante cosmologique,
ρΛ ≪
3M⊙
.
4πrP3
En introduisant les valeurs numériques on trouve(54)
ρΛ ≪ 2.3 · 10−9 kg.m−3 = 6.56 · 10−27 f −4 .
Des estimations beaucoup plus strictes se déduisent d’observations astronomiques
au-delà du simple système solaire et on admet une valeur de l’ordre de
ρΛ ≪ 10−26 kg.m−3 = 2.9 · 10−44 f −4 .
Revenons aux équations d’Einstein en présence du terme cosmologique. Le
dernier terme ρΛ c2 gµν est exactement la forme que prendrait le tenseur énergieimpulsion Tµν d’un fluide au repos(55) de pression pΛ = −ρΛ c2 . Il se trouve que
cette équation d’état est précisément celle que l’on attend de la densité (d’énergie)
associée au vide quantique(56) . En effet, si l’on exige que le vide quantique
(54)
Digression sur les unités “naturelles” (R.J. Adler, B. Casey and O.C. Jacob, Vacuum
catastrophe: an elementary exposition of the cosmological constant problem, Am. J. Phys. 63,
620 (1995)). On utilise fréquemment en physique des particules les unités naturelles dans lesquelles
les constantes c et h̄ valent toutes les deux 1. Cela permet en outre de n’avoir plus qu’une seule
unité fondamentale au lieu des trois dimensions usuelles M, L et T. Choisissons par exemple la
longueur comme dimension fondamentale et le fermi (1 f = 10−15 m) comme unique unité. On
peut alors introduire comme unité de temps le “jiffy” (j), durée que met la lumière pour parcourir
1 f (Notons qu’historiquement, le jiffy a été introduit par le chimiste Lewis qui avait déjà forgé
le terme de photon. C’était une unité de temps fantaisiste associée à la durée nécessaire à la
lumière pour parcourir 1 cm.). On a alors c = 1f.j−1 soit encore 1 j = 10−15 /3.108 s. Si l’on
pose maintenant c = 1 (sans dimension), alors les longueurs se mesurent en f, mais également les
durées car il faut que 1 j = 1 f pour que c soit adimensionnée. Considérons maintenant le cas
de h̄. Plutôt que les J.s, on peut choisir d’exprimer les durées en j (temporairement avant de les
éliminer de nouveau au profit des f) et les énergies en MeV, bien plus adaptés à l’échelle de la
physique subatomique. On a donc h̄ = 1.053 · 10−34 J.s = 1.053 × 3 · 10−11 J.j = 197 MeV.j. On
peut fixer une nouvelle unité d’énergie, le “blip” (b), telle que 1 b = 197 MeV. On a h̄ = 1 b.j.
Si l’on impose maintenant que h̄ = 1 (sans dimension), cela nécessite que 1 b = 1 j−1 = 1 f −1 .
On n’a plus que le fermi comme unité fondamentale. Les fréquences (E/h̄) se mesurent comme
les énergies en f−1 , les masses (E/c2 ) également, . . . . Les conversions utiles sont 1 m = 1015 f,
1 s = 3.1023 f, 1 J = 3.17 · 1010 f −1 . Pour exprimer une densité par exemple, on procède comme suit,
1 J = 1 kg.m2 s−2 = 3.17 · 1010 f −1 , soit 1 kg = 3.17 · 1010 × 10−30 × 9 · 1046 f −1 = 28.5 · 1026 f −1 .
On a ensuite 1 kg.m−3 = 28.5 · 1026 × 10−45 f −4 = 28.5 · 10−19 f −4 .
(55)
Rappelons que pour un fluide Tµν = (ρ + p/c2 )vµ vν − pgµν .
(56)
En mécanique quantique, les inégalités d’Heisenberg interdisent à tout système physique,
particule ou de manière générale degré de liberté quelconque, d’être au repos. Il s’ensuit que même
dans l’état de plus basse énergie subsiste une énergie résiduelle appelée énergie de point zéro. On
parle des fluctuations du vide quantique et pour des raisons fondamentales (invariance de Lorentz),
la densité d’énergie associée correspond à une équation d’état p = −ρc2 .
76
Mis à jour le 14 Décembre 2012
satisfasse aux contraintes relativistes, le tenseur énergie-impulsion associé, Tµν =
(ρ+p/c2 )vµ vν −pgµν , doit être covariant par transformation de Lorentz. Notamment
en considérant le référentiel tangent au référentiel propre du vide (vµ = (c, ~0)) dans
lequel la métrique est minkowskienne, gµν = ηµν = diag (1, −1, −1, −1), on a
Tµν

1
0
2
= (ρc + p)  0
0
0
0
0
0


1
0
0 − p0
0
0
0
0
0
0
0
0
0
−1
0
0
0
0
−1
0
 
0
ρc2
0 = 0
0   0
−1
0
0
p
0
0

0 0
0 0
p 0
0 p
soit finalemant
Tµν = ρc2 ηµν ,
si p = −ρc2 .
Cette équation d’état assure que le vide est invariant de Lorentz. Cette particularité
fait du vide quantique un concept très différent de la matière ordinaire ou du
rayonnement. Dans les autres domaines de la physique où seules les différences
d’énergie interviennent, l’énergie du vide n’a pas d’effet direct mais la situation est
très différente lorsque la gravitation intervient, puisque toutes les formes d’énergie
contribuent à la structure de l’espace-temps par le biais du tenseur énergie-impulsion
dans les équations d’Einstein. Cette observation très encourageante, formulée pour
la première fois par Pauli (57) , donne l’espoir de relier la constante cosmologique
(et les échelles de longueur de l’ordre de 1023 m) aux interactions fondamentales
qui régissent la physique des particules (et des échelles de l’ordre de 10−15 m). La
constante cosmologique trouverait ainsi une interprétation.
L’illusion est de courte durée, car la valeur estimée de la contribution de la
densité d’énergie du vide est 10120 fois plus importante que l’estimation associée à
la constante cosmologique mesurée par observations astronomiques. Pour la densité
d’énergie du vide quantique, on peut fournir une borne inférieure en précisant que la
théorie quantique des champs est vérifiée jusqu’à des échelles d’énergie de l’ordre
de 1014 GeV, puisque l’on mesure de telles énergies pour des photons issus du
rayonnement cosmique. Le vide possède donc une énergie 12 h̄ω par degré de liberté
(oscillateurs harmoniques) et l’on doit sommer sur ces oscillateurs pour obtenir
Evide =
X1
k
2
h̄ωk ,
où les ωk sont tels que h̄2 ωk2 = h̄2 k 2 c2 + m2 c4 , soit en unités naturelles ωk2 = k 2 + m2 .
Dans la limite des très hautes énergies (limite ultrarelativiste) on peut négliger la
masse. En considérant le vide établi dans une boı̂te cubique de taille L3 , la somme
sur les modes peut se calculer par une intégrale
X
k
(57)
L3
→
(2π)3
Z
kmax
4πk 2 dk
0
Voir l’article de N. Straumann, arXiv:0810.2213 ou celui de Bernardeau et Uzan dans les Images
de la Physique 2008.
Cosmologie
77
où le préfacteur tient compte de la quantification des valeurs permises pour k pour
garantir des conditions aux limites périodiques. On a alors
Evide =
X1
k
2
ωk =
Z
L3
(2π)3
kmax
0
Z
kmax
≃
L3
4π 2
=
k4
L3 max2 .
16π
1
4πk 2 dk (k 2 + m2 )1/2
2
k 3 dk
0
La coupure à 1014 GeV correspond à 5.1014 f −1 , soit une densité d’énergie associée au
vide de
Evide
> 4.2 × 1056 f −4 .
L→∞ L3
ρvide = lim
Cette valeur est évidemment sans aucun rapport avec celle de ρΛ . De nombreux
physiciens pensent même que le paramètre de coupure pertinent jusqu’où appliquer
les théories quantiques des champs est plutôt l’énergie de Planck de l’ordre de
1019 GeV, ce qui donne à la densité d’énergie de vide une borne inférieure encore
plus dramatique,
ρvide > 1076 f −4 !
Ce désaccord est la plus grande contradiction connue en physique et probablement dans toutes les sciences. Pour tenter de lever la difficulté, de nombreuses
hypothèses - répondant aux jolis noms de “supersymétrie”, “quintessence” - ont été
avancées, sans succès jusqu’à présent. Les théories de supersymétrie par exemple
élimineraient la difficulté d’un vide possédant une énergie considérable, car par un
mécanisme de compensation entre les fermions et les bosons en nombre identique
dans le cadre supersymétrique, l’énergie du vide est rigoureusement nulle. De nombreux théoriciens estiment très prometteuse cette voie à tel point qu’on en revient à
l’idée d’une constante cosmologique nulle ! A la question : How can the cosmological
constant be so close to zero but not zero?, Edward Witten (58) répond par exemple :
I really don’t know. It’s very perplexing that astronomical observations seem to show
that there is a cosmological constant. It’s definitely the most troublesome, for my
interests, definitely the most troublesome observation in physics in my lifetime. In
my career that is.
Le problème de la platitude
A l’aide de la paramétrisation en Ω, on a vu qu’il était possible d’écrire l’équation
de Friedmann (de “conservation” de l’énergie) comme une contrainte à tout instant
sur les diverses contributions rapportées aux valeurs critiques,
ΩM + ΩR + ΩΛ − 1 =
(58)
k
a2 H 2
.
Edward Witten est l’un des physiciens théoriciens les plus en vogue, récompensé par les
mathématiciens déjà avec la médaille Fields.
78
Mis à jour le 14 Décembre 2012
2
Cela découle en effet de la forme H 2 = 38 πG(ρ + ρΛ ) − kc
a2 dans laquelle ρ
représente les formes ordinaires de matière et de rayonnement et où l’on pose une
3kc2
contribution de courbure ρk = − 8πGa
2 . A chaque densité ρ est associé un rapport
8πGρ
Ω = 3H 2 d’où l’équation proposée. Or, on observe qu’actuellement la valeur de
ΩM (t0 ) + ΩR (t0 ) + ΩΛ (t0 ) ≃ 1 de sorte que le premier membre ΩM + ΩR + ΩΛ − 1
est essentiellement égal à zéro à l’époque actuelle. Au second membre a2 H 2 = ȧ2 ∼
t2(α−1) se comporte comme t−2/3 pour un univers MDU et comme t−1 dans le cas
RDU. Dans les deux cas, cela signifie que |Ω(t) − 1| ∼ |k|t2(1−α) est une fonction
croissante du temps (linéaire ou en t2/3 ) qui prend une valeur très proche de zéro
aujourd’hui, il faut donc qu’elle ait pris une valeur extraordinairement proche de
zéro dans le passé. Par exemple au moment de la nucléosynthèse promordiale ou
dans les tout débuts de l’Univers à l’échelle du temps de Planck, il faut avoir connu
des valeurs telles que
Ω(tNS ) = 1 ± 10−15
Ω(tPl ) = 1 ± 10−60
pour conduire aux valeurs observées aujourd’hui. Ces valeurs, bien que non
impossibles formellement présentent un problème sérieux (dit de fine tuning),
car tout écart infime (par exemple à la quatorzième décimale) aurait comme
conséquence qu’à l’époque présente l’univers serait totalement différent de celui que
nous observons. Reformulé différemment, pour que l’univers actuel soit plat comme
on l’observe actuellement, il faut qu’il ait été plat dans le passé avec un degré de
précision inexpliquable. Ce problème de condition initiale très particulière, s’il n’est
pas rédhibitoire en soi, doit pouvoir être expliqué par une modèle cosmologique
consistent.
Le problème de l’horizon
Le problème de l’horizon est d’une nature assez voisine, puisqu’il s’agit également
d’un problème de conditions initiales ad hoc. Lorsque l’on observe le fond diffus
de rayonnement cosmologique, il apparait d’une remarquable isotropie (une fois
effectuées les corrections Doppler dues aux mouvements locaux de la Terre). Or,
si l’on considère le cône de lumière passé d’un point situé ici et maintenant, et son
extension au moment où a été émis le fond de rayonnement cosmologique (on parle
de la surface de dernière diffusion), celle-ci est beaucoup plus étendue que la région
causale à la même époque. Cela soulève alors le problème de comprendre pourquoi
le fond de rayonnement cosmologique est si homogène, puisque deux régions du ciel
(typiquement distantes de plus de 1 ou 2 degrés) ne peuvent jamais avoir été en
contact causal et donc ne peuvent pas être en équilibre thermique.
Pour préciser quelques chiffres, la distance comobile parcourue par la lumière
2
(ds = c2 dt2 − a2 dσ 2 = 0 pour un univers plat) entre l’époque de l’émission du
CMB, tCMB et l’époque présente, t0 , est donnée par
σ0 = c
Z
t0
tCMB
dt
a(t)
et la distance propre correspondante à tCMB (σ est analogue à un angle) vaut
d0 = a(tCMB )σ0 .
Cosmologie
79
Entre tCMB et t0 , on peut considérer que l’Univers est dominé par la matière,
a(t) ∼ t2/3 , de sorte qu’en écrivant a(t) = a(tCMB )(t/tCMB )2/3 il vient
Z t0
dt
1
1
(tCMB )2/3
(tCMB )2/3 [3t1/3 ]tt0CMB
σ0 = c
=
2/3
a(tCMB )
a(t
)
t
tCMB
CMB
et la distance propre vaut
1/3
d0 ≃ 3c(tCMB )2/3 t0 .
En utilisant les valeurs numériques tCMB ≃ 3.105 ans, t0 ≃ 13.7 109 ans et 1 pc=3.26 al,
il vient d0 ≃ 32 Mal = 9.9 Mpc. C’est la taille de la zone qui à l’époque du CMB a
produit la totalité de l’Univers actuellement observable.
En revanche, la taille de l’horizon causal à tCMB est dominée par la dynamique
antérieure à cette époque, soit par l’Univers dominé par le rayonnement, a(t) ∼ t1/2 .
On en déduit
Z tCMB
1
1
dt
1/2
σh = c
=
(tCMB )
(t
)1/2 [2t1/2 ]t0CMB
1/2
a(tCMB )
a(tCMB ) CMB
t
0
pour une distance propore associée valant
dh = a(tCMB )σh = 2ctCMB .
Cela donne une valeur numérique de dh = 6 Mal = 1.8 Mpc. Cette dernière valeur
correspond à la zone causale d’extension maximale à l’époque de l’émission du CMB.
En d’autres termes, il est impossible d’expliquer que des points au-delà de cette
distance puissent être à la même température, sauf à invoquer des conditions initiales
telles qu’il en soit fortuitement ? ainsi.
80
Mis à jour le 14 Décembre 2012
Figure 6.4 Le problème de l’horizon. Les valeurs numériques ne correspondent
pas à celles du texte, mais elles sont du même ordre.
Autres difficultés
Il existe encore un certain nombre d’autres difficultés assez célèbres.
Le problème des grandes structures, voisin du problème de l’horizon, réside dans
l’interprétation des grandes structures observées (amas ou super-amas de galaxies)
comme prenant leur origine dans les inhomogénéités du fonds de rayonnement
cosmologique. Encore une fois, pour expliquer l’extension des grandes structures
aujourd’hui, ces inhomogénéités doivent avoir été bien plus grandes que les régions
causales !
Le problème des reliques est de nature différente. Il s’agit des particules massives
et défauts topologiques (monopôles notamment) prédits par les théories de grande
unification des interactions fondamentales avec des densités telles que l’on devrait
en observer à l’époque actuelle, ce qui n’est pas le cas. La difficulté consiste ici à
comprendre pourquoi l’expansion a dilué davantage l’Univers que ce que suppose le
modèle comsologique standard.
Le problème des coı̈ncidences enfin interroge le fait que les valeurs de ΩM et ΩΛ
soient très voisines aujourd’hui, faisant de notre époque un moment très particulier
où l’Univers est en train de passer d’une phase d’expansion ralentie à une phase
d’expansion accélérée, sans que l’on sache si une raison profonde explique cette
coı̈ncidence. Dicke a élaboré de principe anthropique, stipulant qu’il doit en être
ainsi pour que l’Univers connaisse des conditions propices au développement de la
vie.
Cosmologie
81
Parenthèse
On reproduit ci-joint un article de vulgarisation présentant un état des lieux sur la
constante comsologique.
82
Mis à jour le 14 Décembre 2012
Cosmologie
83
84
Mis à jour le 14 Décembre 2012
Cosmologie
85
86
Mis à jour le 14 Décembre 2012
Cosmologie
87
88
Mis à jour le 14 Décembre 2012
Cosmologie
89
90
Mis à jour le 14 Décembre 2012
Cosmologie
91
92
Mis à jour le 14 Décembre 2012
Cosmologie
93
94
Mis à jour le 14 Décembre 2012
Cosmologie
Théories des champs
95
96
Mis à jour le 14 Décembre 2012
Interactions fondamentales
97
7
Théories quantiques relativistes
Note : dans ce chapitre on réserve la notation ϕ ou χ pour un champ scalaire
complexe et ψ pour un ensemble de plusieurs champs scalaires complexes réunis en
un vecteur (spineur). On notera avec une flèche un vecteur dans l’espace ordinaire
et on utilisera les caractères gras pour représenter des matrices agissant dans
~ et
l’espace “interne” des composantes du spineur. Par exemple p~ϕ = −ih̄∇ϕ
~
~pψ = p~ 1lψ = −ih̄∇1lψ.
Equation de Schrödinger
⊲ Equation de Schrödinger. Guidés par la “dualité ondes-particules”,
ancienne appelation donnée à une série de concepts dus entre autres à de Broglie (59)
et résumés dans les relations
E = hν = h̄ω,
p~ =
h
~u = h̄~k,
λ k
nous cherchons une formulation ondulatoire de la mécanique.
p
~2
Le cas le plus simple est celui de la particule libre, d’énergie H = 2m
, que
i(~
k~
r−ωt)
l’on peut logiquement représenter par une onde plane u~k (~r, t) = A~k e
dans
la mesure où une telle onde est totalement délocalisée et donc a priori à même de
(59)
L. de Broglie, La longueur d’onde associée à la matière, CRAS 177, 507-510 (1923), reproduit
dans J. Leite-Lopes et B. Escoubès, Sources et Evolutions de la Physique Quantique, Masson, Paris
1995, p.92.
98
Mis à jour le 14 Décembre 2012
représenter une particule qui a une égale probabilité de se trouver en tout point
de l’espace. A quelle équation obéit l’onde plane ? On pourrait bien entendu écrire
2
~ 2 u~ − 12 ∂ u2~k = 0 (soit ω = v|~k|), mais on cherche ici une
l’équation des ondes, ∇
v ∂t
k
équation du premier ordre en dérivée temporelle pour satisfaire au déterminisme.
Utilisant les correspondances rappelées ci-dessus, on écrit plutôt
p
~
E
u~k (~r, t) = A~k ei( h̄ ~r− h̄ t)
d’où on extrait E en faisant
Eu~k (~r, t) = ih̄
∂
u~ (~r, t)
∂t k
et p~ de même
~ ~ (~r, t).
p~u~k (~r, t) = −ih̄∇u
k
L’équation E = p~2 /2m devient alors
ih̄
h̄2 ~ 2
∂
u~k (~r, t) = −
∇ u~k (~r, t).
∂t
2m
Pour une particule soumise à un potentiel V (~r), on généralise pour obtenir l’équation
de Schrödinger pour la fonction d’onde ϕ(~r, t),
∂
ih̄ ϕ(~r, t) =
∂t
h̄2 ~ 2
−
∇ + V (~r) ϕ(~r, t).
2m
(7.1)
Nous ne discuterons pas davantage ici les conséquences de cette équation qui
constitue l’approche non relativiste traditionnelle de la mécanique quantique.
Retenons simplement que la physique est décrite par une fonction d’onde ϕ(~r, t)
dont l’équation de Schrödinger régit la dynamique et que cette fonction d’onde obéit
à une équation de continuité,
∂
ρ(~r, t) + div ~j(~r, t) = 0
∂t
où les densités de probabilité de présence et de courant de probabilité sont définies
par
ρ(~r, t) = ϕ∗ (~r, t)ϕ(~r, t),
~ r , t) − ϕ(~r, t)∇ϕ
~ ∗ (~r, t)).
~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~
2mi
⊲ Lagrangien de Schrödinger. En théorie des champs, on définit le lagrangien
L à partir d’une densité lagrangienne
Z
~ d3 r
L(ϕ, ϕ̇, ∇ϕ)
L=
3
IR
Interactions fondamentales
99
où ϕ(~r, t) est un champ qui varie dans l’espace et le temps. L’intégration porte
sur l’espace IR3 ou sur une partie de cet espace dont la frontière est notée ∂IR3 .
~ de la densité lagrangienne reflète l’existence d’interactions à
La dépendance en ∇ϕ
courte portée. La minimisation de l’action
Z
Z t2 Z
~ d3 r dt
~ d3 r ≡
L(ϕ, ϕ̇, ∇ϕ)
S=
dt 3 L(ϕ, ϕ̇, ∇ϕ)
Ω
IR
t1
conduit aux équations d’Euler-Lagrange si l’on a imposé des conditions assez douces
aux variations de ϕ aux limites ∂IR3 de IR3 . On effectue en effet la variation
"
!#
Z t2 Z
∂L
∂L
∂L
∂
~
−∇
δS = 0 =
dt 3 d3 r
−
δϕ
~
∂ϕ
∂t
∂
ϕ̇
∂(∇ϕ)
IR
t1
t2 Z t2 I
Z
3 ∂L
~ ∂L δϕ
δϕ
dS
+
dt
+
d r
3
3
~
∂ ϕ̇
∂(∇ϕ)
∂ IR
t1
IR
t1
et en supposant que les termes de bords sont tous nuls, il vient
!
∂ ∂L
∂L
∂L
~
−
= 0.
−∇
~
∂ϕ ∂t ∂ ϕ̇
∂(∇ϕ)
Dans le cas de l’équation de Schrödinger, la densité lagrangienne associée fait
intervenir un champ scalaire complexe. Cette densité (due à Jordan et Wigner) est
donnée par
2
~ ∇ϕ
~ ⋆ ) = ih̄ϕ⋆ ϕ̇ − h̄ (∇ϕ
~ ⋆ ) · (∇ϕ)
~
L(ϕ, ϕ⋆ , ϕ̇, ϕ̇⋆ , ∇ϕ,
− V (~r, t)ϕ⋆ ϕ.
2m
On note encore les termes en gradients sous la forme
LSchr. = ih̄ϕ⋆ ϕ̇ −
1
(~
pϕ)⋆ (~
pϕ) − V (~r, t)ϕ⋆ ϕ.
2m
Les champs ϕ et ϕ⋆ sont fonction de l’espace et du temps, ϕ = ϕ(~r, t). Par application
des équations d’Euler-Lagrange à ϕ, on obtient
− ih̄ϕ̇⋆ = −
h̄2 ~ 2 ⋆
∇ ϕ + V (~r, t)ϕ⋆
2m
et par application à ϕ⋆ ,
ih̄ϕ̇ = −
h̄2 ~ 2
∇ ϕ + V (~r, t)ϕ,
2m
c’est-à-dire l’équation de Schrödinger et sa conjuguée. Le moment canonique est
donné par
π=
∂L
= ih̄ϕ⋆
∂ ϕ̇
100
Mis à jour le 14 Décembre 2012
et la densité hamiltonienne
H = π ϕ̇ − L =
i
−ih̄ ~
~
(∇π) · (∇ϕ)
− V (~r, t)πϕ.
2m
h̄
L’hamiltonien (classique) total vaut
Z 2
h̄ ~ ⋆
⋆
~
(∇ϕ ) · (∇ϕ)
+ V (~r, t)ϕ ϕ d3 r.
H=
2m
Par intégration par parties du premier terme on obtient la forme habituelle
Z
h̄2 ~ 2
⋆
H= ϕ −
∇ + V (~r, t) ϕ d3 r = hϕ|Ĥ|ϕi.
2m
On retrouve ainsi l’élément de matrice de l’Hamiltonien de Schrödinger dans l’état
|ϕi, résultat finalement très naturel.
Equation de Pauli
⊲ Introduction du spin et des spineurs de Pauli. L’étude de systèmes sous
champ magnétique a mis en évidence de nouvelles particularités de la mécanique
quantique. Outre la correspondance classique (qu’on appelle couplage minimal)
~ r , t) sous un champ
qui fait passer de H à H − qφ(~r, t) et de ~p à p~ − qA(~
~
électromagnétique (A(~r, t), φ(~r, t)), Pauli a proposé d’introduire un degré de liberté
interne supplémentaire, appelé le spin, ayant dans le cas de l’électron des propriétés
analogues à celles d’un moment cinétique 21 . La fonction d’onde ϕ(~r, t) est remplacée
par un spineur (60) , objet à deux composantes (spineur de Pauli)
ϕ↑ (~r, t)
ψ = ϕ (~r, t)
↓
pour décrire les degrés de liberté de spin en plus des degrés de liberté d’espace. On
obtient alors l’équation de Pauli, incluant le couplage de la charge et du spin au
champ magnétique (termes paramagnétique et de Zeeman),
qh̄ ~
1
∂
2
~
~
~ B(~r, t)ψ.
σ
(−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) ψ −
ih̄ ψ =
∂t
2m
2m
~ . Dans cette
Le spin est introduit au moyen du vecteur des matrices de Pauli, σ
expression, on omet la matrice identité à deux dimensions agissant dans l’espace
des composantes du spineur lorsque cela semble non ambigu. On devrait écrire en
∂
~ − qA(~
~ r , t))2 1lψ pour insister sur
toute rigueur des termes comme ih̄ ∂t
1lψ ou (−ih̄∇
le caractère matriciel de l’équation. Sous forme développée on écrit,
ϕ↑ (~r, t)
1
∂ ϕ↑ (~r, t)
2
~
~
(−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) 1l ϕ (~r, t)
=
ih̄
∂t ϕ↓ (~r, t)
2m
↓
(7.2)
ϕ↑ (~r, t)
qh̄ ~
~ B(~r, t)
−
σ
ϕ↓ (~r, t) ,
2m
(60)
Nous ne nous attarderons pas sur la définition précise d’un spineur, qui obéit à des règles de
transformation particulières.
Interactions fondamentales
101
~ r, t) = σ B + σ B + σ B , avec les matrices de Pauli
~ B(~
où σ
x x
y y
z z
1 0
0 −i
0 1
[σx ] = 1 0 , [σy ] = i 0 , [σz ] = 0 −1 .
Les matrices de Pauli obéissent à l’algèbre de Lie [σi , σj ] = 2iεijk σk ou encore
σi σj = δij 1l + iεijk σk .
La quantité ~s = 12 h̄~
σ est appelée spin. Dans le cas de l’électron, on a q = −|qe |
dans l’équation de Pauli. Le moment magnétique associé au spin de l’électron vaut
q
e |h̄
~ s = g 2m
~s = − |q2m
~ (le facteur de Landé de l’lectron g = 2) de sorte que le terme
µ
σ
~ = |qe |h̄ σ
~ Les matrices de Pauli forment
~ B.
Zeeman prend la forme indiquée −~
µs B
2m
avec l’identité une base pour la représentation des matrices 2 × 2, car
a b = 1 (a + d)1l + 1 (a − d)σ + 1 (b + c)σ + 1 i(b − c)σ .
z
x
y
c d
2
2
2
2
Pour écrire l’équation de Pauli en termes de composantes, on développe (en
omettant l’identité, en utilisant pi = −ih̄∂i et avec la convention de sommation sur
les indices répétés (avec une métrique euclidienne))
~ 2 ψ = (p − qA )(p − qA )ψ
(~
p − qA)
i
i
i
i
= pi pi ψ − q(Ai pi ψ + pi Ai ψ) + q2 Ai Ai ψ
= −h̄2 ∂i ∂i ψ + ih̄q(2Ai (∂i ψ) + (∂i Ai )ψ) + q2 Ai Ai ψ
d’où l’équation complète
ih̄∂t ψ = −
h̄2
ih̄q
q2
qh̄
∂i ∂i ψ +
(2Ai (∂i ψ) + (∂i Ai )ψ) +
Ai Ai ψ − qφψ −
σ B ψ.
2m
2m
2m
2m i i
On peut retrouver cette équation par des arguments très simples. Bien entendu,
tout comme l’équation de Schrödinger, cette équation n’est pas relativiste (61) , mais
elle fait apparaı̂tre la nécessité, pour inclure le spin dans la théorie, de chercher
une équation agissant sur des objets à plusieurs composantes. Une fonction scalaire
complexe n’admet pas de structure interne suffisamment riche pour décrire le spin (62)
. Considérons donc que l’on cherche l’hamiltonien d’une particule libre non relativiste
de spin 12 , sachant que l’on doit pour cela enrichir la structure interne de la fonction
d’onde à des “doublets” complexes. Observant que les matrices de Pauli satisfont à
la propriété (63)
~
(~
σ · ~a)(~
σ · ~b) = ~a · ~b 1l + i(~a × ~b) · σ
(61)
On a l’habitude de considérer que le spin est une conséquence de l’aspect relativiste de la
théorie car l’équation de Pauli apparaı̂t comme limite non relativiste de l’équation de Dirac. Il
n’est cependant pas nécessaire d’avoir un cadre relativiste pour introduire le spin.
(62)
Notons que le caractère complexe de la fonction d’onde est lié à la charge électrique comme on
le verra plus tard avec l’application du théorème de Noether.
(63)
Pour le montrer, on utilise la notation en composantes, (σi ai )(σj bj ) = ai bj (δij + iεijk σk ) =
ai bi + iεkij ai bj σk .
102
Mis à jour le 14 Décembre 2012
soit en particulier
(~
σ · p~)2 = (~
σ · p~)(~
σ · p~) = p2 1l2×2 ,
on généralise
H=
(~
σ · p~)2
p2
−→ H =
.
2m
2m
En présence d’un champ magnétique, la substitution du couplage minimal donne
~ 2
(~
σ · (~
p − qA))
2m
~ 2
1
(~
p − qA)
~ × (~
~ ·σ
~
1l + i
(~
p − qA)
p − qA)
=
2m
2m
~ 2
qh̄
(~
p − qA)
~
~ ·B
σ
1l −
=
2m
2m
H=
c’est-à-dire l’hamiltonien de Pauli, avec l’apparition automatique du terme de
~
~ = −q(~
~
~ pψ) = ih̄q(∇×
~ A)ψ)
~
Zeeman (on a utilisé (64) (~
p −qA)×(~
p −qA)ψ
p ×(Aψ)+
A×~
et notamment le facteur de Landé valant g = 2.
⊲ Lagrangien de Pauli. Comme pour l’équation de Schrödinger, on peut
construire une densité lagrangienne à partir de laquelle les équations d’EulerLagrange conduisent à l’équation de Pauli. En nous guidant sur l’expression de
Jordan et Wigner dans le cas d’un champ scalaire complexe, on généralise au cas de
spineurs de Pauli sous la forme
LPauli = ih̄ψ † ψ̇ −
1
†
~
~
(~
σ · (~
p − qA)ψ)
(~
σ · (~
p − qA)ψ)
− qφ(~r, t)ψ † ψ.
2m
Il apparaı̂t les termes
(65)
σi (pi − qAi )ψ † σj (pj − qAj )ψ = (δij + iεijk σk )(pi ψ † − qAi ψ † )(pj ψ − qAj ψ)
= (−ih̄∂i ψ † − qAi ψ † )(−ih̄∂i ψ − qAi ψ)
+ iεkij σk [(−ih̄)2 ∂i ψ † ∂j ψ
+ ih̄q(Ai ψ † ∂j ψ + (∂i ψ † )Aj ψ) + q2 Ai ψ † Aj ψ]
Dans le dernier crochet, le premier et le dernier terme sont nuls après contraction
avec le tenseur totalement antisymétrique. Finalement, il vient les trois dérivées
(64)
~ × (~
~ → εijk (pj − qAj )(pk − qAk )ψ =
On développe en composantes : (~
p − q A)
p − q A)
−qεijk (pj Ak ψ + Aj pk ψ) = ih̄qεijk ((∂j Ak )ψ + Ak ∂j ψ + Aj ∂k ψ) = ih̄qεijk (∂j Ak )ψ.
(65)
En toute rigueur on devrait noter ψ † σi (pi − qAi ) (le dagger ne porte que sur ψ) plutôt que
σi (pi − qAi )ψ † , mais la notation présente (et courante) est compéhensible.
Interactions fondamentales
103
partielles
1
∂L
= ih̄∂t ψ − qφ(~r, t)ψ −
qA (ih̄∂i ψ + qAi ψ − h̄qεijk σk ∂j ψ),
†
∂ψ
2m i
∂t
∂L
= 0,
∂ ψ̇ †
∂i
1
∂L
=−
[(ih̄)2 ∂i ∂i ψ + ih̄q(Ai ∂i ψ + (∂i Ai )ψ) − h̄qεijk σk ((∂i Aj )ψ + Aj ∂i ψ)].
†
∂(∂i ψ )
2m
En regroupant tous les termes, on obtient bien l’équation de Pauli sous sa forme
développée, avec notamment l’énergie Zeeman issue des termes
−
h̄q
h̄q
εkij σk ∂i Aj = −
σ B .
2m
2m k k
Equation de Klein-Gordon
⊲ Etablissement de l’équation de Klein-Gordon. Une généralisation
immédiate de l’équation de Schrödinger a été proposée très rapidement après
l’équation de Schrödinger elle-même (en 1926), indépendamment par Gordon,
Fock (66) , Klein, Kudar, de Donder et Van Dungen (67) . Schrödinger lui-même
avait obtenu cette équation avant de considérer le cas non relativiste, davantage
conforme aux résultats expérimentaux sur le spectre de l’atome d’hydrogène.
Il suffit d’effectuer les correspondances
∂
∂t
~
p~ → −ih̄∇
E → ih̄
dans l’expression relativiste donnant l’énergie cinétique (au terme mc2 près),
E 2 − |~
p|2 c2 = m2 c4
pour obtenir l’équation de Klein-Gordon de la particule libre,
2 2
2
~ 2 ϕ(~r, t) − 1 ∂ ϕ(~r, t) = m c ϕ(~r, t).
∇
c2 ∂t2
h̄2
(7.3)
De nouveau, on travaille avec un champ scalaire complexe ϕ (une fonction d’onde).
On retrouve l’équation des ondes habituelle, mais avec un terme de masse. Sous
(66)
(67)
Landau et Lifshitz par exemple se réfèrent à Klein et Fock et pas Klein et Gordon.
Voir S. Schweber, Relativistic quantum field theory, Harper and Row, New-York 1961.
104
Mis à jour le 14 Décembre 2012
~ on écrit cette équation comme
forme manifestement covariante (∂µ = (c−1 ∂t , ∇)
2
2
2
2 4
(E − c |~
p| )ϕ = m c ϕ, soit
(E/c, −~
p) E/c
ϕ = pµ pµ ϕ = m2 c2 ϕ
p~
(68)
c’est-à-dire finalement
∂µ ∂ µ + (mc/h̄)2 ϕ = 0,
où l’on a défini
(69)
pµ = ih̄
∂
= ih̄∂ µ ,
∂xµ
pµ = ih̄
∂
= ih̄∂µ .
∂xµ
Là encore, nous ne nous étendrons pas sur les conséquences cette équation, mais
indiquons seulement qu’il n’est pas possible de définir une densité de probabilité
positive conservée au cours du temps, ce qui invalide en partie la théorie basée sur
l’équation de Klein-Gordon. On forme la différence entre ϕ∗ ×KG et son complexe
conjugué pour obtenir une équation de continuité,
∂
ρ(~r, t) + div ~j(~r, t) = 0
∂t
où les densités de probabilité de présence et de courant de probabilité sont cette fois
définies par
∂ ∗
ih̄
∂
∗
ϕ(~
r
,
t)
−
ϕ(~
r
,
t)
ϕ
(~
r
,
t)
,
ρ(~r, t) =
ϕ
(~
r
,
t)
2mc2
∂t
∂t
~ r , t) − ϕ(~r, t)∇ϕ
~ ∗ (~r, t)).
~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~
2mi
(68)
Pour le lecteur n’ayant
! pas lu le chapitre 3 sur les notions de calcul tensoriel, il suffit ici de savoir
ct
x
que l’on note xµ =
un tenseur contravariant de rang 1 (ici la coordonnée spatio-temporelle),
y
z
c’est-à-dire la donnée de 4 nombres qui se transforment par changement de référentiel
inertiel par
!
γ
−βγ 0 0
−βγ
γ
0 0 , que l’on introduit
la transformation de Lorentz x′µ = Λµν xν où [Λµν ] =
0
0
1 0
0
0
0 1
!
1
−1
le tenseur métrique [gµν ] =
de sorte que gµν xµ = xν = (ct, −x, −y, −z)
−1
−1
est le tenseur covariant correspondant à xν . L’intervalle
élémentaire est alors ds2 = c2 dτ 2 =
!
cdt
gµν dxµ dxν = dxµ dxµ = (cdt, −dx, −dy, −dz) dx
= c2 dt2 − dx2 − dy 2 − dz 2 . On généralise
dy
dz
ensuite à d’autres grandeurs telles que v µ =
dxµ
,
dτ
pµ = mv µ =
E/c
p
~
, etc de sorte que l’invariant
2 2
µ
2 2
relativiste E 2 /c2 − |~
p|2 =
m c n’est autre que la contraction pµ p = m c . La généralisation du
gradient est notée ∂ µ =
1
∂
c t
.
~
−∇
(69)
On note la disparition du signe moins due au changement de signe de la partie spatiale entre
les définitions de pµ et ∂µ .
Interactions fondamentales
105
On note que la densité de probabilité de présence est bien une forme analogue à
la densité de courant, mais avec des dérivées temporelles à la place des dérivées
spatiales. Les deux expressions sont rassemblées dans la forme covariante
jµ =
ih̄ ∗
(ϕ ∂µ ϕ − ϕ∂µ ϕ∗ ).
2m
Cette théorie reposant sur des champs complexes scalaires, elle convient après
seconde quantification à la description de bosons massifs de spin nul (70) .
⊲ Lagrangien de Klein-Gordon. En procédant comme pour les sections
précédentes, on peut supposer la forme de la densité lagrangienne qui permet de
retrouver l’équation de Klein-Gordon
LKG = (pµ ϕ)⋆ (pµ ϕ) + m2 c2 ϕ⋆ ϕ
= −h̄2 (∂µ ϕ⋆ )(∂ µ ϕ) + m2 c2 ϕ⋆ ϕ.
⊲ Couplage minimal, particules et antiparticules. Si les particules décrites
par l’équation de Klein-Gordon possèdent une charge électrique e, elles interagissent
avec le champ électromagnétique par le biais du couplage minimal,
(ih̄∂µ − eAµ )(ih̄∂ µ − eAµ )ϕ − m2 c2 ϕ = 0
et on constate, si l’on écrit le conjugué complexe de cette équation, que ϕ∗
obéit strictement à la même équation, avec une même masse m, mais une charge
électrique opposée −e. Les fonctions d’onde ϕ et ϕ∗ décrivent des particules chargées
de spin nul et les antiparticules correspondantes. Des particules neutres de spin
nulles sont décrites par une fonction d’onde réelle. En notant de plus que dans le
cas d’une particule libre, la fonction d’onde de la particule est une onde plane,
i
i
ϕ(~r, t) = Ae h̄ (~p~r−Et) , celle de l’antiparticule est donc ϕ∗ (~r, t) = A∗ e h̄ ((−~p)~r−(−E)t) et
l’antiparticule a donc une énergie négative (si l’énergie de la particule est positive)
et se déplace en sens inverse.
⊲ Limite non relativiste et équation à deux composantes. Pour retrouver
2
i
l’équation de Schrödinger à la limite non relativiste, on pose φ(~r, t) = ϕ(~r, t)e− h̄ mc t
et on examine la limite où E ′ = E − mc2 est petit. Il est facile de montrer qu’on
retrouve alors l’équation de Schrödinger pour la fonction d’onde φ.
Une autre façon de retrouver la limite non relativiste est d’écrire l’équation de
Klein-Gordon sous la forme d’une équation du premier ordre en dérivées temporelles
à deux composantes,
ih̄∂t ψ = Hψ
ϕ+ (~r, t)
où ψ possède deux composantes, ψ =
ϕ− (~r, t) , reliées à ϕ et ∂t ϕ et H
1
est un hamiltonien matriciel 2 × 2. On pose ϕ+ = √2m
(ih̄∂t + mc2 )ϕ, ϕ− =
(70)
En seconde quantification l’équation (de Schrödinger, de Klein-Gordon, de Dirac) est traitée
comme une équation d’onde classique et la quantification est opérée en promouvant la fonction
d’onde au statut d’opérateur de champ obéissant à des régles de commutation particulières. Ces
opérateurs de champs sont associés à la création ou l’annihilation de particules, qui dans le cas KG
sont des bosons massifs de spin nul.
106
Mis à jour le 14 Décembre 2012
√ 1 (−ih̄∂
t
2m
+ mc2 )ϕ et on montre que l’équation de Klein-Gordon prend la forme
ci-dessus avec
|~
p|2
|~
p|2
2
H = mc +
iτ
τ3 +
2m
2m 2
où τ3 et τ2 sont les matrices de Pauli ordinaires (que l’on ne dénote pas avec le
σ conventionnel pour éviter toute confusion avec le spin, nul dans le cas présent).
Cette équation prend une structure très intéressante, voisine de celle de Schrödinger,
mais à deux composantes, a priori en raison de l’existence de particules scalaires (de
spin nul) et des antiparticules associées. Si l’on calcule la charge associée dans ce
formalisme, on a en effet
Z
3
∗
∗
d r(ϕ (ih̄∂t ϕ) − (ih̄∂t ϕ )ϕ) =
=
Z
Z
d3 rψ † τ3 φ
d3 r(|φ+ |2 − |φ− |2 )
ce qui associe φ+ et φ− respectivement aux particules et antiparticules. On définit
également le “KG-adjoint” à partir de l’adjoint complexe, φ̄ = φ† τ3 pour écrire la
densité de charge proportionnelle à φ̄φ.
L’inconvénient de cette approche à deux composantes est en revanche que la
nature relativiste de cette équation n’est plus manifeste.
Equations de Weyl
⊲ Recherche des équations pour des particules sans masse de spin 12 .
On cherche maintenant une équation relativiste pour décrire des fermions sans masse
de spin 12 . On doit s’attendre à retrouver l’équation des ondes sous la forme
~2
∇
2
. = 0,
. − 1 ∂
2
2
.
.
c ∂t
c’est-à-dire agissant sur des objets ayant a priori deux composantes, des spineurs.
En effet, on a vu avec l’équation de Pauli que l’introduction du spin nécessitait de
travailler sur des objets plus élaborés que de simple champs scalaires complexes. On
a vu également dans le cas relativiste que la difficulté d’interprétation de la densité
de probabilité de présence (non définie positive) découlait de ce que l’équation de
Klein-Gordon est du second ordre en dérivées temporelles, on doit donc chercher
une équation du premier ordre,comme
celle de Schrödinger.
ϕ1
On notera en général ψ = ϕ
un spineur à deux composantes. Il faut donc
2
une équation matricielle (matrices 2 × 2) comportant des dérivées du premier ordre
∂ ~
en t, soit, pour être compatible avec ∂µ = ( 1c ∂t
, ∇), l’apparition d’un objet tel que
1 ∂
~
~ ·∇
1l
±σ
c ∂t 2×2
ϕ1
ϕ2
.
Interactions fondamentales
107
On a utilisé le fait mentionné plus haut que les matrices de Pauli, avec l’identité,
∂
permettent d’exprimer n’importe quelle matrice 2 × 2. Si c1 ∂t
apparaı̂t, on s’attend
~ Comme on veut faire agir sur des spineurs à deux composantes,
à voir également ∇.
~ . Pour avoir une forme manifestement
on soupçonne l’apparition de 1l2×2 et de σ
covariante, ∂µ doit être contracté. On introduit pour cela une certaine généralisation
de l’identité sous la forme d’un tenseur de rang 1 (dontles “éléments” sont des
1l2×2
matrices 2 × 2) que l’on note provisoirement γ µ =
(cette notation γ µ sera
~
σ
ensuite réservée à un autre “vecteur contravariant”
1 assez voisin de celui-ci). On peut
∂
~ A ce niveau, le
~ · ∇.
ainsi former γ µ ∂µ = γµ ∂ µ = (1l2×2 , −~
σ ) c t = c1 1l2×2 ∂t + σ
~
−∇
µ
choix du
signe contraire pour la partie spatiale de γ serait parfaitement licite, i.e.
1l2×2
~ et rien ne nous
~ ·∇
γµ =
. La contraction conduirait alors à 1c 1l2×2 ∂t − σ
−~
σ
permet de trancher entre les deux cas proposés. On dispose donc de deux équations
également valables, conduisant à cette norme,
1
~
~ · ∇ ψ (+) = 0,
ih̄
1l ∂ + σ
c 2×2 t
1
~
~ · ∇ ψ (−) = 0.
ih̄
1l ∂ − σ
c 2×2 t
Ce sont les équations de Weyl. Elles agissent sur des champs de spineurs ψ (+) et
ψ (−) distincts que l’on interprétera un peu plus loin.
On peut ainsi conjecturer une équation manifestement covariante du premier
ordre (en rétablissant le facteur ih̄),
ih̄γ µ ∂µ ψ = 0.
Pour retrouver l’équation des ondes, formons la contraction
1 ∂2
~ σ · ∇)
~
ψ
1
l
−
(~
σ
·
∇)(~
{z
}
c2 ∂t2 2×2 |
~ 2 1l2×2
∇
.
2
1 ∂
~ 2 1l
−∇
=
2×2 ψ = 0,
c2 ∂t2
Cette équation prenant la forme d’une norme invariante de Lorentz.
⊲ Equation covariante. Nous venons d’introduire de manière intuitive 4
matrices γ dont il convient maintenant de préciser les propriétés algébriques.
Utilisons un raisonnement un peu différent pour introduire l’équation de Weyl sous
forme covariante adaptée à l’équation de Dirac (c’est-à-dire en conservant la masse)
que nous allons ensuite établir. On a vu avec l’équation de Klein-Gordon que la
dérivée seconde par rapport à t posait quelques difficultés, puisqu’elle ne permettait
pas d’introduire une densité de probabilité définie positive. Au lieu de partir de
pµ pµ = m2 c2 dans le cas classique (non quantique), qui fait apparaı̂tre cette dérivée
108
Mis à jour le 14 Décembre 2012
seconde par la substitution pµ → +ih̄∂µ , essayons de former une contraction du
type γ µ pµ ψ = mcψ, avec dans le cas de fermions non massifs, m = 0. Il faut
alors que γ µ soit comme on l’a anticipé un “quadri-vecteur” contravariant sans
dimension physique, c’est-à-dire une certaine généralisation de 1, mais que ses 4
composantes spatio-temporelles (γ 0 , ~γ ) soient des matrices, pour pouvoir agir sur
des objets à plusieurs composantes (a priori des spineurs de Pauli, mais peut-être
des objets plus complexes encore). Si alors on généralise le carré de γ µ pµ à une
forme convenablement symétrisée avec la propriété 21 (γ µ pµ γ ν pν + γ ν pν γ µ pµ ) =
1
µ ν
ν µ
µν
µ
2 (γ γ + γ γ )pµ pν = g pµ pν = pµ p , on retrouve l’équation cherchée sous la
forme pµ pµ ψ = m2 c2 ψ. Il est clair que cette notation est encore assez ambiguë, mais
g µν est à prendre au sens g µν × 1ln×n où n est le nombre de composantes du spineur.
Notons que l’on a symétrisé le produit γ µ γ ν car on sait en mécanique quantique
que la commutation des objets n’est pas nécessairement assurée.
Supposons que les γ µ soient des scalaires. On obtient rapidement une
inconsistence, car pour µ = 0, ν = 0 on doit avoir γ 0 = ±1 et pour µ = 1, ν = 1 on
doit avoir γ 1 = ±i, ce qui ne permet pas de satisfaire la contrainte γ 0 γ 1 = 0 pour
µ = 0, ν = 1. De même, des matrices 2 × 2 ne conviennent pas non plus. En effet
on aurait par exemple γ 0 = ±1l et γ 1 = ±σ3 qui ne permet pas non plus de réaliser
γ 0 γ 1 + γ 1 γ 0 = 0. On voit que cette algèbre impose aux composantes de γ µ d’être au
moins des matrices 4 × 4 et on peut finalement écrire pµ pµ ψ = −h̄2 ∂µ ∂ µ ψ = m2 c2 ψ.
Reprenons maintenant le raisonnement en admettant d’emblée qu’il faille
travailler sur des spineurs à 4 composantes. Cela ne doit pas surprendre outre mesure,
puisqu’on a vu avec l’équation de Pauli que le spin 21 recquiert un doublement des
composantes, mais aussi que la description de particules et antiparticules dans une
équation en dérivée première par rapport au temps demande de même un doublement
des composantes. On introduit le spineur de Dirac (71)
ψ=
ψ (+)
ψ (−)


ψ1
ψ 
=  ψ2 
3
ψ4
(un spineur à quatre composantes dont deux sont en fait associées aux particules
et deux aux antiparticules comme on va le voir) et des matrices 4 × 4 (appelées les
matrices de Dirac, ici dans la représentation chirale)
γ µ = (γ 0 , ~
γ ),
0
1l2×2
0
γ = 1l
,
0
2×2
~γ =
0
~
σ
−~
σ
0
de sorte que les équations de Weyl se combinent sous une forme unique,
µ
γ ∂µ ψ =
(71)
0
1 ∂
c ∂t 1l2×2
1 ∂
1l
c ∂t 2×2
0
!
ψ (+)
ψ (−)
+
0
~
~ ·∇
σ
~
−~
σ·∇
0
ψ (+)
ψ (−)
= 0.
On ignore ici les lois de transformation de tels spineurs par transformation de Lorentz.
Interactions fondamentales
Les matrices de Dirac obéissent à
109
(72)
γ µ γ ν + γ ν γ µ = 2g µν .
Les matrices ci-dessus obéissent bien à l’algèbre demandée, mais d’une part ce ne
sont pas les seules et il existe d’autres représentations par des matrices 4 × 4, d’autre
part on pourrait trouver des représentations par des matrices de dimensions paires
plus élevées. Le fait que les matrices de Dirac soient ici des matrices 4 × 4 et qu’il
y ait 4 valeurs pour les indices spatio-temporels µ = 0, . . . 3 est une coı̈ncidence
fortuite : les γ µ agissent sur les composantes des spineurs et lorsque l’on représente
g µν par une matrice, elle agit dans l’espace-temps !
Il est instructif de pousser plus avant la forme covariante de l’équation de Weyl,
ih̄γ µ ∂µ ψ = 0, pour chercher à définir le carré invariant. Sur l’équation de Weyl,
manifestement covariante,
ih̄γ µ
∂ψ
= 0,
∂xµ
faisons agir l’opérateur ih̄γ ν ∂ν = ih̄γ ν (∂/∂xν ) :
0 = −h̄2 γ ν γ µ
∂2
ψ
∂xν ∂xµ
1
= − h̄2 (γ µ γ ν + γ ν γ µ )∂ν ∂µ ψ
2
= −h̄2 g µν ∂ν ∂µ ψ
= (ih̄∂ µ )(ih̄∂µ )ψ
= pµ pµ ψ.
On obtient ainsi une forme très satisfaisante,
µ
pµ p ψ =
E2
2
− p~ 1l4×4 ψ = 0.
c2
(7.4)
Il est important de noter que l’équation de Weyl, sous sa forme manifestement
covariante,
ih̄γ µ ∂µ ψ = 0
n’est pas un simple scalaire de Lorentz car γ µ est un objet à quatre composantes
(comme un 4−vecteur), mais ses composantes sont des matrices 4 × 4 et ∂µ ψ est
un objet à 4 composantes scalaires, de sorte que la contraction donne au total un
objet à 4 composantes scalaires. C’est le prix qu’il a fallu payer pour quantifier la
(72)
Attention, dans cette expression, les γ µ sont des matrices 4 × 4, donc pour chaque valeur des
indices µ et ν, le résultat est une matrice et on doit considérer que le second membre est en fait
2g µν 1l4×4 . Il faut noter que dans la littérature on n’utilise pas de caractères gras pour les matrices
de Dirac, ce qui est risque supplémentaire de confusion.
110
Mis à jour le 14 Décembre 2012
théorie, puisqu’en physique quantique on travaille sur des objets qui en général ne
commutent pas.
L’équation de continuité peut s’écrire sous la forme habituelle en définissant la
densité de probabilité de présence et la densité de courant de probabilité comme
ρ = ψ † ψ = ψ̄γ 0 ψ,
~j = cψ̄~
γ ψ,
avec ψ̄ = ψ † γ 0 soit sous forme covariante
∂µ j µ = 0,
j µ = (cρ, ~j) = cψ̄γ µ ψ.
On peut utiliser pour cela la propriété des matrices de Dirac (γ µ )† = γ 0 γ µ γ 0 .
⊲ Particule non massive libre. Si l’on fait agir sur la solution libre
 
A1
(+)
 A2  h̄i pµ xµ
χ
= A  e
ψ=
χ(−)
3
A4
on obtient
ih̄γ µ ∂µ ψ =
0
E
~
c 1l2×2 + σ · p
E
c 1l2×2
− σ · p~
0
!
ψ = 0.
(7.5)
L’équation est homogène ; pour avoir une solution non nulle il faut donc annuler le
déterminant,
!
E
0
1l2×2 − σ · p~
c
Det E
~
0
c 1l2×2 + σ · p
E
E
= 1l2×2 − σ · p~ × 1l2×2 + σ · ~p
c
c
E − p3
−p1 + ip2 Ec − p3 +p1 − ip2 c
= 1
×
E
E
−p − ip2
+ p3 p1 + ip2
+ p3 c
c
2
= (E/c)2 − (p3 )2 − ((p1 )2 + (p2 )2 )
2
2
E
2
=
− p~
= 0,
c2
soit finalement
E = ±|~
p|c.
L’équation de Weyl pour la particule libre admet quatre solutions indépendantes,
dont deux avec une énergie positive E = |~
p|c (ce sont les deux composantes de spin
Interactions fondamentales
111
de la particule non massive que nous souhaitions modéliser) et deux (associées aux
deux composantes de spin de l’antiparticule) avec une énergie négative E = −|~
p|c.
⊲ Lagrangien de Weyl. Pour définir une densité lagrangienne appropriée,
on introduit comme précédemment avec l’équation de Klein-Gordon à deux
composantes l’“adjoint de Dirac” qui a permis la définition de la densité conservée,
ψ̄ = ψ † γ 0 ,
ψ † = (ψ1∗ , ψ2∗ , ψ3∗ , ψ4∗ ),
et on pose pour la particule libre (en l’absence de champ électromagnétique)
LWeyl = ih̄ψ̄γ µ ∂µ ψ.
Avec cette forme, les équations d’Euler-Lagrange se réduisent à
∂L
= ih̄γ µ ∂µ ψ = 0.
∂ ψ̄
Equation de Dirac
⊲ Equation covariante pour des fermions massifs de spin 21 . Pour
obtenir l’équation relativiste de l’électron (73) et plus généralement pour des fermions
massifs de spin 12 , il suffit de généraliser l’équation de Weyl covariante. Partons de
la contraction, ce qui est plus immédiat,
2
µ
E
2
2 2
2 2
− ~p − m c 1l4×4 ψ = 0.
p pµ − m c 1l4×4 ψ =
c2
Cela suggère de coupler les équations pour χ(+) et χ(−) par un terme de masse pour
obtenir l’équation covariante de Dirac (74)
ih̄γ µ
∂ψ
= γ µ pµ ψ = mcψ,
∂xµ
(7.6)
(on omet l’opérateur identité), soit, sous forme développée,
!
1 ∂
~
(+)
(+)
~
0
−
σ
·
∇
χ
χ
c
∂t
= mc
.
ih̄ 1 ∂
χ(−)
χ(−)
~ ~
0
c ∂t + σ · ∇
(73)
P.A.M. Dirac, L’équation d’onde relativiste de l’électron, Proc. Roy. Soc. A 117, 610-624
(1928), traduit dans J. Leite-Lopes et B. Escoubès, op. cit., p.194.
(74)
Une notation “slash” a été introduite (par Feynman) pour simplifier légèrement l’écriture. On
définit
a
/ ≡ γ µ aµ ,
ce qui permet d’écrire l’équation de Dirac par exemple comme
(ih̄/
∂ − mc)ψ = (/
p − mc)ψ = 0.
112
Mis à jour le 14 Décembre 2012
Dans le cas d’une particule libre, on a
0
E − c~
σ · p~
χ(+) = mc χ(+) .
E + c~
σ · p~
0
χ(−)
χ(−)
Il existe d’autres représentations des matrices de Dirac, notamment la
représentation de Dirac obtenue par transformation
unitaire
à partir de la
représentation chirale, γ µ → U γ µ U † où U = 2−1/2 1l 1l ,
1l −1l
γ µ = (γ 0 , γ),
1l2×2
0
γ0 =
0
−1l2×2 ,
~γ =
0
−~
σ
~
σ
0
.
Cette fois on obtient dans le cas de la particule libre l’équation
u =0
E − mc2
−c~
σ · ~p
v
c~
σ · ~p
−E − mc2
(+)
(−)
u , où u et v sont des spineurs à deux
χ
+
χ
−1/2
avec ψ = 2
=
v
χ(+) − χ(−)
composantes. L’équation aux valeurs propres conduit à
2
−c~
σ · p~
Det E − mc
= c2 p~2 − (E 2 − m2 c4 ) = 0,
c~
σ · p~
−E − mc2
ou encore pour les particules et les antiparticules,
p
E = ± |~
p|2 c2 + m2 c4 .
(7.7)
Dans le cas de l’électron, l’antiparticule est le positron. Le positron a été découvert
en 1932 par Anderson.
On trouve fréquemment dans la littérature une formulation alternative (ou plutôt
des notations alternatives pour les matrices de Dirac). On définit les 4 matrices
hermitiennes
~
0
σ
1l 0
~ = ~
β = 0 −1l , α
σ 0 ,
~ = ~γ , β † = β, α
~† = α
~ . On a ensuite directement
c’est-à-dire que l’on a β = γ 0 et β α
ih̄
∂
h̄ ~
+ βmc2 )ψ
ψ = Hψ = (c~
α ∇
∂t
i
2
= (c~
αp~ + βmc )ψ
ou encore, par action sur une onde plane,
(E − c~
αp~)ψ = βmc2 ψ.
(7.8)
Interactions fondamentales
113
⊲ Equation de Dirac covariante sous champ. L’équation de Dirac sous
champ s’obtient par couplage minimal,
pµ → pµ − qAµ ,
soit ih̄γ µ ∂µ ψ = mcψ qu’on écrit encore γ µ pµ ψ = mcψ, que l’on transforme en
γ µ (pµ − qAµ )ψ = ih̄γ µ ∂µ ψ − qγ µ Aµ ψ = mcψ.
(7.9)
Pour comparer cette forme à l’équation de Klein-Gordon sous champ par
exemple, on multiplie par γ ν (pν − qAν ) :
γ µ γ ν (pµ − qAµ )(pν − qAν )ψ = m2 c2 ψ,
où l’on introduit les matrices
1
i(γ µ γ ν − γ ν γ µ ),
2
γ µ γ ν = g µν − iΣ µν .
Σ µν =
L’opérateur Σ µν est antisymétrique, on obtient des représentations matricielles
particulières en appliquant Σ µν = iγ µ γ ν − ig µν 1l4×4 . Dans la représentation chirale
on a par exemple
2
0
1l2×2
1l2×2
0
Σ 00 = i(γ 0 )2 − i1l4×4 = i 1l
−
i
= 0,
0
0
1l
2×2
Σ
01
0
1
= iγ γ = i
0
1l2×2
1l2×2
0
2×2
0
σx
−σx
0
=i
σx
0
0
−σx
.
Les matrices Σ µν = 12 i[γ µ , γ ν ] sont liées aux transformations de Lorentz (les
rotations et les “boosts” (ou rotations hyperboliques)), soit par conséquent aux
composantes du spin S k ,
i
1
1 0i 1 0 i
σ
0
,
Σ = i[γ , γ ] = i
0 −σ i
2
4
2
1 ij
1 i j
1 ijk σ k 0
≡ ǫijk S k /h̄.
Σ = i[γ , γ ] = ǫ
0 σk
2
4
2
Il faut faire attention au fait que les grandeurs en général ne commutent pas en
mécanique quantique. On peut alors ré-écrire le premier membre de l’équation de
Dirac au carré,
(g µν − iΣ µν )(pµ − qAµ )(pν − qAν ) =(pµ − qAµ )(pµ − qAµ )
1
− i(Σ µν − Σ νµ )(pµ − qAµ )(pν − qAν )
2
=(pµ − qAµ )(pµ − qAµ )
1
− iΣ µν [pµ − qAµ , pν − qAν ].
2
114
Mis à jour le 14 Décembre 2012
Le commutateur se développe [pµ − qAµ , pν − qAν ] = q[pν , Aµ ] − q[pµ , Aν ] =
−ih̄q(∂µ Aν − ∂ν Aµ ) et on obtient finalement
1
(pµ − qAµ )(pµ − qAµ )ψ + qh̄Σ µν Fµν ψ = m2 c2 ψ,
2
(7.10)
ce qui fait apparaı̂tre très naturellement le tenseur de Faraday, et où le terme Zeeman
dû au spin est automatiquement inclus dans le couplage avec Fµν .
⊲ Lagrangien de Dirac. En présence d’un champ électromagnétique on a cette
fois
LDirac = ψ̄γ µ (ih̄∂µ − qAµ )ψ − mψ̄ψ,
avec le spineur adjoint ψ̄ = ψ † γ 0 .
Equation relativiste pour le photon
Habituellement on ne passe pas par une équation à une particule pour le photon.
Les théories quantiques des champs consistent à quantifier des théories considérées
comme classiques en remplaçant la fonction d’onde par des opérateurs de champ
(création et annihilation de particules). C’est le cas des équations de Schrödinger,
de Klein-Gordon ou de Dirac et pour le photon des équations de Maxwell. Dans ces
conditions, une équation à une particule pour le photon ne s’impose pas, mais c’est
un intermédiaire intéressant que nous nous proposons d’établir ici. Le photon ayant
une polarisation, on travaillera sur un objet à plusieurs composantes.
Les équations de Maxwell dans le vide (en l’absence de sources) s’écrivent
~E
~ = 0,
∇
~B
~ =0
∇
~
~ ×E
~ = − ∂B ,
∇
∂t
~
~ ×B
~ = 1 ∂E
∇
2
c ∂t
~ + iλcB),
~ λ = ±1. La combinaison iλc~
~
p × F~λ (avec ~p = −ih̄∇
On pose F~λ = √12 (E
un opérateur) s’écrit à l’aide des équations de Maxwell
∂ F~
iλc~
p × F~λ = ih̄ λ .
∂t
Il est naturel dans ces conditions de la noter H, où de ce fait, H est une matrice
3 × 3 agissant sur les composantes de F~λ = col (F1 , F2 , F3 ) (vecteur colonne avec les
trois composantes cartésiennes de F~λ ),

0
H F~λ = iλc  pz
−py
−pz
0
px

py
−px 
0
F1
F2
F3
!
.
R 3 ∗
La quantité
d r F~λ (~r)F~λ (~r) définit l’énergie électromagnétique totale Ue.m.
(dans un volume de référence quelconque). On définit une fonction d’onde vectorielle
ψλ (~r) = col (ψ1 , ψ2 , ψ3 ) en fonction de F~λ en divisant par cette énergie de référence
Interactions fondamentales
115
pour assurer la normation à l’unité. Les fonctions d’onde doivent satisfaire à la
condition de transversalité p~ · ψλ = 0 et l’équation des ondes se déduit de l’action
de H 2 :
2
~ ×∇
~ × ψ = −c2 h̄2 ∇
~ 2 ψ = −h̄2 ∂ ψ .
H 2 ψ = λ2 c2 h̄2 ∇
∂t2
~ i(~k~r−ωt) conduit à
L’action sur une onde plane ψ = Ae
~ = h̄~k ψ,
p~ψ = −ih̄ ∇ψ
Hψ = ih̄
∂ψ
= h̄ω ψ.
∂t
On peut noter que sous cette forme, les équations de Maxwell sont très voisines
de l’équation de Dirac (ou plutôt de l’équation de Weyl en l’occurrence) (75) ,
∂
ih̄ ∂t
ψ = (c~
α · ~p + βmc2 )ψ, car on peut écrire (pour λ = +1)
ih̄
∂
ψ = c(~
τ · p~) ψ,
∂t
où les trois matrices τ (analogues aux matrices de Dirac) sont données par
τx =
(75)
0
0
0
0 0
0 −i
i 0
!
,
τy =
0
0
−i
0 i
0 0
0 0
!
,
τz =
0 −i
i 0
0 0
0
0
0
!
.
C’est une observation due à Oppenheimer (Phys. Rev. 38 725 (1931)) et également à Majorana
(voir à ce propos S. Esposito, Foundations of Physics 37 956 (2007)).
116
Mis à jour le 14 Décembre 2012
Interactions fondamentales
117
8
Classical gauge field theory
Introduction
⊲ Classical field theories. Consider as an example the free particle KleinGordon equation (76) (∂µ ∂ µ + m2 )φ = 0 which follows from the conservation
equation pµ pµ − m2 = 0 with the correspondence pµ → i∂µ . We use the convention
gµν = diag (+1, −1, −1, −1) for the metric tensor. For later use, we choose the
~ ≡ (φ, A),
~ where
MKSA conventions, e.g. pµ = (E/c, p~) ≡ (E, p~) and Aµ = (φ/c, A)
∂
~ ≡ ( ∂ , −∇).
~
, −∇)
an bold font denotes a vector in ordinary space, or ∂ µ = ( c1 ∂t
∂t
Most of the time, h̄ and c are fixed to unity.
The Lagrangian density from which this equation follows must satisfy (77)
Z
δ
∂L
∂L
− ∂µ
= 0,
d4 x L(φ, φ∗ , ∂µ φ, ∂µ φ∗ ) =
∗
∗
δφ
∂φ
∂(∂µ φ∗ )
∂L
= −m2 φ,
∂φ∗
∂µ
∂L
= ∂µ ∂ µ φ.
∂(∂µ φ∗ )
The first condition is fulfilled if
L = −m2 φ∗ φ + terms in ∂µ φ∗ ∂ µ φ,
(76)
(77)
We forget about factors h̄ and c in this chapter.
We consider complex scalar fields. For real fields, factors of
1
2
would appear here and there.
118
Mis à jour le 14 Décembre 2012
and the second if
(78)
L = ∂µ φ∗ ∂ µ φ + terms in φ∗ φ.
Eventually the Klein-Gordon Lagrangian is given by
L = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ.
The first term is usually referred to as kinetic energy, although the space part (79)
is reminiscent from local interactions in the context of classical field theory, and the
second term to the mass term, since it corresponds to the mass of the particles
after quantization. The quantization procedure, not discussed here, consists in
the promotion of the classical fields into creation (or annihilation) field operators
which obey, together with the corresponding conjugate momenta, to canonical
commutation relations. We will stay here at the level of classical field theory, which
means that although the fields correspond to the wave functions of quantum objects
in the first-quantized form of the theory, they are treated by classical field theory
(e.g. Euler-Lagrange equations) and no quantum fluctuations are allowed.
⊲ The idea behind non-Abelian gauge theory. According to Salam and
Ward, cited by Novaes in hep-ph/0001283:
Our basic postulate is that it should be possible to generate strong, weak, and
electromagnetic interaction terms ... by making local gauge transformations on the
kinetic-energy terms in the free Lagrangian for all particles.
or Yang and Mills cited in A.C.T. Wu and C.N. Yang, Int. J. Mod. Phys. Vol. 21,
No. 16 (2006) 3235:
The conservation of isotopic spin points to the existence of a fundamental
invariance law similar to the conservation of electric charge. In the latter case,
the electric charge serves as a source of electromagnetic field. An important concept
in this case is gauge invariance which is closely connected with (1) the equation of
motion of the electromagnetic field, (2) the existence of a current density, and (3)
the possible interactions between a charged field and the electromagnetic field. We
have tried to generalize this concept of gauge invariance to apply to isotopic spin
conservation.
It is worth noticing that Klein and Pauli were pionners in this field, although
they did not publish their results (80) . In an attempt to generalize Kaluza-Klein
theory to the non-Abelian case, Pauli was in trouble with the fact that the new
bosons associated to the non-Abelian gauge fields were non massive: One will always
obtain vector mesons with rest-mass zero (and the rest-mass if at all finite will always
remain zero by all interactions with nucleons permitting the gauge group). In a letter
to Pais, he was nevertheless writing . . . I would like to ask in this connection whether
the transformation group with constant phases can be amplified in a way analogous to
the gauge group of electromagnetic potentials in such a way that the meson-nucleon
interaction is connected with the amplified group. . . .
⊲ The origin of gauge invariance (81) . The idea of “gauging” a theory,
i.e. making local the symmetries, is due to E. Noether, but gauge invariance was
(78)
We develop to obtain ∂µ ∂(∂∂Lφ∗ ) = ∂0 ∂(∂∂Lφ∗ ) + ∂i ∂(∂∂Lφ∗ ) = ∂µ ∂ µ φ = (∂0 ∂ 0 + ∂i ∂ i )φ =
µ
0
i
(∂0 ∂0 − ∂i ∂i )φ, the solution L = ∂0 φ∗ ∂0 φ − ∂i φ∗ ∂i φ = ∂0 φ∗ ∂ 0 φ + ∂i φ∗ ∂ i φ = ∂µ φ∗ ∂ µ φ (up to
terms in φ∗ φ) follows.
2
(79)
~ 2 , and only the time derivatives
− |∇φ|
We have a space and a time part in ∂µ φ∂ µ φ = c12 ∂φ
∂t
are reminiscent of a kinetic energy.
(80)
See N. Straumann, Wolfgang Pauli and modern physics, arXiv:0810.2213.
(81)
See Cheng and Li pp235-236, and Gross p956
Interactions fondamentales
119
introduced by Weyl when he tried to incorporate electromagnetism into geometry
through the idea of local scale transformations. From one point of space-time to an
other at a distance dxµ , the scale is changed from 1 to (1 + Sµ dxµ ) in such a way
that a space-time dependent function (of dimension of a length) f (x) is changed
according to
f (x) → f (x + dx) = (f + ∂µ f dxµ ))(1 + Sµ dxµ ) ≃ f + [(∂µ + Sµ )f ]dxµ .
The original idea of Weyl was to identify Sµ to the 4−potential Aµ , but with the
advent of quantum mechanics and the correspondence between pµ and i∂µ , it was
later realized that the correct identification is Sµ ↔ ieAµ . Weyl nevertheless retained
his original terminology of gauge invariance as an invariance under a change of length
scaled, or a change of the gauge.
Abelian U (1) gauge theory
⊲ The complex nature of the field as an internal structure. The prototype
of gauge theory is the theory of electromagnetism, or Abelian U (1) theory, where
charge conservation is deeply connected to global phase invariance in quantum
mechanics (a connection probably made first by Hermann Weyl).
The complex scalar field ϕ(x) (Schrödinger or Klein-Gordon field) can be
modified by a global phase transformation ϕ(x) → exp(ieα)ϕ(x) (Abelian U (1)
gauge transformation) which leaves the matter Lagrangian L = ∂µ ϕ∗ ∂ µ ϕ − V (|ϕ|2 )
unchanged. We anticipate and introduce already the charge e which couples the
(82)
1
2
particle to the electromagnetic field
. Let us write ϕ = φ + iφ and introduce a
1
real two-component field φ(x) = φ2 . The gauge transformation now appears as
φ
an Abelian rotation in a two-dimensional (internal) space.
⊲ Noether theorem and matter current density. Consider the Langrangian
density
L0 = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ).
For later use, we will call this Lagrangian the function
L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ).
For any symmetry transformation,
δL0 = δϕ∗
∂L0
∂L0
+ δ(∂µ ϕ∗ )
+ ϕ∗ → ϕ = 0.
∗
∂ϕ
∂(∂µ ϕ∗ )
The notation ϕ∗ → ϕ means that we add a similar term with all complex numbers
replaced by their conjugate. The global phase transformation ϕ → ϕ′ = ϕeieα being
(82)
Here we set h̄ = 1. In most of the relations, h̄ is restored through the substitution e → e/h̄,
g → g/h̄, or i∂µ → ih̄∂µ .
120
Mis à jour le 14 Décembre 2012
such a symmetry, we put δϕ = ieαϕ and δ(∂µ ϕ) = ieα∂µ ϕ (to linear order in the
expansion of eieα ) in the expression of δL0 to have
"
#
∂L0
+ ∂µ ϕ
δL0 = −ieα
+ ϕ∗ → ϕ
∂(∂µ ϕ∗ )
"
#
∂L0
∗
= −ieα∂µ ϕ
+ ϕ∗ → ϕ
∂(∂µ ϕ∗ )
∂L
ϕ∗ ∗0
∂ϕ
∗
= −α∂µ j µ
where use has been made of the Euler-Lagrange equation. It follows that the Noether
current
"
∂L0
∂L0
j µ = −ie ϕ
− ϕ∗
∂(∂µ ϕ)
∂(∂µ ϕ∗ )
#
is conserved, ∂µ j µ = 0. The electric charge conservation thus appears as the
consequence of the invariance of the theory under global phase changes, this is called
a global gauge symmetry. Note that in the case of the Klein-Gordon Lagrangian,
the conserved current takes the form (83)
j µ = −ie(ϕ∂ µ ϕ∗ − ϕ∗ ∂ µ ϕ).
⊲ Local gauge symmetry.
Extending the gauge symmetry to local
transformations requires the introduction of a (vector) gauge field which will be
seen later as the vector potential of electromagnetism. In other words, making local
the gauge symmetry builds the electromagnetic interaction.
Let us assume that the gauge transformation is local, i.e. ϕ → ϕ′ = ϕeieα(x) ≡
G(x)ϕ. We note that now ∂µ ϕ → ∂µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ 6= G(x)∂µ ϕ, and
the derivative of the field does not transform like the field itself does. Let us define
the covariant derivative (84)
Dµ ≡ ∂µ + ieAµ
where Aµ is still to be defined by its transformation properties. Like ϕ′ = G(x)ϕ,
we demand that
Dµ ϕ → (Dµ ϕ)′ ≡ G(x)Dµ ϕ.
(83)
Note that at this point, the sign in front of the current density was arbitrary, but if one wants
to recover the usual expression of probability density current in quantum mechanics, e.g. in the
h̄
~ + ϕ∗ → ϕ, it leads to the present charge current density after
Schrödinger case, ~j = 2mi
ϕ∗ ∇ϕ
being multiplied by e.
(84)
The term covariant refers to covariance with respect to the introduction of the local
transformation, and not to covariant-contravariant indices.
Interactions fondamentales
121
Since we have (Dµ ϕ)′ = (∂µ ϕ)′ + ieA′µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ + ieA′µ G(x)ϕ and
G(x)Dµ ϕ = G(x)∂µ ϕ + ieAµ G(x)ϕ, we must require that ieA′µ G(x) = ieAµ G(x) −
∂µ G(x) or, multiplying by G−1 (x),
i
A′µ = Aµ + G−1 (x)∂µ G(x) = Aµ − ∂µ α(x).
e
Demanding the invariance property of the kinetic term (according to Salam and
Ward cited above) in the Lagrangian density under a local gauge transformation
requires the introduction of a vector field which obeys the usual transformation
law of the vector potential of electromagnetism through gauge transformations.
These transformations which appeared before as a kind of mathematical curiosity
of Maxwell theory are now necessary in order to preserve local gauge invariance.
In a sense, the interaction is “created” by the principle of local gauge symmetry,
while the principle of global gauge symmetry implies the conservation of the electric
charge.
The interaction of matter (as described by the Lagrangian density L0 ) with the
electromagnetic field can be built in through essentially two different approaches. In
a first approach, we successively add terms to L0 in order to get at the end a locally
gauge invariant Lagrangian. Since the prescription of local gauge invariance induces
Maxwell interactions, this should automatically incorporate interaction terms in
L. Starting with the observation that L0 is no longer gauge invariant through local
transformations, since δL0 = −α(x)∂µ j µ −(∂µ α(x))j µ now contains the second term,
we have to kill this last term by the introduction of something new (85) L1 = −jµ Aµ .
~ This again generates
The sign here is also coherent with the expression −(ρφ − ~j A).
one more contribution in δ(L0 + L1 ), which is canceled if we add L2 = e2 Aµ Aµ ϕ∗ ϕ.
The combination L0 + L1 + L2 = L0 + Lint is now locally gauge invariant.
In a shorter approach, called minimal coupling, we simply replace the kinetic
term ∂µ ϕ∗ ∂ µ ϕ in L0 by (Dµ ϕ)∗ (D µ ϕ) which was especially constructed in order to
be gauge invariant (under local gauge transformations). The interaction terms are
recovered from (here in the Klein-Gordon case):
(Dµ ϕ)∗ (D µ ϕ) = (∂µ ϕ + ieAµ ϕ)∗ (∂ µ ϕ + ieAµ ϕ)
= ∂µ ϕ∗ ∂ µ ϕ − ieAµ ϕ∗ ∂ µ ϕ + ieAµ ϕ∂µ ϕ∗ + e2 Aµ Aµ ϕ∗ ϕ
= ∂µ ϕ∗ ∂ µ ϕ + ie(ϕ∂µ ϕ∗ − ϕ∗ ∂µ ϕ)Aµ + e2 Aµ Aµ ϕ∗ ϕ.
One also has to add the pure field contribution LA = − 14 Fµν F µν to get the full
Lagrangian density (86)
Ltot = L0 + Lint + LA
≡ F (ϕ, ϕ∗ , (Dµ ϕ), (Dµ ϕ)∗ ) + LA
= (Dµ ϕ)∗ (D µ ϕ) − V (ϕ∗ ϕ) + LA .
Note that being the kinetic energy of the free gauge field, LA is expected to be
quadratic in Aµ , and requiring that it is written in terms of the physical fields
(85)
(86)
Note that here j µ is the current which was conserved in the absence of gauge interaction
Remember that we call L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ).
122
Mis à jour le 14 Décembre 2012
instead of the gauge fields, we form Fµν F µν which has the advantage of being gauge
invariant.
The full Lagrangian is thus
L = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ) − jµ Aµ + e2 Aµ Aµ ϕ∗ ϕ − 14 Fµν F µν .
Now, since the functional form of the interacting matter Lagrangian is the same
as the form of the free Lagrangian with Dµ instead of ∂µ , the conserved Noether
current in the presence of gauge interaction reads as (87)
J µ = ieϕ∗
∂L0
+ ϕ∗ → ϕ
∂(Dµ ϕ)∗
= ieϕ∗ D µ ϕ + ϕ∗ → ϕ.
= j µ − 2e2 ϕ∗ ϕAµ ,
the last two lines being valid for the KG case. The interaction term can now be
written, up to second order terms (88) in Aµ , as Lint = −Jµ Aµ .
The equations of motion follow from Euler-Lagrange equations,
∂Ltot
∂Ltot
δStot
= 0,
=
− ∂ν
δAµ
∂Aµ
∂(∂ν Aµ )
which simply yield
∂Lint
∂LA
.
= ∂ν
∂Aµ
∂(∂ν Aµ )
The l.h.s. is
∂Lint
= −j µ + 2e2 ϕ∗ ϕAµ = −J µ
∂Aµ
while at the r.h.s. we have
∂LA
∂
= − 41
F F αβ = − 14
∂(∂ν Aµ )
∂(∂ν Aµ ) αβ
∂Fαβ
∂F αβ
F αβ + Fαβ
∂(∂ν Aµ )
∂(∂ν Aµ )
!
Both terms in parenthesis are equal to F νµ −F µν = −2F µν and eventually we obtain
after multiplication by − 14 , (89)
∂ν F µν = −∂ν F νµ = −J µ
(87)
See e.g. V. Rubakov, Classical Theory of Gauge fields, Princeton University Press 2002, pp21-27.
These terms are particularly important, since they restore gauge invariance of the interaction
Lagrangian which otherwise would not exhibit this gauge invariance property in the present form.
Indeed, Jµ is gauge invariant, but Aµ is not.
(89)
Note again that our choice of sign for the current density makes the expression coherent with
the usual Maxwell equations.
(88)
.
Interactions fondamentales
123
and, since F µν is antisymmetric, we recover the conservation equation for J µ ,
∂µ J µ = 0.
Non-Abelian (Yang-Mills) SU (2) gauge theory
⊲ Internal structure. The global phase transformation ϕ(x) → exp(ieα)ϕ(x)
as mentioned above appears as an Abelian rotation in a two-dimensional (internal)
space. This gauge transformation, when extended to local phase transformations
α → α(x), generates the electromagnetic interaction. It is possible to generalize to
non-Abelian gauge transformations by extending the internal (isospin) structure.
The field is for example a 3-component real scalar field
 
φ1

φ(x) = φ2 
φ3
and the transformation corresponds to a rotation in the internal space
corresponding charge is now written g)
(90)
(the
φ(x) → exp(igτ α)φ(x),
with τ the generators (which do not commute, hence the name of non-Abelian) of
the rotations in three dimensions(91)
!
!
!
0 −i 0
0 0 i
0 0 0
3
2
1
0 0 0 ,
τ = i 0 0 .
τ =
τ = 0 0 −i ,
0 0 0
−i 0 0
0 i 0
Use of bold font stands for vectors in the internal space and the scalar product (with
the dot · omitted) τ α is a 3 × 3 matrix,
τα =
0
iα3
−iα2
−iα3
0
iα1
iα2
−iα1
0
!
.
The transformation (being a rotation in 3 dimensions) is non Abelian and it can
be rewritten as (92) φ(x) → φ(x) − α × φ(x) or φa (x) → φa (x) − εabc αb φc (x) in
component form. Here we use the Latin indices of the beginning of the alphabet,
a, b, , c, . . ., to denote the internal space components, and α is a vector in the
internal space whose length α is the angle of rotation and whose direction is the
(90)
See Weinberg II p3.
The rotation matrix is 3 × 3 due to the three components of the field and there are three
such matrices because there are three possible rotation axis in three dimensions. The notation
is here with the imaginary
i for convenience. Usually an infinitesimal rotation matrix in 3d is
!
0
ωz
−ωy
.
−ωz
0
ωx
ωy
−ωx
0
(91)
(92)
See Ryder p108.
124
Mis à jour le 14 Décembre 2012
rotation axis. When needed, µ is still the index refering to space-time components
in Minkowski space.
Rotations in three space dimensions are equivalent to SU (2) transformations
acting on complex two-component spinors (93) . The field is now represented by such
a spinor,
ψ(x) =
ϕ↑ (x)
ϕ↓ (x)
.
Each component is complex, but due to a normalization constraint we still have
three independent real scalar fields. Under a rotation in the internal space, ψ(x)
changes into
1
2 igσα
ψ(x) → exp
ψ(x)
where σ are the three Pauli matrices,
1
σ =
0 1
1 0
,
2
σ =
0
i
−i
0
,
3
σ =
1
0
0
−1
,
which obey the Lie algebra
[σ a , σ b ] = 2iεabc σ c
with εabc the totally antisymmetric tensor, and σα is a 2 × 2 matrix
σα =
α3
α1 + iα2
α1 − iα2
−α3
Here 21 σ a are the generators of SU (2) transformations. Here, σ and α are still written
in bold font since they both have three components in the 3d−internal space. All
objects acting on 2−component spinors on the other hand are 2 × 2 matrices, e.g.
in (1 + 12 igσα)ψ, 1 has to be understood as the 2 × 2 identity matrix.
The two representations can be written (94) in a unified way in component form.
The (infinitesimal) transformation of the field (let say Ψ(x), for φ or ψ) is written
δΨl (x) = igαa (ta )l m Ψm (x).
The αa ’s are now the parameters of the infinitesimal transformation. The superscript
a is used as internal space index, l and m denote the 2 components (resp. 3) in the
SU (2) representation (resp SO(3)) and t stands for the generator (σ (resp. τ )).
Together with the internal degrees of freedom, the fields of course depend on
space-time position xµ .
(93)
An O(3) transformation on φ corresponds to an SU (2) transformation on ψ =
φ1 = 12 (ϕ2↓ − ϕ2↑ ), φ2 =
See Weinberg II p2.
(94)
1
(ϕ2↑
2i
+ ϕ2↓ ), φ3 = ϕ↑ ϕ↓ , see Ryder pp32-38.
ϕ↑ (x)
ϕ↓ (x)
with
Interactions fondamentales
125
⊲ Pure matter field and Noether current. From now on, we choose the
SU (2) representation. Let L0 be a gauge invariant matter Lagrangian density
L0 = ∂µ ψ † ∂ µ ψ − V (ψ † ψ)
where ψ † (x) = (ϕ∗↑ (x), ϕ∗↓ (x)) and V (ψ † ψ) is a potential to be defined later.
The variation of the Lagrangian density yields
δL0 = δψ †
∂L0
∂L0
∂L0
∂L0
+ δ(∂µ ψ † )
+
δψ +
δ(∂µ ψ).
∂ψ †
∂(∂µ ψ † )
∂ψ
∂(∂µ ψ)
With the infinitesimal transformation
δψ(x) = 21 igσαψ(x),
δψ † (x) = − 12 igψ † (x)σα,
which can be written in matrix form,
ϕ↑ (x)
α1 − iα2
ϕ↓ (x)
−α3
3
1
2
∗
∗
∗
∗
α
α
+
iα
1
(δϕ↑ (x), δϕ↓ (x)) = − 2 ig(ϕ↑ (x), ϕ↓ (x))
,
α1 − iα2
−α3
δϕ↑ (x)
δϕ↓ (x)
= 12 ig
α3
1
α + iα2
and using the equations of motion
∂L0
∂L0
− ∂µ
= 0,
∂ψ
∂(∂µ ψ)
∂L0
∂L0
− ∂µ
=0
∂ψ †
∂(∂µ ψ † )
we obtain the variation of the Lagrangian density
δL0 = − 12 igψ † σα ∂µ
= −α∂µ jµ
∂L0
∂L0
†
1
ig∂
ψ
σα
+
−
+ (ψ † → ψ)
µ
2
∂(∂µ ψ † )
∂(∂µ ψ † )
where the Noether current
jµ = − − 12 igψ † σ
∂L0
∂L0
−
†
∂(∂µ ψ ) ∂(∂µ ψ)
1
2 igσψ
is conserved, ∂µ jµ = 0, since the variation of the Lagrangian density vanishes for a
symmetry.
The current density is a vector in internal space (isospin current density) (95) .
With the Lagrangian density given above in the Klein-Gordon case, the conserved
(95)
See Quigg p34
126
Mis à jour le 14 Décembre 2012
current is explicitly given by
jµ = 21 igψ † σ∂ µ ψ − ∂ µ ψ † 12 igσψ
ϕ
0
1
∗
∗
1
= 2 ig(ϕ↑ , ϕ↓ ) 1 0 ∂ µ ϕ↑ i − ()∗ → ()
↓
+ 12 ig(ϕ∗↑ , ϕ∗↓ )
+
0
i
−i
0
1
ig(ϕ∗↑ , ϕ∗↓ )
2
∂µ
1
0
ϕ↑
∗
ϕ↓ j − () → ()
0 ∂ µ ϕ↑ k − ()∗ → ()
ϕ↓
−1
= 21 ig(ϕ∗↑ ∂ µ ϕ↓ + ϕ∗↓ ∂ µ ϕ↑ )i − ()∗ → ()
+ 12 ig(−iϕ∗↑ ∂ µ ϕ↓ + iϕ∗↓ ∂ µ ϕ↑ )j − ()∗ → ()
+ 12 ig(ϕ∗↑ ∂ µ ϕ↑ + ϕ∗↓ ∂ µ ϕ↓ )k − ()∗ → ()
where i, j et k are the unit vectors in isospin space. In component form, we have
jaµ = 21 igψ † σa ∂ µ ψ − ∂ µ ψ † 12 igσa ψ.
⊲ Introduction of a gauge potential (96) . Now we extend the formalism to
local gauge transformations
ψ ′ (x) = exp 12 igσα(x) ψ(x) ≡ G(x)ψ(x),
(where G(x) = exp 21 igσα(x) is a 2 × 2 matrix) or locally to
δψ(x) = 12 igσα(x)ψ(x),
but a problem occurs which will make the Lagrangian density L0 not gauge invariant.
The fact that ∂µ ψ does not obey the same gauge transformation than ψ itself
corrupts the transformation of the kinetic energy. We have ∂µ ψ ′ = (∂µ G)ψ+G(∂µ ψ).
Let us introduce a covariant derivative (97)
Dµ ≡ ∂µ + igBµ .
Here as before we use the short notation ∂µ for ∂µ 1l with 1l the 2 by 2 identity matrix.
The context suffices to distinguish between ∂µ and ∂µ 1l. Bµ = 12 σBµ = 21 σ a Bµa
(summation over a understood) is another 2 by 2 matrix (in fact there is one such
matrix for each of the 4 space-time components, Bµ is a gauge potential with three
internal components which all are 4−space-time vectors). We demand the following
transformation
Dµ ψ(x) → Dµ′ ψ ′ (x) = G(x)(Dµ ψ(x)).
(96)
See Quigg pp55-57
In analogy with electromagnetism where the covariant derivative ih̄Dµ is given by pµ − eAµ
with pµ = ih̄∂µ , which yields Dµ = ∂µ + i h̄e Aµ .
(97)
Interactions fondamentales
127
We obtain Dµ′ ψ ′ = (∂µ + igBµ′ )ψ ′ = (∂µ G)ψ + G(∂µ ψ) + igBµ′ Gψ. From the
requirement above, this quantity should be equal to G(∂µ + igBµ )ψ = G(∂µ ψ) +
igG(Bµ ψ). It follows an equation for the transformation of Bµ , igBµ′ Gψ =
igG(Bµ ψ) − (∂µ G)ψ. Written in terms of operators, this equation is Bµ′ G =
GBµ + gi ∂µ G. We multiply both sides by G−1 on the right to get
Bµ′
−1
= GBµ G
i −1
i
−1
+ (∂µ G)G = G Bµ + G (∂µ G) G−1 .
g
g
In the case of electromagnetism, the local gauge transformation is performed
by the operator (now an ordinary function) GEM (x) = exp(ieα(x)) with α(x)
some function, and leads to the known transformation of the gauge potential of
electromagnetism,
i
−1
A′µ = GEM Aµ G−1
EM + (∂µ GEM )GEM = Aµ − ∂µ α.
e
With the transformation of Bµ = 12 σBµ , we can deduce the gauge transformation
of Bµ as well. Consider an infinitesimal gauge transformation
G(x) = 1l + 12 igσα(x),
we have (to linear order in αi )
′
1
2 σBµ
= 21 σBµ + 14 ig((σα) (σBµ ) − (σBµ ) (σα)) − 21 ∂µ (σα).
The term in the middle, written in components, has the form
1
ig((σ a αa )(σ b Bµb )
4
− (σ b Bµb )(σ a αa )) = 41 igαa Bµb (σ a σ b − σ b σ a )
= 41 igαa Bµb 2iεabc σ c
= 21 gεcab αa Bµb σ c
= 21 g(α × Bµ ) · σ
and it follows that
′
1
2 σBµ
= 21 σBµ + 12 g(α × Bµ ) · σ − 21 ∂µ (σα).
Another common expression uses the identity (α × Bµ ) · σ = −2i
that
1
1
′
1
1
1
− 2 ∂µ (σα).
=
σB
σB
+
ig
σα,
σB
µ
µ
µ
2
2
2
2
We can also write directly
B′µ = Bµ + gα × Bµ − ∂µ α.
1
σα,
σB
such
µ
2
2
1
128
Mis à jour le 14 Décembre 2012
The gauge transformation of Bµ appears as a gradient term (like in electromagnetism) plus a rotation in internal space.
⊲ The field-strength tensor and field equations (98) . Let us introduce a
field-strength tensor by the 2 by 2 matrix
Fµν = 21 σFµν
from which we construct the gauge-invariant kinetic energy
(99)
Lfield = − 14 Fµν Fµν .
a
Using the identity Tr(σ a σ b ) = 2δ ab , we form − 14 Fµν Fµν = − 41 Fµν
F aµν =
11
1 a
bµν ab
a a b bµν
− 4 Fµν F δ = − 2 4 Tr(σ Fµν σ F ) and eventually
Lfield = − 12 Tr(Fµν F µν ).
The field-strength tensor is an observable quantity. It is thus supposed to be a “gauge
scalar”, that is to be independent of the choice of gauge (100) :
′
= GFµν G−1 .
Fµν
A simple transcription of the QED Faraday tensor Fµν = ∂µ Aν − ∂ν Aµ is not
satisfactory, but if we note that the QED Faraday tensor can also be written as
Fµν =
1
[D , D ] = ∂µ Aν − ∂ν Aµ + ie[Aµ , Aν ]
ie µ ν
(the commutator vanishes in the Abelian case), we can define
Fµν =
1
[D , D ] = ∂µ Bν − ∂ν Bµ + ig[Bµ , Bν ].
ig µ ν
It is easy to check that this definition has the correct gauge invariance property.
In terms of “isovectors”, the same relation becomes
1
σFµν = 21 σ∂µ Bν − 12 σ∂ν Bµ + ig 21 σBµ , 12 σBν
2
Fµν = ∂µ Bν − ∂ν Bµ − gBµ × Bν ,
where we used 21 σBµ , 12 σBν = 12 i(Bµ × Bν ) · σ. The non-Abelian character of
the theory is obvious in the definition of the field-strength tensor. Written in full
component form, the field-strength tensor reads as
Fµν a = ∂µ Bνa − ∂ν Bµa − gǫabc Bµb B c ν.
(98)
See Quigg pp58-59
This kinetic energy has the same form as in QED, LU (1) field = − 41 Fµν F µν .
(100)
In the same sense than a Lorentz scalar (i.e. a contraction) does not depend on the reference
frame.
(99)
Interactions fondamentales
129
From the field Lagrangian and the Euler-Lagrange equations
"
#
∂Lfield
∂Lfield
− ∂ν
= 0,
∂Bµa
∂(∂ν Bµa )
one can deduce the equations of motion (equivalent to the Maxwell equations in the
absence of charged matter current):
∂
1
1
(− Fκλ b F bκλ ) = g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd ),
a
∂Bµ 4
2
"
#
∂
1
b bκλ
∂ν
(− F F ) = −∂ν F aµν .
∂(∂ν Bµa ) 4 κλ
It appears a term (the first line) which does not exist in the case of electromagnetic
theory. This term is a current density, which is present even in the absence of matter
fields. Hence, the equations of motion are not as simple as the familiar Maxwell
equations which are linear. The Yang-Mills equations of motion are not linear, and
this is due to the fact that the gauge field carries the charge associated to the
interaction. Written in vector form, one has
∂ µ Fµν − gBµ × Fµν = 0.
In the massive case (which is not gauge invariant), a term
m2 Bµ Bµ
would be added to the Lagrangian density and the (Proca-like) equations of motion
become
∂ µ Fµν − gBµ × Fµν = m2 Bν .
⊲ Construction of a gauge-invariant interaction (101) . Since α(x) depends
on space-time, the variations δ(∂µ ψ) (or δ(∂µ ψ † )) contain an extra term which
contributes to δL0
#
"
∂L0
†
1
δL0 = − 2 igψ σα(x) ∂µ
∂(∂µ ψ † )
+ − 21 ig∂µ ψ † σ α(x) − 21 ig∂µ [α(x)] ψ † σ
∂L0
+ (ψ † → ψ)
∂(∂µ ψ † )
= −α(x)(∂µ jµ ) − (∂µ α(x))jµ
(101)
This section may be omitted. It presents step by step the construction of a gauge invariant
Lagrangian which is obtained faster by the minimal coupling requirement presented later. The
approach used here follows the presentation of Ryder pp96-98 in the case of Abelian U (1) gauge
symmetry.
130
Mis à jour le 14 Décembre 2012
The first term vanishes thanks to Noether theorem, but the second term,
−(∂µ α(x))jµ persists, so L0 is not gauge invariant under local gauge transformations.
In order to compensate this new term, we must add another contribution to the
Lagrangian,
L1 = −jµ Bµ
and demand that Bµ obeys the gauge transformation. Now,
δL0 + δL1 = −α(∂µ jµ ) − (∂µ α)jµ − jµ δBµ − δjµ Bµ ,
where only the first term vanishes identically. Performing the variation of jµ yields
−δjµ = − 12 igδψ † σ∂ µ ψ − 21 igψ † σδ(∂ µ ψ) + (ψ † → ψ)
= − 12 ig − 21 igψ † σα σ∂ µ ψ
− 21 igψ † σ 12 igσ∂ µ αψ + 21 igσα∂ µ ψ + (ψ † → ψ)
= 14 g 2 ψ † [σ, σα] ∂ µ ψ + 14 g 2 ∂ µ ψ † [σ, σα] ψ + 14 g 2 ψ † {σ, σ∂ µ α} ψ
= − 21 ig 2 ψ † σ × α∂ µ ψ − 21 ig 2 ∂ µ ψ † σ × αψ + 12 g 2 ∂ µ αψ † ψ
We have used the identities [σ, σα] = −2iσ × α and {σ, σ∂ µ α} = 2∂ µ α which are
proven by the use of Pauli matrices properties [σ a , σ b ] = 2iεabc σ c and {σ a , σ b } =
2δab 1l. The three remaining terms are equal to
−(∂µ α)jµ = − 21 igψ † σ∂µ α∂ µ ψ + (ψ † → ψ),
−jµ δBµ = −gjµ · (α × Bµ ) − jµ ∂µ α,
−δjµ Bµ = − 21 ig 2 ψ † (σ × α) · Bµ ∂ µ ψ − 21 ig 2 ∂ µ ψ † (σ × α) · Bµ ψ
+ 12 g 2 ∂ µ αBµ ψ † ψ
= +gjµ · (α × Bµ ) + 21 g 2 ∂ µ αBµ ψ † ψ,
where we have used the cyclic property (σ × α) · Bµ = (α × Bµ ) · σ. The sum
eventually gives only
δL0 + δL1 = 12 g 2 ∂ µ αBµ ψ † ψ
We still have to add another term which should eventually make the whole
Lagrangian gauge invariant,
L2 = 14 g 2 ψ † Bµ Bµ ψ = 41 g 2 Bµ Bµ ψ † ψ.
The variation of L2 reads as
δL2 = 41 g 2 (Bµ δBµ ψ † ψ + δBµ Bµ ψ † ψ + Bµ Bµ δ(ψ † ψ))
= 12 g 2 Bµ δBµ ψ † ψ
= − 12 g 2 Bµ (g(α × Bµ ) + ∂ µ α)ψ † ψ
= − 12 g 2 Bµ ∂ µ αψ † ψ
Interactions fondamentales
131
and we obtain the expected vanishing variation
δL0 + δL1 + δL2 = 0
which proves that the gauge invariant interaction in the presence of gauge fields
contains two terms,
L1 + L2 = −jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ.
The kinetic energy of the gauge field itself was not included, and the free particle
contribution is also missing.
⊲ Covariant derivative, minimal coupling. The introduction of the gauge
covariant derivative facilitates the calculations. The action should not depend on
the gauge choice, since the equations of motion are independent of the gauge. The
Lagrangian density should thus be a gauge scalar. The potential term is already a
gauge scalar, since it depends only on ψ † ψ which transforms covariantly according
to ψ ′† ψ ′ = (ψ † G−1 )(Gψ). In order to become manifestly gauge covariant, the kinetic
term should be written as (Dµ ψ)† (D µ ψ), since the covariant derivative of the field
Dµ ψ was constructed for the purpose of obeying the same gauge transformation
than the field itself, (Dµ ′ ψ ′ )† (D µ ′ ψ ′ ) = (Dµ ψ)† G−1 G(D µ ψ).
The minimal coupling is the prescription that the interaction with the gauge
field is obtained by the replacement ∂µ ψ → Dµ ψ in the Lagrangian density (102) :
L = (Dµ ψ)† (D µ ψ) − V (ψ † ψ)
= ∂µ − 21 igσBµ ψ † ∂ µ + 12 igσBµ ψ − V (ψ † ψ)
= ∂µ ψ † ∂ µ ψ − 12 igψ † σBµ ∂ µ ψ + 21 ig∂ µ ψ † σBµ ψ
+ 14 g 2 ψ † (σBµ )(σBµ )ψ − V (ψ † ψ)
= ∂µ ψ † ∂ µ ψ − jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ − V (ψ † ψ)
where in the last term use has been made of the identity
(σBµ )(σBµ ) = (σ a Bµa )(σ b B bµ )
B1 B 1 + B2 B 2 + B3 B 3
=
0
0
B1 B 1 + B2 B 2 + B3 B 3
= Bµ Bµ 1l.
This operation is called gauging the Lagrangian. Note that in the case of
fermionic particles, we have to use the Dirac Lagrangian density iψ̄γ µ ∂µ ψ, with
ψ̄ = ψ † γ 0 the adjoint spinor and γ µ the Dirac matrices (103) instead of the kinetic
energy ∂µ ψ † ∂ µ ψ, and the gauge invariant Lagrangian becomes
L = ψ̄(iγ µ Dµ − m)ψ − 41 Fµν Fµν .
In an expression such that ∂µ − 12 igσBµ ψ † , it is understood that σBµ acts on ψ † on the
(102)
left.
(103)
See e.g. Ryder pp43-46
132
Mis à jour le 14 Décembre 2012
⊲ Conserved current in the presence of gauge fields. In the presence of
gauge fields, the conserved Noether current can be written in terms of the covariant
derivative,
Jµ = − − 21 igψ † σ
∂L0
∂L0
−
†
∂((Dµ ψ) ) ∂(Dµ ψ)
1
2 igσψ
In the case of the SU (2) Lagrangian, it becomes
Jµ = 12 igψ † σD µ ψ − (D µ ψ)† 21 igσψ
= 12 igψ † σ ∂ µ ψ + 12 igσBµ ψ − ∂ µ ψ † − 21 igσBµ ψ † 12 igσψ
= jµ − 14 g 2 ψ † [σ, σBµ ] ψ.
We see that the conserved current in the presence of gauge fields has two
contributions, one coming from the ordinary matter current and the other from
the gauge field itself. Using the identity [σ, σBµ ] = −2iσ × Bµ , we get
Jµ = jµ + 21 ig 2 ψ † σ × Bµ ψ.
In component form we have
1
J aµ = j aµ − ig 2 ψ † εabc σ b B cµ ψ.
2
The current density Jµ is conserved in the ordinary sense
(104)
,
µ
∂µ J = 0
while jµ satisfies a gauge-covariant conservation law
Dµ jµ = 0.
Now, the Euler-Lagrange equations of the matter field in the presence of the
gauge field contain a new term,
"
#
∂Lint
∂Lfield
∂Lfield
+
− ∂ν
= 0,
∂Bµa
∂Bµa
∂(∂ν Bµa )
and lead to the equations of motion in the presence of charged matter:
1
1
1
− g(ψ † σ a ∂ µ ψ − ∂ µ ψ † σ a ψ) + 2g 2 ψ † B aµ ψ
2
2
2
1
+ g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd )
2
= ∂ν F aµν
This can be rewritten in vector form, specifying Jν as the matter current only, as
∂ µ Fµν − gBµ × Fµν = Jν .
(104)
See Weinberg II pp12-13
Interactions fondamentales
133
9
Spontaneous symmetry breaking
The question considered in this chapter is that of the mass of the particles which
carry the fundamental interactions (gauge bosons). As we have seen, local gauge
symmetry constrains the field Lagrangian density to contain only massless terms
− 14 F F , since massive terms like −m2X X 2 for a gauge field X would not be locally
gauge invariant. This constraint does not apply to the fermionic sector, since terms
such as −m2φ φ2 are invariant under local gauge transformations (although the
problem of a non zero mass of fermions will also occur for other reasons). The above
observation does not introduce any trouble in the case of U (1) gauge symmetry,
since its physical realization, the electromagnetic interaction is carried by massless
gauge particles, namely the photons. This is not true for the SU (2) counterpart,
a priori realized by the weak interaction for which the gauge bosons are known to
be the massive particles W ± and Z 0 . The question thus arises to find the origin of
the appearence of a non zero mass in the gauge sector of the theory. The notion of
spontaneously broken symmetry, as encountered in the physics of second-order phase
transitions and critical phenomena will help in solving the problem. This solution is
called in the context of particle physics Higgs mechanism.
Spontaneous breaking of global gauge symmetries
⊲ Discrete symmetries. Let us first consider spontaneous breaking of a global
discrete symmetry. It is illustrated by the case of the real scalar field,
L = 12 ∂µ φ∂ µ φ − V (φ(x)),
where V (φ(x)) is a potential which depends on the field configuration. We will
consider two cases
λ
µ2
V (φ) = φ4 ± φ2 , λ, µ2 > 0.
4
2
134
Mis à jour le 14 Décembre 2012
Case 1 with the sign + corresponds to a scalar field theory with square mass µ2 . Let
us first build the Hamiltonian,
H = 21 (∂0 φ)2 + 21 (∇φ)2 + V (φ).
The field with the lowest energy (also called the ground state configuration, which
would be denoted φ0 = hΩ|φ̂|Ωi in the quantized version of the theory) is a constant
field which minimizes the potential. In case 1, it corresponds to a vanishing field
φ0 = 0. The discrete Z2 symmetry φ → −φ of the Lagrangian is also a symmetry of
the ground state. In case 2, with sign − in the potential, the constant ground state
field is given by
µ
φ0 = ± √ = ±v.
λ
While the Lagrangian still possesses the φ → −φ symmetry, in any of the two
degenerate ground states, this Z2 symmetry is broken. This situation occurs in the
low temperature phase of second order phase transitions, when an ordered ground
state emerges (for example a ferromagnetic ground state), which does not respect
the full symmetry of the Hamiltonian (e.g. the “up-down” symmetry in an Ising
model, or rotational symmetry (this is a continuous symmetry in this case) in the
case of an Heisenberg model). It is instructive to study the field fluctuations around
the ground state. For this purpose, we let
φ = v + h,
h ≪ v,
(v is chosen positive without loss of generality) and we remind that V ′ (φ) =
λφ3 − µ2 φ, V ′′ (φ) = 3λφ2 − µ2 , V ′′′ (φ) = 6λφ, and V ′′′′ (φ) = 6λ. The potential
is now
V (φ) = V (v) + hV ′ (v) + 12 h2 V ′′ (v) + 16 h3 V ′′′ (v) +
1 4 ′′′′
(v)
24 h V
√
µ4
+ 0 + 12 2µ2 h2 + λµh3 + 14 λh4 .
λ
√
We note that the new field h acquired a mass 2µ (the coefficient of the quadratic
term in h is now positive).
⊲ Continuous symmetries. Spontaneous breaking of a global continuous
symmetry can be encountered in the SO(2) model (rotations in the plane). We
consider now a theory with two real scalar fields φ1 (x) and φ2 (x), and with the
potential
= − 14
V (φ1 , φ2 ) = 14 λ(φ21 + φ22 − v 2 )2 = 41 λ(|φ|2 − v 2 )2 .
The fields φ1 and φ2 are massless (the coefficients of the quadratic terms are negative)
and the theory is invariant under rotations in the plane,
φ′1
φ′2
=
cos θ
− sin θ
sin θ
cos θ
φ1
φ2
.
Interactions fondamentales
135
Figure 9.1 The “Mexican hat potential” (from E.A. Paschos, Electroweak theory,
Cambridge University Press, Cambridge 2007.
The minima of the potential lie on the circle
|φ0 |2 = φ210 + φ220 = v 2 .
As a result of the continuous symmetry, they are infinitely degenerate. In order to
analyze the field fluctuations around the minimum, we choose a particular vacuum
state φ10 = v, φ20 = 0 and denote the fluctuations by
φ1 = v + h1 ,
φ2 = h2
in terms of which the potential becomes
V (h1 , h2 ) = 14 λ(h21 + h22 + 2vh1 )2 .
Expansion of this potential shows that h1 becomes massive while h2 remains
massless, and the appearance of cubic terms breaks the original SO(2) symmetry.
The massless field is called a Goldstone mode (or Nambu-Goldstone mode). It is
easy to understand why h2 remains massless while h1 acquired a mass: close to the
minimum which we have selected, φ1 fluctuations have to survive to the potential
growth, these are amplitude fluctuations in a polar representation of the model,
while φ2 fluctuations correspond to phase fluctuations which do not cost any energy.
Spontaneous breaking of local symmetries
A new phenomenon occurs with local gauge theories, where the selection of a
particular minimum and the fluctuations around this minimum lead to massive gauge
fields which would otherwise be forbidden, since mass terms for the gauge field would
break gauge invariance. At the same time, the Goldstone mode disappears.
We consider the Lagrangian density of U (1) gauge theory,
L = − 41 Fµν F µν + (Dµ φ)∗ (D µ φ) − V (φ∗ φ),
with the potential
V (φ∗ φ) = −µ2 φ∗ φ + λ(φ∗ φ)2 .
136
Mis à jour le 14 Décembre 2012
As we have seen before, the theory is invariant under the gauge transformation
corresponding to a local rotation of the scalar field in the complex plane
φ(x) → eieα(x) φ(x)
Aµ (x) → Aµ (x) − ∂µ α(x).
Let us define two real fields θ(x) and h(x), associated to the phase and the amplitude
fluctuations around a particular (chosen real) minimum √12 v = (µ2 /2λ)1/2 ,
1
φ(x) = eiθ(x)/v √ (v + h(x)).
2
The local gauge transformation defined by eα(x) = −θ(x)/v eliminates θ(x), since
1
φ′ (x) = e−iθ(x)/v φ(x) = √ (v + h(x)),
2
1
A′µ (x) = Aµ (x) + ∂µ θ(x).
ev
The net effect in the Lagrangian density is the following,
′
F′
L = − 14 Fµν
µν
µ
+ (D ′ µ φ′ )∗ (D ′ φ′ ) + 12 µ2 (v + h2 (x))2 − 14 λ(v + h(x))4 ,
with D ′ µ = ∂µ + ieA′µ . When rewritten in terms of the transformed gauge field, the
kinetic energy term generates the mass for the gauge field A′µ :
µ
µ
(D ′ µ φ′ )∗ (D ′ φ′ ) = 12 ∂µ h∂ µ h + 12 e2 A′µ A′ (v 2 + 2hv + h2 ),
and, as we announced, the Goldstone mode θ(x) was absorbed in the re-definition
of the gauge field.
This mechanism is not at work in the case of the free electromagnetic field
(photons are massless gauge bosons of U (1) interaction), but it is known in condensed
matter physics as the Anderson mechanism (see next section), and it occurs in
superconductivity, where the non-zero mass (which also defines a characteristic
length scale) of the gauge field is responsible for the Meissner effect (the fact that
the magnetic field is expelled from the bulk of the material). In particle physics, this
mechanism enables to give a mass to the gauge bosons, as we discuss below. This is
known in this context as the Higgs mechanism.
The Anderson mechanism
We will first reproduce all the generic arguments given before in the relativistic
U (1) case before considering the application to superconductivity.
⊲ Gauge invariance in non relativistic quantum mechanics. Since
we are interested in this section by non relativistic quantum mechanics, we will
not distinguish between contravariant and covariant indices, i.e. xi = x, y, z and
∂
∂i = ∂x
. Summation is understood as soon as an index is repeated in an expression.
i
The space part of an expression like ∂µ ψ ∗ ∂ µ ψ will thus simply be denoted as
~ 2 ψ. Due to this non-covariant notation,
∂i ψ ∗ ∂ i ψ = −∂i ψ ∗ ∂i ψ, and ∂i ∂i ψ stands for ∇
Interactions fondamentales
137
there are other minus signs here and there, for instance in the definition of the field
tensor Fij = −(∂i Aj − ∂j Ai ).
The Lagrangian density for non relativistic quantum mechanics is given by an
expression due to Jordan and Wigner (here written in a symmetric form)
L0 = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
∂ ψ ∗ ∂i ψ − V ψ ∗ ψ.
2m i
The Euler-Lagrange equation (variation with respect to ψ ∗ ) indeed leads the
Schrödinger equation,
∂L0
= 21 ih̄ψ̇ − V ψ,
∂ψ ∗
∂L0
= − 12 ih̄ψ̇,
∂t
∗
∂ ψ̇
h̄2
∂L0
=
−
∂ ∂ ψ.
∂i
∂(∂i ψ ∗ )
2m i i
and we have
ih̄ψ̇ = −
h̄2
∂ ∂ ψ + V ψ.
2m i i
Once we have noticed that the Lagrangian density is a function of ψ, ψ̇, and ∂i ψ (as
well as their complex conjugates), its variation under an infinitesimal global gauge
transformation δψ = h̄i eαψ leads to
∂L0
∂L0
i
∂L
∂L0
∗
∗
+ ψ ∂t
+ ∂i ψ ∗
δL0 = − eα ψ ∂i
+ ψ̇ ∗ 0
h̄
∂(∂i ψ ∗ )
∂(∂t ψ ∗ )
∂(∂i ψ ∗ )
∂ ψ̇ ∗
− (ψ ∗ ←→ ψ)
= −α[∂i ji + ∂t ρ],
(use has been made of the equations of motion) where
eh̄
(ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) ,
2mi
ρ = eψ ∗ ψ.
ji =
Notice that this continuity equation is usually written in the standard form
~ ~j + ∂ρ = 0.
∇
∂t
In the presence of an electromagnetic field (relativistic in essence), we use the
minimal coupling
D i = ∂i +
i
eA
h̄ i
138
Mis à jour le 14 Décembre 2012
and we add the field Lagrangian contribution (for further purpose, we will only
consider the magnetic contribution and only in a static situation, i.e. − 14 Fij Fij )
(Fij = −(∂i Aj − ∂j Ai )),
L = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
(D ψ)∗ (Di ψ) − V ψ ∗ ψ − 14 Fij Fij .
2m i
The gauge field Ai is changed by a local gauge transformation,
i
ψ ′ (x) = ψ(x)e h̄ eα(x) ,
A′i (x) = Ai (x) − ∂i α(x),
but the field tensor Fij is unaffected. The equations of motion in the presence of the
gauge field are modified (105) ,
∂i
e2
eh̄ ∗
∂L
[ψ (∂j ψ) − (∂j ψ ∗ )ψ] − Aj ψ ∗ ψ,
=
∂Aj
2mi
m
!
∂
∂L
1
(F F )
= − ∂i
∂(∂i Aj )
4 ∂(∂i Aj ) kl kl
= ∂i Fij ,
leading to Maxwell equations
∂i Fij = Jj ,
where the current density is also recovered from the expression
Ji =
=
eh̄
(ψ ∗ (Di ψ) − (Di ψ)∗ ψ)
2mi
eh̄
e2
(ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) − Ai ψ ∗ ψ.
2mi
m
The Schrödinger equation follows from the variation w.r.t. ψ ∗ ,
h̄2
i
e2
∂L
1
= 2 ih̄ψ̇ − V ψ −
eA ∂ ψ + 2 Ai Ai ψ ,
∂ψ ∗
2m h̄ i i
h̄
∂L0
= − 12 ih̄ψ̇,
∂t
∂ ψ̇ ∗
h̄2
i
∂L0
=−
∂i ∂i ψ − e∂i Ai ψ .
∂i
∂(∂i ψ ∗ )
2m
h̄
(105)
Note here a modification in the usual signs.
Interactions fondamentales
139
Collecting the different terms, we get
ih̄ψ̇ = V ψ +
1
[−ih̄∂i − eAi ][−ih̄∂i − eAi ]ψ
2m
provided that the Coulomb gauge ∂i Ai = 0 is chosen.
⊲ Gauge symmetry breaking. We will now suppose that the gauge symmetry
is spontaneously broken, i.e. the uniform ground state wave function which minimizes
the potential energy is allowed to amplitude and phase fluctuation (for convenience,
the phase fluctuations are removed by a local gauge transformation) and the
amplitude fluctuations couple to the gauge field in such a way that the gauge field
becomes massive. The initial Lagrangian density
L = 21 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
(D ψ)∗ (Di ψ) − V (ψ ∗ ψ) − 14 Fij Fij
2m i
is gauge invariant. The potential energy has a minimum |ψ0 | (e.g. in the p
following
µ2 /2λ)
calculations V (ψ ∗ ψ) = −µ2 ψ ∗ ψ + λ(ψ ∗ ψ)2 has a minimum at |ψ0 | =
which can be chosen real positive ψ0 . We now allow for local amplitude and phase
fluctuations around this minimum,
ψ(x) = (ψ0 + h(x))eiθ(x) ,
with h(x) and θ(x) two real functions (and h(x) small w.r.t. ψ0 ).
A convenient gauge transformation
i
ψ ′ (x) = ψ(x)e h̄ eα(x) ,
e
α(x) = −θ(x)
h̄
makes the analysis simpler, since it eliminates the phase fluctuations,
ψ ′ (x) = ψ0 + h(x)
and also changes the gauge field
A′i (x) = Ai (x) +
h̄
∂ θ(x).
e i
The Lagrangian density is left unchanged by the gauge transformation, but written
in terms of the gauged variables it reads
∗
∗
L = 12 ih̄(ψ ′ ψ̇ ′ − ψ̇ ′ ψ ′ ) −
h̄2
∗
(D ′ ψ ′ )∗ (Di′ ψ ′ ) − V (ψ ′ ψ ′ ) − 41 Fij′ Fij′ .
2m i
The first term is identically zero, the second term once expanded leads to
e2 ′ ′
h̄2
2
∂i h∂i h + 2 Ai Ai (ψ0 + h) ,
−
2m
h̄
the third term to
− µ2 (ψ0 + h)2 + λ(ψ0 + h)4
140
Mis à jour le 14 Décembre 2012
(or any other form depending on the potential), and the last gauge invariant term
− 14 Fij′ Fij′
has the usual form for the field kinetic energy, but here given in terms of the
gauged vector potential. The essential novelty stands in the second term where
an extra dependence of the gauge field occurs, ∼ ψ0 A2i , coupled to the ground state
expectation value. This is a mass term which is also denoted as
1 2
2 mA
=
e2 2
ψ0 .
h̄2
Variation of L w.r.t. h(x) leads to the equation of motion known as the GinzburgLandau equation in the context of superconductivity,
∂L
∂L
= ∂i
,
∂h(x)
∂(∂i h(x))
h̄2
e2 ′ 2
Ai (x)(ψ0 + h(x)) + 2µ2 (ψ0 + h(x)) − 4λ(ψ0 + h(x))2 = ∂i ∂i h(x).
m
m
This equation contains information about the Cooper pair wave function ψ0 + h(x)
and it involves a characteristic length scale known as the coherence length,
ξ −2 =
2mµ2
.
h̄2
The coherence length ξ is for example a measure of the length scale needed to attain
the condensate wave function in the bulk of a superconductor from a free surface.
Variation of L w.r.t. the gauge field leads to
∂L
∂L
= ∂i
,
∂A′j (x)
∂(∂i A′j (x))
−
e2 ′
A (x)(ψ0 + h(x))2 = ∂i Fij′ .
m i
The l.h.s. corresponds to the London current density Jj (proportional to the gauge
field instead of the usual Ohm law Jj = σEj in a normal metal). This equation
also involves a typical length scale κ inversely proportional to the Cooper pair wave
function,
κ−2 =
e2 2
ψ .
m 0
This parameter gives an information about the length scale needed to expel the gauge
field from the bulk of a superconductor, a phenomenon known as the Meissner effect.
h̄2
It is completely governed by the gauge field mass, κ−2 = 2m
m2A .
The phenomenology of type I and type II superconductors is essentially described
in terms of the two length scales ξ and κ. If κ ≪ ξ, the magnetic field does not
Interactions fondamentales
141
penetrate at all in the bulk of a superconductor (type I), while in the other limit,
there exist regions of normal phase with non zero magnetic field (Abrikosov vortices)
inside superconducting regions (mixed phase of type II superconductors).
Gauge symmetric electroweak SU (2)W × U (1)Y theory
The electroweak symmetry breaking scenario (106) discovered by Salam and
Weinberg describes the emergence of the present structure of electromagnetic and
weak interactions as the broken gauge symmetry phase of a symmetric (unbroken)
phase SU (2)W × U (1)Y which existed in earlier times (higher energy scales) of the
Universe. With the spontaneous symmetry breaking scenario, some of the bosonic
degrees of freedom (the gauge fields) acquire mass. In the symmetric phase, the
relevant (non massive) fermionic particles (the electron and the neutrino) consist
in a right-handed (107) electron R = eR in an (weak) isospin singlet IW = 0 and
an isospin doublet IW = 21 made of the left-handed electron and the unique (leftν
handed) neutrino L = e e . The bosons are all non massive. The charges carried
L
3
by the leptons follow from their weak isospin component IW
and their hypercharge
Y,
3
+
Q = IW
Y
.
2
The hypercharge of the doublet is thus YL = −1 and that of the singlet is YR = −2.
Under the non-Abelian weak isospin gauge transformation SU (2)W , the fields change
according to
R −→ R,
SU (2)W
L −→ exp
SU (2)W
1
2 igσα
L,
and under the Abelian U (1)Y symmetry, they become
R −→ exp(−ig ′ β)R,
U (1)Y
L −→ exp(−ig ′ β/2)L.
U (1)Y
Note that the isospin coupling is g while the hypercharge coupling is conventionally
called g ′ /2.
SU (2)W × U (1)Y is made a local gauge symmetry through the introduction of
gauge fields Wµ and Xµ with the covariant derivative
Dµ L = ∂µ L + 12 igσWµ L − 12 ig ′ Xµ L,
Dµ R = ∂µ R − ig ′ Xµ R,
(106)
See Ryder pp307-312
In the Dirac Lagrangian iψ̄γ µ ∂µ ψ − mψ̄ψ, the right-handed and left-handed spinors are
defined as R = 12 (1 + γ5 )ψ and L = 21 (1 − γ5 )ψ. Since γ5 and γµ commute, it follows that
iψ̄γ µ ∂µ ψ = iL̄γ µ ∂µ L + iR̄γ µ ∂µ R.
(107)
142
Mis à jour le 14 Décembre 2012
where Wµ is a weak triplet gauge (non-massive) boson IW = 1 with hypercharge
zero and Xµ is also a non-massive boson which has zero hypercharge, but is in an
isospin singlet IW = 0.
We consider non massive fermions, otherwise a term like m2 L̄L would assign the
same mass to the electron and the neutrino (108) . If we forget about the pure gauge
field contributions, the kinetic part of the Lagrangian in the minimal coupling is
given by Dirac Lagrangian (the leptonic particles are fermions with spin 12 ) i.e.
L = iR̄γ µ ∂µ − ig ′ Xµ R + iL̄γ µ ∂µ + 12 igσWµ − 21 ig ′ Xµ L
The weakness of the gauge invariant formulation is obviously that it contains 4
massless gauge fields, while Nature (at the present energy scales) has only one, and
that the fermions are similarly all non massive (if the electron would have a non
zero mass in this theory, the corresponding neutrino would share the same mass,
since it appears as the second component of an isospin doublet). The spontaneous
symmetry breaking scenario leads to 3 massive gauge fields and at the same time,
the electron acquires mass as well (but not the neutrino!).
The Higgs mechanism
The symmetry is broken by introduction of a (bosonic) complex Higgs field
+
1
θ1 + iθ2
φ
φ=
=√
.
φ0
2 θ3 + iθ4
This is an isospin doublet IW =
1
2
with hypercharge unity Yφ = 1,
Dµ φ = ∂µ + 12 igσWµ + 12 ig ′ Xµ φ,
and a Lagrangian of the form
LHiggs = (Dµ φ)† (D µ φ) − m2 φ† φ − λ(φ† φ)2 + interaction with leptons.
The potential V (|φ|) = m2 φ† φ
spontaneous symmetry breaking
field, the choice θ3 = v is made
other θi ’s. Fluctuations around v
1
φ(x) = √
2
+ λ(φ† φ)2 is chosen such √
that it gives rise to
with |φ|2 = −m2 /2λ = v/ 2. For the classical
and a local gauge transformation eliminates the
are introduced through
0
v + h(x)
.
Acting with the covariant derivative gives
1
Dµ φ = √
2
(108)
1
ig(Wµ1 − iWµ2 )(v + h(x))
2
∂µ h − 12 i(gWµ3 − g ′ Xµ )(v + h(x))
!
Particles in an isospin multiplet have approximately the same mass. This is the case for the
strong isospin already, e.g. the proton and the neutron which form an isospin doublet, or the
π−mesons which form an isoispin triplet.
Interactions fondamentales
143
and reported in the Lagrangian density, this leads to (up to cubic terms)
LHiggs = 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4
+ 14 g 2 v 2 (Wµ1 W µ1 + Wµ2 W µ2 ) + 41 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ )v 2
= 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4
2
Wµ+ W −µ + 21 MZ2 Zµ Z µ ,
+ MW
where the charged massive vector bosons are
√
Wµ± = (Wµ1 ∓ iWµ2 )/ 2
2
with masses MW
= 14 g 2 v 2 and the neutral massive boson is such that
µ
2
1
2 MZ Zµ Z
(109)
= 81 v 2 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ )
2
3µ
g
−gg ′
3∗
∗
W
1 2
= 8 v (Wµ , Xµ )
Xµ
−gg ′
g′ 2
3µ
2
∗
∗
0
Z
M
1
Z
.
= 2 (Zµ , Aµ )
0
0
Aµ
The last line is obtained by a diagonalization of the mass matrix by an orthogonal
transformation
Zµ = cos θW Wµ3 − sin θW Xµ
Aµ = sin θW Wµ3 + cos θW Xµ ,
and the masses of the neutral fields are
2
MZ2 = 41 v 2 (g 2 + g ′ )
MA2 = 0.
The coupling constant of the (charged) leptons and the electromagnetic gauge field
gets the value
e = g sin θW .
With the symmetry breaking scenario, the coupling between the Higgs fields and
the leptons of the theory (Yukawa term which forms a Lorentz scalar by the coupling
between a Dirac spinor with a scalar field) in
− Ge (R̄φ∗ L + L̄φR)
similarly leads to massive electrons
√
me = Ge v/ 2.
(109)
See Cheng and Li p351
See Quigg p110
(110)
(110)
144
Mis à jour le 14 Décembre 2012
Interactions fondamentales
L’Univers primordial
145
146
Mis à jour le 14 Décembre 2012
Interactions fondamentales et Cosmologie
147
10
L’inflation cosmologique
Un certain nombre de problèmes cosmologiques sont résolus au prix de l’hypothèse
que dans son histoire primordiale, l’Univers a connu une phase d’expansion extrême.
Cette phase peut prendre naissance sous l’effet d’un champ scalaire ayant des
propriétés bien déterminées. C’est ce que la théorie de l’inflation permet de réaliser.
Introduction
Nous avons vu que le modèle cosmologique standard - dont l’évolution
“friedmanienne” est gouvernée par les trois formes principales d’énergie, Radiation,
Cold Matter et Λ - souffre de certaines difficultés. Parmi ces difficultés, celles qui
sont liées à la nature très particulière des conditions initiales, ou celles qui sont liées
aux problèmes de dilution d’objets ultramassifs peuvent être résolues grâce à un
scénario ingénieux, a priori artificiel, mais qui en fait est extrêmement générique.
Ce scénario est celui de l’inflation. Avant d’en présenter les grandes lignes, revenons
rapidement sur ces problèmes de conditions initiales.
Le problème de l’horizon peut être vu comme un problème de conditions initiales
relatives aux positions(111) . L’univers observable actuellement, d’une taille de l’ordre
de ct0 , est homogène à mieux que 10−5 près en valeur relative. A un instant antérieur
t< dans l’histoire de l’Univers, cet Univers homogène avait une extension spatiale
dans un rapport a(t< )/a0 , soit lh ≃ ct0 a(t< )/a0 . Or, à cet instant antérieur, la taille
de la région causale était de l’ordre de lc ≃ ct< . En supposant pour simplifier que le
passé de l’Univers est essentiellement dominé par le rayonnement, le facteur d’échelle
varie comme l’inverse de la température, a ∼ T −1 (car a ∼ ρ−1/4 et ρc2 ∼ T 4 ), de
sorte que le rapport de ces deux longueurs vaut
(111)
V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press.
148
Mis à jour le 14 Décembre 2012
lh /lc ≃
t T
1017 1
t0 a(t< )
∼ 0 0 ≃ −43 32 ≃ 1028
t < a0
t < T<
10
10
en prenant pour instant antérieur l’échelle de Planck. Il n’est pas crucial de fixer cette
échelle. On pourrait par exemple choisir celle de la brisure de symétrie électrofaible,
le nombre obtenu serait moins gigantesque, mais serait tout de même démesuré.
Si l’on interprète ce résultat, cela signifie que notre Univers homogène actuel est
le résultat de l’évolution friedmanienne d’une ‘bulle’ initiale composée typiquement
de 1084 domaines non connectés causalement ! Dans ces conditions, l’homogénéité
(c’est-à-dire le fait que la température actuelle du CMB soit partout de l’ordre de
3 kelvins à des fluctuations près de l’ordre de 10−5 en valeur relative) est difficile à
comprendre autrement que par un jeu de conditions initiales très particulier. Il faut
ensuite trouver un mécanisme conduisant de façon plus ou moins inévitable à ces
conditions initiales.
Pour ce qui concerne les conditions initiales sur la distribution des vitesses,
on peut faire une estimation grâce au raisonnement suivant : l’énergie mécanique
totale (d’un élément de covolume) est conservée, soit KE< + V< = KE0 + V0 .
Or, les énergies cinétiques sont dans le rapport des vitesses d’expansion au carré,
KE< /KE0 ∼ (ȧ< /ȧ0 )2 , de sorte que l’on peut écrire, en divisant par KE< ,
|V |
KE0 − V0
|V |
1− < =
=1− 0
KE<
KE<
KE0
ȧ0
ȧ<
2
.
Les rapports de vitesses d’expansion sont de l’ordre de ȧ0 /ȧ< ≃ (a0 /a< )(t< /t0 ) ≃
1032 10−43 /1017 = 10−28 , soit
1−
|V< |
|V |
= 1 − 0 10−56
KE<
KE0
et à l’époque actuelle, l’Univers est plat avec une très bonne approximation, ce qui
signifie que KE0 et |V0 | sont du même ordre de grandeur. Il faut donc que KE<
et |V< | aient été gigantesques, mais égaux à mieux que 56 décimales au temps de
Planck pour expliquer leurs valeurs prises aujourd’hui ! Ce problème est lié à celui
de la platitude.
Ces deux problèmes seraient résolus si l’on pouvait invoquer un mécanisme qui
conduise de manière typique à ces conditions initiales apparemment si particulières.
Il faut pour cela que le facteur d’échelle actuel de l’Univers soit considérablement
plus grand (le rapport lh /lc serait alors plus petit d’autant), au moins d’un facteur
1032 , et de même, il faut que la vitesse d’expansion actuelle soit considérablement
plus élevée dans un rapport approximativement du même ordre.
L’inflation est une phase d’expansion exponentielle du facteur d’échelle. Pour
obtenir cette phase, considérons un champ scalaire φ (appelé l’inflaton) dont nous
allons chercher les équations du mouvement. On veut produire une phase de l’Univers
dans laquelle ä(t) > 0, ce qui nécessite ρφ c2 + 3pφ < 0, soit
1
pφ = wφ ρφ c2 < − ρφ c2 .
3
Bien que l’on cherche des effets similaires à ceux produits par la constante
cosmologique (wΛ = −1), celle-ci ne peut pas convenir car au début de l’Univers, sa
Interactions fondamentales et Cosmologie
149
contribution à la dynamique est parfaitement négligeable (ΩR ≫ ΩM ≫ ΩΛ ). Un
champ scalaire en revanche peut jouer le rôle voulu, car comme on va le voir,
ρφ c2 ≃
pφ ≃
h̄2 2
φ̇ + V (φ),
2c2
h̄2 2
φ̇ − V (φ),
2c2
de sorte que l’on peut espérer trouver des conditions qui permettent d’atteindre
wφ ≃ −1 pour peu que le potentiel ait des propriétés convenables.
Dans un espace-temps de Minkowski, l’équation de mouvement d’un champ
scalaire réel (non chargé) libre s’écrit (Klein-Gordon)
m2 c2
∂µ ∂ + 2
h̄
µ
φ = 0.
Le d’Alembertien, ∂µ ∂ µ φ, que l’on peut aussi écrire η µν φ,µν , devient, dans un espacetemps courbe de métrique définie par g µν ,
g µν φ,µν − Γαµν φ,α .
C’est une forme de couplage minimal du champ scalaire à la métrique(112) , de sorte
que l’équation de Klein-Gordon devient
g µν φ,µν − Γαµν φ,α +
m2 c2
φ = 0.
h̄2
En appliquant ces équations (auxquelles on ajoute un terme d’énergie potentielle
2 2
V (φ) plus général que le simple terme de masse 21 mh̄2c φ2 et dont on précisera les
propriétés ultérieurement) au cas de la métrique de Friedmann-Robertson-Walker,
la première équation de Friedmann devient celle d’un oscillateur harmonique amorti
par l’expansion de l’Univers :
h̄2
h̄2 ȧ
φ̈
+
3
φ̇ + V ′ (φ) = 0
c2
ac2
Dans la suite nous allons établir cette équation d’une autre manière, et établir
également les équations de Friedmann.
1 σρ
(gµρ,ν +gνρ,µ −gµν,ρ )
Rappels sur la dérivée covariante : les symboles de Christoffel Γσ
µν = 2 g
permettent de généraliser la dérivée ordinaire ∂κ à la dérivée covariante Dκ . Appliquée à un champ
α
de vecteurs, on a ∂κ Aµ ≡ Aµ,κ et Dκ Aµ ≡ Aµ;κ = Aµ,κ − Γα
µκ Aα = ∂κ Aµ − Γµκ Aα . Dans le cas
d’un tenseur de rang 2, on forme par exemple la combinaison (Aµ Bν ) dont on calcule la dérivée
covariante en distribuant les opérations de dérivation, (Aµ Bν );κ = (Dκ Aµ )Bν + Aµ (Dκ Bν ) =
α
α
α
(Aµ,κ − Γα
µκ Aα )Bν + Aµ (Bν,κ − Γνκ Bα ) = (Aµ Bν ),κ − Γµκ (Aα Bν ) − Γνκ (Aµ Bα ), soit finalement
α
α
Tµν;κ = Tµν,κ − Γµκ Tαν − Γνκ Tµα . En généralisant, la dérivée covariante d’un tenseur de rang n
fait apparaı̂tre la dérivée ordinaire suivie d’un symbole de Christoffel pour chacun des n indices.
En particulier pour un champ scalaire on a Dκ φ = ∂κ φ. Dans le cas présent, φ;µν = Dµ Dν φ =
α
Dµ φ,ν − Γα
νµ φ,α = φ,µν − Γνµ φ,α , donc un seul Christoffel.
(112)
150
Mis à jour le 14 Décembre 2012
Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann
associées
En présence du champ φ, l’action du champ gravitationnel libre et du champ
scalaire s’écrit avec une composante SEH [g µν ] pour la géométrie et Smat [g µν , φ] pour
la matière
S[g µν , φ] = SEH [g µν ] + Smat [g µν , φ]
Z
Z
√
c4
4 √
=−
d x −gR +
d4 x −gLmat
16πG
où le lagrangien de matière est donné par
Lmat = 21 h̄2 ∂µ φ ∂ µ φ − 12 m2 c2 φ2
= 21 h̄2 g µν ∂µ φ ∂ν φ − V (φ)
où l’on a généralisé à un potentiel quelconque
(113)
. La variation
δS[g µν , φ]
=0
δg µν
donne les équations d’Einstein alors que la variation
δS[g µν , φ]
=0
δφ
conduit à l’équation de mouvement de l’inflaton. Par définition (c’est-à-dire pour
retrouver Tµν au second membre des équations d’Einstein), la variation de l’action
de matière définit le tenseur énergie-impulsion associé,
Z
Z
µν
√
√
δ
4
1
−gLmat δg ≡ 2
δSmat =
d x µν
d4 x −gTµν δg µν ,
δg
d’où l’on déduit
Tµν = 2(−g)−1/2
√
δL
δ
−gLmat = 2 mat
− gµν Lmat .
µν
δg
δg µν
√
En effectuant le calcul de manière explicite, et en utilisant l’identité δ −g =
√
− 21 −ggµν δg µν , on obtient
Tµν = 2
δ 1 2 κλ
h̄
g
∂
φ
∂
φ
− gµν 12 h̄2 g κλ ∂κ φ ∂λ φ + gµν V (φ)
κ
λ
δg µν 2
= h̄2 ∂µ φ ∂ν φ − 21 h̄2 gµν ∂κ φ ∂ κ φ + gµν V (φ)
= h̄2 ∂µ φ ∂ν φ − 12 gµν [h̄2 ∂κ φ ∂ κ φ − 2V (φ)]
(113)
On note que s’agissant d’un champ scalaire, Lmat (φ, Dµ φ) = Lmat (φ, ∂µ φ).
Interactions fondamentales et Cosmologie
151
On peut également noter que la définition usuelle
Tµν =
∂L
φ − gµν L
∂φ,µ ,ν
qui découle d’une variation par rapport à φ plutôt que par rapport à la métrique,
donne le même résultat (114) .
Dans la métrique FRW, où
2
2
2
2
ds = c dt − a (t)
dσ 2
2
2
+ σ dΩ ,
1 − kσ 2
on pose dxµ = (cdt, dσ, dθ, dϕ) et σ = r/a(t), soit
g00 = 1,
g11 = −
a2
,
1 − kσ 2
g22 = −a2 σ 2 ,
g33 = −a2 σ 2 sin2 θ
et g µµ = 1/gµµ . On a également ∂µ = (c−1 ∂t , ∂σ , ∂θ , ∂ϕ ), de sorte que
∂κ φ ∂ κ φ = g κλ ∂κ φ ∂λ φ
= g 00 (∂0 φ)2 + g 11 (∂σ φ)2 + g 22 (∂θ φ)2 + g 33 (∂ϕ φ)2
= (∂0 φ)2 −
1 − kσ 2
1
1
(∂σ φ)2 − 2 2 (∂θ φ)2 − 2 2 2 (∂ϕ φ)2 .
2
a
a σ
a σ sin θ
Le tenseur énergie-impulsion devient finalement
h h̄2
2
2 1 − kσ
2
(∂
φ)
−
h̄
(∂σ φ)2
t
c2
a2
i
1
1
− h̄2 2 2 (∂θ φ)2 − h̄2 2 2 2 (∂ϕ φ)2 − 2V (φ) .
a σ
a σ sin θ
Tµν = h̄2 ∂µ φ ∂ν φ − 12 gµν
Dans le cas d’un problème à symétrie sphérique, les dérivées du champ par
rapport à θ et à ϕ n’interviennent pas et cette expression se simplifie pour la partie
diagonale en
Tµµ = h̄2 ∂µ φ ∂µ φ − 12 gµµ h̄2
h1
(φ̇)2 −
c2
i
1 − kσ 2
−2
2
(∂
φ)
−
2h̄
V
(φ)
.
σ
a2
En rappelant que le tenseur énergie-impulsion admet également la forme hydrodynamique habituelle
Tµν = (ρ + p/c2 )vµ vν − pgµν ,
(114)
On note bien le facteur 2 dans
∂L
∂φ,µ
=
1 2
h̄ 2φ,µ .
2
152
Mis à jour le 14 Décembre 2012
on peut calculer la densité d’énergie et la pression associées au champ scalaire φ au
repos dans le référentiel comobile (vµ = (c, ~0)).
h
i
1 − kσ 2
2
T00 = ρφ c2 = 12 h̄2 (∂0 φ)2 +
+ V (φ),
(∂
φ)
σ
a2
T11 =
pφ a2
a2
a2
2
2
1 2
1 2
=
h̄
(∂
φ)
+
h̄
(∂
φ)
−
V (φ).
σ
2
2
1 − kσ 2
1 − kσ 2 0
1 − kσ 2
On peut alors écrire les équations de Friedmann en négligeant toute autre forme
de matière-énergie que celle associée au champ scalaire φ. On considère en général
le cas d’un champ spatialement uniforme, de sorte qu’il ne reste que la dépendance
temporelle et le terme d’énergie potentielle V (φ),
G00 =
3k
8πG
3ȧ2
+ 2 = 4
a2 c2
a
c
G11 = −
2
1 2
2 h̄ (∂0 φ)
8πG
k + 2aä/c2 + ȧ2 /c2
= 4
1 − kσ 2
c
+ V (φ) ,
1 2
2 h̄ 1
a2
a2
(∂0 φ)2 −
V (φ) .
2
2
− kσ
1 − kσ
Equation de mouvement de l’inflaton
L’action de matière dépend évidemment du champ φ de sorte que l’on peut effectuer
une variation par rapport à ce champ. En reprenant l’expression de Lmat dans le
référentiel comobile et en supposant la symétrie sphérique, on a
√
−gLmat = 21 h̄2 √
a3 σ 2
a3 σ 2
1 − kσ 2
2
√
(∂
φ)
−
(∂0 φ)2 −
V (φ)
σ
a2
1 − kσ 2
1 − kσ 2
de sorte que la variation de Smat [g µν , φ] par rapport à φ conduit à
√
∂
δSmat
∂ √
=
( −gLmat ) − ∂µ
( −gLmat ) = 0
δφ
∂φ
∂(∂µ φ)
ou encore, sous une forme plus “symétrique”,
√
1
∂
∂
(Lmat ) − √ ∂µ
( −gLmat ) = 0.
∂φ
−g ∂(∂µ φ)
En effectuant le calcul, on trouve
a3 σ 2 dV
∂ √
( −gLmat ) = − √
,
∂φ
1 − kσ 2 dφ
√
∂
h̄2 σ 2
( −gLmat ) = − √
(3a2 ȧφ̇ + a3 φ̈),
2
2
∂(∂0 φ)
c 1 − kσ
p
√
∂
−∂σ
( −gLmat ) = h̄2 σ 2 1 − kσ 2 a(∂σ φ)2
∂(∂σ φ)
p
+ h̄2 ∂σ (σ 2 1 − kσ 2 )a∂σ φ,
−∂0
Interactions fondamentales et Cosmologie
153
d’où l’équation de Lagrange
3h̄2
h̄2
1
H
φ̇
+
φ̈ − h̄2 (1 − kσ 2 ) 2 ∂σ2 φ = 0
2
2
c
c
a
V ′ (φ) +
que l’on simplifie dans le cas d’un champ φ spatialement uniforme (∂σ φ = 0),
3h̄2
h̄2
H
φ̇
+
φ̈ = 0.
c2
c2
V ′ (φ) +
Cette équation peut aussi se retrouver à partir des expressions de ρφ et de pφ
injectées dans l’équation de continuité,
ρ̇φ c2 + 3(ρφ c2 + pφ )
ȧ
=0
a
en prenant garde au terme V̇ (φ) = V ′ (φ)φ̇. De ce fait, elle n’est pas une équation
indépendante des deux premières.
La phase de de Sitter
Les équations de Friedmann et de Raychaudhuri, et l’équation de mouvement de
l’inflaton dans le cas d’un champ scalaire réel uniforme s’écrivent donc
H2 +
kc2
8πG h̄2 2 1
=
φ̇ + 2 V (φ) ,
2
2
2
a
3c 2c
kc2 + 2Ḣa2 + 3ȧ2 = −
V ′ (φ) +
4πG h̄2 2
φ̇ − V (φ)
2
2
c
c
3h̄2
h̄2
H
φ̇
+
φ̈ = 0
c2
c2
et sont aussi associées à une densité et une pression de la forme
ρφ c2 =
h̄2 2
φ̇ + V (φ),
2c2
pφ =
h̄2 2
φ̇ − V (φ).
2c2
La seconde équation (de Raychaudhuri) n’est généralement pas discutée (les trois
équations étant liées, il est plus simple de raisonner sur la première et la troisième).
Il s’agit maintenant de contraindre le potentiel pour espérer produire la phase
d’inflation. On fait généralement l’approximation du roulement lent qui permet de
trouver une limite où l’équation d’état se réduise à wφ = −1, ce qui conduit à une
phase de de Sitter :
φ̈ ≪ 3H φ̇,
et
φ̇2 ≪
c2
V (φ).
h̄2
154
Mis à jour le 14 Décembre 2012
La seconde condition (énergie cinétique faible devant le potentiel, condition déjà
imposée pour que wφ ≃ −1) suppose un potentiel variant très lentement. Une
forme possible est celle d’un potentiel en φ4 juste au-dessous de la température
de transition, lorsque le terme quadratique est très légèrement négatif.
Figure 10.1 L’approximation du roulement lent.
Dans les conditions du roulement lent, le potentiel varie très peu et T00 ≃ V (φ)
peut être approximé par sa valeur au temps de Planck (nous sommes dans les phases
primordiales de l’Univers),
T00 ≃ 12 V (φPl. ) ≃ ρPl. c2 =
c7
.
h̄G2
L’analyse dimensionnelle permet en effet de former à partir des constantes G, h̄
et c, des quantités homogènes respectivement à une masse, MPl. = (h̄c/G)1/2 ≃
2.2 10−8 kg, à un temps, TPl. = (Gh̄/c5 )1/2 ≃ 5.4 10−44 s et à une longueur, LPl. =
(Gh̄/c3 )1/2 ≃ 1.6 10−35 m. La densité lagrangienne ayant pour dimensions celles du
−2
c7
potentiel, [L] = ML−1 T−2 , on obtient en effet LPl. ≃ V (φPl. ) ≃ MPl. L−1
Pl. TPl. = h̄G2 .
Les dimensions du champ se déduisent de celles du lagrangien et sont données par
c2
.
[φ] = M−1/2 T−3/2 = G1/2
h̄
5
4πc
L’équation de Friedmann donne dans ces conditions H 2 = 4πG
3c2 V (φPl. ) = 3Gh̄ où
l’on a négligé √
le terme en kc2 /a2 en raison de la croissance rapide de a, et il vient
−1
H ≃ HPl. = 4π3TPl.
. Cela conduit bien à une phase de de Sitter d’expansion
exponentielle du facteur d’échelle, car HPl. = const. = (1/a)da/dt admet pour
solution
a(t) = aPl. exp(HPl. t).
Interactions fondamentales et Cosmologie
155
Figure 10.2 Comparaison entre un scenario ordinaire et un scenario avec phase
d’inflation.
On ajuste les paramètres tf et ti de début et de fin de la phase d’inflation pour
156
Mis à jour le 14 Décembre 2012
rendre compte de la valeur d’homogénéité du CMB observée aujourd’hui.
Les conditions du roulement lent permettent l’établissement d’une période
d’inflation, mais pour que celle-ci se termine, il faut que le champ évolue vers
un puits de potentiel où il puisse acquérir une énergie cinétique de l’ordre de
l’énergie potentielle, modifiant l’équation d’état associée qui redevient analogue à
celle de la matière ordinaire (permettant à la gravitation de redevenir attractive).
L’expansion reprend ainsi une forme en loi de puissance telle que celle que l’on
connaı̂t aujourd’hui.
Solutions à certains problèmes cosmologiques
Le problème de la platitude est automatiquement résolu, car pendant l’inflation,
Ω(t) − 1 = a2kH 2 ∼ e−2HPl. t peut avoir été aussi petit qu’on le souhaite. Pour être
compatible avec les valeurs observées aujourd’hui, l’inflation doit avoir provoqué une
croissance du facteur d’échelle telle que
a(tf )
∼ e100 = 1043 .
a(ti )
Cette phase a également produit une dilution extrême qui résoud du même
coup le problème des reliques massives. Le problème de l’horizon et celui des
grandes structures finalement sont résolus également. La figure ci-dessous illustre
la résolution du problème de l’horizon.
Figure 10.3 Solution au problème de l’horizon par la phase d’inflation.
Les scenarios-type
Il existe de nombreux scenarios conduisant à une phase d’inflation. On peut
les regrouper essentiellement en trois classes : les scenarios comprenant un champ
scalaire couplé à un potentiel tel que ce que nous avons décrit dans ce chapitre,
les scenarios à dérivées plus élevées comme les théories f (R) et les modèles de
k−inflation dans lesquelles l’énergie cinétique du champ scalaire prend une forme
Interactions fondamentales et Cosmologie
157
non traditionnelle (les p−théories). Les deux dernières classes conduisent de manière
effective à un champ scalaire couplé à la gravitation et soumis à un potentiel.
Le cas des théories f (R) est bien connu. La théorie d’Einstein est la plus
simple des théories métriques de Rla gravitation.
L’action du champ gravitationnel
√
libre se réduit à celle d’Hilbert, d4 x −gR. C’est la seule théorie qui conduise
dans l’espace-temps à 4d à des équations du mouvement du second ordre. Toute
modification de cette action génère des dérivées d’ordre plus élevé, ce qui entraı̂ne
qu’en plus du graviton de spin 2, la théorie contient génériquement un degré
de liberté supplémentaire, un champ de spin nul, c’est-à-dire un champ scalaire.
Considérons le cas de l’action
Z
√
1
S = 2 d4 x −gf (R).
Les équations de mouvement du champ libre deviennent
′
f ′ (R)Rµν − 12 gµν f (R) + gµν [f ′ (R)],α
,α − [f (R)];µν = 0.
Si l’on applique une transformation conforme (dilatation locale) gµν −→ g̃µν = F gµν ,
le tenseur de Ricci se transforme également et l’on obtient les équations d’Einstein
R̃µν − 12 R̃g̃µν = T̃µν
avec le tenseur T̃µν associé à un champ scalaire effectif φ(x) = ln F (R) (avec
F (R) = f ′ (R)) soumis à un potentiel V (φ) = (f (R) − Rf ′ (R))/[f ′ (R)]2 . Une théorie
de la gravitation ayant des dérivées plus élevées que 2 est conformément équivalente
à une théorie d’Einstein couplée à un champ scalaire.
Les p−théories sont des théories du type Born-Infeld. S’il existe un champ décrit
par l’action
Z
√
S = d4 x −g p(X, φ)
avec X = 12 ∂µ φ ∂ µ φ où le lagrangien p joue le rôle de pression effective et où
ρc2 = 2X(∂p/∂X) − p, vµ = (2X)−1 ∂µ φ dans Tµν . En jouant sur la forme de p,
on peut obtenir une phase d’inflation.
Ce qu’il importe de conclure dans ce chapitre, c’est qu’il existe une grande variété
- ici limitée aux champs scalaires - de candidats à l’inflation, mais qui ont en commun
de conduire à un même scenario générique. En l’absence de moyens de vérification
observationnelle, il importe peu de savoir quel candidat a le plus de chances d’être
réalisé dans notre univers.
158
Mis à jour le 14 Décembre 2012
Cosmologie
159
11
Cosmologies alternatives
Motivations
Le modèle cosmologique standard souffre d’un grand nombre de défauts,
communément appelés les problèmes cosmologiques, comme le problème de la
constante cosmologique, de la matière noire, de l’horizon, des reliques, etc. La
résolution de ces problèmes passe par des théories ingénieuses, mais hautement
spéculatives comme l’inflation, par l’espoir que des campagnes d’observations futures
mettront en évidence de nouvelles formes de matière comme les WIMPS ou d’énergie
comme la quintessence, ou pourquoi pas, par une remise en question des fondements
comme la gravitation. On se propose d’ébaucher quelques pistes dans ce court
chapitre polémique !
Parmi les alternatives éventuelles, il y a essentiellement deux classes de
modifications : les théories alternatives de la gravitation dont il sera davantage
question dans ce chapitre, ou les dynamiques modifiées par rapport au schéma
communément admis (MOND pour MOdified Newtonian Dynamics, etc) (115) .
Si l’on se penche sur internet, on trouve rapidement des pages proposant
des théories de la gravitation alternatives (théorie scalaire de Nordström, théorie
scalaire-tensorielle de Brans et Dicke, théorie conforme de Weyl, généralisations à 5
dimensions avec l’approche de Kaluza et Klein, etc). Par exemple sur Wikipedia.
(115)
Ces dernières sont susceptibles de résoudre l’anomalie observée dans la dépendance avec la
distance au centre des vitesses radiales des étoiles dans les bras de galaxies. En effet, si l’on
suppose une modification de la loi fondamentale de la dynamique faisant apparaı̂tre une accélération
~ = m~af (|~a|/a0 ) avec f (x) → x dans une limite convenable, il en résulte
caractéristique a0 , F
2
2
GM/r = a /a0 = v 4 /a0 r 2 , soit v 4 = GM a0 ce qui permettrait d’expliquer le plateau observé
dans les courbes de vitesse. Tout le problème consiste ensuite à donner à a0 la valeur requise, puis
à explorer les autres conséquences de cette modification en souhaitant qu’elles ne contredisent pas
des succès antérieurs.
160
Mis à jour le 14 Décembre 2012
Figure 11.1 Théories de la gravitation sur Wikipedia.
On se propose de discuter plus en détail de ces théories relativistes de la
gravitation qui offrent une alternative à la relativité générale.
Les ingrédients du modèle cosmologique standard
Passons rapidement en revue les éléments essentiels au modèle cosmologique
standard, avant de proposer des formulations alternatives. Un tel modèle suppose
- de travailler à très grande échelle, typiquement 1024 − 1026 m,
- une théorie de la gravitation, c’est-à-dire essentiellement une géométrie dans
les théories métriques, soit un objet tel que Gµν pour la relativité générale,
- des données (sinon des hypothèses) sur le contenu matériel et énergétique de
l’Univers, Tµν ,
- des hypothèses de symétrie qui contraignent gµν de manière à permettre
d’exprimer à la fois Gµν et Tµν .
Cosmologie
161
Le modèle cosmologique standard est fondé sur le principe cosmologique qui
restreint la métrique à celle proposée par Friedmann, Robertson et Walker, soit avec
xµ = (ct, r, θ, ϕ),
dσ 2
2
2
ds2 = c2 dt2 − a2 (t)
,
+
σ
dΩ
1 − kσ 2
avec σ = r/a(t) la coordonnée comobile et a(t) le facteur d’échelle de l’Univers,
k = 0, ±1 sa courbure. La théorie de la gravitation appliquée dans ce modèle est
celle d’Einstein, appelée aussi relativité générale, soit
1
Gµν = Rµν − gµν Rαα
2
où le tenseur de Ricci Rµν comprend des dérivées premières et secondes de gµν .
Enfin, pour ce qui concerne le contenu matériel de l’Univers, il s’agit d’un “fluide
cosmique”
Tµν = (ρ + p/c2 )vµ vν − pgµν
avec diverses composantes obéissant à des équations d’état de la forme
pw = wρc2 .
Pour rendre le modèle compatible avec les mesures, on distingue essentiellement trois
composantes, la matière froide pM = 0, le rayonnement pR = 31 ρc2 et la constante
cosmologique pΛ = −ρΛ c2 .
Avec l’ensemble de ces “ingrédients”, la dynamique de l’Univers, régie par les
équations d’Einstein,
8πG
1
Rµν − gµν Rαα = 4 Tµν ,
2
c
conduit aux équations de Friedmann
1 ȧ2
kc2
1
4
+
− Λc2 = πGρ,
2
2
2a
2a
6
3
ä ȧ2
kc2
8πG
2 + 2 + 2 − Λc2 = − 2 p.
a a
a
c
Ce qui valide l’utilisation de la relativité générale (GTR) comme théorie de la
gravitation dans l’esprit du modèle cosmologique standard, c’est le schéma suivant :
Tableau 11.1 L’“esprit” du modèle cosmologique standard.
Théorie
Gravité newtonienne
~∇2 φ(~
r) = ρ(~
r)
⇑
GTR
Gµν = κTµν
Solution
−→
−→
Potentiel newtonien
φ(~
r ) = − const.
|~
r|
⇑
Métrique de Schwarzschild gµν
φ = solution newtonienne + corrections
162
Mis à jour le 14 Décembre 2012
dans lequel les corrections au comportement newtonien sont faibles dans le domaine
où la gravité newtonienne était efficace et sont confirmées par l’expérience (les “trois
tests classiques” dans le système solaire). Ces corrections en revanche n’ont aucune
raison d’être faibles dans les domaines nouvellement accessibles, tant qu’elles ne se
heurtent pas à des réultats d’expérience.
On effectue ensuite un inventaire des composants essentiels de l’Univers sur la
base des observations accessibles, pour répertorier les diverses formes de matièreénergie. Les mesures les plus significatives dans le plan ΩΛ − ΩM conduisent à une
proportion très importante de formes de matière-énergie (dite sombre) qui sont
encore très mal connues à l’heure actuelle, mais dont la présence est indispensable
dans le cadre du modèle cosmologique standard pour expliquer les paramètres
“cinématiques” (constante de Hubble, paramètre de décélération, . . . ) observés. On
arrive ainsi aux données récapitulées dans le chapitre précédent et présentées dans
la figure suivante :
Figure 11.2 Composition essentielle de l’Univers dans le plan ΩΛ − ΩM .
Notons que les cosmologistes ont envisagé bien d’autres formes d’énergie.
Mentionnons à côté du rayonnement (w = 1/3), de la matière (w = 0) et de
la constante cosmologique (w = −1), des formes plus exotiques comme l’énergie
ultralégère (ultralight, w > 1/3), les cordes cosmiques (cosmic strings, w = −1/3),
les parois de domaines (domain walls, w = −2/3) ou l’énergie fantôme (phatom
energy, w < −1) (116) .
Théories alternatives de la gravitation
(116)
R.J. Nemiroff and B. Patla, Adventures in Friedmann cosmology: A detailed expansion of the
cosmological Friedmann equations, Am. J. Phys. 76 265 (2008).
Cosmologie
163
⊲ Extensions “métriques” de la relativité générale. Il existe des extensions
de la relativité générale qui entrent dans le cadre évoqué ici avec le tableau précédent.
Rappelons que la relativité générale est fondée sur l’action d’Einstein-Hilbert (en
l’absence de matière-énergie),
SEH = −
Z
√
d4 x −g Rαα ,
de sorte que par variation de l’action on obtient
δSEH
= 0 entraı̂ne
δg µν
1
Gµν ≡ Rµν − gµν Rαα = 0.
2
La relativité générale, basée sur l’action SEH , est la plus simple des théories
métriques de la gravitation. De nombreuses généralisations en ont été proposées,
telles que
- théories f (R)
S=−
S=−
Z
Z
d4 x(−g)1/2 (Rαα )2 ,
d4 x(−g)1/2 Rαβ Rαβ ,
Sf (R) = −
Z
d4 x(−g)1/2 f (Rαα ),
-
théories incluant davantage de champs, comme la théorie scalaire-tenseur de
Brans et Dicke
Z
SBS = − d4 x(−g)1/2 (φRαα − wφ−1 φ;µ )φ;µ ),
-
théories incluant davantage de dimensions, comme la théorie de Kaluza et Klein
ds2 = gM N dxM dxN = dw2 + gµν dxµ dxν .
Toutes ces théories admettent la relativité générale comme limite.
⊲ Schéma d’un modèle cosmologique au-delà du modèle cosmologique
standard. Pour envisager des théories alternatives en toute généralité, il est
bon d’étendre le schéma proposé. En effet, ce schéma est trop restrictif car il est
parfaitement possible qu’une théorie ne redonne jamais la théorie newtonienne (ou
par extension la relativité générale) dans aucune limite, sans toutefois être exclue
si les solutions de la nouvelle théorie sont susceptibles de redonner à la limite
non relativiste la solution newtonienne, ou dans le contexte relativiste, la solution
einsteinienne avec éventuellement des corrections nouvelles, à condition que celles-ci
soient négligeables à l’échelle du système solaire où la gravitation d’Einstein a passé
les tests observationnels avec succès.
Le tableau initial doit donc être remplacé par un schéma analogue avec une
contrainte au niveau des solutions uniquement.
164
Mis à jour le 14 Décembre 2012
Tableau 11.2 Les contraintes pour des théories alternatives de la gravitation.
Théorie
Solution
Gravité newtonienne
~∇2 φ(~
r) = ρ(~
r)
−→
Gravitation relativiste alternative
Wµν = κTµν
−→
Potentiel newtonien
φ(~
r) = − const.
|~
r|
⇑
Métrique généralisée gµν
φ = solution newtonienne + corrections GTR
+ autres corrections
Ici, Wµν est un nouvel objet à construire. Le fait que l’on retrouve les corrections
de relativité générale à la limite faiblement relativiste garantit que les trois tests
classiques soient satisfaits si les nouvelles corrections sont négligeables à l’échelle du
système solaire. A des échelles plus importantes en revanche, on peut espérer que
ces corrections puissent jouer un rôle déterminant et construire ainsi une nouvelle
cosmologie
⊲ Exemples dans un contexte classique. La gravité newtonienne est régie
par exemple par l’équation de Poisson,
~ 2 φ(~r) = ρ(~r).
∇
Dans le cas d’une distribution de masse à symétrie sphérique, limitée par une taille
caractéristique R, le potentiel newtonien à l’extérieur de la distribution de masse
s’en déduit :
Z
1 R ′ ′2 ′
dr r ρ(r )
φr>R (~r) = −
r 0
=−
const.
.
r
On pourrait très bien imaginer une théorie basée sur une équation locale différente,
par exemple
~ 4 φ(~r) = µ(~r).
∇
Dans cette équation, µ(~r) est une quantité reliée à la densité de masse et définie
de sorte que φ(~r) soit toujours le potentiel gravitationnel. Cette équation ne peut
pas redonner l’équation de Poisson traditionelle, mais ses solutions dans le cas de la
symétrie sphérique, de la forme
1
φr>R (~r) = − r
2
Z
R
0
1
dr r µ(r ) −
6r
′ ′2
C
= −C1 × r − 2
r
′
Z
R
4
dr ′ r ′ µ(r ′ )
0
admettent le potentiel newtonien comme limite à courte distance. Le premier terme,
qui varie linéairement avec la distance, est susceptible de donner lieu à une nouvelle
physique à grande distance.
C’est le même type de démarche que l’on peut envisager dans le contexte des
théories métriques et l’exemple de la théorie de Weyl fait l’objet du paragraphe
suivant.
Cosmologie
165
Modification de la géométrie, la théorie conforme de Weyl
⊲ L’action de Weyl. (117) Weyl a envisagé une généralisation de la relativité
générale, éventuellement susceptible de décrire également l’électromagnétisme, en introduisant au-delà des changements arbitraires de coordonnées, des transformations
“de jauge” locales : les transformations conformes, ou dilatations locales,
gµν (x) → e2α(x) gµν (x),
Aµ (x) → Aµ (x) − e∂µ α(x).
L’action SEH n’étant pas invariante par ces transformations, Weyl a construit un
tenseur qui reste inchangé, Cλµνκ , et une action invariante de Lorentz, Cλµνκ C λµνκ
et invariante conforme,
Z
1
1 α 2
4
1/2
λµνκ
µν
SW = −
d x(−g)
Rλµνκ R
− 2Rµν R + (R α )
4
3
conduisant aux équations du mouvement
λµνκ
W µν ≡ 2C;λ;κ
− C λµνκ Rλκ = T µν .
⊲ Solution possible au problème des bras de galaxies. En l’absence
de matière-énergie, Tµν = 0, et l’équation du mouvement Wµν = 0 se réduit à
Rµν = 0, de sorte que l’on retrouve la solution de Schwarzschild, et par conséquent
les prévisions habituelles de la relativité générale en ce qui concerne les trois tests
classiques. La solution de Schwarzschild est donc bien une solution de la théorie
conforme de Weyl dans une certaine limite, bien qu’il soit impossible de retrouver
Gµν à partir de Wµν dans cette limite. La limite non relativiste donne en effet un
intervalle
ds2 = B(r)c2 dt2 −
avec
dr 2
+ r 2 dΩ2 ,
B(r)
~ 4 B(~r) = ρ(~r)
∇
de sorte qu’à l’exterieur d’une distribution de masse sphérique
B(r > R) = g00 = −
1
2β
+ γr.
=1−
g11
r
Le potentiel gravitationnel croı̂t à grande distance, c’est-à-dire typiquement dans
les régions dans lesquelles la matière sombre est habituellement introduite (les halos
galactiques), voire aux distances auxquelles la constante cosmologique joue son rôle
répulsif !
Les anomalies observées dans les courbes de vitesse de rotation des étoiles
lontaines dans les bras des galaxies peuvent être modélisées en utilisant la gravitation
conforme sans avoir recours à l’introduction de halos galactiques constitués de
matière sombre.
(117)
P. Mannheim, astro-ph/0505266
166
Mis à jour le 14 Décembre 2012
Figure 11.3 L’anomalie des vitesses de rotation des étoiles dans les bras de
galaxies. La contribution en tirets est celle de la gravittaion ordinaire, celle en
pointillé (croissante) est due au terme supplémentaire dans la garvitation de Weyl.
Aucune des deux contributions ne nécessite d’introduire de forme de matière autre
que celle qui est visible.
Cosmologie
167
⊲ Cosmologie conforme. Supposons un modèle simple dans lequel l’Univers
est composé d’une espèce non massive de fermions ψ(x) couplée de manière
covariante à la gravitation,
iψ̄γ µ (x)∂µ ψ → iψ̄γ µ (x)[∂µ + Γµ (x)]ψ
et d’un champ scalaire de Higgs φ(x) couplé au champ de fermions ∼ hφψ̄ψ et
également couplé minimalement à la gravitation,
1
∂µ φ∂ µ φ +2m φ2 + λφ4 → φ;µ φ;µ − Rαα φ2 + λφ4 .
6
Au total, l’action prend la forme
SW + SM
1
=−
4
Z
d4 x(−g)−1/2 Cλµνκ (x)C λµνκ (x)
1
+ φ;µ φ;µ − Rαα φ2 + λφ4
6
+ iψ̄γ µ (x)[∂µ + Γµ (x)]ψ − hφψ̄ψ
Dans le cas de la métrique de FRW, on montre que Cλµνκ = 0 et en
introduisant le tenseur énergie-impulsion de la matière (fermionique ici) les équations
du mouvement de la cosmologie conforme deviennent
1
1
Tµν = (ρ + p/c2 )vµ vν + pgµν − φ20 (Rµν − gµν R) − gµν λφ40 = 0.
6
2
Le coefficient 16 φ20 joue le rôle d’une constante de gravitation univeselle effective,
gouvernée par le boson de Higgs,
Geff = −
3c4
.
4πφ20
Cette constante de gravitation négative pourrait éviter l’introduction de matière
noire à l’échelle cosmologique, comme la solution approchée appliquée aux bras de
galaxies a déjà permis d’en faire l’économie. Le terme en φ40 joue le rôle de constante
cosmologique
Λ = λφ40 ,
et peut rendre compte pour sa part de l’accélération de l’expansion cosmologique.
168
Mis à jour le 14 Décembre 2012
Figure 11.4 Comparaison entre la comsologie standard et la cosmologie conforme
pour l’affinement des données issues des SNIa.
On voit à partir de ces exemples simplifiés comment la théorie de Weyl de la
gravitation est susceptible d’apporter une vision différente de l’Univers, sans être
obligé d’introduire des formes exotiques et non observées de matière-énergie. Il
resterait cependant à vérifier que cette théorie est capable de rendre compte des faits
observés sans multiplier les paramètres. C’est une question qui n’est pas tranchée à
l’heure actuelle.
Cosmologie
169
12
Vers la cosmologie quantique
Le problème de l’origine de l’Univers est partiellement résolu moyennant l’hypothèse
d’une naissance par effet tunnel. On élabore pour cela une approche quantique de
la cosmologie.
Formulation lagrangienne et hamiltonienne des équations de Friedmann
Il s’agit de déterminer les équations de Friedmann à partir d’une formulation
variationnelle, soit d’un lagrangien, puis de construire l’hamiltonien et l’impulsion
associée. C’est une présentation simplifiée de l’approche de Wheeler-DeWitt. Partons
des équations de Friedmann,
2
ȧ
8πG
kc2
Λc2
−
ρ+ 2 −
= 0,
a
3
a
3
2
ä 1 ȧ
Λc2
4πGp
kc2
+
+
= 0.
+ 2 −
a 2 a
2a
2
c2
En injectant la première dans la seconde, on reformule la seconde équation comme
Λc2
ä 4πGp
+
(ρ + 3p/c2 ) −
= 0.
a
3
2
La formulation de Wheeler-DeWitt est facilement appliquée en l’absence de matière
et pour un Univers fermé (k = +1), soit dans ce cas
2
ȧ
Λc2
kc2
= 0,
+ 2 −
a
a
3
ä Λc2
−
= 0.
a
2
170
Mis à jour le 14 Décembre 2012
Construisons un lagrangien dont la légitimité vient de ce qu’il permet de
retrouver les équations de Friedmann comme équations du mouvement,
" #
2
ȧ
Λc2
kc2
3
L=a
− 2 +
≡ L(a, ȧ).
a
a
3
On en déduit le moment conjugué au facteur d’échelle,
p=
∂L
= 2aȧ
∂ ȧ
en notant que
∂L
= ȧ2 − kc2 + Λc2 a2 ,
∂a
l’équation d’Euler-Lagrange donne l’équation du mouvement suivante
0 = ṗ −
∂L
∂a
= 2ȧ2 + 2aä − ȧ2 + kc2 − Λc2 a2 ,
soit finalement l’une des équations de Friedmann,
ä 1
+
a 2
2
ȧ
Λc2
kc2
= 0.
+ 2 −
a
2a
2
On peut maintenant construire l’hamiltonien associé (qu’on note H pour ne pas
confondre avec la constante de Hubble),
H = pȧ − L
!
2
2
2
ȧ
Λc
kc
= a3
+ 2 −
a
a
3
≡ 0.
Il est identiquement nul en raison de la première équation de Friedmann. Exprimé
en fonction de p, l’hamiltonien devient
Λc2 a3
p2
+ kc2 a −
4a
3
1 1 2
2 2 4
2 2
=
p + 2kc a − Λc a
2a 2
3
H=
= 0.
Il ne faut pas confondre l’hamiltonien et l’énergie totale, proportionnelle à −k. La
signification de H ne me semble d’ailleurs pas bien claire, mais par le biais de la
Cosmologie
171
quantification canonique, cela conduit à chercher des fonctions propres d’énergie
nulle.
Quantification canonique des équations de Friedmann et équation de
Wheeler-DeWitt
On applique ensuite le principe de correspondance
∂
∂t
∂
p → −ih̄ .
∂a
H → ih̄
pour obtenir l’équation de Wheeler-DeWitt,
h̄2 ∂ 2 ψ(a)
2 2 4
2 2
−
+ 2kc a − Λc a ψ(a) = 0,
2 ∂a2
3
soit une équation de Schrödinger pour un potentiel de la forme
2 2 4
2 2
V (a) = 2kc a − Λc a
3
qui présente une barrière à l’origine au travers de laquelle doit “transiter” la fonction
d’onde pour parvenir à une zone classique de facteur d’échelle fini.
Figure 12.1 Passage par effet tunnel à travers une barrière de potentiel (emprunté
à D. Atkatz, Am. J. Phys. 62, 619 (1994).
Cette approche permet d’éviter que l’Univers ne soit créé par une singularité au
moment du Big Bang. Il apparaı̂t par effet tunnel avec un facteur d’échelle non nul
à partir duquel l’expansion peut se développer.
172
Mis à jour le 14 Décembre 2012
Cosmologie
Bibliographie
173
174
Mis à jour le 14 Décembre 2012
175
Eléments de bibliographie
Incontournables...
L.D. Landau et E. Lifshitz, Théorie des champs, 3ème édition, Editions MIR,
Moscou 1970.
Texte de référence, la relativité restreinte y est présentée dans les chapitres 1 à
4 et 8 (pour le rayonnement des charges accélérées), la relativité générale dans
les chapitres 10 à 12.
Edward W. Kolb et Michael S. Turner , The early universe, Addison-Wesley,
Redwood City, 1990.
C’est le texte de référence par excellence en cosmologie.
John A. Peacock, Cosmological Physics, Cambridge University Press, 1999.
Plus récent que le précédent c’est aussi un classique.
I.R. Kenyon, General relativity, Oxford University Press, New York 1990.
Ouvrage très accessible sur la relativité générale. Mérite vraiment qu’on s’y
attarde (à conserver sur sa table de nuit !).
M.V. Berry, Principles of cosmology and gravitation, Institute of Physics Publishing,
Bristol 1989.
Passionnant ouvrage d’introduction à la relativité générale et à la cosmologie. n
ouvrage très intéressant.
W. Pauli, Theory of relativity, Dover, New York 1958.
C’est un texte classique tout d’abord écrit à la demande de Sommerfeld par
Wolfgang Pauli alors âgé de 21 ans, puis à peine repris et complété en 1955,
à l’occasion du cinquantenaire des premiers articles d’Einstein sur la relativité.
C’est devenu un texte de référence considéré comme très complet. A noter qu’il
emploie d’abord la métrique de Minkowski avant d’introduire la distinction entre
les tenseurs contravariants et covariants comme dans les premières éditions de
Landau et Lifshitz.
P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press,
Princeton 1993.
S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972.
Parmi les textes qui font autorité en matière de relativité générale, c’est
probablement le plus célèbre, . . .
C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, Freeman, San Francisco
1973.
. . . avec celui-ci qui est une mine d’informations.
Pour prolonger la réflexion. . .
E. Harrisson, Cosmology, 2nd edition, Cambridge University Press, Cambridge
2000.
Un ouvrage passionnant sur la cosmologie, de l’antiquité aux théories actuelles.
Très accessible, la relativité y joue un rôle en de multiples endroits.
176
Bibliographie
M. Longair, Theoretical concepts in physics, Cambridge University Press, Cambridge
2003.
Auteur qui revendique et assume l’aspect théorique de la physique.
P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005.
Ouvrage récent en français, remarquable et très complet, notamment en matière
de données issues de mesures. Ce livre est incontestablement appelé à devenir
un classique !
P.A.M. Dirac, General theory of relativity, Princeton University Press, Princeton
1996.
Ouvrage d’une concision étonnante sur la relativité générale. Présentation très
formelle.
J.V. Narlikar, An introduction to Cosmology, Cambridge University Press, Cambridge 2002.
S. Weinberg, Cosmology, Oxford University Press, 2008.
L. Ryder, Introduction to General Relativity, Cambridge University Press, Cambridge 2009.
Du Ryder !
V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press,
Cambridge 2005.
M.P. Hobson; G. Efstathiou and A.N. Lasenby, General Relativity, an introduction
for physicits, Cambridge University Press, Cambridge 2006.
A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics,
and Cosmology Springer-Verlag, New-York 1992.
Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . .
M. Lachièze-Rey, Initiation à la cosmologie, Masson, Paris 1992.
Ouvrage très accessible (et en français !). Très intéressant, avec quelques prises
de positions parfois assez critiques vis à vis de la communauté, malheureusement
pas mal de redondances.
J. Rich, Fundamentals of cosmology, Springer, Berlin 2001.
La cosmologie moderne. Certaines parties sont accessibles assez facilement.
A. Einstein, Œuvres choisies, Vol. 2 et 3, Seuil, CNRS Éditions, Paris 1993.
Représente une somme ! Contient de nombreux textes d’Einstein et correspondances traduits en français et commentés.
G.F.R. Ellis and R.M. Williams, Flat and curved space-times, 2nd edition, Oxford
University Press, Oxford 2000.
Dans le même esprit que Harrisson. Très agréable à parcourir.
W. Rindler, Relativity, Special, general and cosmological, Oxford University Press,
Oxford 2001.
A. Guth et P. Steinhardt, l’Univers inflationniste in La Nouvelle Physique, ed. par
P. Davies, Sciences Flammarion, Paris 1993.
Bel ouvrage de vulgarisation sur les grands domaines de la physique.
M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford
2004.
Ouvrage parfaitement accessible et très à jour.
177
A. Liddle, An introduction to modern cosmology, John Wiley and Sons, Chichester
2003.
Texte assez court, très facile à lire, en chapitres courts et agréablement structuré.
Absolument recommendable !
T.P. Chen, Relativity, Gravitation, and Cosmology: A Basic Introduction, Oxford
University Press, Oxford 2004.
Encore un très bon texte récent.
A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil,
Paris 1997.
Présentation (et traduction si nécessaire) des textes fondateurs de Friedmann et
de Lemaı̂tre sur la cosmologie.
Des ouvrages et articles sur la théorie des champs. . .
D.J. Gross, Gauge Theory-Past, Present, and Future? Chinese Journal of Physics
30 955 (1992)
L.H. Ryder, Quantum field theory, Cambridge University Press, Cambridge 1985.
Texte pédagogique célèbre, assez court.
C. Quigg, Gauge theory of the strong, weak, and electromagnetic interactions,
Westwiew Press, 1997.
Des qualités comparables au Ryder.
S. Weinberg, The quantum theory of fields, Vol. I and II, Cambridge University
Press, Cambridge 1996.
Une somme, du Weinberg!
T.-P. Cheng and L.-F. Li, Gauge theory of elementary particle physics, Oxford
University Press, Oxford 1984.
B. Felsager, Geometry, particles and fields, Odense University Press, Gylling 1981.
M. E. Peskin and D. V. Schroeder, An Introduction to Quantum Field Theory,
(ABP) 1995.
Devenu un classique !
Des articles pédagogiques sur des sujets ponctuels
R.J. Adler, B. Casey and O.C. Jacob, Vacuum catastrophe: an elementary
exposition of the cosmological constant problem, Am. J. Phys. 63, 620 (1995).
D. Atkatz, Quantum cosmology for pedestrians Am. J. Phys. 62, 619 (1994).
Ph. Brax, The cosmological constant problem, Contemp. Phys. 45, 227 (2004).
Exposé à jour sur les problèmes suscités par la valeur de la constante
cosmologique et la matière noire.
C. Callan, R.H. Dicke and P.J.E. Peebles, Cosmology and newtonian mechanics, Am.
J. Phys. 33, 105 (1965).
C.F. Chyba, Kaluza-Klein unified field theory and apparent four-dimensional spacetime, Am. J. Phys. 53, 863 (1985).
V. Faraoni, A new solution for inflation, Am. J. Phys. 69, 372 (2001).
Une présentation simplifiée de la théorie de l’inflation, où un champ scalaire
conduit à des effets analogues à la constante cosmologique et produit une
expansion exponentielle de l’Univers.
V. Faraoni, Solving for the dynamics of the universe, Am. J. Phys. 67, 732 (1999).
178
Bibliographie
O. Gron, A new standard model of the universe, Eur. J. Phys. 23, 135 (2002).
Une présentation assez détaillée de la dynamique du modèle de FriedmannLemaı̂tre.
A. Harvey, Cosmological models, Am. J. Phys. 61, 901 (1993).
A. Harvey and E. Schucking, Einstein’s mistake and the cosmological constant, Am.
J. Phys. 68, 723 (2000).
Le titre est explicite. Très intéressant.
J.W. Norbury, From Newton’s laws to the Wheeler-DeWitt equation, Eur. J. Phys.
19, 143 (1998).
Présentation détaillée de la cosmologie newtonienne, jusqu’à une introduction à
la gravité quantique avec l’équation de Wheeler-DeWitt.
P. Pesic and S. P. Boughn, The Weyl-Cartan theorem and the naturalness of general
relativity, Eur. J. Phys. 24, 261 (2003).
Le théorème de Weyl-Cartan (démontré indépendamment à la même période par
ces deux auteurs) stipule que le scalaire de Ricci est le seul invariant relativiste
construit à partir du tenseur métrique, de ses dérivées premières et qui dépende
linéairement de ses dérivées secondes. Cela entraı̂ne que la théorie d’Einstein est
la seule construite de cette manière à partir du tenseur métrique.
W. Rindler, General relativity before special relativity: an unconventional overview
of relativity theory, Am. J. Phys. 62, 887 (1994).
B. Stefanski and D. Bedford, Vacuum gravity, Am. J. Phys. 62, 638 (1994).
A.J. Schwarz and N.A. Doughty, Kaluza-Klein unification and the Fierz-Pauli weak
field limit Am. J. Phys. 60, 150 (1992).
N. Straumann, The mystery of the cosmic vacuum energy density and the accelerated
expansion of the Universe, Eur. J. Phys. 20, 419 (1999).
Présentation historique du rôle de la constante cosmologique (et des hésitations
qu’elle a suscitées) et des problèmes que pose sa valeur actuelle extrêmement
faible.
Cours en ligne
M. Le Bellac, Relativité générale pour débutants,
http://cel.ccsd.cnrs.fr/cours/cel-33/cel-33.pdf
Nick Kaiser, Notes de cours d’astrophysique,
http://www.ifa.hawaii.edu/~kaiser/lectures/content.html
Ned Wright, Astronomy 275 lecture notes,
http://www.physics.ucla.edu/class/05S/275 WRIGHT/notes/index.html
T. F. Jordan, Cosmology calculations almost without general relativity
astro-ph/0309756
Mark Trodden, Sean M. Carroll, TASI Lectures: Introduction to Cosmology,
astro-ph/0401547
Juan Garcia-Bellido, Cosmology and Astrophysics,
astro-ph/0502139
Juan Garcia-Bellido, Astrophysics and Cosmology,
hep-ph/0004188
Júlio César Fabris, Introduction à la cosmologie,
gr-qc/0412017