Bertrand Berche - Groupe de Physique Statistique

Transcription

Master Sciences Physiques et Matériaux
M1 Physique
Interactions fondamentales et
Cosmologie
Bertrand Berche
Groupe de Physique Statistique
Université Henri Poincaré, Nancy 1
2
Interactions fondamentales et Cosmologie
i
Interactions fondamentales
et Cosmologie
Sommaire
Chap. 1 : Définir la cosmologie . . . . . . . . . . . . . . . . . . . . . .
1
Cosmologie relativiste .
. . . . . . . . . . . . . . . . . . . . .
5
Chap. 2 : Bases empiriques de la cosmologie . . . . . . . . . . . . . .
Introduction
Isotropie et homogénéité de l’Univers à grande échelle
Récession des galaxies, hypothèse de Hubble
7
Chap. 3 : Parenthèse : notions de relativité . . . . . . . . . . . . . .
Quadrivecteurs
Tenseurs
Définition des grandeurs physiques et expression covariante des lois physiques
Formulation covariante de l’électromagnétisme
19
Chap. 4 : Relativité générale et Cosmologie . . . . . . . . . . . . . .
Préambule
Gravitation relativiste
Application à la cosmologie
Histoire sommaire de l’Univers
29
Chap. 5 : Le modèle Lambda-CDM . . . . . . . . . . . . . . . . . . .
Les éléments essentiels du modèle ΛCDM
Paramètres mesurables
L’inventaire cosmique
55
ii
Le rôle particulier de Λ
Chap. 6 : Les “problèmes” cosmologiques . . . . . . . . . . . . . . .
La matière sombre
Le “problème” de la constante cosmoλogique ou de l’énergie sombre
Le problème de la platitude
Le problème de l’horizon
Autres difficultés
71
Théories des champs
. . . . . . . . . . . . . . . . . . . . . . .
95
Chap. 7 : Théories quantiques relativistes . . . . . . . . . . . . . . .
Equation de Schrödinger
Equation de Pauli
Equation de Klein-Gordon
Equations de Weyl
Equation de Dirac
Equation relativiste pour le photon
97
Chap. 8 : Classical gauge field theory . . . . . . . . . . . . . . . . . . 117
Introduction
Abelian U (1) gauge theory
Non-Abelian (Yang-Mills) SU (2) gauge theory
Chap. 9 : Spontaneous symmetry breaking . . . . . . . . . . . . . . . 133
Spontaneous breaking of global gauge symmetries
Spontaneous breaking of local symmetries
The Anderson mechanism
Gauge symmetric electroweak SU (2)W × U (1)Y theory
The Higgs mechanism
L’Univers primordial .
. . . . . . . . . . . . . . . . . . . . . . 145
Chap. 10 : L’inflation cosmologique . . . . . . . . . . . . . . . . . . . 147
Introduction
Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann associées
Equation de mouvement de l’inflaton
La phase de de Sitter
Solutions à certains problèmes cosmologiques
Les scenarios-type
Chap. 11 : Cosmologies alternatives . . . . . . . . . . . . . . . . . . . 159
iii
Motivations
Les ingrédients du modèle cosmologique standard
Théories alternatives de la gravitation
Modification de la géométrie, la théorie conforme de Weyl
Chap. 12 : Vers la cosmologie quantique . . . . . . . . . . . . . . . . 169
Formulation lagrangienne et hamiltonienne des équations de Friedmann
Quantification canonique des équations de Friedmann et équation de WheelerDeWitt
Bibliographie
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Chap. Eléments de bibliographie . . . . . . . . . . . . . . . . . . . . . 175
Incontournables...
Pour prolonger la réflexion. . .
Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . .
Des ouvrages et articles sur la théorie des champs. . .
Des articles pédagogiques sur des sujets ponctuels
Cours en ligne
1
Définir la cosmologie
La cosmologie est l’étude de l’Univers dans son ensemble à très grande échelle,
lorsque la composition et la nature précise du contenu matériel de l’Univers
importent peu et que ce contenu peut être remplacé par un milieu continu ayant
des propriétés moyennes.
Plutôt que de chercher à définir davantage ce dont il s’agit, je cite ci-dessous deux
ouvrages récents, en français. Tout d’abord un extrait des pages d’introduction du
livre de Peter et Uzan (1) qui permet de comprendre les enjeux de la cosmologie et
sa place particulière parmi les théories physiques :
Malgré (. . . ) l’abondance des observations, la cosmologie garde (. . . ) un statut
différent comparé aux autres sciences. En effet nous n’observons qu’un seul
Univers et qui plus est à partir d’une position unique de l’espace et du temps.
La plupart des observations sont donc cantonnées à notre cône de lumière passé.
La cosmologie ne fait donc pas l’économie d’hypothèses invérifiables comme par
exemple le Principe Cosmologique qui a des implications fortes concernant les
symétries des espace-temps cosmologiques.
La construction d’un modèle cosmologique repose principalement sur trois
hypothèses : (1) le choix d’une théorie de la gravitation, (2) des hypothèses sur
la nature de la matière présente dans notre Univers et (3) une hypothèse de
symétrie.
Il faut souligner que les observations cosmologiques ne peuvent être interprétées
indépendamment de ces hypothèses théoriques. Ainsi on ne cherche pas à prouver
la validité d’un modèle, mais à établir un accord entre les observations et
le cadre théorique dans lequel elles sont interprétées. Ceci n’empêche pas la
cosmologie d’exclure les modèles dont les prédictions sont incompatibles avec
les observations, comme dans tout autre domaine de la physique.
(1)
P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005.
1
2
Mis à jour le 14 Décembre 2012
Paru récemment également, un ouvrage collectif (2) comprend une contribution
de F. Bouchet intitulée Cosmologie dont je recommande vivement la lecture :
La cosmologie a pour objet les propriétés globales de l’Univers. Elle ne s’intéresse
pas aux objets de l’Univers en tant que tels, et cherche à ne retenir que ce qui
n’appartient à aucun d’entre eux en particulier. C’est une science physique, au
sens où on utilise la démarche, les méthodes et les lois de la physique. Mais les
investigations cosmologiques doivent utiliser les méthodes de l’astronomie, qui
est une science naturelle d’observation. Les systèmes observés sont à prendre
“comme ils sont”, sans pouvoir modifier à volonté leur environnement pour
en comprendre les mécanismes et valider les modèles qui les décrivent. La
validation scientifique est donc toujours plus délicate, puisqu’elle n’a pas accès à
l’expérience directe dans des conditions contrôlées ; d’autant plus que dans le cas
de la cosmologie, nous n’avons par définition qu’un seul système, qui de surcroı̂t
ne peut être observé que de l’intérieur !
La cosmologie moderne pose les principes suivants :
1. Une cosmologie scientifique a un sens. En d’autres termes il existe
effectivement des propriétés d’ensemble, à découvrir.
2. Les lois de la physique sont bien des lois universelles, qui doivent être valables
en tous temps et en tous lieux.
3. L’Univers est globalement identique partout, aucun lieu d’observation n’est
privilégié.
Tous ces postulats seront jugés à leurs fruits. A commencer par l’intelligibilité
de l’Univers en tant que tel. Le deuxième principe nous enjoint d’appliquer à
distance les lois validées dans notre environnement. La difficulté est que les lois de
la physique sont établies, pour un certain domaine d’échelle, de temps, d’énergie,
d’accélération, etc., par des expériences multiples dans ce domaine-là. Or, la
cosmologie contemporaine est précisément une entreprise où l’on considère des
conditions jamais rencontrées auparavant et qui risque de requérir une modification
de nos lois communes dans ces conditions extrêmes. C’est une difficulté, mais c’est
aussi une chance de forger une meilleure approximation de la réalité. Le troisième
principe, connu sous le nom de principe cosmologique, énonce l’homogénéité et
l’isotropie de l’espace. Néanmoins notre environnement immédiat est à l’évidence
très inhomogène. On entend donc par homogénéité de l’espace que les propriétés
moyennes d’un morceau d’Univers de suffisamment grand volume seront identiques
à celles de tout autre morceau de l’Univers. L’isotropie est l’identité des propriétés
dans toutes les directions autour de l’observateur.
L’objet de la cosmologie étant défini, il me semble utile de déflorer dès
maintenant le sujet ! Pendant longtemps, la cosmologie a été un champ scientifique
essentiellement spéculatif, en raison des difficultés inhérentes au sujet, notamment
en termes d’observations. Depuis une dizaine d’année s’est imposé un modèle
cosmologique standard. Derrière ce terme on entend qu’un consensus s’est dégagé
au sein de la communauté des cosmologistes. Ce consensus est fondé en grande
partie sur les mesures très fines des propriétés du fond de rayonnement cosmologique
(notamment ses “irrégularités”) et sur les campagnes d’observations de supernovæ
très lointaines. On a pu en déduire avec une précision remarquable les valeurs
des paramètres cosmologiques qui déterminent la composition et la dynamique de
l’Univers. Le modèle cosmologique standard est encore appelé modèle ΛCDM BBN et on précise en général qu’il est interprété dans le cadre du paradigme de
l’inflation. Ces termes techniques cachent les propriétés essentielles de l’Univers : il
(2)
M. Leduc et M. Le Bellac eds., Einstein aujourd’hui, CNRS Editions, Paris 2005.
Cosmologie
3
est dominé par la constante cosmologique Λ et la matière froide (c’est-à-dire non
relativiste), mais celle-ci est invisible (cold dark matter), les abondances relatives
des éléments légers dans l’Univers sont conformes aux prédictions du Big Bang
(Big Bang Nucleosynthesis) et enfin les théories cadre de l’inflation apportent des
réponses à un certain nombre de difficultés fondamentales qu’on appelle couramment
les “problèmes cosmologiques”, le problème de l’horizon, le problème de l’Univers
plat, le problème des reliques, . . .
On se propose de donner dans ce cours quelques notions de cosmologie afin de
comprendre en partie le modèle cosmologique standard. Les lecteurs intéressés par
davantage de physique sont encouragés, ne serait-ce que pour butiner, à se reporter
à la bibliographie (3) .
(3)
Notamment les ouvrages (mentionnés dans la bibliographie) de Kenyon, de Berry, de Liddle ou
de Longair, mais aussi le remarquable Harrisson ou encore à un niveau plus élevé, Peebles, Peacock
ou Rich, ou encore Kolb et Turner.
4
Cosmologie
Cosmologie relativiste
5
6
Cosmologie
7
2
Bases empiriques de la cosmologie
Introduction
La cosmologie est l’étude de l’Univers dans son ensemble. C’est un champ
disciplinaire qui a été initié par Einstein lorsqu’il s’est penché sur les implications
de la relativité générale à très grande échelle. D’autres noms sont associés à la
naissance de la cosmologie, de Sitter, Friedmann, Lemaı̂tre, Robertson, Walker,
Eddington, Gamow, Hoyle et d’autres, mais c’est encore Einstein qui a joué un
rôle précurseur, même s’il a assez rapidement abandonné ce domaine d’étude. J.P.
Luminet résume l’évolution de la cosmologie de la façon suivante : . . . Friedmann
et Lemaı̂tre sont de plus en plus reconnus comme des novateurs s’inscrivant dans
la lignée de Ptolémée, Copernic, Kepler, Galilée, Newton et Einstein. (. . . ) Les
contributions respectives des hommes de science ayant participé à l’élaboration du
nouveau paradigme cosmologique se clarifient enfin : Einstein a créé la théorie
de la relativité générale et écrit les équations gouvernant les propriétés physicogéométriques de l’univers ; Friedmann a découvert les solutions non statiques de
ces équations, décrivant la variation temporelle de l’espace, et entrevu son possible
commencement par une singularité ; Lemaı̂tre a relié l’expansion théorique de
l’espace au mouvement observé des galaxies, et jeté les bases physiques du Bing
Bang ; Hubble, enfin, a démontré la nature extragalactique des nébuleuses spirales et
confirmé expérimentalement la loi de proportionnalité entre leur vitesse de récession
et leur distance. in A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P.
Luminet, Seuil, Paris 1997.
Le fait que ce soit la relativité générale qui soit pertinente à l’échelle de l’Univers
provient de ce que la gravitation est la seule interaction effective entre constituants
de l’Univers dans cette limite. Le programme consiste en principe à extraire des
équations d’Einstein la géométrie et la dynamique de l’Univers (4) . Il faut pour
(4)
La discussion qui suit est empruntée à A.K. Raychaudhuri, S. Banerji and A. Banerjee, General
Relativity, Astrophysics, and Cosmology Springer-Verlag, New-York 1992.
8
Figure 2.1 La voie lactée observée à diverses fréquences électromagnétiques.
cela connaı̂tre les sources des champs, soit les composantes de T µν de même que
certaines conditions aux limites. La difficulté réside dans le fait que l’on ignore à peu
près tout de la distribution de matière et d’énergie, des contraintes et des vitesses
dans l’Univers. Il est vrai qu’à l’époque actuelle, les observations astronomiques
nous renseignent en partie sur ces distributions, mais elles semblent si irrégulières et
discontinues à première vue qu’une description mathématique s’avère horriblement
compliquée.
De plus les observations sont limitées au cône de lumière, elles sont donc très
locales. Deux hypothèses peuvent ici être avancées : celle d’un Univers hiérarchique
(discontinu et imbriqué à toute les échelles (5) ) et celle d’un Univers continu à des
échelles extrêmement grandes, au-delà des amas et super-amas galactiques, de l’ordre
(5)
Les galaxies sont un peu les unités de base, ce sont les plus grandes structures bien comprises
dans l’Univers. Au voisinage de notre galaxie (la voie lactée), une quinzaine d’autres galaxies dont
celle d’Andromède forment le groupe local dans un volume d’environ 1 Mpc3 . Au-delà on trouve
l’amas de la Vierge (Virgo) à 10 Mpc et dans une échelle de quelques dizaines de Mpc plusieurs amas
forment le superamas local de Virgo. L’Univers se structure en de tels superamas de taille typique
de l’ordre de 20 Mpc. Ces superamas semblent parfois reliés par des “ponts” de matière et entre
eux se trouvent d’immenses espaces apparemment vides de matière (comme dans la constellation
du Bouvier, à 150 Mpc, un vide d’une trentaine de Mpc). Il semblerait qu’à une échelle encore plus
grande un grand “mur” formé de feuillets se dessine sans qu’on ait la moindre idée pour le moment
sur son origine. Ces éléments sont empruntés à M. Lachièze-Rey.
Cosmologie
9
de quelques centaines de millions d’années-lumière. A cette échelle, la description
“hydrodynamique” prévaut (les galaxies sont l’analogue des molécules d’un liquide
pour lequel à une échelle assez grande devant l’échelle moléculaire, une description
continue en termes de densité ρ(r), de champs et d’équations différentielles
est valide). C’est cette vision hydrodynamique qui convainct actuellement la
communauté.
Le problème des conditions aux limites est aussi assez particulier. En
électromagnétisme en général, on résoud un problème en supposant une distribution
de charge finie et en imposant aux champs de s’annuler à l’infini. Il serait étrange
de considérer ici que toute la distribution de matière et d’énergie de l’Univers est
concentrée dans notre “voisinage” et baigne dans un grand vide, ce qui donne au
problème des conditions aux limites une importance particulière.
Isotropie et homogénéité de l’Univers à grande échelle
En fondant la cosmologie moderne en 1917, Einstein a introduit des hypothèses
naturelles, mais assez arbitraires pour résoudre ces difficultés. L’absence de
conditions aux limites est compensée en supposant un Univers homogène et isotrope.
L’idée d’un Univers homogène (c’est le principe cosmologique) est guidée par le souci
de ne pas être anthropique en attribuant une place privilégiée à la Terre. Par ailleurs
on sait maintenant, notamment grâce aux observations fines du fond de rayonnement
cosmique que l’Univers est essentiellement isotrope et s’il doit être isotrope partout,
il est alors également homogène. Einstein a également supposé un Univers statique,
ce en quoi il avait tort, mais cela l’a conduit à introduire la constante cosmologique
Λ qui se révèle maintenant indispensable dans tous les modèles cosmologiques. Les
anecdotes autour de cette constante sont d’ailleurs très instructives. Einstein a
tout d’abord introduit la constante cosmologique comme la simplification la plus
simple qu’il puisse faire aux équations de la gravitation (respectant les symétries du
problème, mais introduisant une nouvelle constante fondamentale de la physique) de
sorte que l’Univers soit statique. Il a d’ailleurs combattu les solutions non statiques
de Friedmann. Quelques années plus tard, les observations, notamment de Hubble,
mettaient en évidence l’évolution de l’Univers (en l’occurrence son expansion), ce qui
a pour un temps laissé penser à Einstein que la constante cosmologique était la “plus
grosse erreur de sa vie” (6) . Cette constante est de nos jours une pièce maı̂tresse des
modèles d’évolution de l’Univers, même si sa détermination précise est un problème
ouvert, notamment l’interprétation de la valeur mesurée reste problématique et à
l’origine d’un spectaculaire désaccord théorie-expérience (7) .
Les observations de l’Univers à des échelles de plusieurs centaines de millions
d’années-lumière font état d’une distribution de matière et de rayonnement
remarquablement isotropes. A des échelles inférieures, l’Univers apparaı̂t composé
de structures complexes, étoiles, galaxies (les galaxies sont séparées les unes des
(6)
La littérature fait état du terme anglais “blunder”, c’est-à-dire “bévue”, rapporté par G.
Gamow, voir cependant à ce sujet A. Harvey and E. Schucking, Einstein’s mistake and the
cosmological constant, Am. J. Phys. 68, 723 (2000) ou A. Pais (‘Subtle is the Lord...’: The
Science and the Life of Albert Einstein, Oxford University Press, New-York 1982) qui cite une
lettre d’Einstein à Weyl dans laquelle après avoir pris connaissance des données astronomiques en
faveur de l’expansion de l’Univers, il s’exprime ainsi “If there is no quasi-static world, then away
with the cosmological term!”.
(7)
La constante cosmologique a mis du temps à s’imposer. Encore assez récemment, elle ne
faisait pas l’unanimité ; Feynman en 1963 par exemple écrivait dans R.P. Feynman, Lectures
on gravitation, Penguin Books, 1995, qu’elle lui semblait inutile et Landau non plus n’était pas
favorable à l’introduction de cette constante cosmologique, pas plus qu’à aucune modification de
la théorie de la relativité générale qu’il considérait “la plus magnifique des théories physiques
existantes” cité par V.L. Ginzburg, Physics Today May 1989, p.54.
10
Figure 2.2 Les échelles de longueur dans la nature, du noyau à l’Univers. A
l’échelle de la cosmologie, le système solaire est vu comme le noyau atomique à
notre échelle !
Cosmologie
11
Figure 2.3 Distribution de matière visible à grande échelle dans l’Univers.
L’intensité lumineuse en termes de niveaux de gris révèle la densité de matière
“baryonique”. Certaines grandes structures filamentaires sont encore perceptibles,
mais la figure est grossièrement isotrope.
autres de 1 Mpc en moyenne, leur densité est de l’ordre de 2.10−24 kg.m−3 ), amas
de galaxies, super-amas,. . . , mais au-delà, il semble qu’une certaine description de
nature hydrodynamique devienne valide, dans laquelle l’Univers est vu comme un
fluide isotrope caractérisé par une densité, une pression et une équation d’état. Si
l’on admet que la Terre n’occupe aucune position privilégiée, l’isotropie doit être
admise pour tout autre observateur, ce qui entraı̂ne également l’homogénéité de
l’Univers.
Figure 2.4 Le photographie de la zone “la plus grande jamais observée”. Chacun
des 9325 points est une galaxie analogue à la notre qui contient quelques centaines
ou milliers de milliards d’étoiles comme le soleil (tiré du serveur sur les puissances
de 10 au CERN, http://microcosm.web.cern.ch/Microcosm/p10/french/
12
Le rayonnement fossile à 3 K ou fond de rayonnement cosmique (8) est
également remarquablement isotrope (les fluctuations relatives sont de l’ordre de
10−5 seulement), une fois effectuées les corrections Doppler dues à la vitesse de la
Terre, ou celle du satellite d’observation par rapport au référentiel propre du CBR (9)
.
Figure 2.5 Le rayonnement électromagnétique émis par l’Univers en échelle loglog.
Cette observation confirme l’hypothèse que la distribution d’énergie ou de
matière dans l’Univers, quelle que soit sa nature, est isotrope. Il semble même que
les fluctuations observables dans le fond de rayonnement cosmique puissent être
corrélées aux fluctuations de la distribution de matière visible.
(8)
On rencontre les acronymes anglais CMB pour Cosmic Microwave Background, CBR pour
Cosmic Backgroung Radiation ou MBR pour Microwave Backgroung Radiation.
(9)
Le satellite COBE est animé d’une vitesse de 8 km.s−1 par rapport à la Terre, le mouvement
saisonnier de la Terre autour du Soleil est de 30 km.s−1 , le système solaire se déplace à 220 km.s−1
autour de centre galactique, la voie lactée à 80 km.s−1 par rapport au groupe local et le groupe
local de galaxies a une vitesse de 630 km.s−1 dans la direction de la constellation Hydra.
Cosmologie
13
Figure 2.6 L’isotropie du fond diffus de rayonnement cosmique, une fois effectuées
les corrections relatives aux mouvements locaux des satellites d’observation.
Figure 2.7 Distribution essentiellement isotrope du fond de rayonnement
cosmique (CMB pour Cosmic Microwave Background ou CBR pour Cosmic
Backgroung Radiation) dans l’Univers. La figure du dessus provient du satellite
COBE et celle du dessous, de résolution nettement meilleure, de WMAP.
14
Récession des galaxies, hypothèse de Hubble
La mesure du déplacement vers le rouge par effet Doppler de raies caractéristiques
émises par des sources lointaines (galaxies, quasars. . . ) est la preuve d’un Univers
en expansion, et donne un moyen de mesurer la vitesse de récession de ces
objets éloignés. En faisant appel à des modèles cosmologiques, on peut tirer des
informations sur la distance de ces sources à la Terre et même une estimation de
l’âge de l’Univers depuis le Big Bang.
On mesure le déplacement vers le rouge des raies d’un spectre connu dont les
longueurs d’onde propres (mesures et émission effectuées sur Terre) sont λ0 , et celles
émises par la source et détectées sur Terre, λ′ . Cette mesure est caractérisée par le
paramètre
z=
λ′ − λ0
.
λ0
(2.1)
Si la vitesse d’éloignement de la source par rapport à la Terre n’est pas trop
grande, cz est une bonne approximation de la vitesse de récession radiale |v|. En
effet au premier ordre en |v|/c,
λ′ ≃ λ0 (1 + |v|/c),
′
0
soit λ λ−λ
= z = |v|/c
0
Doppler,
λ′ = λ0
(10)
s
(2.2)
. On pourrait utiliser ici les expressions exactes de l’effet
1 + |v|/c
,
1 − |v|/c
d’où l’on tire
|v| = c
(z + 1)2 − 1
.
(z + 1)2 + 1
Les mesures de distances sont beaucoup plus délicates à réaliser. Les distances les
plus courtes, dans notre voisinage immédiat jusqu’à quelques centaines de pc, sont
obtenues par parallaxe (différence angulaire entre des observations faites à 6 mois
d’intervalle). Ensuite il faut faire appel à des calibrations successives. On identifie
un type d’étoile brillante (en fonction de l’abondance d’éléments chimiques et des
raies spectrales qui les caractérisent) qui sert d’étalon. Connaissant la distance d’un
tel objet (étoile, puis galaxie) par mesure de parallaxe et mesurant sa luminosité
apparente Lapp. on en déduit sa luminosité absolue L0 = 4πd2 Lapp . Il faut ensuite
identifier dans des galaxies plus éloignées (puis dans les amas plus lointains) des
objets de même nature et de la mesure de leur luminosité apparente on déduit
leur distance. Ces étalons (candles) sont d’abord des étoiles ordinaires (jusqu’à
0.2 Mpc), puis les Céphéides (jusqu’à 2 Mpc), les amas globulaires (jusqu’à 50 Mpc)
et les galaxies brillantes (jusqu’à 1000 Mpc). Il est évident qu’une telle méthode de
calibrations successives est très délicate et la précision est incertaine.
(10)
S’il s’agissait d’un mouvement de rapprochement, le signe de |v|/c serait opposé.
Cosmologie
15
Figure 2.8 Déplacement des raies spectrales émises par diverses étoiles. On en
déduit le décalage spectral z, puis la vitesse d’éloignement.
16
Figure 2.9 Les raies spectrales émises par le soleil. Chaque étoile ou galaxie a
une “signature” propre.
Des mesures spectrales faites dans le cas de la galaxie NGC7619 donnent
par exemple z = 0.0126. La valeur approchée de la vitesse radiale |v| donne
cz ≃ 3779 km.s−1 alors que la valeur exacte est 3756 km.s−1 . Des mesures effectuées
indépendamment par d’autres méthodes basées sur la luminosité donnent une
distance de d = 65 Mpc (1Mpc vaut 3.26 a.l. et le terme “parsec” provient de parallax
second) entre la Terre et NGC7619. Partant du modèle du Big Bang (hypothèse qu’à
l’origine, tous les objets cosmiques se trouvaient en un même point, donc que leurs
distances relatives étaient nulles), et admettant que la vitesse de récession radiale
est et a toujours été uniforme, on peut estimer que cette distance est d = |v|t où
t est une estimation de l’âge de l’Univers. On obtient ainsi t ≃ 16.9 × 109 ans, soit
de l’ordre de grandeur de la dizaine de milliards d’années, proche des estimations
couramment admises actuellement. Notons que selon les modèles de dynamique de
l’Univers, l’expression d = |v|t est changée, mais d/|v| donne toujours un ordre de
grandeur dimensionné de l’âge de l’Univers.
Le modèle du Big Bang a pour origine les nombreuses observations faites par
Edwin Hubble (11) à partir de 1929 : le calcul précédent, répété pour de nombreuses
sources cosmiques donne toujours, aux erreurs expérimentales près, le même résultat.
Une des conséquences du modèle est que plus la source est éloignée, plus sa vitesse
de récession par rapport à la Terre est grande, et que la relation entre cette distance
d et la vitesse radiale |v| est linéaire :
|v| = Hd.
(2.3)
Le coefficient de proportionnalité H est en fait une fonction du temps, et est appelé
constante de Hubble (12) . La valeur numérique précédente donne H = |v|/d ≃
(11)
En fait la première apparition de la loi de Hubble est due à Lemaı̂tre en 1927, mais son article,
publié en français, est longtemps resté méconnu et sa traduction en anglais par Eddington ne
comporte pas ce passage où la loi de proportionnalité distance-vitesse est établie. Les données
étudiées par Hubble en 1929 provenaient d’observations faites par Slipher. Récemment, la sincérité
de Hubble a été mise en doute dans cette affaire de traduction de la contribution de Lemaı̂tre. Voir
à ce sujet Nature, July 11, 2011 , le papier original , sa traduction et le papier qui soulève la
polémique.
(12)
La dénomination de constante de Hubble est justifiée dans le sens où la variation dans le temps
est extrêmement faible aux échelles du système solaire et par ailleurs la valeur est la même en tout
point de l’espace à un instant donné. L’image classique du ballon de baudruche donne un sens à la
dépendance temporelle.
Cosmologie
17
57.8 km.s−1 Mpc−1 , compatible avec la fourchette admise actuellement de
40 < H < 100 km.s−1 Mpc−1 .
(2.4)
Notons par ailleurs que la Terre ne devant pas occuper de position privilégiée dans
l’espace, on devra s’attacher à retrouver une loi de même forme en choisissant une
origine arbitraire.
Figure 2.10 Les données analysées par Hubble en 1929 (à gauche) et celles issues
d’observations actuelles (à droite).
Les résultats analysés à l’origine par Hubble étaient relativement peu convaincants, comme le montre la figure ci-dessus, mais les données accumulées depuis sont
sans ambigüité. On peut noter à propos des données de 1929 que les distances mises
en jeu sont probablement encore assez faibles par rapport aux échelles de longueur
typiques de la cosmologie. La dispersion observée sur la figure historique peut donc
provenir de l’imprécision des mesures de l’époque, mais aussi simplement du fait
qu’elles mettent encore en jeu des mouvements locaux (13) et pas uniquement le
mouvement de récession générale. Les mesures plus récentes en revanche valident
sans doute possible la loi de Hubble.
Plutôt que le diagramme de Hubble, on reporte maintenant la brillance effective
d’un certain type d’objet bien identifié (par exemple les SNIa) en fonction de leur
redshift z. La première quantité varie comme l’inverse de la distance au carré (le
flux ou la brillance effective d’une classe d’objets de luminosité L vaut L/(4πd2 ) et
la seconde est proportionnelle à la vitesse (v ≃ cz).
(13)
Le groupe local auquel appartient la voie lactée est par exemple animé d’une vistesse de
630 km.s−1 par rapport au référentiel du rayonnement cosmique.
18
Figure 2.11 Représentation dans un diagramme de Hubble des données issues
de observations récentes de supernova de type Ia.
Cosmologie
19
3
Parenthèse : notions de relativité
Quadrivecteurs
La théorie de la relativité repose sur l’expression d’un invariant quadridimensionnel,
ds2 = c2 dt2 − dx2 − dy2 − dz 2 ,
analogue à l’expression du théorème de Pythagore qui donne la distance (ici
infinitésimale) entre deux points de l’espace euclidien. Les signes − qui apparaissent
traduisent la nature un peu différente de l’espace-temps de la relativité (on parle de
métrique de Minkowski). Pour permettre une généralisation de cet invariant à des
espaces quelconques (ou simplement en restant dans l’espace de Minkowski, mais
en travaillant avec les coordonnées locales et non plus cartésiennes), on introduit
la notion de tenseur ou plus simplement d’abord de quadrivecteur contravariant
(ou tenseur de rang 1 contravariant). En coordonnées cartésiennes, les composantes
contravaraintes du quadrivecteur sont simplement les composantes ordinaires, par
exemple dxµ = (c dt, dx, dy, dz) et le jeu de 4 composantes (14) xµ , µ = 0, 1, 2, 3
forme un quadrivecteur si ces 4 composantes obéissent par changement de référentiel
inertiel (15) à la transformation de Lorentz :
x′µ = Λµν xν ,
(14)
Un indice grec, µ par exemple, court sur quatre valeurs, de 0 à 3. La composante 0 est aussi
appelée composante temporelle et les trois autres composantes sont les composantes spatiales (on
utilise parfois un indice latin, i par exemple, qui court alors de 1 à 3, ou bien la notation vectorielle).
(15)
Par défaut, le changement de référentiel inertiel est toujours tel que le référentiel R′ se déplace
à la vitesse u = βc parallèlement à l’axe 1 (axe Ox, commun à Ox′ ) par rapport au référentiel R.
20
où la matrice de transformation de Lorentz est définie par


γ
−βγ 0 0
 −βγ
γ
0 0
[Λµν ] =  0
0
1 0.
0
0
0 1
Il est très important de noter quelques règles de lecture de la transformation cidessus : Lorsqu’un même indice apparaı̂t comme c’est le cas ici en position haute
et basse (on parle de positions contravariante et covariante), cela signifie qu’une
somme sur les quatre valeurs permises pour cet indice est sous-entendue. C’est la
convention de sommation des indices muets d’Einstein qui allège considérablement
l’écriture. On dit que l’indice est contracté, il a donc explicitement disparu de
l’expression considérée après sommation. Pour le reste, on doit voir apparaı̂tre des
deux côtés de l’égalité les mêmes indices non contractés dans les mêmes positions,
contravariantes ou covariantes. L’introduction de la matrice de transformation
Λµν est une commodité d’écriture. Si l’on note de manière très générale qu’au
quadrivecteur xν exprimé dans R, il correspond un quadrivecteur x′µ exprimé dans
R′ , et que celui-ci est une fonction de xν , alors, si la transformation de l’un à l’autre
est linéaire, le développement de Taylor de x′µ (xν ) ne laisse subsister que le terme
du premier ordre,
x′µ =
∂x′µ ν
x .
∂xν
Pour que l’indice ν soit en bonne position (covariante), on écrit aussi
∂
= ∂ν ,
∂xν
∂ ~
ce qui définit la dérivée covariante, ∂ν = 1c ∂t
, ∇ . La justification d’un indice “en
bas” est la suivante : une grandeur scalaire Q fonction des coordonnées d’espace∂Q
µ
temps varie d’une quantité δQ = ∂x
si les coordonnées varient. Pour assurer
µ δx
∂Q
que δQ soit un scalaire, il faut contracter l’indice µ et donc le terme ∂x
µ doit avoir
un indice covariant, c’est-à-dire s’écrire comme ∂µ Q.
L’origine de la transformation de Lorentz est à chercher dans la nécessité de
trouver une loi de transformation des composantes spatio-temporelles qui généralise
celle de Galilée,
ct′ = ct
x′ = −βct + x
y′ = y
z′ = z
devenue inacceptable car elle ne préserve pas la forme des équations de Maxwell
et n’assure donc pas l’invariance des phénomènes liés à l’électromagnétisme par
changement de référentiel inertiel. La généralisation cherchée doit être linéaire afin
d’assurer que si le principe d’inertie est satisfait dans un référentiel donné, il le soit
Cosmologie
21
automatiquement dans tout autre référentiel en translation uniforme par rapport
au premier. De plus les composantes transverses doivent être inchangées dans la
transformation (16) , on écrit donc en toute généralité
ct′ = Dct − Ex
x′ = −Aβct + Bx
ce qui conduit à la transformation des vitesses sous la forme v ′ /c = Bv−Aβc
Dc−Ev .
′
′
′
Appliquée à l’origine de R (v = 0 et v = u), à l’origine de R (v = −u et v = 0) et
à la lumière (v ′ = v = c), on obtient trois contraintes soit,
ct′ = A(u)(ct − βx)
x′ = A(u)(−βct + x)
La quatrième contrainte est assurée par la condition A(−u) = A(u) (le signe de la
vitesse est pris en compte dans β), ce qui fait qu’en combinant cette transformation
à la transformation inverse on obtient
1 −β
ct
ct′ = A(u)
−β
1
x
x′
1 β
1 −β
ct′ ,
ct′ = 1 0
= A(u)A(−u)
′
0 1
β 1
−β
1
x′
x
qui impose A(u) = γ ≡ (1 − β 2 )−1/2 .
Ayant maintenant défini un quadrivecteur contravariant comme la donnée
de 4 composantes qui se transforment par changement de référentiel inertiel
conformément à la transformation linéaire de Lorentz, on peut construire une norme
à ce quadrivecteur, qui s’avère invariante par changement de référentiel inertiel, ce
qui lui confère un rôle privilégié dans la théorie de la relativité. Reprenons le cas de
l’intervalle. On a défini dxµ = (c dt, dr) et ds2 = (c dt)2 − | dr|2 . Introduisant les
composantes covariantes associées à dxµ , soit
dxµ = (c dt, − dr),
on peut écrire
ds2 = dxµ dxµ = (c dt)2 − | dr|2 .
On introduit encore le tenseur métrique qui fait passer des composantes
contravariantes aux composantes covariantes,
gµν dxµ = dxν ,
(16)
ds2 = gµν dxµ dxν

1 0
 0 −1
[gµν ] =  0 0
0 0
0
0
−1
0

0
0 
0 
−1
On note r⊥ les coordonnées transverses à u. La seule transformation acceptable est de la forme
r′⊥ = K(u)r⊥ avec K(0) = 1 et K(−u) = K(u) (ce sont des coordonnées transverses). On a donc
r′⊥ = K(u)r⊥ = K(−u)K(u)r′⊥ , soit K(−u)K(u) = K 2 (u) = 1, ou en définitive K(u) = 1.
22
en coordonnées cartésiennes. On joue avec gµν ou g µν pour élever ou abaisser des
indices, par exemple pour transformer les composantes covariantes
x′µ = Λµν xν =
∂x′µ
x
∂xν ν
avec Λµν = gµσ g τ ν Λστ , ce qui revient à préserver la composante si l’on élève ou l’on
abaisse une composante temporelle et à changer le signe s’il s’agit d’une composante
spatiale. Il est clair que toute contraction (norme) d’un quadrivecteur, Aµ Aµ définit
un scalaire invariant par transformation de Lorentz.
Tenseurs
On généralise les notions précédentes à des objets ayant davantage de composantes.
Ainsi par exemple, le jeu de 16 composantes Aµν obéissant par changement de
référentiel inertiel à la transformation
A′
µν
= Λµσ Λν τ Aστ
définit un tenseur de rang 2 deux fois contravariant. De manière équivalente, le
tenseur deux fois covariant associé se transforme comme
A′ µν = Λµσ Λν τ Aστ
et un tenseur mixte, comme
ν
A ′ µ = Λ µσ Λ ν τ A σ τ .
Il est bon de noter que tout objet muni d’indices ne forme pas nécessairement un
tenseur. Par exemple Λµν caractérise un changement de référentiel, mais pas une
quantité physique dans un référentiel donné. De même, la loi de transformation
étant linéaire si un objet n’a que des composantes nulles dans un référentiel inertiel,
il doit en être de même dans tous s’il s’agit d’un tenseur.
Définition des grandeurs physiques et expression covariante des lois
physiques
Pour définir une quantité physique dans le formalisme tensoriel, il est naturel
de partir d’une expression classique, par exemple vectorielle, puis d’en chercher
la généralisation évidente sous forme de quadrivecteur. On peut ensuite écrire
explicitement les composantes du quadrivecteur pour leur donner un sens. On obtient
du même coup la loi de transformation des composantes et des invariants (par
contraction) qui peuvent s’avérer très utiles. Prenons le cas de la vitesse,
v=
dr
dt
−→
vµ =
dxµ
.
dτ
Le temps n’étant plus un invariant, on a choisi de paramétrer la trajectoire (on parle
de ligne d’univers) par le temps propre, tel qu’il s’écoule dans le référentiel propre
de l’objet d’étude, défini par
ds2 = dxµ dxµ = c2 dτ 2 ,
p
dτ = dt 1 − |v|2 /c2
Cosmologie
23
La quadrivitesse v µ est bien un tenseur de rang 1 car xµ en est un et τ est un
dt
dr
invariant. Ses composantes, c dτ
et dτ
ou encore
v µ = (γc, γv),
γ ≡ (1 − |v|2 /c2 )−1/2
se transforment comme v ′ µ = Λµν v ν , ce qui conduit notamment à la loi habituelle
de composition des vitesses qui remplace celle de Galilée. L’invariant associé est
µ
dx
2
vµ v µ = dτµ dx
dτ = c .
On peut maintenant généraliser p = mv pour définir le quadrivecteur énergieimpulsion,
pµ = mv µ = (γmc, γmv)
dont la première composante est homogène à une énergie divisée par c, p0 = E/c et
de sorte que l’on ait d’une part la loi de transformation, p′µ = Λµν pν et d’autre part
l’invariant très important (17) ,
pµ pµ ≡ E 2 /c2 − |p|2 = m2 c2 .
Cette quantité est utile en particulier dans l’étude des collisions, où la quadriimpulsion totale se conserve.
Exprimées à l’aide des tenseurs, les lois physiques prennent une forme dite
manifestement covariante car leur validité est assurée dans tout référentiel inertiel,
moyennant les règles de transformation des tenseurs. Un exemple est fourni par la
généralisation de la loi fondamentale de la dynamique que l’on écrit
m
dv µ
= Φµ
dτ
d
où Φµ définit la quadri-force, Φµ = γ dt
(E/c, p), soit Φ0 =
La loi de transformation s’ensuit également, Φ′µ = Λµν Φν .
γ dE
c dt
~ =γ
et Φ
dp
dt
= γF.
Formulation covariante de l’électromagnétisme
Les lois de l’électromagnétisme prennent également une forme plus élégante et
compacte à l’aide de la notation tensorielle. Commençons par la loi de conservation
de la charge,
div j +
∂ρ
= 0.
∂t
Si elle vaut pour un système donné étudié dans un certain référentiel, on souhaite
évidemment qu’elle soit vraie aussi pour tout autre observateur. La forme de cette
équation suggère l’introduction du quadrivecteur j µ = (ρc, j), qui n’est rien d’autre
que la généralisation de j = ρv de sorte que
∂µ j µ =
(17)
1 ∂ρc
+ div j = 0.
c ∂t
Attention, ici p = γmv et non pas mv.
24
Le fait que cette expression soit une contraction nous assure de sa validité dans
tous les référentiels inertiels. C’est une expression manifestement covariante. Pour
les potentiels on procède de manière analogue. On sait que les équations de Maxwell
dans le vide,
div E = ρ/ε0
div B = 0
rot E = −
∂B
∂t
∂E
∂t
et la relation entre champs et potentiels,
rot B = µ0 j + ε0 µ0
~ −
E = −∇φ
∂A
∂t
B = rot A.
entraı̂nent les équations de propagation des potentiels,
2
~ 2A − 1 ∂ A = − 1 j
∇
c2 ∂t2
ε0 c2
2
~ 2 φ − 1 ∂ φ = −ρ/ε .
∇
0
c2 ∂t2
si l’on impose la jauge de Lorenz-Lorentz
(18)
1 ∂φ
= 0.
c2 ∂t
La forme même de la jauge de Lorenz suggère l’introduction d’un quadripotentiel
div A +
Aµ = (φ/c, A)
de sorte qu’elle apparaisse comme une contraction invariante,
1 ∂ φ
µ
∂µ A =
+ div A = 0.
c ∂t c
Les équations de propagation s’obtiennent de même de manière covariante au moyen
de l’opérateur d’Alembertien,
1 ∂ ~
, ∇)
c ∂t
1 ∂
~
, −∇)
∂µ = (
c ∂t
∂µ = (
∂µ ∂ µ = (
(18)
1 ∂2
~ 2)
, −∇
c2 ∂t2
Cette relation, très importante puisqu’il s’agit d’une jauge covariante, est due au danois
Ludvig Valentin Lorenz, mais elle fut popularisée par un quasi-homonyme, le physicien hollandais
incontournable, Hendrik Antoon Lorentz, auquel l’usage en a attribué la paternité.
Cosmologie
25
soit
∂µ ∂ µ Aν = µ0 j ν ,
µ0 = 1/ε0 c2 .
On cherche ensuite à définir un tenseur représentant le champ électromagnétique
(qu’on appelle souvent tenseur de Faraday). On sait que Aµ est un 4-vecteur. Par
ailleurs la relation B = rot A contient des termes de la forme
Bx =
∂Ay
∂Az
−
∂y
∂z
qui suggèrent de définir un tenseur de rang 2 antisymétrique
F µν = ∂ µ Aν − ∂ ν Aµ .
On a trivialement des zéros sur la diagonale, F 00 = F ii = 0 et F µν = −F νµ ou encore
Fµν = −Fνµ . Les composantes non nulles du tenseur deux fois contravariant (19)
s’expriment explicitement en fonction des champs E et B.
F µν = ∂ µ Aν − ∂ ν Aµ =

0

E
x /c
[F µν ] = 
 Ey /c
Ez /c
∂Aµ
∂Aν
−
.
∂xµ
∂xν
−Ex /c −Ey /c
0
−Bz
Bz
0
−By
Bx

−Ez /c
By 

−Bx  .
0
On définit également un tenseur champ électromagnétique dual
(19)
(20)
.
Le tenseur deux fois covariant
Fµν = gµσ gντ F στ
s’en déduit en conservant le signe de F00 = F 00 et des composantes purement spatiales, Fij = F ij
et en changeant le signe des composantes mixtes F0j = −F 0j :

0
−Ex /c
[Fµν ] = 
−Ey /c
−Ez /c
(20)
Ex /c
0
Bz
−By
Ey /c
−Bz
0
Bx

Ez /c
By 
.
−Bx
0
Celui-ci est formé au moyen du tenseur de Levi-Civita
ǫµνστ =
+1
−1
0
si µ, ν, σ, τ = 0, 1, 2, 3 et permutations paires
si permutations impaires
si deux indices ou plus sont égaux
En particulier on a ǫµνστ = −ǫµνστ . On définit le tenseur dual F̄ µν par la contraction
F̄ µν =
1 µνστ
ǫ
Fστ .
2
26
Utilisant les règles de transformation des tenseurs, on obtient aisément les
transformations des champs électromagnétiques par changement de référentiel
inertiel. F µν étant un tenseur de rang deux, deux fois contravariant, il se transforme
par définition selon
F′
µν
= Λµσ Λν τ F στ ,
et sous forme condensée on écrit :
E′k = Ek ,
B′k = Bk ,
E′⊥ = γu (E⊥ + βu c ∧ B⊥ )
B′⊥ = γu (B⊥ − (βu /c) ∧ E⊥ ).
En réalisant des contractions sur tous les indices, on obtient les invariants du
champ électromagnétique :
1
− F µν Fµν = E2 /c2 − B2 ,
2
1
− F̄ µν Fµν = E · B/c.
4
Construisons les contractions du tenseur champ électromagnétique, par exemple
∂µ F µν . Pour ν = 0, on a
∂µ F µ0 = ∂0 F 00 + ∂1 F 10 + ∂2 F 20 + ∂3 F 30
=0+
=
∂
∂
∂
(Ex /c) +
(Ey /c) +
(E /c)
∂x
∂y
∂z z
1
1
div E =
ρc
c
ε0 c2
= µ0 j 0 .
Pour ν = 1, on a de même
∂µ F µ1 = ∂0 F 01 + ∂1 F 11 + ∂2 F 21 + ∂3 F 31
=
∂
∂
1 ∂
(−Ex /c) + 0 +
Bz +
(−By )
c ∂t
∂y
∂z
=−
1 ∂Ex
+ (rot B)ux
c2 ∂t
= µ0 j 1 ,
Ses composantes s’obtiennent à partir de celles de F µν en changeant E/c en B et B en −E/c :

0
Bx
µν

[F̄ ] =
By
Bz
−Bx
0
−Ez /c
Ey /c
−By
Ez /c
0
−Ex /c

−Bz
−Ey /c 
Ex /c
0.
Cosmologie
27
et les deux dernières composantes spatiales s’en déduisent par permutation. On a
donc
∂µ F µν = µ0 j ν ,
(3.1)
expression qui regroupe les deux équations de Maxwell avec sources,
div E =
ρ
ε0
1 ∂E
= µ0 j.
rot B − 2
c ∂t
(3.2)
Le second couple d’équations de Maxwell s’obtient plus aisément après
l’introduction du tenseur champ électromagnétique dual. Examinons la contraction
∂µ F̄ µν . Pour ν = 0, on a
∂µ F̄ µ0 = ∂0 F̄ 00 + ∂1 F̄ 10 + ∂2 F̄ 20 + ∂3 F̄ 30
=0+
∂By
∂Bx
∂Bz
+
+
∂x
∂y
∂z
= div B.
Pour ν = 1, on a de même
∂µ F̄ µ1 = ∂0 F̄ 01 + ∂1 F̄ 11 + ∂2 F̄ 21 + ∂3 F̄ 31
=
∂
∂
1 ∂
(−Bx ) + 0 +
(−Ez /c) +
(E /c)
c ∂t
∂y
∂z y
=−
1 ∂Bx
1
− (rot E)ux .
c ∂t
c
On en déduit l’expression unifiée du second couple d’équations de Maxwell, les
équations sans second membre,
∂µ F̄ µν = 0.
(3.3)
Les équations de Maxwell manifestement covariantes s’écrivent donc :
∂µ F µν = µ0 j ν ,
∂µ F̄ µν = ∂µ F νλ + ∂ν F λµ + ∂λ F µν = 0.
(3.4)
28
Cosmologie
29
4
Relativité générale et Cosmologie
On se propose de donner dans ce chapitre quelques éléments de cosmologie
relativiste. Il faut pour cela tout d’abord disposer d’une théorie relativiste de la
gravitation, la plus célèbre étant la théorie de la relativité générale dont on présentera
les ingrédients avant de passer à son application à la cosmologie. Les lecteurs
intéressés par davantage de physique sont encouragés, ne serait-ce que pour butiner,
à se reporter à la bibliographie (21) .
Préambule
Rappelons succintement quelques notions sur les tenseurs qui seront utiles à la
compréhension de ce qui suit. On repère un événement de l’espace-temps par ses
coordonnées, e.g. xµ = (ct, r, θ, ϕ) et l’intervalle élémentaire entre deux événements
voisins s’écrit
ds2 = gµν dxµ dxν
où gµν est le tenseur métrique, tel que gµν g µν = 1. Placé “en haut”, l’indice
µ = 0, 1, 2, 3 est appelé contravariant. En position basse, il est dit covariant et
l’on passe de l’un à l’autre au moyen du tenseur métrique,
xµ = gµν xν .
La répétition des indices (“en haut” et “en bas”) s’appelle une contraction, et
elle signifie que l’indice en question est sommé sur ses quatre valeurs. De manière
(21)
Notamment les ouvrages de Kenyon, de Berry ou de Longair, mais aussi le remarquable
Harrisson ou encore à un niveau plus élevé, Peacock, Peebles, Kolb et Turner ou Rich.
30
générale, un tenseur obéit à une loi de transformation linéaire par changement de
référentiel inertiel (représenté par la loi Λµν ) et peut avoir autant d’indices que
nécessaire, chaque indice induisant la loi de transformation, e.g.
µ
µ
x′ = Λµν xν ,
Λ µν =
∂x′
∂xν
R′ µν = Λµρ Λνσ Rρσ ,
λ
R′ µνo = Λλρ Λµσ Λντ Λoυ Rρστ υ .
On introduira de nombreux tenseurs par construction à partir de tenseurs existants,
comme v µ = dxµ / dτ où τ est le temps propre, ds2 = c2 dτ 2 , et on rencontrera
également des objets qui ne sont pas des tenseurs, mais portent des indices, comme
les symboles de Christoffel. Dans ce cas cependant, les “règles pour monter ou
descendre les indices” sont les mêmes que pour les tenseurs.
Gravitation relativiste
Nous allons tout d’abord établir le cas particulier de la métrique de Schwarzschild
avant de donner quelques justifications aux équations d’Einstein.
⊲ Le décalage spectral gravitationnel. En , Einstein a montré, à partir
du principe d’équivalence, que les radiations électromagnétiques sont affectées par
la présence d’un champ gravitationnel(22) .
Le raisonnement utilise simplement l’effet Doppler et le principe d’équivalence
qui stipule en particulier que la lumière se propage à la vitesse c dans un référentiel
tangent au référentiel en chute libre (i.e. dans le référentiel animé d’une vitesse
uniforme coı̈ncidant à l’instant donné avec la vitesse du référentiel en chute libre, et
ceci à condition que la durée de l’expérience soit suffisamment brève et que l’étendue
spatiale du référentiel soit petite). Considérons une capsule de longueur dr en chute
(23)
libre dans le champ de gravitation g = − GM
. Une
r 2 ur créé par une masse M
source lumineuse placée au bas de la capsule émet une onde électromagnétique captée
ensuite par un détecteur situé au plafond de la capsule.
Conformément au principe d’équivalence, la vitesse de propagation de l’onde, c,
est constante dans toutes les directions dans la capsule en chute libre. Le pulse de
lumière émis par la source atteint le détecteur après une durée dt = dr/c. Pour un
observateur extérieur, immobile par rapport à la source du champ de gravitation,
l’onde est détectée avec un décalage Doppler dû à l’éloignement de la source à la
vitesse instantanée v = g dt. Au premier ordre en vc , la variation de fréquence vaut(24)
dν
v
g dr
dν
g
= − = − 2 , ou
= − 2 ν.
ν
c
c
dr
c
A l’altitude r+ dr, un observateur externe mesure une fréquence modifiée ν(r+ dr) =
ν(r) + dr dν
dr :
g dr
GM
ν(r + dr) = ν(r) 1 − 2
= ν(r) 1 − 2 2 dr .
c
r c
(22)
A. Einstein, Principe de Relativité et Gravitation, §V, op. cit., pp. 115-119.
I.R. Kenyon, General Relativity (Oxford University Press, Oxford 1990), p. 15.
(24)
Il s’agit de l’effet
:si la
source S s’éloigne à la vitesse v de l’observateur
q Doppler longitudinal
(23)
O, on a νO = νS
1−v/c
1+v/c
≃ νS
1−
v
c
+O
v2
c2
redonne le résultat classique de l’effet Doppler.
. Au premier ordre en
v
,
c
la relativité restreinte
Cosmologie
31
D
g
t(r+dr)
dr
S
v
t(r)
Figure 4.1 Le temps propre dépend du champ de gravitation. Pour le mettre
en évidence, on considère une capsule en chute libre dans le champ de gravitation
g supposé uniforme. Une source située sur le sol de la capsule émet une onde
électromagnétique détectée par un récepteur placé au plafond. On compare les
fréquences mesurées par un observateur lié à la capsule et un observateur fixe par
rapport à la source de gravitation.
Si chaque “pulse” de l’onde est utilisé comme unité de temps, les horloges situées
1
tels que :
aux distances r et r + dr indiquent des temps t(r) ∼ ν(r)
GM
t(r + dr) = t(r) 1 + 2 2 dr
r c
au premier ordre. Avec t(r + dr) = t(r)+
dt
dr
dr, on en déduit l’équation différentielle
GM
dt
= 2 2 dr
t
r c
que l’on intègre de l’infini, où le champ de gravitation n’est plus sensible, jusqu’à r,
soit :
∞
t(∞)
GM
1
GM
ln
= 2 −
=
t(r)
c
r r
rc2
(4.1)
2
GM
t(r) = t(∞) × e−GM/rc ∼ t(∞) 1 −
.
rc2
Cette expression est parfois écrite en fonction du potentiel gravitationnel ψ(r) =
−GM/r :
ψ(r)
t(r) = t(∞) 1 + 2
c
.
Comme ψ(r) est toujours négatif, t(∞) > t(r), les horloges sont accélérées par le
champ de gravitation.
32
L’équation précédente a été obtenue en partant de l’effet Doppler au premier
ordre en vc . A cet ordre, les résultats classique et relativiste coı̈ncident, ce qui suppose
que la vitesse d’éloignement de la source reste faible par rapport à c, ou encore, que
le champ de gravitation n’est pas trop important (ce qui légitime le développement
au premier ordre.
Il est commode d’introduire ici la notation propre à la notion d’intervalle. t(r)
représente le temps propre local, plus généralement noté τ . Dans la limite des faibles
champs de gravitation, on a donc au premier ordre :
2GM
,
(4.2)
dτ 2 = dt2 1 −
rc2
qui fournit la composante g00 du tenseur métrique.
⊲ Courbure de l’espace-temps dans un champ de gravitation statique
et isotrope. La courbure de l’espace-temps au voisinage d’une source de champ
gravitationnel s’obtient facilement grâce à la déviation géodésique (La déviation
géodésique exprime le fait que deux corps lancés avec une même vitesse initiale d’un
même point, dans deux directions distinctes, voient leur distance relative croı̂tre
selon une loi non linéaire si l’espace-temps n’est pas plat. De ce point de vue,
l’effet d’un champ de gravtitation est localement équivalent à une courbure.). Une
géodésique de l’espace-temps plat est une ligne droite, c’est-à-dire la trajectoire d’une
particule libre dans un référentiel inertiel. Les lignes géodésiques de l’espace-temps
courbe doivent être, par extension, les trajectoires de particules tests en chute libre.
FB
Α
t
r
FA
ξ
α
M
r
FB
Β
Figure 4.2 On calcule la courbure de l’espace-temps grâce à la déviation
géodésique. On considère pour cela deux masses tests attirées par une même source
de gravitation M et l’on calcule l’accélération relative des deux corps d’épreuve.
Considérons deux objets A et B, de masses identiques m (on néglige leur
interaction gravitationnelle mutuelle), en chute libre dans le champ de gravitation
d’une même masse M située à l’origine des coordonnées. Nous allons éliminer le
champ de gravitation créé par M et le remplacer par un effet de géométrique de
courbure. Du fait de leur mouvement, les deux corps A et B se rapprochent l’un
de l’autre et on se propose de calculer leur accélération relative, dans une direction
perpendiculaire à la géodésique (direction tangentielle),
Ft = m
d2 ξ
,
dt2
Cosmologie
33
où ξ = αr est l’abscisse curviligne dans la direction tangentielle. Dans le référentiel
en chute libre A, la force apparente(25) s’exerçant sur A, projetée dans la direction
tangentielle t s’écrit Ft = −FB sin α ≃ −FB α. En écrivant
FB =
GM m
,
r2
α=
ξ
,
r
on obtient l’accélération différentielle
GM
d2 ξ
=− 3 ξ
2
dt
r
qui ne peut disparaı̂tre que si le champ de gravitation est uniforme. Pour un
mouvement supposé non relativiste, ds2 = c2 dτ 2 ≃ c2 dt2 , on obtient
d2 ξ
1 d2 ξ
GM
= 2 2 = − 3 2 ξ = Kξ
2
ds
c dt
r c
(4.3)
par définition de la courbure K dans un continuum hyperbolique (on modifie
simplement le signe pour tenir compte de la signature des coordonnées spatiales
dans l’équation métrique(26) ) :
K =−
GM
.
r 3 c2
(4.4)
Cette quantité représente la courbure de l’espace-temps en présence d’un champ de
gravitation statique et à symétrie sphérique. On constate que c’est la distribution de
matière, à l’origine des champs gravitationnels, qui est responsable de la courbure
de l’espace-temps.
Figure 4.3 La distribution de matière est à l’origine de la courbure de l’espacetemps (tiré de Gamow, op. cit., p. 106).
(25)
On néglige l’interaction entre les corps A et B, cette force apparente résulte donc de l’existence
d’une accélération relative entre A et B.
(26)
Il s’agit en fait de la composante Kφt du tenseur de courbure car l’accélération est transverse
par rapport au mouvement de A qui se fait au cours du temps.
34
⊲ La métrique de Schwarzschild.
− Tenseur métrique pour un champ statique à symétrie sphérique : Le “redshift
gravitationnel” nous donne la partie temporelle de l’équation métrique au voisinage
d’un objet massif. Si l’on considère un champ de gravitation à symétrie sphérique,
la partie angulaire est également connue et l’on a
2GM
2
2
2
2
ds = c dτ = c 1 −
dt2 + grr dr 2 − r 2 dΩ2
rc2
2GM
2
= c 1−
dt2 + grr dr 2 − r 2 dθ2 − r 2 sin2 θ dϕ2 ,
rc2
il manque néanmoins une information sur la partie radiale.
Dans le cas d’une répartition de matière à symétrie sphérique, l’espace-temps doit
être isotrope, c’est-à-dire que la courbure obtenue au paragraphe précédent doit être
la même dans toutes les directions. De plus, celle-ci détermine la partie radiale du
tenseur métrique par l’intermédiaire de l’“excellent théorème de Gauss”(27) . On a
donc ici, en ne considérant que l’espace tridimensionnel, donc en ignorant les signes
négatifs dans les composantes du tenseur métrique (cela signifie que l’on pose ici
′
′
′
ds2 = grr
dr 2 + gθ′ dθ2 + gϕϕ
dϕ2 , avec gij
= −gij où les gij sont finalement les
composantes cherchées)
′
GM
1 dgrr
=− 3 2,
′2 dr
2rgrr
r c
K=
′
soit, par intégration entre le point courant et l’infini où grr
= 1 (espace euclidien),
′
2GM dr
dgrr
,
2 = − c2
′
r2
grr
r
r
1
2GM
− ′
=
,
grr ∞
rc2 ∞
1−
2GM
1
,
=
′
grr
rc2
et finalement
′
=
grr
1
1−
2GM
rc2
.
(4.5)
La métrique purement spatiale est donc de la forme
ds2espace =
(27)
dr 2
+ r 2 dΩ2 .
1 − 2GM
2
rc
Le Theorema Egregium (“théorème remarquable” en latin) est un important théorème énoncé
par Carl Friedrich Gauss et portant sur la courbure des surfaces. Il dit que celle-ci peut être
entièrement déterminée en mesurant les angles et les distances d’une surface, c’est-à-dire qu’elle
ne dépend pas de la manière dont la surface peut être plongée dans l’espace tridimensionnel
(wikipedia).
Cosmologie
35
On en déduit, en rétablissant les signes, l’équation métrique et le tenseur métrique
de Schwarzschild(28) :
2GM
dr 2
2
2
2
2
2
− r 2 dΩ2 ,
(4.6a)
ds = c dτ = 1 −
c
dt
−
rc2
1 − 2GM
rc2


gµν = 

1−
2GM
rc2
0
0
0
0
− 1−
2GM −1
rc2
0
0
0
0
−r 2
0
0


0
.

0
2
2
−r sin θ
(4.6b)
qui redonnent bien les expressions de Minkowski dans les limites r → ∞ ou M = 0.
Si l’on introduit le potentiel gravitationnel ψ(r) = −GM/r, les composantes du
tenseur métrique s’écrivent
g00 = −
2ψ(r)
1
.
=1+
g11
c2
Les effets de courbure (donc de relativité générale) sont importants si
pas négligeable devant 1. La quantité
2GM
rc2
n’est
2GM
c2
donne l’ordre de grandeur des distances auxquelles les effets relativistes sont
sensibles. A titre indicatif, à la surface de la Terre ou du Soleil, on a respectivement
rg =
Terre :
rg⊕ /R⊕ = 1.4 · 10−9 ,
Soleil :
rg⊙ /R⊙ = 4.2 · 10−6 .
− Equation géodésique dans la métrique de Schwarzschild : Dans le cadre de la
relativité restreinte, on sait que l’action de la particule libre est proportionnelle à la
longueur de la géodésique(29) , soit, avec la métrique de Minkowski :
Z
Z
S = −mc ds = L dλ,
1/2
dxµ dxν
ds = ηµν dx dx
= ηµν
dλ,
dλ dλ
1/2
dxµ dxν
L = −mc ηµν
,
dλ dλ
µ
(28)
ν 1/2
(4.7)
La métrique en présence d’un champ de gravitation statique à symétrie sphérique a été
obtenue par la résolution des équations d’Einstein, moins de deux mois après la parution de
l’article d’Einstein, par K. Schwarzschild, On the Gravitational Field of a Point Mass According
to Einstein’s theory, Sitzber. Preuss. Akad. Wiss., Physik-Math. K1, 189 (1916) 189, traduit dans
Black Holes, Selected Reprints, Am. Ass. Physics Teachers, december 1982, p.19 ou encore dans
arXiv:physics/9905030.
(29)
F. Rohrlich, Classical Charged Particles (Addison-Wesley, Redwood City 1990), p. 277,
P.J.E. Peebles, Principles of Physical Cosmology (Princeton University Press, Princeton 1993), p.
244.
36
où λ est un paramètre arbitraire permettant de paramétrer la trajectoire de la
1/2
2
si λ est le temps
particule libre. On retrouve bien entendu L = −mc2 1 − |v|
2
c
t mesuré par un observateur.
En présence d’une énergie potentielle U (r), l’observateur fixe pourra définir un
lagrangien par l’expression(30)
2
L = −mc
|v|2
1− 2
c
1/2
− U (r),
et les équations du mouvement découlent des équations d’Euler-Lagrange appliquées
à ce lagrangien, mais en gravitation relativiste, l’énergie potentielle sera automatiquement incluse dans les composantes gµν du tenseur métrique, et l’étude du mouvement d’un corps d’épreuve se réduit à un problème purement géométrique.
Tandis que, chez Newton, les équations des trajectoires doivent être
postulées à part, tout à fait indépendamment de la structure de l’espace, le
principe géodésique édicte ici, d’une manière extraordinairement naturelle, que
les trajectoires des particules d’épreuve ne sont rien d’autre que les géodésiques
de l’espace(∗) . L’espace une fois esquissé, après que les équations de champ
ont été résolues, les trajectoires sont toutes et totalement définies, contenues,
tracées, creusées dans la structure même de l’espace qui va s’en trouver précisé.
(. . .) Qui plus est, le principe géodésique s’appuie sur le principe d’inertie qu’il
généralise. A tel point que l’expression de l’un s’applique à l’autre : un corps
abandonné à lui-même persiste dans son état de mouvement. Mais tandis que,
pour Galilée, cet état se réduit au mouvement rectiligne uniforme, il couvre
désormais l’ensemble des mouvements purement gravitationnels possibles. Ainsi
les corps sont-ils abandonnés à eux-mêmes, libérés de toute contrainte sinon
de celle que leur trace l’espace lui-même. L’espace qui n’est guère plus que
l’ensemble des mouvements possibles (31) .
(∗) Il ne s’agit ici que des particules d’épreuve et non pas des trajectoires des corps participant
au champ gravitationnel dans lequel ils naviguent.
La généralisation de l’action en relativité générale conduit naturellement à la
définir par l’élément curviligne le long de la courbe géodésique. Celle-ci est bien
invariante par changement arbitraire de système de coordonnées(32) .
Z
Z
µ
ν 1/2
S = −mc ds, ds = gµν dx dx
, δ
ds = 0.
(4.8)
On peut alors effectuer le calcul variationnel en conservant le formalisme covariant.
On note pour cela que
δ( ds2 ) = δ(gµν dxµ dxν ) = 2 ds δ( ds) = dxµ dxν δgµν + 2gµν dxµ δ( dxν ).
On obtient
δ( ds) =
(30)
1 dxµ ν ∂gµν ρ
dxµ
dx
δx
+
g
d(δxν ).
µν
2 ds
∂xρ
ds
L. Brillouin, L’atome de Bohr (Presses Universitaires de France, Paris 1931), p. 105.
J. Eisenstaedt, Trajectoires et Impasses de la Solution de Scwarzschild, Arch. Hist. Exact Sci.
37 (1988) 275, p.283.
(32)
P.J.E. Peebles, op. cit., p. 245.
(31)
Cosmologie
37
µ
µν
, ce qui conduit à
et gµν,ρ = ∂g
∂xρ
1 µ ν
ρ
µ d
ν
δ( ds) =
ẋ ẋ gµν,ρ δx + gµν ẋ
(δx ) ds
2
ds
dx
ds
On pose ẋµ =
dont l’intégrale sur la ligne d’univers doit s’annuler,
Z
Z
Z
1 µ ν
ν
ρ
µ d
ds =
δ
ẋ ẋ gµν,ρ δx ds +
(δx ) ds
gµν ẋ
ds
Ligne 2
Ligne
Ligne
|
}
R{z d
[gµν ẋµ δxν ]∂L −
=
Z
Ligne
(gµν ẋ
L ds
µ )δxν
ds
1 µ ν
d
µ
ẋ ẋ gµν,ρ −
(g ẋ ) δxρ ds.
2
ds µρ
Comme d’habitude, on a annulé le terme de bords aux extrémités de la ligne
d’univers. La variation est arbitraire, de sorte que l’intégrant doit être nul, soit
1 µ ν
ẋ ẋ gµν,ρ − gµρ ẍµ − gµρ,ν ẋµ ẋν = 0.
2
On arrange les termes en multipliant par g σρ et en notant que dans le dernier
terme ci-dessus on peut permuter les indices contractés µ et ν, soit gµρ,ν ẋµ ẋν =
1
µ ν
ν µ
2 (gµρ,ν ẋ ẋ + gνρ,µ ẋ ẋ ), d’où
1
1
σρ
µ
σρ 1
gµν,ρ − gµρ,ν − gνρ,µ ẋµ ẋν .
g gµρ ẍ = g
2
2
2
| {z }
ẍσ
En définissant le symbole de Christoffel ou connexion affine
Γσµν =
(33)
(contraction sur ρ),
1 σρ
g [gµρ,ν + gνρ,µ − gµν,ρ ],
2
on obtient l’équation de mouvement
(34)
(33)
Ce n’est pas un tenseur car il est identiquement nul dans un référentiel localement inertiel et
la loi linéaire de transformation des tenseurs exigerait sinon qu’il soit identiquement nul dans tout
référentiel.
(34)
On peut noter à ce sujet que la notion de dérivée covariante permet d’écrire directement
l’équation géodésique. La dérivée covariante est donnée par
dq σ
dxν
Dq σ
=
+ Γσµν q µ
.
Ds
ds
ds
En présence d’un champ de force F µ , l’équation de mouvement devient
Dpσ
= Fσ
Dτ
soit dans le cas du mouvement de chute libre
0=
d2 xσ
dxµ dxν
Dpσ
σ
=m
+
mΓ
.
µν
Dτ
dτ 2
dτ dτ
Précisons également des notations anciennes pournles connexions
affines (symboles de Christoffel
o
ρ
ρ
ρσ
de 1ère et 2ème espèces) : Γµν,ρ = [µν, ρ], Γ µν = µν = g [µν, σ].
38
d2 xσ
dxµ dxν
σ
=
−Γ
.
µν
ds2
ds ds
(4.9)
On peut introduire la dérivée covariante (au sens des théories de jauge cette fois)
Dκ qσ = ∂κ qσ + Γσµκ qµ
et la propriété
D
D ∂xκ
=
Ds
Dxκ ∂s
pour retrouver l’équation de déviation géodésique
∂xκ
Dqσ
= Dκ q σ
Ds
∂s
∂xκ
∂xκ
= ∂κ q σ
+ Γσµκ qµ
∂s
∂s
κ
σ
∂x
∂q
+ Γσµκ qµ
,
=
∂s
∂s
ou encore
D ẋσ
= Dκ ẋσ ẋκ = ẍσ + Γσµν ẋµ ẋκ .
Ds
⊲ Les équations d’Einstein. On présente dans cette section la forme générale
des équations d’Einstein. Il ne s’agit pas de démontrer les expressions mises en jeu,
mais de pousser encore un peu le formalisme.
− Sur la difficulté d’une analogie avec l’électromagnétisme : Les équations
d’Einstein constituent une généralisation de l’équation de Poisson pour le potentiel
gravitationnel ψ(r),
~ 2 ψ(r) = 4πGρ(r),
∇
défini en fonction de la densité de masse locale ρ(r). Cette équation est analogue à
celle que l’on rencontre en électromagnétisme où les équations de Maxwell relient le
tenseur de Faraday F µν aux sources, les densités de charges et de courant électrique
sous la forme ∂µ F µν = µ0 j ν où j ν = (ρc, j). La partie temporelle de cette équation
conduit à l’équation de Poisson une fois utilisée la définition du tenseur de Faraday
F µν = ∂ µ Aν − ∂ ν Aµ et celle du quadri-potentiel Aµ = (φ/c, A),
~ 2 φ(r) = − 1 ρ(r).
∇
ε0
L’analogie avec le potentiel gravitationnel est évidente et il est tentant de
chercher une généralisation des équations de Maxwell (on parle d’équations
gravitomagnétiques). Il faut pour cela un 4−courant gravitationnel j µ et un tenseur
Cosmologie
39
analogue au tenseur de Faraday, [−−]µν qui soient reliés par une équation de la forme
∂µ [−−]µν = const×j ν . La densité de masse ρ(r) serait déterminée par la composante
j 0 . Nous allons voir que cette définition n’est pas possible, car la densité de masse
n’a pas les bonnes propriétés. En effet, elle se transforme comme on va le voir un peu
plus loin comme la composante d’un tenseur de rang 2 et doit donc être identifiée à la
composante 00 d’un tenseur plus général. Pour remplacer les équations de Maxwell,
il faut donc une équation tensorielle de rang 2, écrite symboliquement
Géométrie µν = Matière µν .
Le rôle du potentiel ψ(r) est joué par le tenseur métrique (rappelons par exemple
dans le cas de la métrique de Schwarzschild que g00 = −1/g11 = 1 + 2ψ/c2 ) et celui
de la densité de masse par le tenseur énergie impulsion (35) . Le contenu matériel,
par l’intermédiaire de ρ(r) intervient dans l’objet Matière µν , le tenseur énergieimpulsion T µν et détermine de ce fait les propriétés spatio-temporelles données en
termes de la métrique g µν qui intervient dans l’objet Géométrie µν .
L’équation d’Einstein est donc une équation différentielle pour les composantes
du tenseur métrique, dont les sources sont données par le tenseur énergie impulsion.
Une équation plausible serait de la forme ∂σ Γσµν = Tµν . Elle possède bien deux
indices explicites, et la géométrie apparaı̂t par une dérivée de la connexion affine,
c’est-à-dire qu’elle contient des dérivées secondes du tenseur métrique, indispensables
pour explorer l’écart au comportement minkowskien. Nous verrons cependant que
les équations d’Einstein sont plus complexes que cela.
− Tenseur de Riemann : On cherche tout d’abord à caractériser la courbure
d’un espace arbitraire (l’espace-temps) au moyen d’un tenseur. Rappelons qu’il est
toujours possible de trouver en un point quelconque un référentiel localement tangent
qui soit inertiel (le référentiel en chute libre), c’est-à-dire tel que
gµν = ηµν
∂gµν
= 0.
∂xρ
Ici, ηµν est le tenseur métrique de Minkowski ηµν = diag(1, −1, −1, −1).
L’information sur la courbure provient donc des dérivées d’ordre supérieur du tenseur
métrique. Ce qui distingue notamment un espace courbe d’un espace plat, c’est que
dans le premier, les référentiels localement tangents en x et en x + ∆x diffèrent,
de sorte que les variations du tenseur métrique sont du second ordre. L’information
cherchée réside dans un tenseur de rang 4 contenant des termes comme gµν,ρσ , le
tenseur de Riemann Rµνρσ , défini par les connexions affines (36) ,
Rµνρσ = Γµνσ,ρ − Γµνρ,σ + Γµλρ Γλνσ − Γµλσ Γλνρ .
Dans un référentiel localement inertiel, les connexions affines sont nulles mais pas
nécessairement leurs dérivées et il vient Rµνρσ = Γµνσ,ρ − Γµνρ,σ . On définit aussi la
forme totalement covariante Rµνρσ = gµλ Rλνρσ telle que dans un référentiel inertiel
2Rµνρσ = gµσ,νρ − gνσ,νρ + gνρ,µσ − gµρ,νσ . Notons que le tenseur de Riemann
(35)
(36)
Dans les ouvrages en anglais on utilise en général le terme de stress energy tensor.
On rappelle que Γσµν = 21 g σρ [gµρ,ν + gνρ,µ − gµν,ρ ].
40
possède 256 composantes dont en fait seulement 20 sont indépendantes en raison
des symétries.
− Tenseur énergie impulsion : Energie et impulsion sont deux aspects d’un
même objet, la 4-impulsion pµ telle que E 2 − c2 |p|2 = m2 c4 . Voyons maintenant
comment construire le tenseur énergie impulsion en généralisant la densité de masse
ρ. Considérons un nuage de poussière. Dans le référentiel R dans lequel il est au
repos, il possède une densité d’énergie ρc2 = mnc2 = E/V s’il est constitué de
grains de masses m et de densité n (dans R). Ici V est le volume occupé par le
gaz et E son énergie. Dans un autre référentiel R′ , on aura une augmentation de
l’énergie E → E ′ = γE et une contraction du volume, V → V ′ = γ −1 V à cause
de la transformation des longueurs longitudinales, rk → rk′ = γ −1 rk de sorte que
ρ → ρ′ = γ 2 ρ. Il est donc évident que ρc2 ne peut ni être un scalaire ni une
composante de quadrivecteur, mais doit être la composante d’un tenseur de rang
2 (37) . On définit ainsi le tenseur énergie impulsion T µν pour un gaz dilué,
T µν = ρv µ v ν .
Dans le référentiel R, on a la quantité cherchée T 00 = ρc2 . Si l’on prend la pression
en compte, l’expression devient
T µν = (ρ + p/c2 )v µ v ν − g µν p.
Une définition qui s’applique à des systèmes plus complexes que le nuage de poussière
considéré ici est que T µν représente le flux de la composante µ du 4-vecteur énergie
impulsion pµ le long de la direction ν. Il obéit à une loi de conservation (38) ,
T µν,ν = 0.
Finalement, on retiendra que T µν
- est un tenseur de rang 2,
- s’annule en l’absence de matière,
- a toutes ses divergences nulles,
- est symétrique.
− Tenseur d’Einstein : Einstein a identifié le tenseur énergie impulsion comme
la source de la courbure de l’espace-temps et a ainsi suggéré la forme la plus simple
possible de relation entre l’énergie Tµν et la courbure Gµν , soit KTµν = Gµν où
K est une constante à déterminer pour restaurer la limite newtonienne et Gµν , le
tenseur d’Einstein, décrit la courbure. Gµν est de rang 2 et de divergence nulle (à
cause de ces mêmes propriétés satisfaites par Tµν ). Il doit être construit à partir du
tenseur de Riemann. Celui-ci est de rang 4, il faut donc une double contraction (39)
, c’est le tenseur de Ricci
Rµν = Rρµρν = g ρσ Rσµρν .
(37)
Revenant à la discussion évoquée plus haut sur la forme des équations d’Einstein, c’est pour cette
raison que l’on ne peut pas construire une théorie de la gravitation calquée sur l’électromagnétisme,
car la densité de charge se transformant avec un seul facteur γ, elle est la composante d’un 4vecteur, la 4-densité de courant j µ et le tenseur de Faraday obéit à ∂µ F µν = µ0 j ν . Dans une
théorie analogue de la gravitation, le second membre est nécessairement un tenseur de rang 2, ce
qui complique l’équation cherchée.
(38)
En relativité générale, cette loi de conservation est étendue à un référentiel arbitraire en passant
à la dérivée covariante, T µν;ν = 0.
(39)
On peut montrer que d’autres contractions donnent des résultats équivalents.
Cosmologie
41
Le tenseur de Ricci n’est pas de divergence nulle, ce que l’on rétablit par soustraction
1
Gµν = Rµν − gµν R,
2
où R = g µν Rµν est le scalaire de Ricci. L’équation d’Einstein peut maintenant
s’écrire
Gµν =
8πG
T .
c4 µν
Une généralisation apportée par Einstein lors d’applications en cosmologie consiste
en l’introduction d’une nouvelle constante fondamentale, la constante cosmologique
Λ, de sorte que l’équation d’Einstein devient alors
Gµν − Λgµν =
8πG
T .
c4 µν
Cette constante a pour effet de produire une courbure de l’espace-temps même en
l’absence de toute forme de matière ou de radiation (40) . Elle joue un rôle central
en cosmologie et dans la compréhension actuelle de l’Univers.
⊲ Action d’Einstein - Hilbert. Une formulation alternative de l’équation
d’Einstein repose sur la définition d’une action, proposée initialement par Hilbert.
Il faut tout d’abord exprimer un élément d’intégration invariant dans un système de
coordonnées arbitraire. Dans l’espace de Minkowski l’élément d4 x = dx0 dx1 dx2 dx3
est un invariant en raison de la compensation des facteurs γ qui interviennent dans
c dt et dans drk . Si l’on cherche à former un élément d’intégration invariant dans un
système de coordonnées quelconque, il apparait le déterminant du tenseur métrique.
Considérons les systèmes de coordonnées x et x′ . On a
∂x 4 ′
d x = ′ d x
∂x
4
∂x où le jacobien de la transformation, ∂x
′ , est le déterminant de la matrice des
∂xµ
dérivées partielles ∂x′ν . De la loi de transformation
′
=
gµν
∂xρ ∂xσ
g
∂x′µ ∂x′ν ρσ
(on rappelle que g ′ µν = Λµρ Λν σ g ρσ et g ′ µν = Λµρ Λν σ g ρσ avec Λµρ = ∂x′ µ /∂xρ
2
et Λ ρ = ∂xρ /∂x′ µ ) on déduit que g ′ = g ∂x′ où g est le déterminant (négatif)
µ
(40)
∂x
C’est pour cette raison d’ailleurs qu’Eddington argumentait sur le rôle indispensable de la
constante cosmologique. C’est la seule façon, d’après lui, d’introduire en physique une longueur
intrinsèque, le rayon de courbure de l’Univers dans la limite d’un Univers vide, comme c est une
constante fondamentale de la physique, la vitesse de propagation de particules non massives dans
le vide. (A. Eddington, The Expanding Universe, Cambridge University Press, Cambridge 1933,
chap. IV.).
42
de gµν , soit pour l’élément d’intégration d4 x =
invariant est donné par
p
√
−g d4 x = −g ′ d4 x′ .
p
g ′ /g d4 x′ et finalement l’élément
√
L’action d’Einstein-Hilbert est formée en intégrant sur −g d4 x un scalaire
invariant décrivant la courbure de l’espace-temps. Nous avons vu que le scalaire
de Ricci est défini par contractions successives du tenseur de Riemann, il forme
donc le bon lagrangien et l’action est donnée par
Z
√
c4
SEH = −
R −g d4 x.
16πG
Omettant pour un instant la constante inessentielle à ce niveau, on cherche à
minimiser l’action(41)
Z
√
S = R −g d4 x
avec δgµν = 0 sur une 3−surface envoyée à l’infini. Comme R est fonction des gµν
et de leurs dérivées premières et secondes, les équations d’Euler-Langrange sont
formellement données par
∂ √
∂ √
∂ √
−gR − ∂κ
−gR + ∂κ ∂λ
−gR = 0.
∂gµν
∂gµν,κ
∂gµν,κλ
Cette forme est nénamoins difficilement exploitable. On a défini antérieurement
R = g µν Rµν ,
Rµν = g ρσ Rρµνσ
= Γρµσ Γσρν − Γρµν Γσρσ + Γρµρ,ν − Γρµν,ρ .
Il vient alors pour δS
δS = 0 =
Z
√ √
√
d4 x δRµν g µν −g + Rµν δg µν −g + Rµν g µν δ −g .
R
√
Le premier terme s’annule par intégration par parties (il apparaı̂t d3 xRµν g µν −g
nul car le tenseur de Ricci est
R nul à l’infini
√ et le terme restant disparaı̂t grâce
à des propriétés difficiles de d4 xRµν δ(g µν −g)). Par ailleurs, on a la propriété
(également difficile à montrer !)
δg = −ggµν δg µν
√
qui permet d’écrire δ −g = − 12 (−g)−1/2 δg et d’obtenir
Z
√
1
4
ρσ
δS =
d x Rµν − Rρσ g gµν δg µν −g = 0
2
(41)
On pourra consulter wikipedia http://en.wikipedia.org/wiki/Einstein-Hilbert action.
Cosmologie
43
pour une variation arbitraire de la métrique si
1
Rµν − Rgµν = 0.
2
Gµν = Rµν − 12 gµν R est bien le tenseur d’Einstein. Lorsque la gravité interagit avec la
matière il faut ajouter un nouveau terme invariant décrivant les champs de matière
et de radiation dont la variation par rapport aux composantes du tenseur métrique
fait apparaı̂tre le tenseur énergie impulsion.
S=
Z
√
−g d4 x
Lm −
c4
R ,
16πG
et la forme précise de Lm dépend du problème considéré, mais définit le tenseur
énergie impulsion par (42) la définition
Z
Z
µν
√
√
δ
4
1
d4 x −gTµν δg µν ,
δSmat. =
d x µν
−gLmat δg ≡ 2
δg
d’où l’on déduit
Tµν
2
= √
−g
√
√
∂( −gLm )
∂ ∂( −gLm )
.
−
∂g µν
∂xρ ∂g µν,ρ
La variation de l’action conduit à
Z
√
1
c4
1
4
µν
T −
(R − g R) ,
δS =
−g d x δg
2 µν 16πG µν 2 µν
et il vient
1
8πG
Rµν − Rgµν = 4 Tµν .
2
c
L’introduction de la constante cosmologique nécessite un terme supplémenatire
dans l’action,
Z
√
−g d4 x,
Λ
et la variation conduit cette fois à
8πG
1
Rµν − Rgµν − gµν Λ = 4 Tµν .
2
c
(42)
voir par exemple S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972, chap. 12 ;
P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press, Princeton 1993,
p.259 ; A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics, and
Cosmology Springer-Verlag, New-York 1992, p.47.
44
Application à la cosmologie
⊲ Le modèle de Friedmann, Robertson et Walker. Le modèle de Robertson
et Walker, ou encore de Friedmann, Robertson et Walker (FRW) donne la forme
générale de la métrique, puis établit les équations de Friedmann régissant la
dynamique de l’Univers par application des équations d’Einstein.
− La métrique de Robertson et Walker : Cherchons la métrique d’un Univers
homogène, isotrope, et dont la courbure (qui pourra être positive, négative ou nulle),
K(t) = k/a2 (t) est la même en tout point en vertu du principe cosmologique et ne
dépend que du temps cosmique t. a(t) est un facteur d’échelle qui fixe l’amplitude
de la courbure et k définit le signe, k = +1, 0 ou −1. La métrique cherchée est a
priori de la forme
ds2 = c2 dt2 − dl2
où dl2 est la métrique tridimensionnelle de l’espace ordinaire, éventuellement courbe.
Lorsque k est positif, on obtient un espace à courbure positive et dans ce cas, par
analogie avec la surface de la sphère, plongée dans IR3 , on introduit une coordonnée
supplémentaire, w, pour plonger l’espace tridimensionnel à courbure positive dans
IR4 ,
x2 + y2 + z 2 +w2 = a2 (t).
{z
}
|
r2
On a donc r 2 + w2 = a2 (t), soit (r dr)2 = (w dw)2 à un instant donné, ou encore
dw2 =
r2
dr 2 .
a2 (t) − r 2
Deux points voisins sont distants de
dl2 = dr 2 + r 2 dΩ2 + dw2
=
a2 (t)
dr 2 + r 2 dθ2 + r 2 sin2 θ dϕ2 .
a2 (t) − r 2
On a bien un espace homogène (la courbure est la même partout) et isotrope
(dépendance angulaire de la métrique en r 2 dΩ2 ). On introduit en général une
variable sans dimension σ = r/a(t), de sorte que
dσ 2
2
2
.
+
σ
dΩ
dl2 = a2 (t)
1 − σ2
On en déduit la métrique de Robertson et Walker, introduite indépendamment
par ces deux auteurs en 1936, mais déjà connue de Friedmann, en généralisant
à
√
des courbures éventuellement nulles ou négatives en remplaçant a par a/ k et en
incorporant la coordonnée temporelle,
dσ 2
2
2
2
2
2
2
+ σ dΩ .
(4.10)
ds = c dt − a (t)
1 − kσ 2
Cosmologie
45
On en déduit la forme du tenseur métrique, dxµ = (c dt, dσ, dθ, dϕ), et
ds2 = gµν dxµ dxν , soit

1
0
[gµν ] = 
0
0
02
a
− 1−kσ
2
0
0
0
0
−a2 σ 2
0

0
0
0
−a2 σ 2 sin2 θ

.
(4.11)
g µν et gµν ne sont plus représentés par la même matrice. En effet, comme dxµ =
gµν dxν et dxµ = g µν dxν l’intervalle s’écrit
ds2 = dxµ dxµ = gµν g µν dxν dxν ,
| {z }
ds2
soit gµν g µν = 1 d’où l’on déduit
g µν =
1 µν
G
g
où g est le déterminant de gµν et Gµν la matrice de ses cofacteurs (gµν étant
symétrique, il n’est pas nécessaire de transposer la matrice des cofacteurs) (43) .
On a donc


1
0 2
0
0

 0 − 1−kσ
0
0
a2
.
[g µν ] = 

0
0
− a21σ2
0
1
0
0
0
− a2 σ2 sin2 θ
− Référentiel comobile : Les coordonnées intervenant dans la métrique de
Robertson-Walker sont xµ = (ct, σ, θ, ϕ) où t est le temps cosmique et σ la
coordonnée spatiale radiale ramenée au facteur d’échelle de l’Univers. Tout point
se déplaçant dans l’Univers de sorte que ses coordonnées spatiales xi = σ, θ, ϕ soient
constantes suit une ligne d’Univers particulière. En effet on a dans ce cas xi = const.,
soit
d2 xi
dxi
=
= 0,
ds
ds2
et comme la métrique est diagonale, les connexions affines
Γσµν =
1 σρ
g [gµρ,ν + gνρ,µ − gµν,ρ ]
2
spatio-temporelles deviennent
Γi 00 =
1 iρ
1
g (2∂0 g0ρ − ∂ρ g00 ) = g ii (2∂0 g0i −∂i g00 ) = 0.
2
2
|{z}
|{z}
0
(43)
1
On pourrait plus simplement ici utiliser le fait qu’il s’agit de matrices diagonales, les éléments
de la matrice produit sont alors les produits des éléments diagonaux.
46
On en déduit automatiquement que le point en question obéit à l’équation
dxµ dxν
d2 xi
i
+
Γ
=0
µν
2
{z } |{z} | ds{z ds}
| ds
0
c’est-à-dire
nul si
µν=00
nul si µν6=00
Dpi
= 0.
Ds
(4.12)
Les coodonnées σ, θ, ϕ sont appelées coordonnées comobiles et le référentiel dans
lequel elles restent constantes est le référentiel comobile. L’origine du référentiel
comobile obéit à l’équation de la particule libre dans un référentiel inertiel, le
référentiel comobile est donc un référentiel en chute libre. Par ailleurs, dans ce
référentiel la métrique de Robertson-Walker se réduit à ds2 = c2 dt2 c’est-à-dire
que le temps cosmique est le temps propre du référentiel comobile.
− Dynamique : les équations de Friedmann : Pour obtenir les équations de
Friedmann (44) qui régissent la dynamique de l’Univers, on part du tenseur énergie
impulsion du fluide cosmique,
Tµν = (ρ + p/c2 )vµ vν − pgµν
(4.13)
et de la métrique de Robertson-Walker pour écrire les équations d’Einstein.
Les composantes du tenseur métrique valent
g00 = g 00 = 1,
g11 = 1/g 11 = −a2 /(1 − kσ 2 ),
g22 = 1/g 22 = −a2 σ 2 ,
g33 = 1/g 33 = −a2 σ 2 sin2 θ.
Les sources sont définies par Tµν . Dans le référentiel comobile, v µ = (c, 0, 0, 0)
et le tenseur énergie impulsion se simplifie en composantes diagonales,
T00 = ρc2 ,
T11 = pa2 /(1 − kσ 2 ),
T22 = pa2 σ 2 ,
T33 = pa2 σ 2 sin2 θ.
La géométrie est déterminée par le tenseur d’Einstein. Les connexions affines se
déduisent de gµν ,
Γσµν =
1 σρ
1
g (gµρ,ν + gνρ,µ − gµν,ρ ) = g σσ (gµσ,ν + gνσ,µ − gµν,σ )
2 |{z}
2
diag
(44)
Pour un commentaire sur l’orthographe de Friedmann, voir la note 11 p. 83 dans A. Friedmann,
G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil, Paris 1997.
Cosmologie
47
soit en particulier
Γ101 =
∂g
1 1 − kσ 2 2aȧ
ȧ
1
1 11
g (g01,1 +g11,0 − g01,1 ) = g 11 110 =
=
2
2
2
2
∂x
2c
a
1
−
kσ
ac
|{z}
|{z}
=0
=0
et on calcule également
Γ011 = c−1 aȧ/(1 − kσ 2 ),
Γ022 = c−1 σ 2 aȧ,
Γ033 = c−1 σ 2 sin2 θaȧ,
Γ101 = Γ110 = c−1 ȧ/a,
Γ111 = kσ/(1 − kσ 2 ),
Γ133 = −σ(1 − kσ 2 ) sin2 θ,
Γ122 = −σ(1 − kσ 2 ),
Γ202 = c−1 ȧ/a,
Γ212 = 1/σ,
Γ303 = c−1 ȧ/a,
Γ313 = 1/σ,
Γ233 = − sin θ cos θ,
Γ323 = cot θ.
La composante R1010 du tenseur de Riemann est donnée par
R1010
=
−Γ101,0
−
Γ110 Γ101
∂Γ101
=−
−
∂x0
ȧ
ac
2
= (ȧ2 /a2 c2 − ä/ac2 ) − ȧ2 /a2 c2 = −ä/ac2 .
De même les autres composantes valent R2020 = R3030 = −ä/ac2 et R0000 = 0. On
en déduit la composante 00 du tenseur de Ricci,
R00 = R0000 + R1010 + R2020 + R3030 = −3ä/ac2
et de même R11 = R0101 + R1111 + R2121 + R3131 = T /(1 − kσ 2 ) avec T =
2k + aä/c2 + 2ȧ2 /c2 . Les autres composantes diagonales valent R22 = T σ 2 et
R33 = T σ 2 sin2 θ. Cela permet de calculer le scalaire de Ricci,
R = g µν Rµν
= g 00 R00 + g 11 R11 + g 22 R22 + g 33 R33
= −6S/a2
avec S = k + aä/c2 + ȧ2 /c2 . Finalement, le tenseur d’Einstein,
Gµν = Rµν − 12 gµν R,
a pour composantes 00 et 11
G00 = 3ȧ2 /a2 c2 + 3k/a2 ,
G11 = −
k + 2aä/c2 + ȧ2 /c2
.
1 − kσ 2
48
On en déduit les composantes correspondantes des équations d’Einstein,
3
ȧ2 (t)
c2
+ 3k 2
− c2 Λ = 8πGρ(t),
2
a (t)
a (t)
c2
ä(t) ȧ2 (t)
− 2
−k 2
+ c2 Λ = 8πGp(t)/c2 .
−2
a(t) a (t)
a (t)
(4.14)
Les autres composantes n’apportent pas d’information supplémentaire. Ces
équations ont été découvertes par Friedmann en 1922 dans le cas p = 0 puis
généralisées à pression non nulle par Lemaı̂tre en 1927. On réserve parfois le terme
d’équation de Friedmann à la première équation seulement aussi appelée équation
de l’énergie, la seconde étant alors appelée équation de Raychaudhuri ou équation
de l’accélération.
Il est remarquable de noter que les équations de Friedmann prennent une forme
identique à celle des équations obtenues dans le cadre purement newtonien (45) . Les
deux équations ci-dessus peuvent effectivement être écrites
1 2
4
1
1
ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2
2
3
6
2
1
4
ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t).
3
3
La première exprime la conservation de l’énergie totale et la seconde la loi
fondamentale de la dynamique. Ces équations montrent que le paramètre de
courbure k est analogue (au signe près) à la densité d’énergie totale et que la
(45)
Rappelons les grandes lignes du raisonnement : Considérons une sphère comobile avec le fluide
cosmique, de rayon σa. Si la courbure et les vitesses locales sont faibles, la dynamique newtonienne
et la gravitation newtonienne peuvent s’appliquer, de sorte que l’énergie cinétique par unité de
masse d’un point de la sphère vaut 12 (σ ȧ)2 . De même, la densité d’énergie gravitationnelle due au
contenu de la sphère vaut −M (σa)G/σa avec M (σa) = 43 πρσ 3 a3 la masse de la sphère comobile
(ce qui est à l’extérieur ne contribue pas en symétrie sphérique en raison du théorème de Gauss,
ou plutôt du théorème de Birkhoff dans le contexte de la relativité générale). La conservation
de l’énergie totale locale s’écrit 21 σ 2 ȧ2 − 34 πGρσ 2 a2 = const. Si l’on choisit d’écrire la constante
2
2
const. = − 21 kσ 2 c2 , on obtient 3 ȧ
+ 3k ac 2 = 8πGρ. On voit que k détermine le signe de la courbure
a2
de l’Univers, mais dans la limite newtonienne, c’est également k qui détermine le signe de l’énergie
totale de la matière dans l’Univers.
Tableau 4.1 Courbure et énergie totale de l’Univers pour des modèles à pression
nulle et sans constante cosmologique.
k
courbure
énergie totale
+1
0
−1
positive
plate
négative
négative
nulle
positive
Si l’on multiplie cette dernière équation par a3 et que l’on différentie par rapport à t, il vient
d
6äȧa + 3ȧ3 + 3kc2 ȧ = dt
(8πGρa3 ), soit, en utilisant aussi la seconde équation de Friedmann
qui montre que le membre de gauche s’annule,
d
dt
4πGρa3
3
= 0. Cette équation exprime que la
masse totale dans la sphère comobile est constante. En d’autres termes, les équations de Friedmann
à pression nulle et sans constante cosmologique sont équivalentes, dans la limite newtonienne, à la
conservation de l’énergie et à l’équation de continuité.
Cosmologie
49
constante cosmologique joue le rôle d’une force répulsive (“énergie potentielle” dont
le minimum est rejeté en a → ∞), comme on l’obtient facilement dans un traitement
newtonien.
Il reste à résoudre le problème de la dépendance de la pression avec la densité
et pour cela il faut encore une équation d’état p = p(ρ) qui suppose une forme
particulière de matière dominant l’Univers ou la connaissance des diverses formes
possibles d’énergie dans l’Univers.
On obtient alors (cf. l’histoire sommaire de l’Univers ci-après) les évolutions
en a(t) ∼ t2/3 pour le modèle MDU (Matter Dominated Universe), en a(t) ∼ t1/2
pour le modèle RDU (Radiation Dominated Universe), et en exponentielle pour le
modèle “ΛDU” (cf. ci-dessous). On définit la densité critique ρc (t) dans l’Univers
à un instant donné comme celle qui correspond à une énergie totale (ou courbure)
nulle (cas limite entre un Univers fermé (cette énergie totale serait négative) et un
Univers ouvert (elle serait positive)), en l’absence de constante cosmologique, soit
ρc (t) = 3H 2 (t)/8πG, H(t) ≡ ȧ(t)/a(t).
Pour obtenir l’équation de conservation, on peut dériver la première des deux
équations ci-dessus, on obtient un terme en ȧä que l’on divise par aȧ pour pouvoir
utiliser la seconde équation de Friedmann dans laquelle le terme en ȧ2 /a2 est ensuite
éliminé à l’aide de la première équation de Friedmann. Il reste finalement l’équation
de continuité
ρ̇(t) + 3(ρ(t) + p(t)/c2 )
ȧ(t)
= 0.
a(t)
Histoire sommaire de l’Univers
⊲ Univers dominé par la matière (MDU). Dans le cas d’un Univers “de
poussière”, c’est-à-dire composé de matière non relativiste uniquement, la relation
de continuité devient
d
(ρ(t)a3 ) = ρ̇(t)a3 + 3ρ(t)a2 ȧ = 0.
dt
Cette expression traduit la conservation de la masse contenue dans la sphère en
expansion. Elle permet de donner une forme asymptotique simplifiée de l’évolution
temporelle de a. Supposons une forme a(t) ∼ tα , la compatibilité des deux termes
dans l’expression de conservation de l’énergie, avec la dépendance ρ(t) ∼ a−3 déduite
de la loi de conservation, conduit à une énergie cinétique en t2(α−1) et une énergie
potentielle en t−3α+2α . On en déduit α = 2/3,
a ∼ t2/3 .
Cette expression est satisfaite par les modèles d’Univers dominés par la matière,
c’est-à-dire lorsque ρ(t) = ρM (t) est la densité de matière (non relativiste comme on
le verra un peu plus loin). La puissance α < 1 traduit la décélération de l’expansion
de l’Univers (les courbes a(t) ont une courbure négative).
50
Figure 4.4 Diverses dynamiques d’univers permises (Harrisson).
Cosmologie
51
⊲ Dynamique d’un Univers dominé par le rayonnement (RDU). En
négligeant la matière non relativiste, on peut considérer le cas d’un Univers ne
comportant comme énergie que celle associée au rayonnement électromagnétique
(ce
p
cas décrit également la matière ultra-relativiste pour laquelle E = |p2 |c2 + m2 c4 ≃
|p|c.). Dans ce cas, la densité d’énergie est donnée par la loi de Stefan ρR c2 = σT 4
(l’indice R est ici pour rayonnement ou pour relativiste) et l’équation d’état du fluide
de photons par
p=
1 4 1
σT = ρR (t)c2 .
3
3
L’équation de continuité tenant compte de la pression devient
ρ̇R (t) = −4ρR (t)
ȧ
a
d’où l’on déduit une variation ρR (t) ∼ a−4 , différente de ρM (t) ∼ a−3 pour la densité
de matière non relativiste. Dans les deux cas, l’expansion conduit à une dilution de
la densité d’énergie. Le comportement asymptotique de a(t) se déduit de nouveau
de la compatibilité de la conservation de l’énergie avec une loi en tα qui demande
cette fois que les deux termes en t2(α−1) et t−4α+2α soient comparables, soit α = 1/2
et
a ∼ t1/2 .
Un Univers dominé par le rayonnement voit également son expansion décélérer, mais
la dynamique est différente de celle de l’Univers dominé par la matière.
⊲ Le rôle de la constante cosmologique (ΛDU). Ce qu’Einstein a
initialement conçu comme une difficulté des modèles cosmologiques est le fait
qu’ils soient non statiques. Il a alors introduit la constante cosmologique. La limite
newtonienne des équations d’Einstein conduit ainsi à l’équation de Poisson modifiée
~ 2 ψ(a) = 4πGρ(a) − Λc2 .
∇
La contribution ψΛ (a) de la constante cosmologique au potentiel gravitationnel est
d2
2
alors solution de a1 da
2 (aψΛ (a)) = −Λc , soit encore
1
ψΛ (a) = − Λc2 |a|2 .
6
Il correspond à ce potentiel un champ de gravitation répulsif si Λ > 0, GΛ (a) =
(c’est aussi la force par unité de masse). La constante Λ joue ainsi le rôle
d’une force source d’expansion qui peut s’opposer à la gravitation et permet de
restaurer un Univers statique. En effet, pour une énergie totale nulle (Univers plat),
la conservation de l’énergie devient
+ 13 Λc2 a
1 2 4πGρa2
1
ȧ −
− Λc2 a2 = 0,
2
3
6
de sorte que la constante
de Hubble peut être nulle si l’on impose la valeur de
p
8πGρ/3(1 + Λc2 /8πGρ)1/2 = 0. Une dizine d’années après
Λ, ȧ/a = H =
52
l’introduction par Einstein de la constante cosmologique (1917), l’observation
montrera que l’Univers n’est pas statique, mais en expansion (Slipher 1925, Lemaı̂tre
1927, Hubble 1929) et la condition ci-dessus deviendra caduque.
⊲ Histoire de l’Univers. Les quelques éléments fournis dans les sections
précédentes permettent de discuter en termes simples de l’histoire de l’Univers. Dans
le cas k ≤ 0 qui nous intéresse davantage car on verra que les observations favorisent
ce scénario pour notre Univers, le facteur d’échelle a(t) est une fonction monotone,
croissante, mais dont la vitesse diminue (on peut définir un paramètre de décélération
q = −äa/ȧ2 ∼ −(α−1)/α > 0 si α < 1 (46) .). Dans le passé, a(t) était donc plus petit
que sa valeur actuelle. L’Univers actuel est dominé par la matière, mais lorsqu’on
remonte dans le passé, comme ρR (t) a décru plus rapidement que ρM (t), l’Univers a
été dominé par le rayonnement.
Il y a eu un moment particulier qu’on appelle découplage matière-rayonnement
ou recombinaison où les deux formes de densité d’énergie ont été du même ordre (47)
. L’Univers a donc été plus dense, plus chaud, d’abord gouverné par une expansion
en a ∼ t1/2 à l’époque où le rayonnement et les particules relativistes étaient
responsables de la dynamique de l’Univers, puis par une expansion un peu plus
rapide en a ∼ t2/3 après la recombinaison lorsque c’est la matière non relativiste qui
a joué un rôle dominant pour la dynamique.
Notons que lors de la phase dominée par le rayonnement, la vitesse d’expansion a
divergé à l’origine, puisque ȧ ∼ (2t)−1/2 → ∞ lorsque t → 0. Ce serait une difficulté
essentielle dans une interprétation newtonienne car dans la phase primordiale de
l’Univers, la vitesse relative des objets aurait dépassé celle de la lumière, en
contradiction avec la causalité relativiste. On est alors amené à supposer que la
validité du modèle ne s’étend pas, en remontant le temps, aux instants initiaux.
Cette difficulté précise est levée dans le cadre relativiste car la vitesse en question
est celle de l’expansion du facteur d’échelle qui caractérise la dynamique de l’espacetemps, mais cela ne permet pas de communiquer entre différentes régions spatiales à
des vitesses supérieures à c. Notons que cela soulèvera un autre problème appelé
problème de l’horizon. En revanche on se heurtera toujours à une impossibilité
d’étendre la théorie à t → 0, mais cette fois pour des raisons d’invalidité des théories
quantiques, non testées à ces énergies, davantage que de causalité.
⊲ Paramétrisation Ω. Si l’on rejette le terme cosmologique du côté matière
(au second membre de l’équation d’Einstein), on peut l’écrire comme dû à un fluide
équivalent de densité ρΛ et de pression pΛ tel que
Λg µν =
8πG
[(ρΛ + pΛ /c2 )v µ v ν − pΛ g µν ]
c4
à condition de poser l’équation d’état
pΛ = −ρΛ c2 ,
ρΛ =
Λc2
.
8πG
Il est alors possible d’écrire les équations de Friedmann et l’équation de continuité
(cette dernière étant d’ailleurs inchangée) en faisant uniquement intervenir les
(46)
Nous verrons cependant que des mesures récentes montrent que q < 0 pour notre Univers.
Ici encore en toute rigueur on doit distinguer la recombinaison, c’est-à-dire la disparition
des électrons libres et la formation d’états liés avec les noyaux (les atomes !) et le moment
de la transition d’un Univers dominé par la rayonnement à un Univers dominé par la matière.
Cependant ces deux phases de l’Univers sont très proches (environ 105 ans après le Big Bang) et
donc assimilables en première approximation.
(47)
Cosmologie
53
densités, soit
1 2
4
1
ȧ (t) − πG(ρ(t) + ρΛ )a2 (t) = − kc2
2
3
2
4
ä(t) = − πG(ρ(t) + ρΛ + 3(p(t) + pΛ )/c2 )a(t),
3
ȧ(t)
= 0.
ρ̇(t) + 3(ρ(t) + p(t)/c2 )
a(t)
Figure 4.5 Evolution de l’Univers.
On peut maintenant exprimer la première équation de Friedmann en termes
de la paramétrisation en Ω qui ramène les densités à leur valeur critique, avec
la densité critique de référence à l’époque actuelle ρc0 = ρc (t0 ) = 3H02 /8πG. On
écrit la première équation de Friedmann comme ȧ2 (t) = (8πG/3)[(ρM (t) + ρR (t) +
ρΛ (t))a2 (t) − 3kc2 /8πG] où la densité ordinaire a été décomposée en matière et
rayonnement, puis on exprime ces densités comme ρM (t) = ρM (t0 )(a(t0 )/a(t))3 =
ρc (t0 )ΩM (t0 )(a(t0 )/a(t))3 , ρR (t) = ρR (t0 )(a(t0 )/a(t))4 = ρc (t0 )ΩR (t0 )(a(t0 )/a(t))4 ,
ρΛ (t) = ρΛ (t0 ) = ρc (t0 )ΩΛ (t0 ). On peut également définir un paramètre Ωk associé à
la courbure, de sorte que −3kc2 /8πGa2 (t) = ρc (t0 )Ωk (t0 )(a(t0 )/a(t))2 . Finalement,
on pose
ΩM (t0 ) =
8πGρM (t0 )
,
3H02
ΩR (t0 ) =
8πGρR (t0 )
,
3H02
Ωk (t0 ) = −
k
,
H02 a20
ΩΛ (t0 ) =
Λc2
,
3H02
et l’équation de Friedmann devient
a40
a20
a30
2
2
+ ΩR (t0 ) 4
+ Ωk (t0 ) 2
+ ΩΛ (t0 ) .
H (t) = H0 ΩM (t0 ) 3
a (t)
a (t)
a (t)
54
Une conséquence immédiate de cette équation est qu’elle s’écrit comme une “règle
de somme cosmique” à l’instant présent, ΩM (t0 ) + ΩR (t0 ) + Ωk (t0 ) + ΩΛ (t0 ) = 1.
Les cosmologistes établissent une classification des divers modèles possibles
d’univers en fonction des valeurs prises par les paramètres caractéristiques,
notamment la courbure et la constante cosmologique. C’est la comparaison entre
les éléments dynamiques issus de l’observation (constante de Hubble et paramètre
de décélération notamment) et les prédictions déduites des divers modèles qui permet
ensuite de valider tel modèle et par conséquent tel contenu énergétique de l’Univers.
Cosmologie
55
5
Le modèle Lambda-CDM
On se propose ici de montrer comment les paramètres de l’Univers sont mesurables
et de souligner le rôle particulier joué par la constante cosmologique, puis d’insister
sur la situation singulière de l’Univers actuel.
Les éléments essentiels du modèle ΛCDM
Le modèle d’Univers est essentiellement gouverné par les paramètres
– de courbure, k,
– de densité de matière, ρ, pour laquelle on distingue en général la matière
relativiste ou rayonnement (on parle également de matière chaude, hot
matter, ρHM ), et la matière non relativiste (on parle également de matière
froide, cold matter, ρCM ),
– de constante cosmologique, Λ.
On choisit en général d’écrire la constante cosmologique sous la forme d’une
densité ρΛ = Λ/8πG de sorte qu’il apparaı̂t trois contributions essentielles à la
densité, chacune obéissant à une équation d’état différente,
ρ(t) = ρHM (t) + ρCM (t) + ρΛ (t),
1
ρ c2 ,
3 HM
= 0,
pHM =
pCM
pΛ = −ρΛ c2 .
Pour chaque modèle d’Univers (c’est-à-dire des proportions relatives des trois types
de matière), on calcule la dynamique que l’on compare aux mesures pour sélectionner
les caractéristiques de l’Univers actuel.
56
Paramètres mesurables
On considère une étoile située en σ dans le référentiel comobile, observée depuis la
Terre à σ = 0. La métrique est celle de FLRW,
ds2 = c2 dt2 − a2 (t)
dσ 2
2
2
.
+
σ
dΩ
1 − kσ 2
L’axe Terre-étoile est choisi comme référence de sorte que θ = ϕ = 0 et l’intervalle
devient
ds2 = c2 dt2 − a2 (t)
dσ 2
.
1 − kσ 2
⊲ Les distances. Une première notion de distance est la distance propre dp (t).
Comme en relativisté restreinte, c’est la distance entre deux points “mesurée” au
dσ 2
même instant, soit ds2 = −a2 (t) 1−kσ
2 . La distance propre définie positive (disons à
t0 ) entre l’étoile et la Terre vaut
Z σ
Z p
dσ
√
= a(t0 )Ak (σ)
− ds2 = a(t0 )
dp (t0 ) =
1 − kσ 2
0
où
Ak (σ) =
(
Arcsin σ
σ
Argsinh σ
si k = 1
si k = 0
si k = −1
On peut ensuite en déduire la loi de Hubble de la manière suivante :
d˙p (t0 ) = ȧ(t0 )Ak (σ) = H0 dp (t0 )
avec H0 = ȧ(t0 )/a(t0 ). On en déduit notamment la distance de Hubble qui mesure
l’Univers observable, comme la distance dH (t0 ) au-delà de laquelle la vitesse de
récession des galaxies dépasse c, soit dH (t0 ) = c/H0 . Avec la valeur H0 = 70 ±
7 km.s−1 .Mpc−1 , on obtient
dH (t0 ) = 4300 ± 430 Mpc.
Une autre expression de la distance propre peut être obtenue en considérant
maintenant que l’étoile en σ émet un signal lumineux à t = tém. reçu sur Terre à t0 .
dσ 2
Il s’agit d’une trajectoire radiale du genre lumière, soit ds2 = c2 dt2 −a2 (t) 1−kσ
2 = 0
ou encore
c dt
dσ
=√
.
a(t)
1 − kσ 2
R σ dσ
= Ak (σ) et dp (t0 ) = a(t0 )Ak (σ), on peut ré-exprimer
Comme par ailleurs 0 √1−kσ
2
dp (t0 ) = a(t0 )
Z
t0
tém.
c dt
.
a(t)
Cosmologie
57
Il est conventionnel de donner un nom aux premiers coefficients du
développement de Taylor du facteur d’échelle,
a(t) = a(t0 ) + (t − t0 )ȧ(t0 ) + 12 (t − t0 )2 ä(t0 ) + . . .
= a(t0 )(1 + H0 (t − t0 ) − 21 q0 H02 (t − t0 )2 + . . .)
en ajoutant des indices 0 aux valeurs présentes. q0 est le paramètre (sans dimension)
de décélération,
q0 ≡ −ä(t0 )a(t0 )/ȧ2 (t0 ) = −ä(t0 )/H02 a(t0 ).
(5.1)
On peut effectuer
R t0 c dt un développement de Taylor de l’inverse du facteur d’échelle pour
exprimer t a(t) en puissances de t0 − tém. ,
ém.
a−1 (t) = a−1 (t0 )(1 − H0 (t − t0 ) + (1 +
q0 2
)H0 (t − t0 )2 + . . .)
2
On en déduit
1
q
1
dp (t0 ) = c(t0 − tém. ) + cH0 (t0 − tém. )2 + (1 + 0 )cH02 (t0 − tém. )3 + . . .
2
3
2
La valeur du “redshift” z est également accessible à l’expérience,
z=
λobs − λém
λém
et sa forme en fonction de tobs − tém fait intervenir des paramètres fondamentaux.
Pour montrer cela, considérons comme précd́edemmant que nous sommes à l’origine
du référentiel comobile, σ = 0, et qu’un signal lumineux issu d’une galaxie située
en σém (fixé) émis à l’instant tém nous parvient à tobs . Le signal émis à la période
suivante est émis à l’instant tém +∆tém et nous arrive à tobs +∆tobs . Ces deux signaux
parcourent des intervalles de genre lumière,
0 = dt2 − a2 (t) dσ 2 /c2 (1 − kσ 2 )
de sorte qu’il vient les deux égalités
Z
tobs
tém
dt
1
=−
a(t)
c
Z
0
σém
dσ
√
1 − kσ 2
et
Z
tobs +∆tobs
tém +∆tém
dt
1
=−
a(t)
c
Z
0
σém
dσ
√
.
1 − kσ 2
On voit que cela entraı̂ne l’égalité des deux premiers membres, et comme les
intervalles ∆t sont arbitrairement petits, on peut négliger la dépendance temporelle
du facteur d’échelle dans les intégrales et il vient simplement
tobs
t
t + ∆tobs
t + ∆tém
− ém = obs
− ém
a(tobs ) a(tém )
a(tobs )
a(tém )
58
soit
∆tobs
∆tém
−
= 0.
a(tobs ) a(tém )
En multipliant les ∆t par c pour avoir les longueurs d’onde, on obtient le redshift
z = (λobs − λém )/λém ,
z = a(tobs )/a(tém ) − 1.
(5.2)
On peut ainsi réexprimer le redshift
z = H0 (t0 − tém ) + (1 + 12 q0 )H02 (t0 − tém )2 .
En formant également z 2 , cette expression est inversible, pour donner
t0 − tém = H0−1 z(1 − (1 +
q0
)z) + O(z 3 )
2
soit finalement la distance propre exprimée en fonction du redshift
dp (t0 ) =
1 + q0
cz
1−
z + O(z 2 ) .
H0
2
On constate que la relation linéaire dp ∼ z vaut uniquement dans la limite où les
2
.
redshifts sont faibles, typiquement z ≪ 1+q
0
Les observations astronomiques ne permettent pas la détermination directe de
la distance propre qui nous sépare d’une étoile ou d’une galaxie. On mesure la
luminosité apparente ℓ, luminosité par unité de surface vue depuis la Terre, ce qui
permet de définir une quantité homogène à une longueur, la distance de luminosité,
dl , par la relation
L = 4πd2l ℓ
à condition de connaı̂tre une estimation de la luminosité absolue ou intrinsèque,
L. Cette estimation est possible pour les chandelles
standard, que nous discuterons
p
au paragraphe suivant. La quantité dl = L/4πℓ prend effectivement le sens de
distance à laquelle un objet de luminosité absolue L produit une luminosité par
unité de surface de ℓ dans un espace euclidien statique. Dans le cas d’un espace
éventuellement courbe et en expansion, deux corrections sont nécessaires. D’une part
l’effet de courbure, qui produit une correction géométrique et d’autre part l’effet de
l’expansion. Pour exprimer la correction géométrique, considérons le cas d’une sphère
de rayon a sur laquelle on trace un cercle autour de l’axe des pôles. Le périmètre de
ce cercle est donné par 2πa sin σ si σ est l’angle d’un point du cercle par rapport à
l’axe des pôles, soit en fonction du “rayon” r = aσ mesuré sur la surface sphérique,
2πa sin(r/a). Ce résultat vaut pour un espace de courbure positive. Dans le cas
général, on a un périmètre de 2πrSk (σ) avec Sk (σ) = σ −1 sin σ pour k = 1, 1 pour
k = 0 et σ −1 sinh σ pour k = −1. On peut généraliser cette relation à une relation
similaire entre distance de luminosité et distance propre, dl (t0 ) = dp (t0 )Sk (σ). Une
seconde correction provient de l’expansion de l’Univers. Il y a tout d’abord un effet
d’augmentation des longueurs d’onde, puisqu’un photon de longueur d’onde λém
Cosmologie
59
émis lorsque le facteur d’échelle de l’Univers est a(tém ) à tém est mesuré à t0 avec
une longueur d’onde λ0 telle que λ0 /a(t0 ) = λém /a(tém ), soit λ0 = (1 + z)λém . Les
énergies hc/λ varient dans les proportions inverses, soit E0 = Eém /(1 + z). Un
deuxième effet de l’expansion vient s’ajouter si l’on tient compte du changement de
distances entre l’émission et la reception de deux photons successifs. Supposons deux
photons émis par la galaxie lointaine à des instants séparés de ∆tém . Il correspond
à ces deux instants un intervalle dsém = c∆tém qui, comme la longueur d’onde, sera
augmenté par l’expansion par un facetur 1 + z au moment de la réception à t0 , soit
ds0 = c∆tém (1 + z). Cela signifie que les deux photons sont absorbés sur Terre à des
intervalles ∆tém (1 + z). Lorsque l’on combine les deux effets liés à l’expansion, on
voit que la luminosité apparente est diminuée d’un facteur (1 + z)2 par rapport à sa
valeur en l’absence d’expansion. Courbure et expansion permettent donc d’écrire la
luminosité apparente comme
ℓ(t0 ) =
L
L
=
2
2
2
4πdl (t0 )
4πdp (t0 )Sk (σ)(1 + z)2
et finalement, il vient entre la distance de luminsoité et la distance propre la relation
dl (t0 ) = dp (t0 )Sk (σ)(1 + z).
Connaissant le développement de la distance propre en fonction du redshift, on a
dl (t0 ) =
cz
1 − q0
1+
z + O(z 2 ) .
H0
2
Les deux distances coı̈ncident aux z petits.
⊲ Magnitudes. La magnitude est définie par
m = −2.5 log10
ℓ
ℓx
où ℓx = 2.53 10−8 W.m−2 est une luminosité de référence. Le choix des facteurs
numériques dans cette expression permet de classer les étoiles visibles à l’œil nu sur
une échelle de 1 à 6, comme cela avait été imaginé par Ptolémée et Hipparcos sur la
base de l’observation d’un millier d’étoiles. Si l’on passe à une expression en fonction
de la distance de luminosité, on obtient
m = 2.5 log10
4π 2.53 10−8
cz
1 − q0
+ 5 log10 dl + 5 log10
z)
+ 5 log10 (1 +
L
H0
2
de sorte que la courbe de m en fonction de z donne accès, pour peu que l’on connaisse
la luminosité intrinsèque L, aux paramètres cosmioques H0 et q0 .
A titre d’exemple; les SNIa ont un luminosité intrinsèque de L = 12.1 1035 W
(soit 4.109 L⊙ ). Une SNIa de redshift z = 0.2 a une luminosité apparente de
ℓ = 1.328 10−16 W.m−2 . Cela correspond dans un espace plat à d = l = 871 Mpc,
dp = 725 Mpc, m = 20.7. Pour une SNIa de redshift z = 1 a une luminosité apparente
de ℓ = 3.041 10−18 W.m−2 . Cela correspond à d = l = 5760 Mpc, dp = 2880 Mpc,
m = 24.8.
60
⊲ Chandelles standard. Les chandelles standard sont des “objets” (étoiles,
galaxies) dont la luminosité intrinsèque est calibrée, de sorte que de la mesure de leur
luminosité apparente on peut déduire leur distance. Les Céphéı̈des sont des étoiles
variables géantes ou supergéantes jaunes (4 M⊙ − 15 M⊙ , 100 L⊙ − 30 000 L⊙ ). Leur
éclat varie de 0.1 à 2 magnitudes de manière périodique en raison de variations de
surface et de température de surface (période comprise entre 1 et 135 jours) et la
période est directement corrélée à la luminosité. La distance des Céphéı̈des les plus
proches est accessible à des mesures de parallaxe, de sorte que l’on peut calibrer la
luminosité intrinsèque sur la la périodicité de l’éclat.
Figure 5.1
gauche).
Variation de luminosité apparente d’une Céphéı̈de (δ−Céphéı̈de à
Figure 5.2 Relation période-luminosité pour les Céphéı̈des du super amas de la
Vierge.
Les campagnes d’observations de SNe Ia sont basées sur le fait que ce sont
des chandelles incroyablement lumineuses. Leur signature spectrale est parfaitement
caractérisée et même à des distances extrêmement grandes, elles sont suffisamment
brillantes pour être observables.
Cosmologie
61
Figure 5.3 L’étude des supernovæ Ia résulte de campagnes d’observation
systématique du ciel (figure extraite des Images de la Physique 2008).
Figure 5.4 Les supernovæ Ia sont des objets extrêmement lumineux et qui ont
des signatures spectrales caractéristiques comme en atteste la figure (extraite des
Images de la Physique 2008).
Les supernovæ Ia sont formées à partir d’étoiles doubles associant une naine
blanche d’une masse de l’ordre de la masse solaire, qui “aspire” de la matière de son
compagnon de sorte que la naine blanche atteint la limite de Chandrasekhar, 1.3M⊙ ,
où elle se transforme en supernova selon un mécanisme suffisamment connu pour que
la luminosité intrinsèque soit appréciée convenablement à 4.109 L⊙ , c’est-à-dire à peu
près aussi brillante qu’une petite galaxie !
62
Figure 5.5 Une supernova presque aussi lumineuse que sa galaxie.
A des échelles intermédiaires entre les Céphéı̈des et les SNIa, certaines galaxies
servent également de chandelles standard et leur calibration est assurée au moyen
d’une relation connue comme loi de Tully-Fisher.
⊲ Paramètres mesurés. Plutôt que les courbes v vs d de Hubble, les
astronomes reportent en général aujourd’hui la magnitude effective m(z),
m = 2.5 log10
4π 2.53 10−8
cz
1 − q0
+ 5 log10 dl + 5 log10
z),
+ 5 log10 (1 +
L
H0
2
pour les chandelles standard en fonction du redshift. H0 dL (z) est donné par une
intégrale (48) déterminée par la métrique FRW, soit
1+z
Sk
H0 dL (z) = p
|Ωk |
"Z
p
|Ωk | dz ′
z
0
p
(1 + z ′ )2 (1 + z ′ ΩM ) − z ′ (2 + z ′ )ΩΛ
#
avec la fonction Sk (x) = x si k = 0, sin x si k = +1 et sinh x si k = −1 et où
ΩM =
8πGρM
,
3H02
ΩΛ =
Λ
,
3H02
Ωk = −
k
,
a20 H02
en négligeant complètement la contribution du rayonnement. De la mesure des
magnitudes, on peut par consq́uent déduire les paramètres cosmologiques H0 et
q0 .
(48)
cf. hep-ph/0004188.
Cosmologie
63
Figure 5.6 Illustration de la loi de Hubble déduite de l’observation des Céphéı̈des
dans le cadre du “Hubble Key Project” et comparaison avec d’autres chandelles
standard.
64
FAINTER
(Farther)
(Further back in time)
Perlmutter, et al. (1998)
24
effective mB
22
Flat
Supernova
Cosmology
Project
Λ=0
(ΩΜ,ΩΛ) =
( 0, 1 )
(0.5,0.5) (0, 0)
( 1, 0 ) (1, 0)
(1.5,–0.5) (2, 0)
26
20
18
Calan/Tololo
(Hamuy et al,
A.J. 1996)
16
14
0.02
0.05
0.1
redshift z
0.2
0.5
1.0
MORE REDSHIFT
(More total expansion of universe
since the supernova explosion)
In flat universe: ΩM = 0.28 [± 0.085 statistical] [± 0.05 systematic]
Prob. of fit to Λ = 0 universe: 1%
Figure 5.7 Diagramme de Hubble en 1998.
Il est à noter que l’estimation de ces paramètres a beaucoup évolué au cours du
XXème siècle.
Cosmologie
65
Figure 5.8 Evolution de l’estimation de la constante de Hubble.
Les paramètres H0 , q0 , de même que la courbure k, la valeur du rapport Ω de la
densité de l’Univers à la densité critique et la valeur de la constante cosmologique
Λ sont les paramètres qui définissent l’Univers. Précisons les valeurs présentes,
actuellement admises (49) :
H0 = 72 ± 8 km s−1 Mpc−1
Hubble Key Project
− 0.02 ≤ kc2 /a20 H02 ≤ 0.02
fluctuations du rayonnement cosmique à 3 K
τ0 = H0−1 = 1.36 ± 0.15 1010 années
ΩM = Ω0 = 8πGρ0 /3H02 = 0.3 ± 0.1
ΩΛ = λ0 = Λ/3H02 = 0.7 ± 0.2
structures à grande échelle
supernovæ Ia
Nous avons déjà précisé le rôle des campagnes de mesures basées sur l’observation
de supernovæ distantes dans la détermination des paramètres caractérisant la
dynamique de l’Univers et en particulier la qualité de la valeur obtenue pour
la constante cosmologique. On peut se reporter aux articles suivants : Cosmic
Concordance, [astro-ph/9505066], puis First Year Wilkinson Microwave Anisotropy
Probe (WMAP) Observations: Determination of Cosmological Parameters, [astroph/0302209] et plus récemment, Wilkinson Microwave Anisotropy Probe (WMAP)
Three Year Results: Implications for Cosmology, [astro-ph/0603449].
Les campagnes de mesures précises des paramètres Ω sont essentiellement basées,
outre l’analyse fine du fond de rayonnement cosmique, sur l’étude des grandes
structures et l’étude des supernovæ Ia a fort “redshift”. De ces mesures combinées,
il ressort les valeurs admises des paramètres de densité
ΩM = 0.275 ± 0.033
ΩR = 0.0010 ± 0.0005
ΩΛ = 0.72 ± 0.03
Ωk = 0.000025 ± 0.006500
d’où l’appellation de modèle Λ-CDM
(49)
Tirées de M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford 2004.
Nous reviendrons sur ces paramètres.
66
Figure 5.9 Les zones de confiance dans le plan ΩΛ − ΩM d’après les campagnes
de mesures de supernovæIa.
Figure 5.10 Les zones de confiance dans le plan ΩΛ −ΩM d’après les campagnes de
mesures combinées des supernovæIa, les fluctuations du fond diffus de rayonnement
cosmique et l’étude des grandes structures.
Cosmologie
67
L’inventaire cosmique
On a indiqué précédemment les valeurs expérimentales présentes, soit k ≃ 0,
ΩHM ≃ 0, ΩCM ≃ 0.3, ΩΛ ≃ 0.7. L’Univers est ainsi actuellement dominé par
la constante cosmologique et la matière froide. Comme la valeur de ΩCM est très
largement supérieure à la quantité visible de matière froide, on considère que
cette matière froide est sombre (ne rayonne pas) et on parle de cold dark matter
(cf. le chapitre sur les problèmes cosmologiques). Les candidats à cette matière
froide invisible sont hypothétiques (naines brunes, WIMPS (weakly interacting
massive particles), MACHOS (Massive Compact Halo Objects), . . . ). L’origine de
la constante cosmologique étant également sujette à interrogations, on parle souvent
d’énergie sombre (dark energy) car d’autres formes d’énergie qu’une simple constante
cosmologique Λ peuvent produire l’effet voulu (par exemple la quintessence). Le
modèle d’Univers qui prévaut actuellement est ainsi appelé modèle ΛCDM.
On reproduit ci-dessous certains de résultats obtenus par les analyses fines du
fond de rayonnement cosmologique extraits de astro-ph/0603449.
Tableau 5.1 Définition des paramètres cosmologiques [astro-ph/0603449].
Parameter
Description
Definition
H0
ωb
ωc
fν
P
Hubble expansion factor
Baryon density
Cold dark matter density
Massive neutrino fraction
Total neutrino mass (eV)
Effective number of relativistic neutrino species
Spatial curvature
Dark energy density
Matter energy density
Dark energy equation of state
H0 = 100h Mpc−1 km s−1
ωb = Ωb h2 = ρb /1.88 × 10−26 kg m−3
ωc = Ωc h2 = ρc /18.8 yoctograms/ m−3
fν = Ων /Ωc
P
mν = 93.104Ων h2
mν
Nν
Ωk
ΩDE
Ωm
w
For w = −1, ΩΛ = ΩDE
Ωm = Ωb + Ωc + Ων
w = pDE /ρDE
Tableau 5.2 ΛCDM Model.
WMAP+
SDSS
WMAP+
LRG
WMAP+
SNLS
WMAP +
SN Gold
WMAP+
CFHTLS
2.233+0.062
−0.086
0.1329+0.0056
−0.0075
2.242+0.062
−0.084
0.1337+0.0044
−0.0061
2.233+0.069
−0.088
0.1295+0.0056
−0.0072
2.227+0.065
−0.082
0.1349+0.0056
−0.0071
2.255+0.062
−0.083
0.1408+0.0034
−0.0050
0.085+0.028
−0.032
0.950+0.015
−0.019
0.079+0.028
−0.034
0.946+0.015
−0.019
0.088+0.026
−0.032
0.953+0.015
−0.019
Parameter
100Ωb h2
Ωm h2
0.709+0.024
−0.032
0.813+0.042
−0.052
0.723+0.021
−0.030
0.808+0.044
−0.051
τ
ns
0.079+0.029
−0.032
0.948+0.015
−0.018
0.709+0.016
−0.023
0.816+0.042
−0.049
σ8
Ωm
0.772+0.036
−0.048
0.266+0.026
−0.036
0.781+0.032
−0.045
0.267+0.018
−0.025
0.758+0.038
−0.052
0.249+0.024
−0.031
h
A
0.082+0.028
−0.033
0.951+0.014
−0.018
0.701+0.020
−0.026
0.827+0.045
−0.053
0.784+0.035
−0.049
0.276+0.023
−0.031
0.687+0.016
−0.024
0.846+0.037
−0.047
0.826+0.022
−0.035
0.299+0.019
−0.025
68
Tableau 5.3 The Cosmic Energy Inventory (beginning)d’après M. Fukugita et
P. J. E. Peebles, arXiv:astro-ph/0406095.
Content
Componentsa
dark sector
dark energy
dark matter
primeval gravitational waves
0.72 ± 0.03
0.23 ± 0.03
< 10−10
primeval thermal remnants
electromagnetic radiation
neutrinos
prestellar nuclear binding energy
10−4.3±0.0
10−2.9±0.1
−10−4.1±0.0
baryon rest mass
warm intergalactic plasma
intracluster plasma
main sequence stars (spheroids and bulges)
(disks and irregular)
white dwarfs
neutron stars
black holes
substellar objects
HI + HeI
molecular gas
planets
condensed matter
sequestered in massive black holes
0.040 ± 0.003
0.0018 ± 0.0007
0.0015 ± 0.0004
0.00055 ± 0.00014
0.00036 ± 0.00008
0.00005 ± 0.00002
0.00007 ± 0.00002
0.00014 ± 0.00007
0.00062 ± 0.00010
0.00016 ± 0.00006
10−6
10−5.6±0.3
10−5.4 (1 + ǫn )
primeval gravitational binding energy
virialized halos of galaxies
clusters
large-scale structure
binding energy from gravitational settling
baryon-dominated parts of galaxies
main sequence stars and substellar objects
white dwarfs
neutron stars
stellar mass black holes
galactic nuclei (early type)
(late type)
poststellar nuclear binding energy
main sequence stars and substellar objects
diffuse material in galaxies
white dwarfs
clusters
intergalactic
poststellar radiation
resolved radio-microwave
far infrared
optical
X-γ ray
gravitational radiation (stellar mass binaries)
(massive black holes)
a Based
on Hubble parameter h = 0.7.
Totalsa
0.954 ± 0.003
0.0010 ± 0.0005
0.045 ± 0.003
−10−6.1±0.1
−10−7.2
−10−6.9
−10−6.2
−10−4.9
−10−8.8±0.3
−10−8.1
−10−7.4
−10−5.2
−10−4.2 ǫs
−10−5.6 ǫn
−10−5.8 ǫn
−10−5.2
−10−5.8
−10−6.5
−10−5.6
−10−6.5
−10−6.2±0.5
10−5.7±0.1
10−10.3±0.3
10−6.1
10−5.8±0.2
10−7.9±0.2
10−9±1
10−7.5±0.5
Cosmologie
69
Tableau 5.4 The Cosmic Energy Inventory (end).
Componentsa
Content
Totalsa
10−5.5
stellar neutrinos
nuclear burning
white dwarf formation
core collapse
10−6.8
10−7.7
10−5.5
+0.6
−8.3−0.3
cosmic rays and magnetic fields
10
kinetic energy in the intergalactic medium
10−8.0±0.3
a Based
on Hubble parameter h = 0.7.
Tableau 5.5 Joint Data Set Constraints on Geometry and Vacuum Energy.
Data Set
ΩK
ΩΛ
WMAP + h = 0.72 ± 0.08
−0.003+0.013
−0.017
−0.037+0.021
−0.015
−0.0057+0.0061
−0.0088
−0.010+0.011
−0.015
−0.015+0.020
−0.016
−0.017+0.022
−0.017
0.758+0.035
−0.058
WMAP + SDSS
WMAP + 2dFGRS
WMAP + SDSS LRG
WMAP + SNLS
WMAP + SNGold
0.650+0.055
−0.048
0.739+0.026
−0.029
0.728+0.020
−0.028
0.719+0.021
−0.029
0.703+0.030
−0.038
Le rôle particulier de Λ
Revenons sur les solutions dans les cas simples et sur le succès de l’approche
newtonienne. A l’époque actuelle, la dynamique de l’Univers est dominée par la
matière froide, sans pression, et par la constante cosmologique. Les équations de
Friedmann et la loi de continuité prennent la forme générale
1 2
4
1
1
ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2
2
3
6
2
4
1
ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t),
3
3
a(t)
+ 3(ρ(t) + p(t)/c2 ) = 0.
ρ̇(t)
ȧ(t)
Nous avons vu que les valeurs admises des paramètres cosmologiques sont en
faveur d’un Univers plat k = 0 avec une constante cosmologique positive. Dans ce
cas, la première équation s’écrit encore
a30
2
2
+ ΩΛ (t0 ) .
H (t) = H0 ΩM 0 3
a (t)
a3
0
≫ ΩΛ0 dans l’Univers MDU soit
Aux instants t ≪ t0 , ΩM 0 a3 (t)
a(t)3 H(t)2 ≡ ȧ2 (t)a30 = H02 ΩM 0 a30
qui admet comme on l’a vu une solution de la forme
2/3
t
a(t) = a0
,
4/9t20 = H02 ΩM 0 .
t0
70
a3
0
En revanche aux temps t ≫ t0 , ΩM 0 a3 (t)
≪ ΩΛ0 , l’équation de Friedmann devient
H 2 (t) = H02 ΩΛ0
soit ȧ(t)/a(t) = H0
p
ΩΛ0 qui admet comme solution
a(t) = a0 exp H0
p
ΩΛ0 t.
Il est important de noter que le rôle de Λ est de produire tôt ou tard (dès que
la constante cosmologique l’emporte sur les formes ordinaires de gravitation) une
accélération de l’expansion de l’Univers. Le paramètre de décélération q doit donc
passer d’une valeur positive à une valeur négative et il est particulièrement singulier
de noter que ce changement dans notre Univers se produit précisément à notre
époque !
Etant donnée l’incertitude sur les valeurs des paramètres cosmologiques,
les ouvrages de cosmologie établissent en général une classification (appelée
Friedmanologie par Rich) des modèles d’Univers et de leur dynamique (modèles
plats (k = 0), modèles sans constante cosmologique (Λ = 0), modèles vides (ρ = 0),
etc). Nous nous limitons ici à un Univers plat avec constante cosmologique positive
et densité de matière sous-critique.
Cosmologie
71
6
Les “problèmes” cosmologiques
Il reste de nombreux problèmes et controverses en suspens en cosmologie
(notamment concenant le contenu de l’Univers - voir figure ci-dessous) et les
hypothèses pour y apporter des réponses sont parfois hardies. Nous évoquons dans
ce chapitre quelques-uns de ces problèmes.
72
Figure 6.1 Evolution du contenu de l’Univers dans le modèle ΛCDM (Hiranya
V. Peiris).
La matière sombre
La quantité de matière non relativiste compatible avec la dynamique de l’Univers
est de l’ordre de
ΩM ≃ 0.30.
Or on n’en observe qu’une infime partie sous forme d’étoiles ou de galaxies,
Ωvisible ≃ 0.003.
L’essentiel de la matière non relativiste est donc sombre (dark matter), mais reste à
être identifiée. La présence de matière sombre (c’est-à-dire non visible par des moyens
directs d’observation) dans les galaxies est attestée par les anomalies de courbes de
rotation des étoiles périphériques. En effet, les étoiles (brillantes) très périphériques
ont une vitesse essentiellement indépendante de leur distance au centre galactique.
Si l’essentiel de la masse d’une galaxie était concentré au voisinage de son centre,
on attendrait de la relation fondamentale de la dynamique v 2 (r)/r = GM (r)/r 2
qu’elle implique une loi de variation en inverse de la racine carrée de la distance
au centre, v(r) ≃ r −1/2 . Ce n’est pas du tout conforme à l’observation, et pour
rendre compatibles les observations avec la distribution de masse dans les galaxies,
on est amené à supposer l’existence de halos galactiques composés de matière sombre
distribuée suivant une loi empirique de la forme ρ(r) = const/(r 2 + r02 ).
Figure 6.2 Courbe de vitesse des étoiles périphériques.
Il reste encore à chercher (et à trouver) la matière dont ces halos sont constitués.
Parmi les candidats, les naines brunes sont des étoiles en fin de vie qui ont brulé leur
“carburant nucléaire” et sont donc à peine visibles dans le spectre électromagnétique.
Ces étoiles peuvent toutefois être mises en évidence de manière indirecte par les
Cosmologie
73
mirages gravitationnels qu’ils peuvent produire(50) . Une estimation réaliste de la
densité de matière associée à ces MACHOS (Massive Halo Compact Objects) reste
cependant très en-dessous de ce qui manque,
ΩMACHOS ≃ 0.04.
Finalement, il existe une autre façon d’estimer la quantité totale de matière non
relativiste dans l’Univers, à partir des modèles de nucléosynthèse primordiale (BBN
pour Bing Bang Nucleosynthesis) qui conduisent à des abondances relatives pour
les éléments légers paramétrés par la densité baryonique totale. Les abondances
observées sont compatibles avec
Ωbaryons ≃ 0.045.
Au total, on constate que la matière baryonique constitue à peine plus de 10%
de la matière froide qu’il semble nécessaire d’introduire dans l’Univers pour rendre
compte de sa dynamique à très grande échelle. Les physiciens, rarement à court
d’idées, ont alors émis l’hypothèse que d’autre particules, de nature non baryonique,
doivent peupler l’Univers en nombre. On les appelle des WIMPS (Weakly Interacting
Massice ParticleS), mais là encore; il reste à les trouver !
(50)
Si une étoile brune passe sur la ligne de visée depuis la Terre d’un rayon lumineux issu d’une
galaxie plus lointaine, elle est susceptible de courber la trajectoire suivie par les photons
74
Figure 6.3 Abondances relatives des éléments légers en fonction de la densité
baryonique de l’Univers.
Le “problème” de la constante cosmoλogique ou de l’énergie sombre
On s’intéresse à nouveau dans cette section à l’histoire de la constante
cosmologique,(51) évoquée précédemment. On pose tout d’abord les éléments factuels,
puis on donne les estimations quantitatives d’un désaccord maintenant célèbre (52) .
Rappelons qu’Einstein a modifié les équations de la gravitation relativiste,
Gµν =
8πG
T ,
c4 µν
par l’introduction au premier membre d’un terme −Λgµν qui respecte la covariance
relativiste(53) et compense l’effet de gravitation (si Λ > 0) permettant ainsi de
trouver des solutions pour un Univers statique à condition de fixer pour Λ une
valeur bien précise dépendant de la densité de l’Univers. La constante cosmologique
est homogène à l’inverse d’une longueur au carré et fixe une échelle universelle de
longueurs : la courbure d’un Univers vide de matière (la solution de de Sitter).
Rapidement, Friedmann puis Lemaı̂tre établiront que l’Univers statique d’Einstein
est instable. Au contraire, les équations d’Einstein admettent (avec ou sans Λ) des
solutions dynamiques pour un Univers en expansion ou en contraction. L’observation
de l’expansion (à partir du décalage systématique vers le rouge des galaxies éloignées)
par Slipher et Hubble fera dire à Einstein que la constante cosmologique est inutile.
Après Einstein, de nombreux physiciens théoriciens adopteront la même attitude
à l’égard de la constante cosmologique et s’en désintéresseront. Les astronomes
et cosmologistes seront en revanche attachés à l’existence du terme cosmologique,
notamment Eddigton, car sans sa présence les modèles conduisent à un Univers
trop jeune, plus jeune même que la Terre, et seule l’introduction du paramètre
supplémentaire Λ peut “vieillir” suffisamment l’Univers.
Récemment (1997) des mesures effectuées sur des supernovae lointaines
(supernova cosmology project) ont montré sans doute possible que l’expansion
de l’Univers s’accélère. Pour rendre compte d’une telle expansion accélérée, il est
indispensable d’avoir recours à la constante cosmologique, ce qui a suscité un regain
d’intérêt pour ce Λ, sa détermination expérimentale et son interprétation théorique.
Le terme cosmologique −Λgµν peut être rejeté au second membre sous la forme
+Λgµν =
8πG
2
c4 ρΛ c gµν
Gµν =
avec ρΛ =
Λc2
8πG
pour donner aux équations d’Einstein la forme
8πG
(Tµν + ρΛ c2 gµν ).
c4
Nous sommes en mesure d’estimer facilement une borne supérieure de ρΛ en notant
que la gravitation newtonienne est une très bonne approximation à l’échelle du
système solaire. Comme les effets de la constante cosmologique sont susceptibles de
(51)
S. Weinberg, The cosmological constant problem, Rev. Mod. Phys. 61, 1 (1989), P.J.E.
Peebles and B. Ratra, The cosmological constant and dark energy, Rev. Mod. Phys. 75, 559
(2003), N. Straumann, On the cosmological constant problems and the astronomical evidence for
a homogeneous energy density with negative pressure, astro-ph/0203330.
(52)
Je conseille également le site http://super.colorado.edi/~michaele/Lambda pour une très
agréable présentation des problèmes suscités par la constante cosmologique.
(53)
A l’origine, Einstein a utilisé la notation λ.
Cosmologie
75
se faire sentir aux grandes distances, on aura une valeur maximale en écrivant que
l’effet de ρΛ est négligeable devant celui de l’attraction gravitationnelle du Soleil
à l’échelle de Pluton par exemple. Le champ de gravitation exercé par le Soleil
au niveau de l’orbite de Pluton, rP = 5.9 · 1012 m, vaut G⊙ (rP ) = GM⊙ /rP2 . Celui
qu’exercerait une masse volumique uniforme ρΛ à cette même distance s’exprime par
GΛ (rP ) = GMΛ (rP )/rP2 = 4πρΛ GrP /3. En écrivant que cette seconde contribution
est négligeable devant la première, on obtient la borne supérieure suivante à la
densité de masse associée à la constante cosmologique,
ρΛ ≪
3M⊙
.
4πrP3
En introduisant les valeurs numériques on trouve(54)
ρΛ ≪ 2.3 · 10−9 kg.m−3 = 6.56 · 10−27 f −4 .
Des estimations beaucoup plus strictes se déduisent d’observations astronomiques
au-delà du simple système solaire et on admet une valeur de l’ordre de
ρΛ ≪ 10−26 kg.m−3 = 2.9 · 10−44 f −4 .
Revenons aux équations d’Einstein en présence du terme cosmologique. Le
dernier terme ρΛ c2 gµν est exactement la forme que prendrait le tenseur énergieimpulsion Tµν d’un fluide au repos(55) de pression pΛ = −ρΛ c2 . Il se trouve que
cette équation d’état est précisément celle que l’on attend de la densité (d’énergie)
associée au vide quantique(56) . En effet, si l’on exige que le vide quantique
(54)
Digression sur les unités “naturelles” (R.J. Adler, B. Casey and O.C. Jacob, Vacuum
catastrophe: an elementary exposition of the cosmological constant problem, Am. J. Phys. 63,
620 (1995)). On utilise fréquemment en physique des particules les unités naturelles dans lesquelles
les constantes c et h̄ valent toutes les deux 1. Cela permet en outre de n’avoir plus qu’une seule
unité fondamentale au lieu des trois dimensions usuelles M, L et T. Choisissons par exemple la
longueur comme dimension fondamentale et le fermi (1 f = 10−15 m) comme unique unité. On
peut alors introduire comme unité de temps le “jiffy” (j), durée que met la lumière pour parcourir
1 f (Notons qu’historiquement, le jiffy a été introduit par le chimiste Lewis qui avait déjà forgé
le terme de photon. C’était une unité de temps fantaisiste associée à la durée nécessaire à la
lumière pour parcourir 1 cm.). On a alors c = 1f.j−1 soit encore 1 j = 10−15 /3.108 s. Si l’on
pose maintenant c = 1 (sans dimension), alors les longueurs se mesurent en f, mais également les
durées car il faut que 1 j = 1 f pour que c soit adimensionnée. Considérons maintenant le cas
de h̄. Plutôt que les J.s, on peut choisir d’exprimer les durées en j (temporairement avant de les
éliminer de nouveau au profit des f) et les énergies en MeV, bien plus adaptés à l’échelle de la
physique subatomique. On a donc h̄ = 1.053 · 10−34 J.s = 1.053 × 3 · 10−11 J.j = 197 MeV.j. On
peut fixer une nouvelle unité d’énergie, le “blip” (b), telle que 1 b = 197 MeV. On a h̄ = 1 b.j.
Si l’on impose maintenant que h̄ = 1 (sans dimension), cela nécessite que 1 b = 1 j−1 = 1 f −1 .
On n’a plus que le fermi comme unité fondamentale. Les fréquences (E/h̄) se mesurent comme
les énergies en f−1 , les masses (E/c2 ) également, . . . . Les conversions utiles sont 1 m = 1015 f,
1 s = 3.1023 f, 1 J = 3.17 · 1010 f −1 . Pour exprimer une densité par exemple, on procède comme suit,
1 J = 1 kg.m2 s−2 = 3.17 · 1010 f −1 , soit 1 kg = 3.17 · 1010 × 10−30 × 9 · 1046 f −1 = 28.5 · 1026 f −1 .
On a ensuite 1 kg.m−3 = 28.5 · 1026 × 10−45 f −4 = 28.5 · 10−19 f −4 .
(55)
Rappelons que pour un fluide Tµν = (ρ + p/c2 )vµ vν − pgµν .
(56)
En mécanique quantique, les inégalités d’Heisenberg interdisent à tout système physique,
particule ou de manière générale degré de liberté quelconque, d’être au repos. Il s’ensuit que même
dans l’état de plus basse énergie subsiste une énergie résiduelle appelée énergie de point zéro. On
parle des fluctuations du vide quantique et pour des raisons fondamentales (invariance de Lorentz),
la densité d’énergie associée correspond à une équation d’état p = −ρc2 .
76
satisfasse aux contraintes relativistes, le tenseur énergie-impulsion associé, Tµν =
(ρ+p/c2 )vµ vν −pgµν , doit être covariant par transformation de Lorentz. Notamment
en considérant le référentiel tangent au référentiel propre du vide (vµ = (c, ~0)) dans
lequel la métrique est minkowskienne, gµν = ηµν = diag (1, −1, −1, −1), on a
Tµν

1
0
2
= (ρc + p)  0
0
0
0
0
0


1
0
0 − p0
0
0
0
0
0
0
0
0
0
−1
0
0
0
0
−1
0
 
0
ρc2
0 = 0
0   0
−1
0
0
p
0
0

0 0
0 0
p 0
0 p
soit finalemant
Tµν = ρc2 ηµν ,
si p = −ρc2 .
Cette équation d’état assure que le vide est invariant de Lorentz. Cette particularité
fait du vide quantique un concept très différent de la matière ordinaire ou du
rayonnement. Dans les autres domaines de la physique où seules les différences
d’énergie interviennent, l’énergie du vide n’a pas d’effet direct mais la situation est
très différente lorsque la gravitation intervient, puisque toutes les formes d’énergie
contribuent à la structure de l’espace-temps par le biais du tenseur énergie-impulsion
dans les équations d’Einstein. Cette observation très encourageante, formulée pour
la première fois par Pauli (57) , donne l’espoir de relier la constante cosmologique
(et les échelles de longueur de l’ordre de 1023 m) aux interactions fondamentales
qui régissent la physique des particules (et des échelles de l’ordre de 10−15 m). La
constante cosmologique trouverait ainsi une interprétation.
L’illusion est de courte durée, car la valeur estimée de la contribution de la
densité d’énergie du vide est 10120 fois plus importante que l’estimation associée à
la constante cosmologique mesurée par observations astronomiques. Pour la densité
d’énergie du vide quantique, on peut fournir une borne inférieure en précisant que la
théorie quantique des champs est vérifiée jusqu’à des échelles d’énergie de l’ordre
de 1014 GeV, puisque l’on mesure de telles énergies pour des photons issus du
rayonnement cosmique. Le vide possède donc une énergie 12 h̄ω par degré de liberté
(oscillateurs harmoniques) et l’on doit sommer sur ces oscillateurs pour obtenir
Evide =
X1
k
2
h̄ωk ,
où les ωk sont tels que h̄2 ωk2 = h̄2 k 2 c2 + m2 c4 , soit en unités naturelles ωk2 = k 2 + m2 .
Dans la limite des très hautes énergies (limite ultrarelativiste) on peut négliger la
masse. En considérant le vide établi dans une boı̂te cubique de taille L3 , la somme
sur les modes peut se calculer par une intégrale
X
k
(57)
L3
→
(2π)3
Z
kmax
4πk 2 dk
0
Voir l’article de N. Straumann, arXiv:0810.2213 ou celui de Bernardeau et Uzan dans les Images
de la Physique 2008.
Cosmologie
77
où le préfacteur tient compte de la quantification des valeurs permises pour k pour
garantir des conditions aux limites périodiques. On a alors
Evide =
X1
k
2
ωk =
Z
L3
(2π)3
kmax
0
Z
kmax
≃
L3
4π 2
=
k4
L3 max2 .
16π
1
4πk 2 dk (k 2 + m2 )1/2
2
k 3 dk
0
La coupure à 1014 GeV correspond à 5.1014 f −1 , soit une densité d’énergie associée au
vide de
Evide
> 4.2 × 1056 f −4 .
L→∞ L3
ρvide = lim
Cette valeur est évidemment sans aucun rapport avec celle de ρΛ . De nombreux
physiciens pensent même que le paramètre de coupure pertinent jusqu’où appliquer
les théories quantiques des champs est plutôt l’énergie de Planck de l’ordre de
1019 GeV, ce qui donne à la densité d’énergie de vide une borne inférieure encore
plus dramatique,
ρvide > 1076 f −4 !
Ce désaccord est la plus grande contradiction connue en physique et probablement dans toutes les sciences. Pour tenter de lever la difficulté, de nombreuses
hypothèses - répondant aux jolis noms de “supersymétrie”, “quintessence” - ont été
avancées, sans succès jusqu’à présent. Les théories de supersymétrie par exemple
élimineraient la difficulté d’un vide possédant une énergie considérable, car par un
mécanisme de compensation entre les fermions et les bosons en nombre identique
dans le cadre supersymétrique, l’énergie du vide est rigoureusement nulle. De nombreux théoriciens estiment très prometteuse cette voie à tel point qu’on en revient à
l’idée d’une constante cosmologique nulle ! A la question : How can the cosmological
constant be so close to zero but not zero?, Edward Witten (58) répond par exemple :
I really don’t know. It’s very perplexing that astronomical observations seem to show
that there is a cosmological constant. It’s definitely the most troublesome, for my
interests, definitely the most troublesome observation in physics in my lifetime. In
my career that is.
Le problème de la platitude
A l’aide de la paramétrisation en Ω, on a vu qu’il était possible d’écrire l’équation
de Friedmann (de “conservation” de l’énergie) comme une contrainte à tout instant
sur les diverses contributions rapportées aux valeurs critiques,
ΩM + ΩR + ΩΛ − 1 =
(58)
k
a2 H 2
.
Edward Witten est l’un des physiciens théoriciens les plus en vogue, récompensé par les
mathématiciens déjà avec la médaille Fields.
78
2
Cela découle en effet de la forme H 2 = 38 πG(ρ + ρΛ ) − kc
a2 dans laquelle ρ
représente les formes ordinaires de matière et de rayonnement et où l’on pose une
3kc2
contribution de courbure ρk = − 8πGa
2 . A chaque densité ρ est associé un rapport
8πGρ
Ω = 3H 2 d’où l’équation proposée. Or, on observe qu’actuellement la valeur de
ΩM (t0 ) + ΩR (t0 ) + ΩΛ (t0 ) ≃ 1 de sorte que le premier membre ΩM + ΩR + ΩΛ − 1
est essentiellement égal à zéro à l’époque actuelle. Au second membre a2 H 2 = ȧ2 ∼
t2(α−1) se comporte comme t−2/3 pour un univers MDU et comme t−1 dans le cas
RDU. Dans les deux cas, cela signifie que |Ω(t) − 1| ∼ |k|t2(1−α) est une fonction
croissante du temps (linéaire ou en t2/3 ) qui prend une valeur très proche de zéro
aujourd’hui, il faut donc qu’elle ait pris une valeur extraordinairement proche de
zéro dans le passé. Par exemple au moment de la nucléosynthèse promordiale ou
dans les tout débuts de l’Univers à l’échelle du temps de Planck, il faut avoir connu
des valeurs telles que
Ω(tNS ) = 1 ± 10−15
Ω(tPl ) = 1 ± 10−60
pour conduire aux valeurs observées aujourd’hui. Ces valeurs, bien que non
impossibles formellement présentent un problème sérieux (dit de fine tuning),
car tout écart infime (par exemple à la quatorzième décimale) aurait comme
conséquence qu’à l’époque présente l’univers serait totalement différent de celui que
nous observons. Reformulé différemment, pour que l’univers actuel soit plat comme
on l’observe actuellement, il faut qu’il ait été plat dans le passé avec un degré de
précision inexpliquable. Ce problème de condition initiale très particulière, s’il n’est
pas rédhibitoire en soi, doit pouvoir être expliqué par une modèle cosmologique
consistent.
Le problème de l’horizon
Le problème de l’horizon est d’une nature assez voisine, puisqu’il s’agit également
d’un problème de conditions initiales ad hoc. Lorsque l’on observe le fond diffus
de rayonnement cosmologique, il apparait d’une remarquable isotropie (une fois
effectuées les corrections Doppler dues aux mouvements locaux de la Terre). Or,
si l’on considère le cône de lumière passé d’un point situé ici et maintenant, et son
extension au moment où a été émis le fond de rayonnement cosmologique (on parle
de la surface de dernière diffusion), celle-ci est beaucoup plus étendue que la région
causale à la même époque. Cela soulève alors le problème de comprendre pourquoi
le fond de rayonnement cosmologique est si homogène, puisque deux régions du ciel
(typiquement distantes de plus de 1 ou 2 degrés) ne peuvent jamais avoir été en
contact causal et donc ne peuvent pas être en équilibre thermique.
Pour préciser quelques chiffres, la distance comobile parcourue par la lumière
2
(ds = c2 dt2 − a2 dσ 2 = 0 pour un univers plat) entre l’époque de l’émission du
CMB, tCMB et l’époque présente, t0 , est donnée par
σ0 = c
Z
t0
tCMB
dt
a(t)
et la distance propre correspondante à tCMB (σ est analogue à un angle) vaut
d0 = a(tCMB )σ0 .
Cosmologie
79
Entre tCMB et t0 , on peut considérer que l’Univers est dominé par la matière,
a(t) ∼ t2/3 , de sorte qu’en écrivant a(t) = a(tCMB )(t/tCMB )2/3 il vient
Z t0
dt
1
1
(tCMB )2/3
(tCMB )2/3 [3t1/3 ]tt0CMB
σ0 = c
=
2/3
a(tCMB )
a(t
)
t
tCMB
CMB
et la distance propre vaut
1/3
d0 ≃ 3c(tCMB )2/3 t0 .
En utilisant les valeurs numériques tCMB ≃ 3.105 ans, t0 ≃ 13.7 109 ans et 1 pc=3.26 al,
il vient d0 ≃ 32 Mal = 9.9 Mpc. C’est la taille de la zone qui à l’époque du CMB a
produit la totalité de l’Univers actuellement observable.
En revanche, la taille de l’horizon causal à tCMB est dominée par la dynamique
antérieure à cette époque, soit par l’Univers dominé par le rayonnement, a(t) ∼ t1/2 .
On en déduit
Z tCMB
1
1
dt
1/2
σh = c
=
(tCMB )
(t
)1/2 [2t1/2 ]t0CMB
1/2
a(tCMB )
a(tCMB ) CMB
t
0
pour une distance propore associée valant
dh = a(tCMB )σh = 2ctCMB .
Cela donne une valeur numérique de dh = 6 Mal = 1.8 Mpc. Cette dernière valeur
correspond à la zone causale d’extension maximale à l’époque de l’émission du CMB.
En d’autres termes, il est impossible d’expliquer que des points au-delà de cette
distance puissent être à la même température, sauf à invoquer des conditions initiales
telles qu’il en soit fortuitement ? ainsi.
80
Figure 6.4 Le problème de l’horizon. Les valeurs numériques ne correspondent
pas à celles du texte, mais elles sont du même ordre.
Autres difficultés
Il existe encore un certain nombre d’autres difficultés assez célèbres.
Le problème des grandes structures, voisin du problème de l’horizon, réside dans
l’interprétation des grandes structures observées (amas ou super-amas de galaxies)
comme prenant leur origine dans les inhomogénéités du fonds de rayonnement
cosmologique. Encore une fois, pour expliquer l’extension des grandes structures
aujourd’hui, ces inhomogénéités doivent avoir été bien plus grandes que les régions
causales !
Le problème des reliques est de nature différente. Il s’agit des particules massives
et défauts topologiques (monopôles notamment) prédits par les théories de grande
unification des interactions fondamentales avec des densités telles que l’on devrait
en observer à l’époque actuelle, ce qui n’est pas le cas. La difficulté consiste ici à
comprendre pourquoi l’expansion a dilué davantage l’Univers que ce que suppose le
modèle comsologique standard.
Le problème des coı̈ncidences enfin interroge le fait que les valeurs de ΩM et ΩΛ
soient très voisines aujourd’hui, faisant de notre époque un moment très particulier
où l’Univers est en train de passer d’une phase d’expansion ralentie à une phase
d’expansion accélérée, sans que l’on sache si une raison profonde explique cette
coı̈ncidence. Dicke a élaboré de principe anthropique, stipulant qu’il doit en être
ainsi pour que l’Univers connaisse des conditions propices au développement de la
vie.
Cosmologie
81
Parenthèse
On reproduit ci-joint un article de vulgarisation présentant un état des lieux sur la
constante comsologique.
82
Cosmologie
83
84
Cosmologie
85
86
Cosmologie
87
88
Cosmologie
89
90
Cosmologie
91
92
Cosmologie
93
94
Cosmologie
Théories des champs
95
96
97
7
Théories quantiques relativistes
Note : dans ce chapitre on réserve la notation ϕ ou χ pour un champ scalaire
complexe et ψ pour un ensemble de plusieurs champs scalaires complexes réunis en
un vecteur (spineur). On notera avec une flèche un vecteur dans l’espace ordinaire
et on utilisera les caractères gras pour représenter des matrices agissant dans
~ et
l’espace “interne” des composantes du spineur. Par exemple p~ϕ = −ih̄∇ϕ
~
~pψ = p~ 1lψ = −ih̄∇1lψ.
Equation de Schrödinger
⊲ Equation de Schrödinger. Guidés par la “dualité ondes-particules”,
ancienne appelation donnée à une série de concepts dus entre autres à de Broglie (59)
et résumés dans les relations
E = hν = h̄ω,
p~ =
h
~u = h̄~k,
λ k
nous cherchons une formulation ondulatoire de la mécanique.
p
~2
Le cas le plus simple est celui de la particule libre, d’énergie H = 2m
, que
i(~
k~
r−ωt)
l’on peut logiquement représenter par une onde plane u~k (~r, t) = A~k e
dans
la mesure où une telle onde est totalement délocalisée et donc a priori à même de
(59)
L. de Broglie, La longueur d’onde associée à la matière, CRAS 177, 507-510 (1923), reproduit
dans J. Leite-Lopes et B. Escoubès, Sources et Evolutions de la Physique Quantique, Masson, Paris
1995, p.92.
98
représenter une particule qui a une égale probabilité de se trouver en tout point
de l’espace. A quelle équation obéit l’onde plane ? On pourrait bien entendu écrire
2
~ 2 u~ − 12 ∂ u2~k = 0 (soit ω = v|~k|), mais on cherche ici une
l’équation des ondes, ∇
v ∂t
k
équation du premier ordre en dérivée temporelle pour satisfaire au déterminisme.
Utilisant les correspondances rappelées ci-dessus, on écrit plutôt
p
~
E
u~k (~r, t) = A~k ei( h̄ ~r− h̄ t)
d’où on extrait E en faisant
Eu~k (~r, t) = ih̄
∂
u~ (~r, t)
∂t k
et p~ de même
~ ~ (~r, t).
p~u~k (~r, t) = −ih̄∇u
k
L’équation E = p~2 /2m devient alors
ih̄
h̄2 ~ 2
∂
u~k (~r, t) = −
∇ u~k (~r, t).
∂t
2m
Pour une particule soumise à un potentiel V (~r), on généralise pour obtenir l’équation
de Schrödinger pour la fonction d’onde ϕ(~r, t),
∂
ih̄ ϕ(~r, t) =
∂t
h̄2 ~ 2
−
∇ + V (~r) ϕ(~r, t).
2m
(7.1)
Nous ne discuterons pas davantage ici les conséquences de cette équation qui
constitue l’approche non relativiste traditionnelle de la mécanique quantique.
Retenons simplement que la physique est décrite par une fonction d’onde ϕ(~r, t)
dont l’équation de Schrödinger régit la dynamique et que cette fonction d’onde obéit
à une équation de continuité,
∂
ρ(~r, t) + div ~j(~r, t) = 0
∂t
où les densités de probabilité de présence et de courant de probabilité sont définies
par
ρ(~r, t) = ϕ∗ (~r, t)ϕ(~r, t),
~ r , t) − ϕ(~r, t)∇ϕ
~ ∗ (~r, t)).
~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~
2mi
⊲ Lagrangien de Schrödinger. En théorie des champs, on définit le lagrangien
L à partir d’une densité lagrangienne
Z
~ d3 r
L(ϕ, ϕ̇, ∇ϕ)
L=
3
IR
99
où ϕ(~r, t) est un champ qui varie dans l’espace et le temps. L’intégration porte
sur l’espace IR3 ou sur une partie de cet espace dont la frontière est notée ∂IR3 .
~ de la densité lagrangienne reflète l’existence d’interactions à
La dépendance en ∇ϕ
courte portée. La minimisation de l’action
Z
Z t2 Z
~ d3 r dt
~ d3 r ≡
L(ϕ, ϕ̇, ∇ϕ)
S=
dt 3 L(ϕ, ϕ̇, ∇ϕ)
Ω
IR
t1
conduit aux équations d’Euler-Lagrange si l’on a imposé des conditions assez douces
aux variations de ϕ aux limites ∂IR3 de IR3 . On effectue en effet la variation
"
!#
Z t2 Z
∂L
∂L
∂L
∂
~
−∇
δS = 0 =
dt 3 d3 r
−
δϕ
~
∂ϕ
∂t
∂
ϕ̇
∂(∇ϕ)
IR
t1
t2 Z t2 I
Z
3 ∂L
~ ∂L δϕ
δϕ
dS
+
dt
+
d r
3
3
~
∂ ϕ̇
∂(∇ϕ)
∂ IR
t1
IR
t1
et en supposant que les termes de bords sont tous nuls, il vient
!
∂ ∂L
∂L
∂L
~
−
= 0.
−∇
~
∂ϕ ∂t ∂ ϕ̇
∂(∇ϕ)
Dans le cas de l’équation de Schrödinger, la densité lagrangienne associée fait
intervenir un champ scalaire complexe. Cette densité (due à Jordan et Wigner) est
donnée par
2
~ ∇ϕ
~ ⋆ ) = ih̄ϕ⋆ ϕ̇ − h̄ (∇ϕ
~ ⋆ ) · (∇ϕ)
~
L(ϕ, ϕ⋆ , ϕ̇, ϕ̇⋆ , ∇ϕ,
− V (~r, t)ϕ⋆ ϕ.
2m
On note encore les termes en gradients sous la forme
LSchr. = ih̄ϕ⋆ ϕ̇ −
1
(~
pϕ)⋆ (~
pϕ) − V (~r, t)ϕ⋆ ϕ.
2m
Les champs ϕ et ϕ⋆ sont fonction de l’espace et du temps, ϕ = ϕ(~r, t). Par application
des équations d’Euler-Lagrange à ϕ, on obtient
− ih̄ϕ̇⋆ = −
h̄2 ~ 2 ⋆
∇ ϕ + V (~r, t)ϕ⋆
2m
et par application à ϕ⋆ ,
ih̄ϕ̇ = −
h̄2 ~ 2
∇ ϕ + V (~r, t)ϕ,
2m
c’est-à-dire l’équation de Schrödinger et sa conjuguée. Le moment canonique est
donné par
π=
∂L
= ih̄ϕ⋆
∂ ϕ̇
100
et la densité hamiltonienne
H = π ϕ̇ − L =
i
−ih̄ ~
~
(∇π) · (∇ϕ)
− V (~r, t)πϕ.
2m
h̄
L’hamiltonien (classique) total vaut
Z 2
h̄ ~ ⋆
⋆
~
(∇ϕ ) · (∇ϕ)
+ V (~r, t)ϕ ϕ d3 r.
H=
2m
Par intégration par parties du premier terme on obtient la forme habituelle
Z
h̄2 ~ 2
⋆
H= ϕ −
∇ + V (~r, t) ϕ d3 r = hϕ|Ĥ|ϕi.
2m
On retrouve ainsi l’élément de matrice de l’Hamiltonien de Schrödinger dans l’état
|ϕi, résultat finalement très naturel.
Equation de Pauli
⊲ Introduction du spin et des spineurs de Pauli. L’étude de systèmes sous
champ magnétique a mis en évidence de nouvelles particularités de la mécanique
quantique. Outre la correspondance classique (qu’on appelle couplage minimal)
~ r , t) sous un champ
qui fait passer de H à H − qφ(~r, t) et de ~p à p~ − qA(~
~
électromagnétique (A(~r, t), φ(~r, t)), Pauli a proposé d’introduire un degré de liberté
interne supplémentaire, appelé le spin, ayant dans le cas de l’électron des propriétés
analogues à celles d’un moment cinétique 21 . La fonction d’onde ϕ(~r, t) est remplacée
par un spineur (60) , objet à deux composantes (spineur de Pauli)
ϕ↑ (~r, t)
ψ = ϕ (~r, t)
↓
pour décrire les degrés de liberté de spin en plus des degrés de liberté d’espace. On
obtient alors l’équation de Pauli, incluant le couplage de la charge et du spin au
champ magnétique (termes paramagnétique et de Zeeman),
qh̄ ~
1
∂
2
~
~
~ B(~r, t)ψ.
σ
(−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) ψ −
ih̄ ψ =
∂t
2m
2m
~ . Dans cette
Le spin est introduit au moyen du vecteur des matrices de Pauli, σ
expression, on omet la matrice identité à deux dimensions agissant dans l’espace
des composantes du spineur lorsque cela semble non ambigu. On devrait écrire en
∂
~ − qA(~
~ r , t))2 1lψ pour insister sur
toute rigueur des termes comme ih̄ ∂t
1lψ ou (−ih̄∇
le caractère matriciel de l’équation. Sous forme développée on écrit,
ϕ↑ (~r, t)
1
∂ ϕ↑ (~r, t)
2
~
~
(−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) 1l ϕ (~r, t)
=
ih̄
∂t ϕ↓ (~r, t)
2m
↓
(7.2)
ϕ↑ (~r, t)
qh̄ ~
~ B(~r, t)
−
σ
ϕ↓ (~r, t) ,
2m
(60)
Nous ne nous attarderons pas sur la définition précise d’un spineur, qui obéit à des règles de
transformation particulières.
101
~ r, t) = σ B + σ B + σ B , avec les matrices de Pauli
~ B(~
où σ
x x
y y
z z
1 0
0 −i
0 1
[σx ] = 1 0 , [σy ] = i 0 , [σz ] = 0 −1 .
Les matrices de Pauli obéissent à l’algèbre de Lie [σi , σj ] = 2iεijk σk ou encore
σi σj = δij 1l + iεijk σk .
La quantité ~s = 12 h̄~
σ est appelée spin. Dans le cas de l’électron, on a q = −|qe |
dans l’équation de Pauli. Le moment magnétique associé au spin de l’électron vaut
q
e |h̄
~ s = g 2m
~s = − |q2m
~ (le facteur de Landé de l’lectron g = 2) de sorte que le terme
µ
σ
~ = |qe |h̄ σ
~ Les matrices de Pauli forment
~ B.
Zeeman prend la forme indiquée −~
µs B
2m
avec l’identité une base pour la représentation des matrices 2 × 2, car
a b = 1 (a + d)1l + 1 (a − d)σ + 1 (b + c)σ + 1 i(b − c)σ .
z
x
y
c d
2
2
2
2
Pour écrire l’équation de Pauli en termes de composantes, on développe (en
omettant l’identité, en utilisant pi = −ih̄∂i et avec la convention de sommation sur
les indices répétés (avec une métrique euclidienne))
~ 2 ψ = (p − qA )(p − qA )ψ
(~
p − qA)
i
i
i
i
= pi pi ψ − q(Ai pi ψ + pi Ai ψ) + q2 Ai Ai ψ
= −h̄2 ∂i ∂i ψ + ih̄q(2Ai (∂i ψ) + (∂i Ai )ψ) + q2 Ai Ai ψ
d’où l’équation complète
ih̄∂t ψ = −
h̄2
ih̄q
q2
qh̄
∂i ∂i ψ +
(2Ai (∂i ψ) + (∂i Ai )ψ) +
Ai Ai ψ − qφψ −
σ B ψ.
2m
2m
2m
2m i i
On peut retrouver cette équation par des arguments très simples. Bien entendu,
tout comme l’équation de Schrödinger, cette équation n’est pas relativiste (61) , mais
elle fait apparaı̂tre la nécessité, pour inclure le spin dans la théorie, de chercher
une équation agissant sur des objets à plusieurs composantes. Une fonction scalaire
complexe n’admet pas de structure interne suffisamment riche pour décrire le spin (62)
. Considérons donc que l’on cherche l’hamiltonien d’une particule libre non relativiste
de spin 12 , sachant que l’on doit pour cela enrichir la structure interne de la fonction
d’onde à des “doublets” complexes. Observant que les matrices de Pauli satisfont à
la propriété (63)
~
(~
σ · ~a)(~
σ · ~b) = ~a · ~b 1l + i(~a × ~b) · σ
(61)
On a l’habitude de considérer que le spin est une conséquence de l’aspect relativiste de la
théorie car l’équation de Pauli apparaı̂t comme limite non relativiste de l’équation de Dirac. Il
n’est cependant pas nécessaire d’avoir un cadre relativiste pour introduire le spin.
(62)
Notons que le caractère complexe de la fonction d’onde est lié à la charge électrique comme on
le verra plus tard avec l’application du théorème de Noether.
(63)
Pour le montrer, on utilise la notation en composantes, (σi ai )(σj bj ) = ai bj (δij + iεijk σk ) =
ai bi + iεkij ai bj σk .
102
soit en particulier
(~
σ · p~)2 = (~
σ · p~)(~
σ · p~) = p2 1l2×2 ,
on généralise
H=
(~
σ · p~)2
p2
−→ H =
.
2m
2m
En présence d’un champ magnétique, la substitution du couplage minimal donne
~ 2
(~
σ · (~
p − qA))
2m
~ 2
1
(~
p − qA)
~ × (~
~ ·σ
~
1l + i
(~
p − qA)
p − qA)
=
2m
2m
~ 2
qh̄
(~
p − qA)
~
~ ·B
σ
1l −
=
2m
2m
H=
c’est-à-dire l’hamiltonien de Pauli, avec l’apparition automatique du terme de
~
~ = −q(~
~
~ pψ) = ih̄q(∇×
~ A)ψ)
~
Zeeman (on a utilisé (64) (~
p −qA)×(~
p −qA)ψ
p ×(Aψ)+
A×~
et notamment le facteur de Landé valant g = 2.
⊲ Lagrangien de Pauli. Comme pour l’équation de Schrödinger, on peut
construire une densité lagrangienne à partir de laquelle les équations d’EulerLagrange conduisent à l’équation de Pauli. En nous guidant sur l’expression de
Jordan et Wigner dans le cas d’un champ scalaire complexe, on généralise au cas de
spineurs de Pauli sous la forme
LPauli = ih̄ψ † ψ̇ −
1
†
~
~
(~
σ · (~
p − qA)ψ)
(~
σ · (~
p − qA)ψ)
− qφ(~r, t)ψ † ψ.
2m
Il apparaı̂t les termes
(65)
σi (pi − qAi )ψ † σj (pj − qAj )ψ = (δij + iεijk σk )(pi ψ † − qAi ψ † )(pj ψ − qAj ψ)
= (−ih̄∂i ψ † − qAi ψ † )(−ih̄∂i ψ − qAi ψ)
+ iεkij σk [(−ih̄)2 ∂i ψ † ∂j ψ
+ ih̄q(Ai ψ † ∂j ψ + (∂i ψ † )Aj ψ) + q2 Ai ψ † Aj ψ]
Dans le dernier crochet, le premier et le dernier terme sont nuls après contraction
avec le tenseur totalement antisymétrique. Finalement, il vient les trois dérivées
(64)
~ × (~
~ → εijk (pj − qAj )(pk − qAk )ψ =
On développe en composantes : (~
p − q A)
p − q A)
−qεijk (pj Ak ψ + Aj pk ψ) = ih̄qεijk ((∂j Ak )ψ + Ak ∂j ψ + Aj ∂k ψ) = ih̄qεijk (∂j Ak )ψ.
(65)
En toute rigueur on devrait noter ψ † σi (pi − qAi ) (le dagger ne porte que sur ψ) plutôt que
σi (pi − qAi )ψ † , mais la notation présente (et courante) est compéhensible.
103
partielles
1
∂L
= ih̄∂t ψ − qφ(~r, t)ψ −
qA (ih̄∂i ψ + qAi ψ − h̄qεijk σk ∂j ψ),
†
∂ψ
2m i
∂t
∂L
= 0,
∂ ψ̇ †
∂i
1
∂L
=−
[(ih̄)2 ∂i ∂i ψ + ih̄q(Ai ∂i ψ + (∂i Ai )ψ) − h̄qεijk σk ((∂i Aj )ψ + Aj ∂i ψ)].
†
∂(∂i ψ )
2m
En regroupant tous les termes, on obtient bien l’équation de Pauli sous sa forme
développée, avec notamment l’énergie Zeeman issue des termes
−
h̄q
h̄q
εkij σk ∂i Aj = −
σ B .
2m
2m k k
Equation de Klein-Gordon
⊲ Etablissement de l’équation de Klein-Gordon. Une généralisation
immédiate de l’équation de Schrödinger a été proposée très rapidement après
l’équation de Schrödinger elle-même (en 1926), indépendamment par Gordon,
Fock (66) , Klein, Kudar, de Donder et Van Dungen (67) . Schrödinger lui-même
avait obtenu cette équation avant de considérer le cas non relativiste, davantage
conforme aux résultats expérimentaux sur le spectre de l’atome d’hydrogène.
Il suffit d’effectuer les correspondances
∂
∂t
~
p~ → −ih̄∇
E → ih̄
dans l’expression relativiste donnant l’énergie cinétique (au terme mc2 près),
E 2 − |~
p|2 c2 = m2 c4
pour obtenir l’équation de Klein-Gordon de la particule libre,
2 2
2
~ 2 ϕ(~r, t) − 1 ∂ ϕ(~r, t) = m c ϕ(~r, t).
∇
c2 ∂t2
h̄2
(7.3)
De nouveau, on travaille avec un champ scalaire complexe ϕ (une fonction d’onde).
On retrouve l’équation des ondes habituelle, mais avec un terme de masse. Sous
(66)
(67)
Landau et Lifshitz par exemple se réfèrent à Klein et Fock et pas Klein et Gordon.
Voir S. Schweber, Relativistic quantum field theory, Harper and Row, New-York 1961.
104
~ on écrit cette équation comme
forme manifestement covariante (∂µ = (c−1 ∂t , ∇)
2
2
2
2 4
(E − c |~
p| )ϕ = m c ϕ, soit
(E/c, −~
p) E/c
ϕ = pµ pµ ϕ = m2 c2 ϕ
p~
(68)
c’est-à-dire finalement
∂µ ∂ µ + (mc/h̄)2 ϕ = 0,
où l’on a défini
(69)
pµ = ih̄
∂
= ih̄∂ µ ,
∂xµ
pµ = ih̄
∂
= ih̄∂µ .
∂xµ
Là encore, nous ne nous étendrons pas sur les conséquences cette équation, mais
indiquons seulement qu’il n’est pas possible de définir une densité de probabilité
positive conservée au cours du temps, ce qui invalide en partie la théorie basée sur
l’équation de Klein-Gordon. On forme la différence entre ϕ∗ ×KG et son complexe
conjugué pour obtenir une équation de continuité,
∂
ρ(~r, t) + div ~j(~r, t) = 0
∂t
où les densités de probabilité de présence et de courant de probabilité sont cette fois
définies par
∂ ∗
ih̄
∂
∗
ϕ(~
r
,
t)
−
ϕ(~
r
,
t)
ϕ
(~
r
,
t)
,
ρ(~r, t) =
ϕ
(~
r
,
t)
2mc2
∂t
∂t
~ r , t) − ϕ(~r, t)∇ϕ
~ ∗ (~r, t)).
~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~
2mi
(68)
Pour le lecteur n’ayant
! pas lu le chapitre 3 sur les notions de calcul tensoriel, il suffit ici de savoir
ct
x
que l’on note xµ =
un tenseur contravariant de rang 1 (ici la coordonnée spatio-temporelle),
y
z
c’est-à-dire la donnée de 4 nombres qui se transforment par changement de référentiel
inertiel par
!
γ
−βγ 0 0
−βγ
γ
0 0 , que l’on introduit
la transformation de Lorentz x′µ = Λµν xν où [Λµν ] =
0
0
1 0
0
0
0 1
!
1
−1
le tenseur métrique [gµν ] =
de sorte que gµν xµ = xν = (ct, −x, −y, −z)
−1
−1
est le tenseur covariant correspondant à xν . L’intervalle
élémentaire est alors ds2 = c2 dτ 2 =
!
cdt
gµν dxµ dxν = dxµ dxµ = (cdt, −dx, −dy, −dz) dx
= c2 dt2 − dx2 − dy 2 − dz 2 . On généralise
dy
dz
ensuite à d’autres grandeurs telles que v µ =
dxµ
,
dτ
pµ = mv µ =
E/c
p
~
, etc de sorte que l’invariant
2 2
µ
2 2
relativiste E 2 /c2 − |~
p|2 =
m c n’est autre que la contraction pµ p = m c . La généralisation du
gradient est notée ∂ µ =
1
∂
c t
.
~
−∇
(69)
On note la disparition du signe moins due au changement de signe de la partie spatiale entre
les définitions de pµ et ∂µ .
105
On note que la densité de probabilité de présence est bien une forme analogue à
la densité de courant, mais avec des dérivées temporelles à la place des dérivées
spatiales. Les deux expressions sont rassemblées dans la forme covariante
jµ =
ih̄ ∗
(ϕ ∂µ ϕ − ϕ∂µ ϕ∗ ).
2m
Cette théorie reposant sur des champs complexes scalaires, elle convient après
seconde quantification à la description de bosons massifs de spin nul (70) .
⊲ Lagrangien de Klein-Gordon. En procédant comme pour les sections
précédentes, on peut supposer la forme de la densité lagrangienne qui permet de
retrouver l’équation de Klein-Gordon
LKG = (pµ ϕ)⋆ (pµ ϕ) + m2 c2 ϕ⋆ ϕ
= −h̄2 (∂µ ϕ⋆ )(∂ µ ϕ) + m2 c2 ϕ⋆ ϕ.
⊲ Couplage minimal, particules et antiparticules. Si les particules décrites
par l’équation de Klein-Gordon possèdent une charge électrique e, elles interagissent
avec le champ électromagnétique par le biais du couplage minimal,
(ih̄∂µ − eAµ )(ih̄∂ µ − eAµ )ϕ − m2 c2 ϕ = 0
et on constate, si l’on écrit le conjugué complexe de cette équation, que ϕ∗
obéit strictement à la même équation, avec une même masse m, mais une charge
électrique opposée −e. Les fonctions d’onde ϕ et ϕ∗ décrivent des particules chargées
de spin nul et les antiparticules correspondantes. Des particules neutres de spin
nulles sont décrites par une fonction d’onde réelle. En notant de plus que dans le
cas d’une particule libre, la fonction d’onde de la particule est une onde plane,
i
i
ϕ(~r, t) = Ae h̄ (~p~r−Et) , celle de l’antiparticule est donc ϕ∗ (~r, t) = A∗ e h̄ ((−~p)~r−(−E)t) et
l’antiparticule a donc une énergie négative (si l’énergie de la particule est positive)
et se déplace en sens inverse.
⊲ Limite non relativiste et équation à deux composantes. Pour retrouver
2
i
l’équation de Schrödinger à la limite non relativiste, on pose φ(~r, t) = ϕ(~r, t)e− h̄ mc t
et on examine la limite où E ′ = E − mc2 est petit. Il est facile de montrer qu’on
retrouve alors l’équation de Schrödinger pour la fonction d’onde φ.
Une autre façon de retrouver la limite non relativiste est d’écrire l’équation de
Klein-Gordon sous la forme d’une équation du premier ordre en dérivées temporelles
à deux composantes,
ih̄∂t ψ = Hψ
ϕ+ (~r, t)
où ψ possède deux composantes, ψ =
ϕ− (~r, t) , reliées à ϕ et ∂t ϕ et H
1
est un hamiltonien matriciel 2 × 2. On pose ϕ+ = √2m
(ih̄∂t + mc2 )ϕ, ϕ− =
(70)
En seconde quantification l’équation (de Schrödinger, de Klein-Gordon, de Dirac) est traitée
comme une équation d’onde classique et la quantification est opérée en promouvant la fonction
d’onde au statut d’opérateur de champ obéissant à des régles de commutation particulières. Ces
opérateurs de champs sont associés à la création ou l’annihilation de particules, qui dans le cas KG
sont des bosons massifs de spin nul.
106
√ 1 (−ih̄∂
t
2m
+ mc2 )ϕ et on montre que l’équation de Klein-Gordon prend la forme
ci-dessus avec
|~
p|2
|~
p|2
2
H = mc +
iτ
τ3 +
2m
2m 2
où τ3 et τ2 sont les matrices de Pauli ordinaires (que l’on ne dénote pas avec le
σ conventionnel pour éviter toute confusion avec le spin, nul dans le cas présent).
Cette équation prend une structure très intéressante, voisine de celle de Schrödinger,
mais à deux composantes, a priori en raison de l’existence de particules scalaires (de
spin nul) et des antiparticules associées. Si l’on calcule la charge associée dans ce
formalisme, on a en effet
Z
3
∗
∗
d r(ϕ (ih̄∂t ϕ) − (ih̄∂t ϕ )ϕ) =
=
Z
Z
d3 rψ † τ3 φ
d3 r(|φ+ |2 − |φ− |2 )
ce qui associe φ+ et φ− respectivement aux particules et antiparticules. On définit
également le “KG-adjoint” à partir de l’adjoint complexe, φ̄ = φ† τ3 pour écrire la
densité de charge proportionnelle à φ̄φ.
L’inconvénient de cette approche à deux composantes est en revanche que la
nature relativiste de cette équation n’est plus manifeste.
Equations de Weyl
⊲ Recherche des équations pour des particules sans masse de spin 12 .
On cherche maintenant une équation relativiste pour décrire des fermions sans masse
de spin 12 . On doit s’attendre à retrouver l’équation des ondes sous la forme
~2
∇
2
. = 0,
. − 1 ∂
2
2
.
.
c ∂t
c’est-à-dire agissant sur des objets ayant a priori deux composantes, des spineurs.
En effet, on a vu avec l’équation de Pauli que l’introduction du spin nécessitait de
travailler sur des objets plus élaborés que de simple champs scalaires complexes. On
a vu également dans le cas relativiste que la difficulté d’interprétation de la densité
de probabilité de présence (non définie positive) découlait de ce que l’équation de
Klein-Gordon est du second ordre en dérivées temporelles, on doit donc chercher
une équation du premier ordre,comme
celle de Schrödinger.
ϕ1
On notera en général ψ = ϕ
un spineur à deux composantes. Il faut donc
2
une équation matricielle (matrices 2 × 2) comportant des dérivées du premier ordre
∂ ~
en t, soit, pour être compatible avec ∂µ = ( 1c ∂t
, ∇), l’apparition d’un objet tel que
1 ∂
~
~ ·∇
1l
±σ
c ∂t 2×2
ϕ1
ϕ2
.
107
On a utilisé le fait mentionné plus haut que les matrices de Pauli, avec l’identité,
∂
permettent d’exprimer n’importe quelle matrice 2 × 2. Si c1 ∂t
apparaı̂t, on s’attend
~ Comme on veut faire agir sur des spineurs à deux composantes,
à voir également ∇.
~ . Pour avoir une forme manifestement
on soupçonne l’apparition de 1l2×2 et de σ
covariante, ∂µ doit être contracté. On introduit pour cela une certaine généralisation
de l’identité sous la forme d’un tenseur de rang 1 (dontles “éléments” sont des
1l2×2
matrices 2 × 2) que l’on note provisoirement γ µ =
(cette notation γ µ sera
~
σ
ensuite réservée à un autre “vecteur contravariant”
1 assez voisin de celui-ci). On peut
∂
~ A ce niveau, le
~ · ∇.
ainsi former γ µ ∂µ = γµ ∂ µ = (1l2×2 , −~
σ ) c t = c1 1l2×2 ∂t + σ
~
−∇
µ
choix du
signe contraire pour la partie spatiale de γ serait parfaitement licite, i.e.
1l2×2
~ et rien ne nous
~ ·∇
γµ =
. La contraction conduirait alors à 1c 1l2×2 ∂t − σ
−~
σ
permet de trancher entre les deux cas proposés. On dispose donc de deux équations
également valables, conduisant à cette norme,
1
~
~ · ∇ ψ (+) = 0,
ih̄
1l ∂ + σ
c 2×2 t
1
~
~ · ∇ ψ (−) = 0.
ih̄
1l ∂ − σ
c 2×2 t
Ce sont les équations de Weyl. Elles agissent sur des champs de spineurs ψ (+) et
ψ (−) distincts que l’on interprétera un peu plus loin.
On peut ainsi conjecturer une équation manifestement covariante du premier
ordre (en rétablissant le facteur ih̄),
ih̄γ µ ∂µ ψ = 0.
Pour retrouver l’équation des ondes, formons la contraction
1 ∂2
~ σ · ∇)
~
ψ
1
l
−
(~
σ
·
∇)(~
{z
}
c2 ∂t2 2×2 |
~ 2 1l2×2
∇
.
2
1 ∂
~ 2 1l
−∇
=
2×2 ψ = 0,
c2 ∂t2
Cette équation prenant la forme d’une norme invariante de Lorentz.
⊲ Equation covariante. Nous venons d’introduire de manière intuitive 4
matrices γ dont il convient maintenant de préciser les propriétés algébriques.
Utilisons un raisonnement un peu différent pour introduire l’équation de Weyl sous
forme covariante adaptée à l’équation de Dirac (c’est-à-dire en conservant la masse)
que nous allons ensuite établir. On a vu avec l’équation de Klein-Gordon que la
dérivée seconde par rapport à t posait quelques difficultés, puisqu’elle ne permettait
pas d’introduire une densité de probabilité définie positive. Au lieu de partir de
pµ pµ = m2 c2 dans le cas classique (non quantique), qui fait apparaı̂tre cette dérivée
108
seconde par la substitution pµ → +ih̄∂µ , essayons de former une contraction du
type γ µ pµ ψ = mcψ, avec dans le cas de fermions non massifs, m = 0. Il faut
alors que γ µ soit comme on l’a anticipé un “quadri-vecteur” contravariant sans
dimension physique, c’est-à-dire une certaine généralisation de 1, mais que ses 4
composantes spatio-temporelles (γ 0 , ~γ ) soient des matrices, pour pouvoir agir sur
des objets à plusieurs composantes (a priori des spineurs de Pauli, mais peut-être
des objets plus complexes encore). Si alors on généralise le carré de γ µ pµ à une
forme convenablement symétrisée avec la propriété 21 (γ µ pµ γ ν pν + γ ν pν γ µ pµ ) =
1
µ ν
ν µ
µν
µ
2 (γ γ + γ γ )pµ pν = g pµ pν = pµ p , on retrouve l’équation cherchée sous la
forme pµ pµ ψ = m2 c2 ψ. Il est clair que cette notation est encore assez ambiguë, mais
g µν est à prendre au sens g µν × 1ln×n où n est le nombre de composantes du spineur.
Notons que l’on a symétrisé le produit γ µ γ ν car on sait en mécanique quantique
que la commutation des objets n’est pas nécessairement assurée.
Supposons que les γ µ soient des scalaires. On obtient rapidement une
inconsistence, car pour µ = 0, ν = 0 on doit avoir γ 0 = ±1 et pour µ = 1, ν = 1 on
doit avoir γ 1 = ±i, ce qui ne permet pas de satisfaire la contrainte γ 0 γ 1 = 0 pour
µ = 0, ν = 1. De même, des matrices 2 × 2 ne conviennent pas non plus. En effet
on aurait par exemple γ 0 = ±1l et γ 1 = ±σ3 qui ne permet pas non plus de réaliser
γ 0 γ 1 + γ 1 γ 0 = 0. On voit que cette algèbre impose aux composantes de γ µ d’être au
moins des matrices 4 × 4 et on peut finalement écrire pµ pµ ψ = −h̄2 ∂µ ∂ µ ψ = m2 c2 ψ.
Reprenons maintenant le raisonnement en admettant d’emblée qu’il faille
travailler sur des spineurs à 4 composantes. Cela ne doit pas surprendre outre mesure,
puisqu’on a vu avec l’équation de Pauli que le spin 21 recquiert un doublement des
composantes, mais aussi que la description de particules et antiparticules dans une
équation en dérivée première par rapport au temps demande de même un doublement
des composantes. On introduit le spineur de Dirac (71)
ψ=
ψ (+)
ψ (−)


ψ1
ψ 
=  ψ2 
3
ψ4
(un spineur à quatre composantes dont deux sont en fait associées aux particules
et deux aux antiparticules comme on va le voir) et des matrices 4 × 4 (appelées les
matrices de Dirac, ici dans la représentation chirale)
γ µ = (γ 0 , ~
γ ),
0
1l2×2
0
γ = 1l
,
0
2×2
~γ =
0
~
σ
−~
σ
0
de sorte que les équations de Weyl se combinent sous une forme unique,
µ
γ ∂µ ψ =
(71)
0
1 ∂
c ∂t 1l2×2
1 ∂
1l
c ∂t 2×2
0
!
ψ (+)
ψ (−)
+
0
~
~ ·∇
σ
~
−~
σ·∇
0
ψ (+)
ψ (−)
= 0.
On ignore ici les lois de transformation de tels spineurs par transformation de Lorentz.
Les matrices de Dirac obéissent à
109
(72)
γ µ γ ν + γ ν γ µ = 2g µν .
Les matrices ci-dessus obéissent bien à l’algèbre demandée, mais d’une part ce ne
sont pas les seules et il existe d’autres représentations par des matrices 4 × 4, d’autre
part on pourrait trouver des représentations par des matrices de dimensions paires
plus élevées. Le fait que les matrices de Dirac soient ici des matrices 4 × 4 et qu’il
y ait 4 valeurs pour les indices spatio-temporels µ = 0, . . . 3 est une coı̈ncidence
fortuite : les γ µ agissent sur les composantes des spineurs et lorsque l’on représente
g µν par une matrice, elle agit dans l’espace-temps !
Il est instructif de pousser plus avant la forme covariante de l’équation de Weyl,
ih̄γ µ ∂µ ψ = 0, pour chercher à définir le carré invariant. Sur l’équation de Weyl,
manifestement covariante,
ih̄γ µ
∂ψ
= 0,
∂xµ
faisons agir l’opérateur ih̄γ ν ∂ν = ih̄γ ν (∂/∂xν ) :
0 = −h̄2 γ ν γ µ
∂2
ψ
∂xν ∂xµ
1
= − h̄2 (γ µ γ ν + γ ν γ µ )∂ν ∂µ ψ
2
= −h̄2 g µν ∂ν ∂µ ψ
= (ih̄∂ µ )(ih̄∂µ )ψ
= pµ pµ ψ.
On obtient ainsi une forme très satisfaisante,
µ
pµ p ψ =
E2
2
− p~ 1l4×4 ψ = 0.
c2
(7.4)
Il est important de noter que l’équation de Weyl, sous sa forme manifestement
covariante,
ih̄γ µ ∂µ ψ = 0
n’est pas un simple scalaire de Lorentz car γ µ est un objet à quatre composantes
(comme un 4−vecteur), mais ses composantes sont des matrices 4 × 4 et ∂µ ψ est
un objet à 4 composantes scalaires, de sorte que la contraction donne au total un
objet à 4 composantes scalaires. C’est le prix qu’il a fallu payer pour quantifier la
(72)
Attention, dans cette expression, les γ µ sont des matrices 4 × 4, donc pour chaque valeur des
indices µ et ν, le résultat est une matrice et on doit considérer que le second membre est en fait
2g µν 1l4×4 . Il faut noter que dans la littérature on n’utilise pas de caractères gras pour les matrices
de Dirac, ce qui est risque supplémentaire de confusion.
110
théorie, puisqu’en physique quantique on travaille sur des objets qui en général ne
commutent pas.
L’équation de continuité peut s’écrire sous la forme habituelle en définissant la
densité de probabilité de présence et la densité de courant de probabilité comme
ρ = ψ † ψ = ψ̄γ 0 ψ,
~j = cψ̄~
γ ψ,
avec ψ̄ = ψ † γ 0 soit sous forme covariante
∂µ j µ = 0,
j µ = (cρ, ~j) = cψ̄γ µ ψ.
On peut utiliser pour cela la propriété des matrices de Dirac (γ µ )† = γ 0 γ µ γ 0 .
⊲ Particule non massive libre. Si l’on fait agir sur la solution libre
 
A1
(+)
 A2  h̄i pµ xµ
χ
= A  e
ψ=
χ(−)
3
A4
on obtient
ih̄γ µ ∂µ ψ =
0
E
~
c 1l2×2 + σ · p
E
c 1l2×2
− σ · p~
0
!
ψ = 0.
(7.5)
L’équation est homogène ; pour avoir une solution non nulle il faut donc annuler le
déterminant,
!
E
0
1l2×2 − σ · p~
c
Det E
~
0
c 1l2×2 + σ · p
E
E
= 1l2×2 − σ · p~ × 1l2×2 + σ · ~p
c
c
E − p3
−p1 + ip2 Ec − p3 +p1 − ip2 c
= 1
×
E
E
−p − ip2
+ p3 p1 + ip2
+ p3 c
c
2
= (E/c)2 − (p3 )2 − ((p1 )2 + (p2 )2 )
2
2
E
2
=
− p~
= 0,
c2
soit finalement
E = ±|~
p|c.
L’équation de Weyl pour la particule libre admet quatre solutions indépendantes,
dont deux avec une énergie positive E = |~
p|c (ce sont les deux composantes de spin
111
de la particule non massive que nous souhaitions modéliser) et deux (associées aux
deux composantes de spin de l’antiparticule) avec une énergie négative E = −|~
p|c.
⊲ Lagrangien de Weyl. Pour définir une densité lagrangienne appropriée,
on introduit comme précédemment avec l’équation de Klein-Gordon à deux
composantes l’“adjoint de Dirac” qui a permis la définition de la densité conservée,
ψ̄ = ψ † γ 0 ,
ψ † = (ψ1∗ , ψ2∗ , ψ3∗ , ψ4∗ ),
et on pose pour la particule libre (en l’absence de champ électromagnétique)
LWeyl = ih̄ψ̄γ µ ∂µ ψ.
Avec cette forme, les équations d’Euler-Lagrange se réduisent à
∂L
= ih̄γ µ ∂µ ψ = 0.
∂ ψ̄
Equation de Dirac
⊲ Equation covariante pour des fermions massifs de spin 21 . Pour
obtenir l’équation relativiste de l’électron (73) et plus généralement pour des fermions
massifs de spin 12 , il suffit de généraliser l’équation de Weyl covariante. Partons de
la contraction, ce qui est plus immédiat,
2
µ
E
2
2 2
2 2
− ~p − m c 1l4×4 ψ = 0.
p pµ − m c 1l4×4 ψ =
c2
Cela suggère de coupler les équations pour χ(+) et χ(−) par un terme de masse pour
obtenir l’équation covariante de Dirac (74)
ih̄γ µ
∂ψ
= γ µ pµ ψ = mcψ,
∂xµ
(7.6)
(on omet l’opérateur identité), soit, sous forme développée,
!
1 ∂
~
(+)
(+)
~
0
−
σ
·
∇
χ
χ
c
∂t
= mc
.
ih̄ 1 ∂
χ(−)
χ(−)
~ ~
0
c ∂t + σ · ∇
(73)
P.A.M. Dirac, L’équation d’onde relativiste de l’électron, Proc. Roy. Soc. A 117, 610-624
(1928), traduit dans J. Leite-Lopes et B. Escoubès, op. cit., p.194.
(74)
Une notation “slash” a été introduite (par Feynman) pour simplifier légèrement l’écriture. On
définit
a
/ ≡ γ µ aµ ,
ce qui permet d’écrire l’équation de Dirac par exemple comme
(ih̄/
∂ − mc)ψ = (/
p − mc)ψ = 0.
112
Dans le cas d’une particule libre, on a
0
E − c~
σ · p~
χ(+) = mc χ(+) .
E + c~
σ · p~
0
χ(−)
χ(−)
Il existe d’autres représentations des matrices de Dirac, notamment la
représentation de Dirac obtenue par transformation
unitaire
à partir de la
représentation chirale, γ µ → U γ µ U † où U = 2−1/2 1l 1l ,
1l −1l
γ µ = (γ 0 , γ),
1l2×2
0
γ0 =
0
−1l2×2 ,
~γ =
0
−~
σ
~
σ
0
.
Cette fois on obtient dans le cas de la particule libre l’équation
u =0
E − mc2
−c~
σ · ~p
v
c~
σ · ~p
−E − mc2
(+)
(−)
u , où u et v sont des spineurs à deux
χ
+
χ
−1/2
avec ψ = 2
=
v
χ(+) − χ(−)
composantes. L’équation aux valeurs propres conduit à
2
−c~
σ · p~
Det E − mc
= c2 p~2 − (E 2 − m2 c4 ) = 0,
c~
σ · p~
−E − mc2
ou encore pour les particules et les antiparticules,
p
E = ± |~
p|2 c2 + m2 c4 .
(7.7)
Dans le cas de l’électron, l’antiparticule est le positron. Le positron a été découvert
en 1932 par Anderson.
On trouve fréquemment dans la littérature une formulation alternative (ou plutôt
des notations alternatives pour les matrices de Dirac). On définit les 4 matrices
hermitiennes
~
0
σ
1l 0
~ = ~
β = 0 −1l , α
σ 0 ,
~ = ~γ , β † = β, α
~† = α
~ . On a ensuite directement
c’est-à-dire que l’on a β = γ 0 et β α
ih̄
∂
h̄ ~
+ βmc2 )ψ
ψ = Hψ = (c~
α ∇
∂t
i
2
= (c~
αp~ + βmc )ψ
ou encore, par action sur une onde plane,
(E − c~
αp~)ψ = βmc2 ψ.
(7.8)
113
⊲ Equation de Dirac covariante sous champ. L’équation de Dirac sous
champ s’obtient par couplage minimal,
pµ → pµ − qAµ ,
soit ih̄γ µ ∂µ ψ = mcψ qu’on écrit encore γ µ pµ ψ = mcψ, que l’on transforme en
γ µ (pµ − qAµ )ψ = ih̄γ µ ∂µ ψ − qγ µ Aµ ψ = mcψ.
(7.9)
Pour comparer cette forme à l’équation de Klein-Gordon sous champ par
exemple, on multiplie par γ ν (pν − qAν ) :
γ µ γ ν (pµ − qAµ )(pν − qAν )ψ = m2 c2 ψ,
où l’on introduit les matrices
1
i(γ µ γ ν − γ ν γ µ ),
2
γ µ γ ν = g µν − iΣ µν .
Σ µν =
L’opérateur Σ µν est antisymétrique, on obtient des représentations matricielles
particulières en appliquant Σ µν = iγ µ γ ν − ig µν 1l4×4 . Dans la représentation chirale
on a par exemple
2
0
1l2×2
1l2×2
0
Σ 00 = i(γ 0 )2 − i1l4×4 = i 1l
−
i
= 0,
0
0
1l
2×2
Σ
01
0
1
= iγ γ = i
0
1l2×2
1l2×2
0
2×2
0
σx
−σx
0
=i
σx
0
0
−σx
.
Les matrices Σ µν = 12 i[γ µ , γ ν ] sont liées aux transformations de Lorentz (les
rotations et les “boosts” (ou rotations hyperboliques)), soit par conséquent aux
composantes du spin S k ,
i
1
1 0i 1 0 i
σ
0
,
Σ = i[γ , γ ] = i
0 −σ i
2
4
2
1 ij
1 i j
1 ijk σ k 0
≡ ǫijk S k /h̄.
Σ = i[γ , γ ] = ǫ
0 σk
2
4
2
Il faut faire attention au fait que les grandeurs en général ne commutent pas en
mécanique quantique. On peut alors ré-écrire le premier membre de l’équation de
Dirac au carré,
(g µν − iΣ µν )(pµ − qAµ )(pν − qAν ) =(pµ − qAµ )(pµ − qAµ )
1
− i(Σ µν − Σ νµ )(pµ − qAµ )(pν − qAν )
2
=(pµ − qAµ )(pµ − qAµ )
1
− iΣ µν [pµ − qAµ , pν − qAν ].
2
114
Le commutateur se développe [pµ − qAµ , pν − qAν ] = q[pν , Aµ ] − q[pµ , Aν ] =
−ih̄q(∂µ Aν − ∂ν Aµ ) et on obtient finalement
1
(pµ − qAµ )(pµ − qAµ )ψ + qh̄Σ µν Fµν ψ = m2 c2 ψ,
2
(7.10)
ce qui fait apparaı̂tre très naturellement le tenseur de Faraday, et où le terme Zeeman
dû au spin est automatiquement inclus dans le couplage avec Fµν .
⊲ Lagrangien de Dirac. En présence d’un champ électromagnétique on a cette
fois
LDirac = ψ̄γ µ (ih̄∂µ − qAµ )ψ − mψ̄ψ,
avec le spineur adjoint ψ̄ = ψ † γ 0 .
Equation relativiste pour le photon
Habituellement on ne passe pas par une équation à une particule pour le photon.
Les théories quantiques des champs consistent à quantifier des théories considérées
comme classiques en remplaçant la fonction d’onde par des opérateurs de champ
(création et annihilation de particules). C’est le cas des équations de Schrödinger,
de Klein-Gordon ou de Dirac et pour le photon des équations de Maxwell. Dans ces
conditions, une équation à une particule pour le photon ne s’impose pas, mais c’est
un intermédiaire intéressant que nous nous proposons d’établir ici. Le photon ayant
une polarisation, on travaillera sur un objet à plusieurs composantes.
Les équations de Maxwell dans le vide (en l’absence de sources) s’écrivent
~E
~ = 0,
∇
~B
~ =0
∇
~
~ ×E
~ = − ∂B ,
∇
∂t
~
~ ×B
~ = 1 ∂E
∇
2
c ∂t
~ + iλcB),
~ λ = ±1. La combinaison iλc~
~
p × F~λ (avec ~p = −ih̄∇
On pose F~λ = √12 (E
un opérateur) s’écrit à l’aide des équations de Maxwell
∂ F~
iλc~
p × F~λ = ih̄ λ .
∂t
Il est naturel dans ces conditions de la noter H, où de ce fait, H est une matrice
3 × 3 agissant sur les composantes de F~λ = col (F1 , F2 , F3 ) (vecteur colonne avec les
trois composantes cartésiennes de F~λ ),

0
H F~λ = iλc  pz
−py
−pz
0
px

py
−px 
0
F1
F2
F3
!
.
R 3 ∗
La quantité
d r F~λ (~r)F~λ (~r) définit l’énergie électromagnétique totale Ue.m.
(dans un volume de référence quelconque). On définit une fonction d’onde vectorielle
ψλ (~r) = col (ψ1 , ψ2 , ψ3 ) en fonction de F~λ en divisant par cette énergie de référence
115
pour assurer la normation à l’unité. Les fonctions d’onde doivent satisfaire à la
condition de transversalité p~ · ψλ = 0 et l’équation des ondes se déduit de l’action
de H 2 :
2
~ ×∇
~ × ψ = −c2 h̄2 ∇
~ 2 ψ = −h̄2 ∂ ψ .
H 2 ψ = λ2 c2 h̄2 ∇
∂t2
~ i(~k~r−ωt) conduit à
L’action sur une onde plane ψ = Ae
~ = h̄~k ψ,
p~ψ = −ih̄ ∇ψ
Hψ = ih̄
∂ψ
= h̄ω ψ.
∂t
On peut noter que sous cette forme, les équations de Maxwell sont très voisines
de l’équation de Dirac (ou plutôt de l’équation de Weyl en l’occurrence) (75) ,
∂
ih̄ ∂t
ψ = (c~
α · ~p + βmc2 )ψ, car on peut écrire (pour λ = +1)
ih̄
∂
ψ = c(~
τ · p~) ψ,
∂t
où les trois matrices τ (analogues aux matrices de Dirac) sont données par
τx =
(75)
0
0
0
0 0
0 −i
i 0
!
,
τy =
0
0
−i
0 i
0 0
0 0
!
,
τz =
0 −i
i 0
0 0
0
0
0
!
.
C’est une observation due à Oppenheimer (Phys. Rev. 38 725 (1931)) et également à Majorana
(voir à ce propos S. Esposito, Foundations of Physics 37 956 (2007)).
116
117
8
Classical gauge field theory
Introduction
⊲ Classical field theories. Consider as an example the free particle KleinGordon equation (76) (∂µ ∂ µ + m2 )φ = 0 which follows from the conservation
equation pµ pµ − m2 = 0 with the correspondence pµ → i∂µ . We use the convention
gµν = diag (+1, −1, −1, −1) for the metric tensor. For later use, we choose the
~ ≡ (φ, A),
~ where
MKSA conventions, e.g. pµ = (E/c, p~) ≡ (E, p~) and Aµ = (φ/c, A)
∂
~ ≡ ( ∂ , −∇).
~
, −∇)
an bold font denotes a vector in ordinary space, or ∂ µ = ( c1 ∂t
∂t
Most of the time, h̄ and c are fixed to unity.
The Lagrangian density from which this equation follows must satisfy (77)
Z
δ
∂L
∂L
− ∂µ
= 0,
d4 x L(φ, φ∗ , ∂µ φ, ∂µ φ∗ ) =
∗
∗
δφ
∂φ
∂(∂µ φ∗ )
∂L
= −m2 φ,
∂φ∗
∂µ
∂L
= ∂µ ∂ µ φ.
∂(∂µ φ∗ )
The first condition is fulfilled if
L = −m2 φ∗ φ + terms in ∂µ φ∗ ∂ µ φ,
(76)
(77)
We forget about factors h̄ and c in this chapter.
We consider complex scalar fields. For real fields, factors of
1
2
would appear here and there.
118
and the second if
(78)
L = ∂µ φ∗ ∂ µ φ + terms in φ∗ φ.
Eventually the Klein-Gordon Lagrangian is given by
L = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ.
The first term is usually referred to as kinetic energy, although the space part (79)
is reminiscent from local interactions in the context of classical field theory, and the
second term to the mass term, since it corresponds to the mass of the particles
after quantization. The quantization procedure, not discussed here, consists in
the promotion of the classical fields into creation (or annihilation) field operators
which obey, together with the corresponding conjugate momenta, to canonical
commutation relations. We will stay here at the level of classical field theory, which
means that although the fields correspond to the wave functions of quantum objects
in the first-quantized form of the theory, they are treated by classical field theory
(e.g. Euler-Lagrange equations) and no quantum fluctuations are allowed.
⊲ The idea behind non-Abelian gauge theory. According to Salam and
Ward, cited by Novaes in hep-ph/0001283:
Our basic postulate is that it should be possible to generate strong, weak, and
electromagnetic interaction terms ... by making local gauge transformations on the
kinetic-energy terms in the free Lagrangian for all particles.
or Yang and Mills cited in A.C.T. Wu and C.N. Yang, Int. J. Mod. Phys. Vol. 21,
No. 16 (2006) 3235:
The conservation of isotopic spin points to the existence of a fundamental
invariance law similar to the conservation of electric charge. In the latter case,
the electric charge serves as a source of electromagnetic field. An important concept
in this case is gauge invariance which is closely connected with (1) the equation of
motion of the electromagnetic field, (2) the existence of a current density, and (3)
the possible interactions between a charged field and the electromagnetic field. We
have tried to generalize this concept of gauge invariance to apply to isotopic spin
conservation.
It is worth noticing that Klein and Pauli were pionners in this field, although
they did not publish their results (80) . In an attempt to generalize Kaluza-Klein
theory to the non-Abelian case, Pauli was in trouble with the fact that the new
bosons associated to the non-Abelian gauge fields were non massive: One will always
obtain vector mesons with rest-mass zero (and the rest-mass if at all finite will always
remain zero by all interactions with nucleons permitting the gauge group). In a letter
to Pais, he was nevertheless writing . . . I would like to ask in this connection whether
the transformation group with constant phases can be amplified in a way analogous to
the gauge group of electromagnetic potentials in such a way that the meson-nucleon
interaction is connected with the amplified group. . . .
⊲ The origin of gauge invariance (81) . The idea of “gauging” a theory,
i.e. making local the symmetries, is due to E. Noether, but gauge invariance was
(78)
We develop to obtain ∂µ ∂(∂∂Lφ∗ ) = ∂0 ∂(∂∂Lφ∗ ) + ∂i ∂(∂∂Lφ∗ ) = ∂µ ∂ µ φ = (∂0 ∂ 0 + ∂i ∂ i )φ =
µ
0
i
(∂0 ∂0 − ∂i ∂i )φ, the solution L = ∂0 φ∗ ∂0 φ − ∂i φ∗ ∂i φ = ∂0 φ∗ ∂ 0 φ + ∂i φ∗ ∂ i φ = ∂µ φ∗ ∂ µ φ (up to
terms in φ∗ φ) follows.
2
(79)
~ 2 , and only the time derivatives
− |∇φ|
We have a space and a time part in ∂µ φ∂ µ φ = c12 ∂φ
∂t
are reminiscent of a kinetic energy.
(80)
See N. Straumann, Wolfgang Pauli and modern physics, arXiv:0810.2213.
(81)
See Cheng and Li pp235-236, and Gross p956
119
introduced by Weyl when he tried to incorporate electromagnetism into geometry
through the idea of local scale transformations. From one point of space-time to an
other at a distance dxµ , the scale is changed from 1 to (1 + Sµ dxµ ) in such a way
that a space-time dependent function (of dimension of a length) f (x) is changed
according to
f (x) → f (x + dx) = (f + ∂µ f dxµ ))(1 + Sµ dxµ ) ≃ f + [(∂µ + Sµ )f ]dxµ .
The original idea of Weyl was to identify Sµ to the 4−potential Aµ , but with the
advent of quantum mechanics and the correspondence between pµ and i∂µ , it was
later realized that the correct identification is Sµ ↔ ieAµ . Weyl nevertheless retained
his original terminology of gauge invariance as an invariance under a change of length
scaled, or a change of the gauge.
Abelian U (1) gauge theory
⊲ The complex nature of the field as an internal structure. The prototype
of gauge theory is the theory of electromagnetism, or Abelian U (1) theory, where
charge conservation is deeply connected to global phase invariance in quantum
mechanics (a connection probably made first by Hermann Weyl).
The complex scalar field ϕ(x) (Schrödinger or Klein-Gordon field) can be
modified by a global phase transformation ϕ(x) → exp(ieα)ϕ(x) (Abelian U (1)
gauge transformation) which leaves the matter Lagrangian L = ∂µ ϕ∗ ∂ µ ϕ − V (|ϕ|2 )
unchanged. We anticipate and introduce already the charge e which couples the
(82)
1
2
particle to the electromagnetic field
. Let us write ϕ = φ + iφ and introduce a
1
real two-component field φ(x) = φ2 . The gauge transformation now appears as
φ
an Abelian rotation in a two-dimensional (internal) space.
⊲ Noether theorem and matter current density. Consider the Langrangian
density
L0 = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ).
For later use, we will call this Lagrangian the function
L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ).
For any symmetry transformation,
δL0 = δϕ∗
∂L0
∂L0
+ δ(∂µ ϕ∗ )
+ ϕ∗ → ϕ = 0.
∗
∂ϕ
∂(∂µ ϕ∗ )
The notation ϕ∗ → ϕ means that we add a similar term with all complex numbers
replaced by their conjugate. The global phase transformation ϕ → ϕ′ = ϕeieα being
(82)
Here we set h̄ = 1. In most of the relations, h̄ is restored through the substitution e → e/h̄,
g → g/h̄, or i∂µ → ih̄∂µ .
120
such a symmetry, we put δϕ = ieαϕ and δ(∂µ ϕ) = ieα∂µ ϕ (to linear order in the
expansion of eieα ) in the expression of δL0 to have
"
#
∂L0
+ ∂µ ϕ
δL0 = −ieα
+ ϕ∗ → ϕ
∂(∂µ ϕ∗ )
"
#
∂L0
∗
= −ieα∂µ ϕ
+ ϕ∗ → ϕ
∂(∂µ ϕ∗ )
∂L
ϕ∗ ∗0
∂ϕ
∗
= −α∂µ j µ
where use has been made of the Euler-Lagrange equation. It follows that the Noether
current
"
∂L0
∂L0
j µ = −ie ϕ
− ϕ∗
∂(∂µ ϕ)
∂(∂µ ϕ∗ )
#
is conserved, ∂µ j µ = 0. The electric charge conservation thus appears as the
consequence of the invariance of the theory under global phase changes, this is called
a global gauge symmetry. Note that in the case of the Klein-Gordon Lagrangian,
the conserved current takes the form (83)
j µ = −ie(ϕ∂ µ ϕ∗ − ϕ∗ ∂ µ ϕ).
⊲ Local gauge symmetry.
Extending the gauge symmetry to local
transformations requires the introduction of a (vector) gauge field which will be
seen later as the vector potential of electromagnetism. In other words, making local
the gauge symmetry builds the electromagnetic interaction.
Let us assume that the gauge transformation is local, i.e. ϕ → ϕ′ = ϕeieα(x) ≡
G(x)ϕ. We note that now ∂µ ϕ → ∂µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ 6= G(x)∂µ ϕ, and
the derivative of the field does not transform like the field itself does. Let us define
the covariant derivative (84)
Dµ ≡ ∂µ + ieAµ
where Aµ is still to be defined by its transformation properties. Like ϕ′ = G(x)ϕ,
we demand that
Dµ ϕ → (Dµ ϕ)′ ≡ G(x)Dµ ϕ.
(83)
Note that at this point, the sign in front of the current density was arbitrary, but if one wants
to recover the usual expression of probability density current in quantum mechanics, e.g. in the
h̄
~ + ϕ∗ → ϕ, it leads to the present charge current density after
Schrödinger case, ~j = 2mi
ϕ∗ ∇ϕ
being multiplied by e.
(84)
The term covariant refers to covariance with respect to the introduction of the local
transformation, and not to covariant-contravariant indices.
121
Since we have (Dµ ϕ)′ = (∂µ ϕ)′ + ieA′µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ + ieA′µ G(x)ϕ and
G(x)Dµ ϕ = G(x)∂µ ϕ + ieAµ G(x)ϕ, we must require that ieA′µ G(x) = ieAµ G(x) −
∂µ G(x) or, multiplying by G−1 (x),
i
A′µ = Aµ + G−1 (x)∂µ G(x) = Aµ − ∂µ α(x).
e
Demanding the invariance property of the kinetic term (according to Salam and
Ward cited above) in the Lagrangian density under a local gauge transformation
requires the introduction of a vector field which obeys the usual transformation
law of the vector potential of electromagnetism through gauge transformations.
These transformations which appeared before as a kind of mathematical curiosity
of Maxwell theory are now necessary in order to preserve local gauge invariance.
In a sense, the interaction is “created” by the principle of local gauge symmetry,
while the principle of global gauge symmetry implies the conservation of the electric
charge.
The interaction of matter (as described by the Lagrangian density L0 ) with the
electromagnetic field can be built in through essentially two different approaches. In
a first approach, we successively add terms to L0 in order to get at the end a locally
gauge invariant Lagrangian. Since the prescription of local gauge invariance induces
Maxwell interactions, this should automatically incorporate interaction terms in
L. Starting with the observation that L0 is no longer gauge invariant through local
transformations, since δL0 = −α(x)∂µ j µ −(∂µ α(x))j µ now contains the second term,
we have to kill this last term by the introduction of something new (85) L1 = −jµ Aµ .
~ This again generates
The sign here is also coherent with the expression −(ρφ − ~j A).
one more contribution in δ(L0 + L1 ), which is canceled if we add L2 = e2 Aµ Aµ ϕ∗ ϕ.
The combination L0 + L1 + L2 = L0 + Lint is now locally gauge invariant.
In a shorter approach, called minimal coupling, we simply replace the kinetic
term ∂µ ϕ∗ ∂ µ ϕ in L0 by (Dµ ϕ)∗ (D µ ϕ) which was especially constructed in order to
be gauge invariant (under local gauge transformations). The interaction terms are
recovered from (here in the Klein-Gordon case):
(Dµ ϕ)∗ (D µ ϕ) = (∂µ ϕ + ieAµ ϕ)∗ (∂ µ ϕ + ieAµ ϕ)
= ∂µ ϕ∗ ∂ µ ϕ − ieAµ ϕ∗ ∂ µ ϕ + ieAµ ϕ∂µ ϕ∗ + e2 Aµ Aµ ϕ∗ ϕ
= ∂µ ϕ∗ ∂ µ ϕ + ie(ϕ∂µ ϕ∗ − ϕ∗ ∂µ ϕ)Aµ + e2 Aµ Aµ ϕ∗ ϕ.
One also has to add the pure field contribution LA = − 14 Fµν F µν to get the full
Lagrangian density (86)
Ltot = L0 + Lint + LA
≡ F (ϕ, ϕ∗ , (Dµ ϕ), (Dµ ϕ)∗ ) + LA
= (Dµ ϕ)∗ (D µ ϕ) − V (ϕ∗ ϕ) + LA .
Note that being the kinetic energy of the free gauge field, LA is expected to be
quadratic in Aµ , and requiring that it is written in terms of the physical fields
(85)
(86)
Note that here j µ is the current which was conserved in the absence of gauge interaction
Remember that we call L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ).
122
instead of the gauge fields, we form Fµν F µν which has the advantage of being gauge
invariant.
The full Lagrangian is thus
L = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ) − jµ Aµ + e2 Aµ Aµ ϕ∗ ϕ − 14 Fµν F µν .
Now, since the functional form of the interacting matter Lagrangian is the same
as the form of the free Lagrangian with Dµ instead of ∂µ , the conserved Noether
current in the presence of gauge interaction reads as (87)
J µ = ieϕ∗
∂L0
+ ϕ∗ → ϕ
∂(Dµ ϕ)∗
= ieϕ∗ D µ ϕ + ϕ∗ → ϕ.
= j µ − 2e2 ϕ∗ ϕAµ ,
the last two lines being valid for the KG case. The interaction term can now be
written, up to second order terms (88) in Aµ , as Lint = −Jµ Aµ .
The equations of motion follow from Euler-Lagrange equations,
∂Ltot
∂Ltot
δStot
= 0,
=
− ∂ν
δAµ
∂Aµ
∂(∂ν Aµ )
which simply yield
∂Lint
∂LA
.
= ∂ν
∂Aµ
∂(∂ν Aµ )
The l.h.s. is
∂Lint
= −j µ + 2e2 ϕ∗ ϕAµ = −J µ
∂Aµ
while at the r.h.s. we have
∂LA
∂
= − 41
F F αβ = − 14
∂(∂ν Aµ )
∂(∂ν Aµ ) αβ
∂Fαβ
∂F αβ
F αβ + Fαβ
∂(∂ν Aµ )
∂(∂ν Aµ )
!
Both terms in parenthesis are equal to F νµ −F µν = −2F µν and eventually we obtain
after multiplication by − 14 , (89)
∂ν F µν = −∂ν F νµ = −J µ
(87)
See e.g. V. Rubakov, Classical Theory of Gauge fields, Princeton University Press 2002, pp21-27.
These terms are particularly important, since they restore gauge invariance of the interaction
Lagrangian which otherwise would not exhibit this gauge invariance property in the present form.
Indeed, Jµ is gauge invariant, but Aµ is not.
(89)
Note again that our choice of sign for the current density makes the expression coherent with
the usual Maxwell equations.
(88)
.
123
and, since F µν is antisymmetric, we recover the conservation equation for J µ ,
∂µ J µ = 0.
Non-Abelian (Yang-Mills) SU (2) gauge theory
⊲ Internal structure. The global phase transformation ϕ(x) → exp(ieα)ϕ(x)
as mentioned above appears as an Abelian rotation in a two-dimensional (internal)
space. This gauge transformation, when extended to local phase transformations
α → α(x), generates the electromagnetic interaction. It is possible to generalize to
non-Abelian gauge transformations by extending the internal (isospin) structure.
The field is for example a 3-component real scalar field
 
φ1

φ(x) = φ2 
φ3
and the transformation corresponds to a rotation in the internal space
corresponding charge is now written g)
(90)
(the
φ(x) → exp(igτ α)φ(x),
with τ the generators (which do not commute, hence the name of non-Abelian) of
the rotations in three dimensions(91)
!
!
!
0 −i 0
0 0 i
0 0 0
3
2
1
0 0 0 ,
τ = i 0 0 .
τ =
τ = 0 0 −i ,
0 0 0
−i 0 0
0 i 0
Use of bold font stands for vectors in the internal space and the scalar product (with
the dot · omitted) τ α is a 3 × 3 matrix,
τα =
0
iα3
−iα2
−iα3
0
iα1
iα2
−iα1
0
!
.
The transformation (being a rotation in 3 dimensions) is non Abelian and it can
be rewritten as (92) φ(x) → φ(x) − α × φ(x) or φa (x) → φa (x) − εabc αb φc (x) in
component form. Here we use the Latin indices of the beginning of the alphabet,
a, b, , c, . . ., to denote the internal space components, and α is a vector in the
internal space whose length α is the angle of rotation and whose direction is the
(90)
See Weinberg II p3.
The rotation matrix is 3 × 3 due to the three components of the field and there are three
such matrices because there are three possible rotation axis in three dimensions. The notation
is here with the imaginary
i for convenience. Usually an infinitesimal rotation matrix in 3d is
!
0
ωz
−ωy
.
−ωz
0
ωx
ωy
−ωx
0
(91)
(92)
See Ryder p108.
124
rotation axis. When needed, µ is still the index refering to space-time components
in Minkowski space.
Rotations in three space dimensions are equivalent to SU (2) transformations
acting on complex two-component spinors (93) . The field is now represented by such
a spinor,
ψ(x) =
ϕ↑ (x)
ϕ↓ (x)
.
Each component is complex, but due to a normalization constraint we still have
three independent real scalar fields. Under a rotation in the internal space, ψ(x)
changes into
1
2 igσα
ψ(x) → exp
ψ(x)
where σ are the three Pauli matrices,
1
σ =
0 1
1 0
,
2
σ =
0
i
−i
0
,
3
σ =
1
0
0
−1
,
which obey the Lie algebra
[σ a , σ b ] = 2iεabc σ c
with εabc the totally antisymmetric tensor, and σα is a 2 × 2 matrix
σα =
α3
α1 + iα2
α1 − iα2
−α3
Here 21 σ a are the generators of SU (2) transformations. Here, σ and α are still written
in bold font since they both have three components in the 3d−internal space. All
objects acting on 2−component spinors on the other hand are 2 × 2 matrices, e.g.
in (1 + 12 igσα)ψ, 1 has to be understood as the 2 × 2 identity matrix.
The two representations can be written (94) in a unified way in component form.
The (infinitesimal) transformation of the field (let say Ψ(x), for φ or ψ) is written
δΨl (x) = igαa (ta )l m Ψm (x).
The αa ’s are now the parameters of the infinitesimal transformation. The superscript
a is used as internal space index, l and m denote the 2 components (resp. 3) in the
SU (2) representation (resp SO(3)) and t stands for the generator (σ (resp. τ )).
Together with the internal degrees of freedom, the fields of course depend on
space-time position xµ .
(93)
An O(3) transformation on φ corresponds to an SU (2) transformation on ψ =
φ1 = 12 (ϕ2↓ − ϕ2↑ ), φ2 =
See Weinberg II p2.
(94)
1
(ϕ2↑
2i
+ ϕ2↓ ), φ3 = ϕ↑ ϕ↓ , see Ryder pp32-38.
ϕ↑ (x)
ϕ↓ (x)
with
125
⊲ Pure matter field and Noether current. From now on, we choose the
SU (2) representation. Let L0 be a gauge invariant matter Lagrangian density
L0 = ∂µ ψ † ∂ µ ψ − V (ψ † ψ)
where ψ † (x) = (ϕ∗↑ (x), ϕ∗↓ (x)) and V (ψ † ψ) is a potential to be defined later.
The variation of the Lagrangian density yields
δL0 = δψ †
∂L0
∂L0
∂L0
∂L0
+ δ(∂µ ψ † )
+
δψ +
δ(∂µ ψ).
∂ψ †
∂(∂µ ψ † )
∂ψ
∂(∂µ ψ)
With the infinitesimal transformation
δψ(x) = 21 igσαψ(x),
δψ † (x) = − 12 igψ † (x)σα,
which can be written in matrix form,
ϕ↑ (x)
α1 − iα2
ϕ↓ (x)
−α3
3
1
2
∗
∗
∗
∗
α
α
+
iα
1
(δϕ↑ (x), δϕ↓ (x)) = − 2 ig(ϕ↑ (x), ϕ↓ (x))
,
α1 − iα2
−α3
δϕ↑ (x)
δϕ↓ (x)
= 12 ig
α3
1
α + iα2
and using the equations of motion
∂L0
∂L0
− ∂µ
= 0,
∂ψ
∂(∂µ ψ)
∂L0
∂L0
− ∂µ
=0
∂ψ †
∂(∂µ ψ † )
we obtain the variation of the Lagrangian density
δL0 = − 12 igψ † σα ∂µ
= −α∂µ jµ
∂L0
∂L0
†
1
ig∂
ψ
σα
+
−
+ (ψ † → ψ)
µ
2
∂(∂µ ψ † )
∂(∂µ ψ † )
where the Noether current
jµ = − − 12 igψ † σ
∂L0
∂L0
−
†
∂(∂µ ψ ) ∂(∂µ ψ)
1
2 igσψ
is conserved, ∂µ jµ = 0, since the variation of the Lagrangian density vanishes for a
symmetry.
The current density is a vector in internal space (isospin current density) (95) .
With the Lagrangian density given above in the Klein-Gordon case, the conserved
(95)
See Quigg p34
126
current is explicitly given by
jµ = 21 igψ † σ∂ µ ψ − ∂ µ ψ † 12 igσψ
ϕ
0
1
∗
∗
1
= 2 ig(ϕ↑ , ϕ↓ ) 1 0 ∂ µ ϕ↑ i − ()∗ → ()
↓
+ 12 ig(ϕ∗↑ , ϕ∗↓ )
+
0
i
−i
0
1
ig(ϕ∗↑ , ϕ∗↓ )
2
∂µ
1
0
ϕ↑
∗
ϕ↓ j − () → ()
0 ∂ µ ϕ↑ k − ()∗ → ()
ϕ↓
−1
= 21 ig(ϕ∗↑ ∂ µ ϕ↓ + ϕ∗↓ ∂ µ ϕ↑ )i − ()∗ → ()
+ 12 ig(−iϕ∗↑ ∂ µ ϕ↓ + iϕ∗↓ ∂ µ ϕ↑ )j − ()∗ → ()
+ 12 ig(ϕ∗↑ ∂ µ ϕ↑ + ϕ∗↓ ∂ µ ϕ↓ )k − ()∗ → ()
where i, j et k are the unit vectors in isospin space. In component form, we have
jaµ = 21 igψ † σa ∂ µ ψ − ∂ µ ψ † 12 igσa ψ.
⊲ Introduction of a gauge potential (96) . Now we extend the formalism to
local gauge transformations
ψ ′ (x) = exp 12 igσα(x) ψ(x) ≡ G(x)ψ(x),
(where G(x) = exp 21 igσα(x) is a 2 × 2 matrix) or locally to
δψ(x) = 12 igσα(x)ψ(x),
but a problem occurs which will make the Lagrangian density L0 not gauge invariant.
The fact that ∂µ ψ does not obey the same gauge transformation than ψ itself
corrupts the transformation of the kinetic energy. We have ∂µ ψ ′ = (∂µ G)ψ+G(∂µ ψ).
Let us introduce a covariant derivative (97)
Dµ ≡ ∂µ + igBµ .
Here as before we use the short notation ∂µ for ∂µ 1l with 1l the 2 by 2 identity matrix.
The context suffices to distinguish between ∂µ and ∂µ 1l. Bµ = 12 σBµ = 21 σ a Bµa
(summation over a understood) is another 2 by 2 matrix (in fact there is one such
matrix for each of the 4 space-time components, Bµ is a gauge potential with three
internal components which all are 4−space-time vectors). We demand the following
transformation
Dµ ψ(x) → Dµ′ ψ ′ (x) = G(x)(Dµ ψ(x)).
(96)
See Quigg pp55-57
In analogy with electromagnetism where the covariant derivative ih̄Dµ is given by pµ − eAµ
with pµ = ih̄∂µ , which yields Dµ = ∂µ + i h̄e Aµ .
(97)
127
We obtain Dµ′ ψ ′ = (∂µ + igBµ′ )ψ ′ = (∂µ G)ψ + G(∂µ ψ) + igBµ′ Gψ. From the
requirement above, this quantity should be equal to G(∂µ + igBµ )ψ = G(∂µ ψ) +
igG(Bµ ψ). It follows an equation for the transformation of Bµ , igBµ′ Gψ =
igG(Bµ ψ) − (∂µ G)ψ. Written in terms of operators, this equation is Bµ′ G =
GBµ + gi ∂µ G. We multiply both sides by G−1 on the right to get
Bµ′
−1
= GBµ G
i −1
i
−1
+ (∂µ G)G = G Bµ + G (∂µ G) G−1 .
g
g
In the case of electromagnetism, the local gauge transformation is performed
by the operator (now an ordinary function) GEM (x) = exp(ieα(x)) with α(x)
some function, and leads to the known transformation of the gauge potential of
electromagnetism,
i
−1
A′µ = GEM Aµ G−1
EM + (∂µ GEM )GEM = Aµ − ∂µ α.
e
With the transformation of Bµ = 12 σBµ , we can deduce the gauge transformation
of Bµ as well. Consider an infinitesimal gauge transformation
G(x) = 1l + 12 igσα(x),
we have (to linear order in αi )
′
1
2 σBµ
= 21 σBµ + 14 ig((σα) (σBµ ) − (σBµ ) (σα)) − 21 ∂µ (σα).
The term in the middle, written in components, has the form
1
ig((σ a αa )(σ b Bµb )
4
− (σ b Bµb )(σ a αa )) = 41 igαa Bµb (σ a σ b − σ b σ a )
= 41 igαa Bµb 2iεabc σ c
= 21 gεcab αa Bµb σ c
= 21 g(α × Bµ ) · σ
and it follows that
′
1
2 σBµ
= 21 σBµ + 12 g(α × Bµ ) · σ − 21 ∂µ (σα).
Another common expression uses the identity (α × Bµ ) · σ = −2i
that
1
1
′
1
1
1
− 2 ∂µ (σα).
=
σB
σB
+
ig
σα,
σB
µ
µ
µ
2
2
2
2
We can also write directly
B′µ = Bµ + gα × Bµ − ∂µ α.
1
σα,
σB
such
µ
2
2
1
128
The gauge transformation of Bµ appears as a gradient term (like in electromagnetism) plus a rotation in internal space.
⊲ The field-strength tensor and field equations (98) . Let us introduce a
field-strength tensor by the 2 by 2 matrix
Fµν = 21 σFµν
from which we construct the gauge-invariant kinetic energy
(99)
Lfield = − 14 Fµν Fµν .
a
Using the identity Tr(σ a σ b ) = 2δ ab , we form − 14 Fµν Fµν = − 41 Fµν
F aµν =
11
1 a
bµν ab
a a b bµν
− 4 Fµν F δ = − 2 4 Tr(σ Fµν σ F ) and eventually
Lfield = − 12 Tr(Fµν F µν ).
The field-strength tensor is an observable quantity. It is thus supposed to be a “gauge
scalar”, that is to be independent of the choice of gauge (100) :
′
= GFµν G−1 .
Fµν
A simple transcription of the QED Faraday tensor Fµν = ∂µ Aν − ∂ν Aµ is not
satisfactory, but if we note that the QED Faraday tensor can also be written as
Fµν =
1
[D , D ] = ∂µ Aν − ∂ν Aµ + ie[Aµ , Aν ]
ie µ ν
(the commutator vanishes in the Abelian case), we can define
Fµν =
1
[D , D ] = ∂µ Bν − ∂ν Bµ + ig[Bµ , Bν ].
ig µ ν
It is easy to check that this definition has the correct gauge invariance property.
In terms of “isovectors”, the same relation becomes
1
σFµν = 21 σ∂µ Bν − 12 σ∂ν Bµ + ig 21 σBµ , 12 σBν
2
Fµν = ∂µ Bν − ∂ν Bµ − gBµ × Bν ,
where we used 21 σBµ , 12 σBν = 12 i(Bµ × Bν ) · σ. The non-Abelian character of
the theory is obvious in the definition of the field-strength tensor. Written in full
component form, the field-strength tensor reads as
Fµν a = ∂µ Bνa − ∂ν Bµa − gǫabc Bµb B c ν.
(98)
See Quigg pp58-59
This kinetic energy has the same form as in QED, LU (1) field = − 41 Fµν F µν .
(100)
In the same sense than a Lorentz scalar (i.e. a contraction) does not depend on the reference
frame.
(99)
129
From the field Lagrangian and the Euler-Lagrange equations
"
#
∂Lfield
∂Lfield
− ∂ν
= 0,
∂Bµa
∂(∂ν Bµa )
one can deduce the equations of motion (equivalent to the Maxwell equations in the
absence of charged matter current):
∂
1
1
(− Fκλ b F bκλ ) = g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd ),
a
∂Bµ 4
2
"
#
∂
1
b bκλ
∂ν
(− F F ) = −∂ν F aµν .
∂(∂ν Bµa ) 4 κλ
It appears a term (the first line) which does not exist in the case of electromagnetic
theory. This term is a current density, which is present even in the absence of matter
fields. Hence, the equations of motion are not as simple as the familiar Maxwell
equations which are linear. The Yang-Mills equations of motion are not linear, and
this is due to the fact that the gauge field carries the charge associated to the
interaction. Written in vector form, one has
∂ µ Fµν − gBµ × Fµν = 0.
In the massive case (which is not gauge invariant), a term
m2 Bµ Bµ
would be added to the Lagrangian density and the (Proca-like) equations of motion
become
∂ µ Fµν − gBµ × Fµν = m2 Bν .
⊲ Construction of a gauge-invariant interaction (101) . Since α(x) depends
on space-time, the variations δ(∂µ ψ) (or δ(∂µ ψ † )) contain an extra term which
contributes to δL0
#
"
∂L0
†
1
δL0 = − 2 igψ σα(x) ∂µ
∂(∂µ ψ † )
+ − 21 ig∂µ ψ † σ α(x) − 21 ig∂µ [α(x)] ψ † σ
∂L0
+ (ψ † → ψ)
∂(∂µ ψ † )
= −α(x)(∂µ jµ ) − (∂µ α(x))jµ
(101)
This section may be omitted. It presents step by step the construction of a gauge invariant
Lagrangian which is obtained faster by the minimal coupling requirement presented later. The
approach used here follows the presentation of Ryder pp96-98 in the case of Abelian U (1) gauge
symmetry.
130
The first term vanishes thanks to Noether theorem, but the second term,
−(∂µ α(x))jµ persists, so L0 is not gauge invariant under local gauge transformations.
In order to compensate this new term, we must add another contribution to the
Lagrangian,
L1 = −jµ Bµ
and demand that Bµ obeys the gauge transformation. Now,
δL0 + δL1 = −α(∂µ jµ ) − (∂µ α)jµ − jµ δBµ − δjµ Bµ ,
where only the first term vanishes identically. Performing the variation of jµ yields
−δjµ = − 12 igδψ † σ∂ µ ψ − 21 igψ † σδ(∂ µ ψ) + (ψ † → ψ)
= − 12 ig − 21 igψ † σα σ∂ µ ψ
− 21 igψ † σ 12 igσ∂ µ αψ + 21 igσα∂ µ ψ + (ψ † → ψ)
= 14 g 2 ψ † [σ, σα] ∂ µ ψ + 14 g 2 ∂ µ ψ † [σ, σα] ψ + 14 g 2 ψ † {σ, σ∂ µ α} ψ
= − 21 ig 2 ψ † σ × α∂ µ ψ − 21 ig 2 ∂ µ ψ † σ × αψ + 12 g 2 ∂ µ αψ † ψ
We have used the identities [σ, σα] = −2iσ × α and {σ, σ∂ µ α} = 2∂ µ α which are
proven by the use of Pauli matrices properties [σ a , σ b ] = 2iεabc σ c and {σ a , σ b } =
2δab 1l. The three remaining terms are equal to
−(∂µ α)jµ = − 21 igψ † σ∂µ α∂ µ ψ + (ψ † → ψ),
−jµ δBµ = −gjµ · (α × Bµ ) − jµ ∂µ α,
−δjµ Bµ = − 21 ig 2 ψ † (σ × α) · Bµ ∂ µ ψ − 21 ig 2 ∂ µ ψ † (σ × α) · Bµ ψ
+ 12 g 2 ∂ µ αBµ ψ † ψ
= +gjµ · (α × Bµ ) + 21 g 2 ∂ µ αBµ ψ † ψ,
where we have used the cyclic property (σ × α) · Bµ = (α × Bµ ) · σ. The sum
eventually gives only
δL0 + δL1 = 12 g 2 ∂ µ αBµ ψ † ψ
We still have to add another term which should eventually make the whole
Lagrangian gauge invariant,
L2 = 14 g 2 ψ † Bµ Bµ ψ = 41 g 2 Bµ Bµ ψ † ψ.
The variation of L2 reads as
δL2 = 41 g 2 (Bµ δBµ ψ † ψ + δBµ Bµ ψ † ψ + Bµ Bµ δ(ψ † ψ))
= 12 g 2 Bµ δBµ ψ † ψ
= − 12 g 2 Bµ (g(α × Bµ ) + ∂ µ α)ψ † ψ
= − 12 g 2 Bµ ∂ µ αψ † ψ
131
and we obtain the expected vanishing variation
δL0 + δL1 + δL2 = 0
which proves that the gauge invariant interaction in the presence of gauge fields
contains two terms,
L1 + L2 = −jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ.
The kinetic energy of the gauge field itself was not included, and the free particle
contribution is also missing.
⊲ Covariant derivative, minimal coupling. The introduction of the gauge
covariant derivative facilitates the calculations. The action should not depend on
the gauge choice, since the equations of motion are independent of the gauge. The
Lagrangian density should thus be a gauge scalar. The potential term is already a
gauge scalar, since it depends only on ψ † ψ which transforms covariantly according
to ψ ′† ψ ′ = (ψ † G−1 )(Gψ). In order to become manifestly gauge covariant, the kinetic
term should be written as (Dµ ψ)† (D µ ψ), since the covariant derivative of the field
Dµ ψ was constructed for the purpose of obeying the same gauge transformation
than the field itself, (Dµ ′ ψ ′ )† (D µ ′ ψ ′ ) = (Dµ ψ)† G−1 G(D µ ψ).
The minimal coupling is the prescription that the interaction with the gauge
field is obtained by the replacement ∂µ ψ → Dµ ψ in the Lagrangian density (102) :
L = (Dµ ψ)† (D µ ψ) − V (ψ † ψ)
= ∂µ − 21 igσBµ ψ † ∂ µ + 12 igσBµ ψ − V (ψ † ψ)
= ∂µ ψ † ∂ µ ψ − 12 igψ † σBµ ∂ µ ψ + 21 ig∂ µ ψ † σBµ ψ
+ 14 g 2 ψ † (σBµ )(σBµ )ψ − V (ψ † ψ)
= ∂µ ψ † ∂ µ ψ − jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ − V (ψ † ψ)
where in the last term use has been made of the identity
(σBµ )(σBµ ) = (σ a Bµa )(σ b B bµ )
B1 B 1 + B2 B 2 + B3 B 3
=
0
0
B1 B 1 + B2 B 2 + B3 B 3
= Bµ Bµ 1l.
This operation is called gauging the Lagrangian. Note that in the case of
fermionic particles, we have to use the Dirac Lagrangian density iψ̄γ µ ∂µ ψ, with
ψ̄ = ψ † γ 0 the adjoint spinor and γ µ the Dirac matrices (103) instead of the kinetic
energy ∂µ ψ † ∂ µ ψ, and the gauge invariant Lagrangian becomes
L = ψ̄(iγ µ Dµ − m)ψ − 41 Fµν Fµν .
In an expression such that ∂µ − 12 igσBµ ψ † , it is understood that σBµ acts on ψ † on the
(102)
left.
(103)
See e.g. Ryder pp43-46
132
⊲ Conserved current in the presence of gauge fields. In the presence of
gauge fields, the conserved Noether current can be written in terms of the covariant
derivative,
Jµ = − − 21 igψ † σ
∂L0
∂L0
−
†
∂((Dµ ψ) ) ∂(Dµ ψ)
1
2 igσψ
In the case of the SU (2) Lagrangian, it becomes
Jµ = 12 igψ † σD µ ψ − (D µ ψ)† 21 igσψ
= 12 igψ † σ ∂ µ ψ + 12 igσBµ ψ − ∂ µ ψ † − 21 igσBµ ψ † 12 igσψ
= jµ − 14 g 2 ψ † [σ, σBµ ] ψ.
We see that the conserved current in the presence of gauge fields has two
contributions, one coming from the ordinary matter current and the other from
the gauge field itself. Using the identity [σ, σBµ ] = −2iσ × Bµ , we get
Jµ = jµ + 21 ig 2 ψ † σ × Bµ ψ.
In component form we have
1
J aµ = j aµ − ig 2 ψ † εabc σ b B cµ ψ.
2
The current density Jµ is conserved in the ordinary sense
(104)
,
µ
∂µ J = 0
while jµ satisfies a gauge-covariant conservation law
Dµ jµ = 0.
Now, the Euler-Lagrange equations of the matter field in the presence of the
gauge field contain a new term,
"
#
∂Lint
∂Lfield
∂Lfield
+
− ∂ν
= 0,
∂Bµa
∂Bµa
∂(∂ν Bµa )
and lead to the equations of motion in the presence of charged matter:
1
1
1
− g(ψ † σ a ∂ µ ψ − ∂ µ ψ † σ a ψ) + 2g 2 ψ † B aµ ψ
2
2
2
1
+ g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd )
2
= ∂ν F aµν
This can be rewritten in vector form, specifying Jν as the matter current only, as
∂ µ Fµν − gBµ × Fµν = Jν .
(104)
See Weinberg II pp12-13
133
9
Spontaneous symmetry breaking
The question considered in this chapter is that of the mass of the particles which
carry the fundamental interactions (gauge bosons). As we have seen, local gauge
symmetry constrains the field Lagrangian density to contain only massless terms
− 14 F F , since massive terms like −m2X X 2 for a gauge field X would not be locally
gauge invariant. This constraint does not apply to the fermionic sector, since terms
such as −m2φ φ2 are invariant under local gauge transformations (although the
problem of a non zero mass of fermions will also occur for other reasons). The above
observation does not introduce any trouble in the case of U (1) gauge symmetry,
since its physical realization, the electromagnetic interaction is carried by massless
gauge particles, namely the photons. This is not true for the SU (2) counterpart,
a priori realized by the weak interaction for which the gauge bosons are known to
be the massive particles W ± and Z 0 . The question thus arises to find the origin of
the appearence of a non zero mass in the gauge sector of the theory. The notion of
spontaneously broken symmetry, as encountered in the physics of second-order phase
transitions and critical phenomena will help in solving the problem. This solution is
called in the context of particle physics Higgs mechanism.
Spontaneous breaking of global gauge symmetries
⊲ Discrete symmetries. Let us first consider spontaneous breaking of a global
discrete symmetry. It is illustrated by the case of the real scalar field,
L = 12 ∂µ φ∂ µ φ − V (φ(x)),
where V (φ(x)) is a potential which depends on the field configuration. We will
consider two cases
λ
µ2
V (φ) = φ4 ± φ2 , λ, µ2 > 0.
4
2
134
Case 1 with the sign + corresponds to a scalar field theory with square mass µ2 . Let
us first build the Hamiltonian,
H = 21 (∂0 φ)2 + 21 (∇φ)2 + V (φ).
The field with the lowest energy (also called the ground state configuration, which
would be denoted φ0 = hΩ|φ̂|Ωi in the quantized version of the theory) is a constant
field which minimizes the potential. In case 1, it corresponds to a vanishing field
φ0 = 0. The discrete Z2 symmetry φ → −φ of the Lagrangian is also a symmetry of
the ground state. In case 2, with sign − in the potential, the constant ground state
field is given by
µ
φ0 = ± √ = ±v.
λ
While the Lagrangian still possesses the φ → −φ symmetry, in any of the two
degenerate ground states, this Z2 symmetry is broken. This situation occurs in the
low temperature phase of second order phase transitions, when an ordered ground
state emerges (for example a ferromagnetic ground state), which does not respect
the full symmetry of the Hamiltonian (e.g. the “up-down” symmetry in an Ising
model, or rotational symmetry (this is a continuous symmetry in this case) in the
case of an Heisenberg model). It is instructive to study the field fluctuations around
the ground state. For this purpose, we let
φ = v + h,
h ≪ v,
(v is chosen positive without loss of generality) and we remind that V ′ (φ) =
λφ3 − µ2 φ, V ′′ (φ) = 3λφ2 − µ2 , V ′′′ (φ) = 6λφ, and V ′′′′ (φ) = 6λ. The potential
is now
V (φ) = V (v) + hV ′ (v) + 12 h2 V ′′ (v) + 16 h3 V ′′′ (v) +
1 4 ′′′′
(v)
24 h V
√
µ4
+ 0 + 12 2µ2 h2 + λµh3 + 14 λh4 .
λ
√
We note that the new field h acquired a mass 2µ (the coefficient of the quadratic
term in h is now positive).
⊲ Continuous symmetries. Spontaneous breaking of a global continuous
symmetry can be encountered in the SO(2) model (rotations in the plane). We
consider now a theory with two real scalar fields φ1 (x) and φ2 (x), and with the
potential
= − 14
V (φ1 , φ2 ) = 14 λ(φ21 + φ22 − v 2 )2 = 41 λ(|φ|2 − v 2 )2 .
The fields φ1 and φ2 are massless (the coefficients of the quadratic terms are negative)
and the theory is invariant under rotations in the plane,
φ′1
φ′2
=
cos θ
− sin θ
sin θ
cos θ
φ1
φ2
.
135
Figure 9.1 The “Mexican hat potential” (from E.A. Paschos, Electroweak theory,
Cambridge University Press, Cambridge 2007.
The minima of the potential lie on the circle
|φ0 |2 = φ210 + φ220 = v 2 .
As a result of the continuous symmetry, they are infinitely degenerate. In order to
analyze the field fluctuations around the minimum, we choose a particular vacuum
state φ10 = v, φ20 = 0 and denote the fluctuations by
φ1 = v + h1 ,
φ2 = h2
in terms of which the potential becomes
V (h1 , h2 ) = 14 λ(h21 + h22 + 2vh1 )2 .
Expansion of this potential shows that h1 becomes massive while h2 remains
massless, and the appearance of cubic terms breaks the original SO(2) symmetry.
The massless field is called a Goldstone mode (or Nambu-Goldstone mode). It is
easy to understand why h2 remains massless while h1 acquired a mass: close to the
minimum which we have selected, φ1 fluctuations have to survive to the potential
growth, these are amplitude fluctuations in a polar representation of the model,
while φ2 fluctuations correspond to phase fluctuations which do not cost any energy.
Spontaneous breaking of local symmetries
A new phenomenon occurs with local gauge theories, where the selection of a
particular minimum and the fluctuations around this minimum lead to massive gauge
fields which would otherwise be forbidden, since mass terms for the gauge field would
break gauge invariance. At the same time, the Goldstone mode disappears.
We consider the Lagrangian density of U (1) gauge theory,
L = − 41 Fµν F µν + (Dµ φ)∗ (D µ φ) − V (φ∗ φ),
with the potential
V (φ∗ φ) = −µ2 φ∗ φ + λ(φ∗ φ)2 .
136
As we have seen before, the theory is invariant under the gauge transformation
corresponding to a local rotation of the scalar field in the complex plane
φ(x) → eieα(x) φ(x)
Aµ (x) → Aµ (x) − ∂µ α(x).
Let us define two real fields θ(x) and h(x), associated to the phase and the amplitude
fluctuations around a particular (chosen real) minimum √12 v = (µ2 /2λ)1/2 ,
1
φ(x) = eiθ(x)/v √ (v + h(x)).
2
The local gauge transformation defined by eα(x) = −θ(x)/v eliminates θ(x), since
1
φ′ (x) = e−iθ(x)/v φ(x) = √ (v + h(x)),
2
1
A′µ (x) = Aµ (x) + ∂µ θ(x).
ev
The net effect in the Lagrangian density is the following,
′
F′
L = − 14 Fµν
µν
µ
+ (D ′ µ φ′ )∗ (D ′ φ′ ) + 12 µ2 (v + h2 (x))2 − 14 λ(v + h(x))4 ,
with D ′ µ = ∂µ + ieA′µ . When rewritten in terms of the transformed gauge field, the
kinetic energy term generates the mass for the gauge field A′µ :
µ
µ
(D ′ µ φ′ )∗ (D ′ φ′ ) = 12 ∂µ h∂ µ h + 12 e2 A′µ A′ (v 2 + 2hv + h2 ),
and, as we announced, the Goldstone mode θ(x) was absorbed in the re-definition
of the gauge field.
This mechanism is not at work in the case of the free electromagnetic field
(photons are massless gauge bosons of U (1) interaction), but it is known in condensed
matter physics as the Anderson mechanism (see next section), and it occurs in
superconductivity, where the non-zero mass (which also defines a characteristic
length scale) of the gauge field is responsible for the Meissner effect (the fact that
the magnetic field is expelled from the bulk of the material). In particle physics, this
mechanism enables to give a mass to the gauge bosons, as we discuss below. This is
known in this context as the Higgs mechanism.
The Anderson mechanism
We will first reproduce all the generic arguments given before in the relativistic
U (1) case before considering the application to superconductivity.
⊲ Gauge invariance in non relativistic quantum mechanics. Since
we are interested in this section by non relativistic quantum mechanics, we will
not distinguish between contravariant and covariant indices, i.e. xi = x, y, z and
∂
∂i = ∂x
. Summation is understood as soon as an index is repeated in an expression.
i
The space part of an expression like ∂µ ψ ∗ ∂ µ ψ will thus simply be denoted as
~ 2 ψ. Due to this non-covariant notation,
∂i ψ ∗ ∂ i ψ = −∂i ψ ∗ ∂i ψ, and ∂i ∂i ψ stands for ∇
137
there are other minus signs here and there, for instance in the definition of the field
tensor Fij = −(∂i Aj − ∂j Ai ).
The Lagrangian density for non relativistic quantum mechanics is given by an
expression due to Jordan and Wigner (here written in a symmetric form)
L0 = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
∂ ψ ∗ ∂i ψ − V ψ ∗ ψ.
2m i
The Euler-Lagrange equation (variation with respect to ψ ∗ ) indeed leads the
Schrödinger equation,
∂L0
= 21 ih̄ψ̇ − V ψ,
∂ψ ∗
∂L0
= − 12 ih̄ψ̇,
∂t
∗
∂ ψ̇
h̄2
∂L0
=
−
∂ ∂ ψ.
∂i
∂(∂i ψ ∗ )
2m i i
and we have
ih̄ψ̇ = −
h̄2
∂ ∂ ψ + V ψ.
2m i i
Once we have noticed that the Lagrangian density is a function of ψ, ψ̇, and ∂i ψ (as
well as their complex conjugates), its variation under an infinitesimal global gauge
transformation δψ = h̄i eαψ leads to
∂L0
∂L0
i
∂L
∂L0
∗
∗
+ ψ ∂t
+ ∂i ψ ∗
δL0 = − eα ψ ∂i
+ ψ̇ ∗ 0
h̄
∂(∂i ψ ∗ )
∂(∂t ψ ∗ )
∂(∂i ψ ∗ )
∂ ψ̇ ∗
− (ψ ∗ ←→ ψ)
= −α[∂i ji + ∂t ρ],
(use has been made of the equations of motion) where
eh̄
(ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) ,
2mi
ρ = eψ ∗ ψ.
ji =
Notice that this continuity equation is usually written in the standard form
~ ~j + ∂ρ = 0.
∇
∂t
In the presence of an electromagnetic field (relativistic in essence), we use the
minimal coupling
D i = ∂i +
i
eA
h̄ i
138
and we add the field Lagrangian contribution (for further purpose, we will only
consider the magnetic contribution and only in a static situation, i.e. − 14 Fij Fij )
(Fij = −(∂i Aj − ∂j Ai )),
L = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
(D ψ)∗ (Di ψ) − V ψ ∗ ψ − 14 Fij Fij .
2m i
The gauge field Ai is changed by a local gauge transformation,
i
ψ ′ (x) = ψ(x)e h̄ eα(x) ,
A′i (x) = Ai (x) − ∂i α(x),
but the field tensor Fij is unaffected. The equations of motion in the presence of the
gauge field are modified (105) ,
∂i
e2
eh̄ ∗
∂L
[ψ (∂j ψ) − (∂j ψ ∗ )ψ] − Aj ψ ∗ ψ,
=
∂Aj
2mi
m
!
∂
∂L
1
(F F )
= − ∂i
∂(∂i Aj )
4 ∂(∂i Aj ) kl kl
= ∂i Fij ,
leading to Maxwell equations
∂i Fij = Jj ,
where the current density is also recovered from the expression
Ji =
=
eh̄
(ψ ∗ (Di ψ) − (Di ψ)∗ ψ)
2mi
eh̄
e2
(ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) − Ai ψ ∗ ψ.
2mi
m
The Schrödinger equation follows from the variation w.r.t. ψ ∗ ,
h̄2
i
e2
∂L
1
= 2 ih̄ψ̇ − V ψ −
eA ∂ ψ + 2 Ai Ai ψ ,
∂ψ ∗
2m h̄ i i
h̄
∂L0
= − 12 ih̄ψ̇,
∂t
∂ ψ̇ ∗
h̄2
i
∂L0
=−
∂i ∂i ψ − e∂i Ai ψ .
∂i
∂(∂i ψ ∗ )
2m
h̄
(105)
Note here a modification in the usual signs.
139
Collecting the different terms, we get
ih̄ψ̇ = V ψ +
1
[−ih̄∂i − eAi ][−ih̄∂i − eAi ]ψ
2m
provided that the Coulomb gauge ∂i Ai = 0 is chosen.
⊲ Gauge symmetry breaking. We will now suppose that the gauge symmetry
is spontaneously broken, i.e. the uniform ground state wave function which minimizes
the potential energy is allowed to amplitude and phase fluctuation (for convenience,
the phase fluctuations are removed by a local gauge transformation) and the
amplitude fluctuations couple to the gauge field in such a way that the gauge field
becomes massive. The initial Lagrangian density
L = 21 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) −
h̄2
(D ψ)∗ (Di ψ) − V (ψ ∗ ψ) − 14 Fij Fij
2m i
is gauge invariant. The potential energy has a minimum |ψ0 | (e.g. in the p
following
µ2 /2λ)
calculations V (ψ ∗ ψ) = −µ2 ψ ∗ ψ + λ(ψ ∗ ψ)2 has a minimum at |ψ0 | =
which can be chosen real positive ψ0 . We now allow for local amplitude and phase
fluctuations around this minimum,
ψ(x) = (ψ0 + h(x))eiθ(x) ,
with h(x) and θ(x) two real functions (and h(x) small w.r.t. ψ0 ).
A convenient gauge transformation
i
ψ ′ (x) = ψ(x)e h̄ eα(x) ,
e
α(x) = −θ(x)
h̄
makes the analysis simpler, since it eliminates the phase fluctuations,
ψ ′ (x) = ψ0 + h(x)
and also changes the gauge field
A′i (x) = Ai (x) +
h̄
∂ θ(x).
e i
The Lagrangian density is left unchanged by the gauge transformation, but written
in terms of the gauged variables it reads
∗
∗
L = 12 ih̄(ψ ′ ψ̇ ′ − ψ̇ ′ ψ ′ ) −
h̄2
∗
(D ′ ψ ′ )∗ (Di′ ψ ′ ) − V (ψ ′ ψ ′ ) − 41 Fij′ Fij′ .
2m i
The first term is identically zero, the second term once expanded leads to
e2 ′ ′
h̄2
2
∂i h∂i h + 2 Ai Ai (ψ0 + h) ,
−
2m
h̄
the third term to
− µ2 (ψ0 + h)2 + λ(ψ0 + h)4
140
(or any other form depending on the potential), and the last gauge invariant term
− 14 Fij′ Fij′
has the usual form for the field kinetic energy, but here given in terms of the
gauged vector potential. The essential novelty stands in the second term where
an extra dependence of the gauge field occurs, ∼ ψ0 A2i , coupled to the ground state
expectation value. This is a mass term which is also denoted as
1 2
2 mA
=
e2 2
ψ0 .
h̄2
Variation of L w.r.t. h(x) leads to the equation of motion known as the GinzburgLandau equation in the context of superconductivity,
∂L
∂L
= ∂i
,
∂h(x)
∂(∂i h(x))
h̄2
e2 ′ 2
Ai (x)(ψ0 + h(x)) + 2µ2 (ψ0 + h(x)) − 4λ(ψ0 + h(x))2 = ∂i ∂i h(x).
m
m
This equation contains information about the Cooper pair wave function ψ0 + h(x)
and it involves a characteristic length scale known as the coherence length,
ξ −2 =
2mµ2
.
h̄2
The coherence length ξ is for example a measure of the length scale needed to attain
the condensate wave function in the bulk of a superconductor from a free surface.
Variation of L w.r.t. the gauge field leads to
∂L
∂L
= ∂i
,
∂A′j (x)
∂(∂i A′j (x))
−
e2 ′
A (x)(ψ0 + h(x))2 = ∂i Fij′ .
m i
The l.h.s. corresponds to the London current density Jj (proportional to the gauge
field instead of the usual Ohm law Jj = σEj in a normal metal). This equation
also involves a typical length scale κ inversely proportional to the Cooper pair wave
function,
κ−2 =
e2 2
ψ .
m 0
This parameter gives an information about the length scale needed to expel the gauge
field from the bulk of a superconductor, a phenomenon known as the Meissner effect.
h̄2
It is completely governed by the gauge field mass, κ−2 = 2m
m2A .
The phenomenology of type I and type II superconductors is essentially described
in terms of the two length scales ξ and κ. If κ ≪ ξ, the magnetic field does not
141
penetrate at all in the bulk of a superconductor (type I), while in the other limit,
there exist regions of normal phase with non zero magnetic field (Abrikosov vortices)
inside superconducting regions (mixed phase of type II superconductors).
Gauge symmetric electroweak SU (2)W × U (1)Y theory
The electroweak symmetry breaking scenario (106) discovered by Salam and
Weinberg describes the emergence of the present structure of electromagnetic and
weak interactions as the broken gauge symmetry phase of a symmetric (unbroken)
phase SU (2)W × U (1)Y which existed in earlier times (higher energy scales) of the
Universe. With the spontaneous symmetry breaking scenario, some of the bosonic
degrees of freedom (the gauge fields) acquire mass. In the symmetric phase, the
relevant (non massive) fermionic particles (the electron and the neutrino) consist
in a right-handed (107) electron R = eR in an (weak) isospin singlet IW = 0 and
an isospin doublet IW = 21 made of the left-handed electron and the unique (leftν
handed) neutrino L = e e . The bosons are all non massive. The charges carried
L
3
by the leptons follow from their weak isospin component IW
and their hypercharge
Y,
3
+
Q = IW
Y
.
2
The hypercharge of the doublet is thus YL = −1 and that of the singlet is YR = −2.
Under the non-Abelian weak isospin gauge transformation SU (2)W , the fields change
according to
R −→ R,
SU (2)W
L −→ exp
SU (2)W
1
2 igσα
L,
and under the Abelian U (1)Y symmetry, they become
R −→ exp(−ig ′ β)R,
U (1)Y
L −→ exp(−ig ′ β/2)L.
U (1)Y
Note that the isospin coupling is g while the hypercharge coupling is conventionally
called g ′ /2.
SU (2)W × U (1)Y is made a local gauge symmetry through the introduction of
gauge fields Wµ and Xµ with the covariant derivative
Dµ L = ∂µ L + 12 igσWµ L − 12 ig ′ Xµ L,
Dµ R = ∂µ R − ig ′ Xµ R,
(106)
See Ryder pp307-312
In the Dirac Lagrangian iψ̄γ µ ∂µ ψ − mψ̄ψ, the right-handed and left-handed spinors are
defined as R = 12 (1 + γ5 )ψ and L = 21 (1 − γ5 )ψ. Since γ5 and γµ commute, it follows that
iψ̄γ µ ∂µ ψ = iL̄γ µ ∂µ L + iR̄γ µ ∂µ R.
(107)
142
where Wµ is a weak triplet gauge (non-massive) boson IW = 1 with hypercharge
zero and Xµ is also a non-massive boson which has zero hypercharge, but is in an
isospin singlet IW = 0.
We consider non massive fermions, otherwise a term like m2 L̄L would assign the
same mass to the electron and the neutrino (108) . If we forget about the pure gauge
field contributions, the kinetic part of the Lagrangian in the minimal coupling is
given by Dirac Lagrangian (the leptonic particles are fermions with spin 12 ) i.e.
L = iR̄γ µ ∂µ − ig ′ Xµ R + iL̄γ µ ∂µ + 12 igσWµ − 21 ig ′ Xµ L
The weakness of the gauge invariant formulation is obviously that it contains 4
massless gauge fields, while Nature (at the present energy scales) has only one, and
that the fermions are similarly all non massive (if the electron would have a non
zero mass in this theory, the corresponding neutrino would share the same mass,
since it appears as the second component of an isospin doublet). The spontaneous
symmetry breaking scenario leads to 3 massive gauge fields and at the same time,
the electron acquires mass as well (but not the neutrino!).
The Higgs mechanism
The symmetry is broken by introduction of a (bosonic) complex Higgs field
+
1
θ1 + iθ2
φ
φ=
=√
.
φ0
2 θ3 + iθ4
This is an isospin doublet IW =
1
2
with hypercharge unity Yφ = 1,
Dµ φ = ∂µ + 12 igσWµ + 12 ig ′ Xµ φ,
and a Lagrangian of the form
LHiggs = (Dµ φ)† (D µ φ) − m2 φ† φ − λ(φ† φ)2 + interaction with leptons.
The potential V (|φ|) = m2 φ† φ
spontaneous symmetry breaking
field, the choice θ3 = v is made
other θi ’s. Fluctuations around v
1
φ(x) = √
2
+ λ(φ† φ)2 is chosen such √
that it gives rise to
with |φ|2 = −m2 /2λ = v/ 2. For the classical
and a local gauge transformation eliminates the
are introduced through
0
v + h(x)
.
Acting with the covariant derivative gives
1
Dµ φ = √
2
(108)
1
ig(Wµ1 − iWµ2 )(v + h(x))
2
∂µ h − 12 i(gWµ3 − g ′ Xµ )(v + h(x))
!
Particles in an isospin multiplet have approximately the same mass. This is the case for the
strong isospin already, e.g. the proton and the neutron which form an isospin doublet, or the
π−mesons which form an isoispin triplet.
143
and reported in the Lagrangian density, this leads to (up to cubic terms)
LHiggs = 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4
+ 14 g 2 v 2 (Wµ1 W µ1 + Wµ2 W µ2 ) + 41 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ )v 2
= 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4
2
Wµ+ W −µ + 21 MZ2 Zµ Z µ ,
+ MW
where the charged massive vector bosons are
√
Wµ± = (Wµ1 ∓ iWµ2 )/ 2
2
with masses MW
= 14 g 2 v 2 and the neutral massive boson is such that
µ
2
1
2 MZ Zµ Z
(109)
= 81 v 2 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ )
2
3µ
g
−gg ′
3∗
∗
W
1 2
= 8 v (Wµ , Xµ )
Xµ
−gg ′
g′ 2
3µ
2
∗
∗
0
Z
M
1
Z
.
= 2 (Zµ , Aµ )
0
0
Aµ
The last line is obtained by a diagonalization of the mass matrix by an orthogonal
transformation
Zµ = cos θW Wµ3 − sin θW Xµ
Aµ = sin θW Wµ3 + cos θW Xµ ,
and the masses of the neutral fields are
2
MZ2 = 41 v 2 (g 2 + g ′ )
MA2 = 0.
The coupling constant of the (charged) leptons and the electromagnetic gauge field
gets the value
e = g sin θW .
With the symmetry breaking scenario, the coupling between the Higgs fields and
the leptons of the theory (Yukawa term which forms a Lorentz scalar by the coupling
between a Dirac spinor with a scalar field) in
− Ge (R̄φ∗ L + L̄φR)
similarly leads to massive electrons
√
me = Ge v/ 2.
(109)
See Cheng and Li p351
See Quigg p110
(110)
(110)
144
L’Univers primordial
145
146
147
10
L’inflation cosmologique
Un certain nombre de problèmes cosmologiques sont résolus au prix de l’hypothèse
que dans son histoire primordiale, l’Univers a connu une phase d’expansion extrême.
Cette phase peut prendre naissance sous l’effet d’un champ scalaire ayant des
propriétés bien déterminées. C’est ce que la théorie de l’inflation permet de réaliser.
Introduction
Nous avons vu que le modèle cosmologique standard - dont l’évolution
“friedmanienne” est gouvernée par les trois formes principales d’énergie, Radiation,
Cold Matter et Λ - souffre de certaines difficultés. Parmi ces difficultés, celles qui
sont liées à la nature très particulière des conditions initiales, ou celles qui sont liées
aux problèmes de dilution d’objets ultramassifs peuvent être résolues grâce à un
scénario ingénieux, a priori artificiel, mais qui en fait est extrêmement générique.
Ce scénario est celui de l’inflation. Avant d’en présenter les grandes lignes, revenons
rapidement sur ces problèmes de conditions initiales.
Le problème de l’horizon peut être vu comme un problème de conditions initiales
relatives aux positions(111) . L’univers observable actuellement, d’une taille de l’ordre
de ct0 , est homogène à mieux que 10−5 près en valeur relative. A un instant antérieur
t< dans l’histoire de l’Univers, cet Univers homogène avait une extension spatiale
dans un rapport a(t< )/a0 , soit lh ≃ ct0 a(t< )/a0 . Or, à cet instant antérieur, la taille
de la région causale était de l’ordre de lc ≃ ct< . En supposant pour simplifier que le
passé de l’Univers est essentiellement dominé par le rayonnement, le facteur d’échelle
varie comme l’inverse de la température, a ∼ T −1 (car a ∼ ρ−1/4 et ρc2 ∼ T 4 ), de
sorte que le rapport de ces deux longueurs vaut
(111)
V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press.
148
lh /lc ≃
t T
1017 1
t0 a(t< )
∼ 0 0 ≃ −43 32 ≃ 1028
t < a0
t < T<
10
10
en prenant pour instant antérieur l’échelle de Planck. Il n’est pas crucial de fixer cette
échelle. On pourrait par exemple choisir celle de la brisure de symétrie électrofaible,
le nombre obtenu serait moins gigantesque, mais serait tout de même démesuré.
Si l’on interprète ce résultat, cela signifie que notre Univers homogène actuel est
le résultat de l’évolution friedmanienne d’une ‘bulle’ initiale composée typiquement
de 1084 domaines non connectés causalement ! Dans ces conditions, l’homogénéité
(c’est-à-dire le fait que la température actuelle du CMB soit partout de l’ordre de
3 kelvins à des fluctuations près de l’ordre de 10−5 en valeur relative) est difficile à
comprendre autrement que par un jeu de conditions initiales très particulier. Il faut
ensuite trouver un mécanisme conduisant de façon plus ou moins inévitable à ces
conditions initiales.
Pour ce qui concerne les conditions initiales sur la distribution des vitesses,
on peut faire une estimation grâce au raisonnement suivant : l’énergie mécanique
totale (d’un élément de covolume) est conservée, soit KE< + V< = KE0 + V0 .
Or, les énergies cinétiques sont dans le rapport des vitesses d’expansion au carré,
KE< /KE0 ∼ (ȧ< /ȧ0 )2 , de sorte que l’on peut écrire, en divisant par KE< ,
|V |
KE0 − V0
|V |
1− < =
=1− 0
KE<
KE<
KE0
ȧ0
ȧ<
2
.
Les rapports de vitesses d’expansion sont de l’ordre de ȧ0 /ȧ< ≃ (a0 /a< )(t< /t0 ) ≃
1032 10−43 /1017 = 10−28 , soit
1−
|V< |
|V |
= 1 − 0 10−56
KE<
KE0
et à l’époque actuelle, l’Univers est plat avec une très bonne approximation, ce qui
signifie que KE0 et |V0 | sont du même ordre de grandeur. Il faut donc que KE<
et |V< | aient été gigantesques, mais égaux à mieux que 56 décimales au temps de
Planck pour expliquer leurs valeurs prises aujourd’hui ! Ce problème est lié à celui
de la platitude.
Ces deux problèmes seraient résolus si l’on pouvait invoquer un mécanisme qui
conduise de manière typique à ces conditions initiales apparemment si particulières.
Il faut pour cela que le facteur d’échelle actuel de l’Univers soit considérablement
plus grand (le rapport lh /lc serait alors plus petit d’autant), au moins d’un facteur
1032 , et de même, il faut que la vitesse d’expansion actuelle soit considérablement
plus élevée dans un rapport approximativement du même ordre.
L’inflation est une phase d’expansion exponentielle du facteur d’échelle. Pour
obtenir cette phase, considérons un champ scalaire φ (appelé l’inflaton) dont nous
allons chercher les équations du mouvement. On veut produire une phase de l’Univers
dans laquelle ä(t) > 0, ce qui nécessite ρφ c2 + 3pφ < 0, soit
1
pφ = wφ ρφ c2 < − ρφ c2 .
3
Bien que l’on cherche des effets similaires à ceux produits par la constante
cosmologique (wΛ = −1), celle-ci ne peut pas convenir car au début de l’Univers, sa
149
contribution à la dynamique est parfaitement négligeable (ΩR ≫ ΩM ≫ ΩΛ ). Un
champ scalaire en revanche peut jouer le rôle voulu, car comme on va le voir,
ρφ c2 ≃
pφ ≃
h̄2 2
φ̇ + V (φ),
2c2
h̄2 2
φ̇ − V (φ),
2c2
de sorte que l’on peut espérer trouver des conditions qui permettent d’atteindre
wφ ≃ −1 pour peu que le potentiel ait des propriétés convenables.
Dans un espace-temps de Minkowski, l’équation de mouvement d’un champ
scalaire réel (non chargé) libre s’écrit (Klein-Gordon)
m2 c2
∂µ ∂ + 2
h̄
µ
φ = 0.
Le d’Alembertien, ∂µ ∂ µ φ, que l’on peut aussi écrire η µν φ,µν , devient, dans un espacetemps courbe de métrique définie par g µν ,
g µν φ,µν − Γαµν φ,α .
C’est une forme de couplage minimal du champ scalaire à la métrique(112) , de sorte
que l’équation de Klein-Gordon devient
g µν φ,µν − Γαµν φ,α +
m2 c2
φ = 0.
h̄2
En appliquant ces équations (auxquelles on ajoute un terme d’énergie potentielle
2 2
V (φ) plus général que le simple terme de masse 21 mh̄2c φ2 et dont on précisera les
propriétés ultérieurement) au cas de la métrique de Friedmann-Robertson-Walker,
la première équation de Friedmann devient celle d’un oscillateur harmonique amorti
par l’expansion de l’Univers :
h̄2
h̄2 ȧ
φ̈
+
3
φ̇ + V ′ (φ) = 0
c2
ac2
Dans la suite nous allons établir cette équation d’une autre manière, et établir
également les équations de Friedmann.
1 σρ
(gµρ,ν +gνρ,µ −gµν,ρ )
Rappels sur la dérivée covariante : les symboles de Christoffel Γσ
µν = 2 g
permettent de généraliser la dérivée ordinaire ∂κ à la dérivée covariante Dκ . Appliquée à un champ
α
de vecteurs, on a ∂κ Aµ ≡ Aµ,κ et Dκ Aµ ≡ Aµ;κ = Aµ,κ − Γα
µκ Aα = ∂κ Aµ − Γµκ Aα . Dans le cas
d’un tenseur de rang 2, on forme par exemple la combinaison (Aµ Bν ) dont on calcule la dérivée
covariante en distribuant les opérations de dérivation, (Aµ Bν );κ = (Dκ Aµ )Bν + Aµ (Dκ Bν ) =
α
α
α
(Aµ,κ − Γα
µκ Aα )Bν + Aµ (Bν,κ − Γνκ Bα ) = (Aµ Bν ),κ − Γµκ (Aα Bν ) − Γνκ (Aµ Bα ), soit finalement
α
α
Tµν;κ = Tµν,κ − Γµκ Tαν − Γνκ Tµα . En généralisant, la dérivée covariante d’un tenseur de rang n
fait apparaı̂tre la dérivée ordinaire suivie d’un symbole de Christoffel pour chacun des n indices.
En particulier pour un champ scalaire on a Dκ φ = ∂κ φ. Dans le cas présent, φ;µν = Dµ Dν φ =
α
Dµ φ,ν − Γα
νµ φ,α = φ,µν − Γνµ φ,α , donc un seul Christoffel.
(112)
150
Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann
associées
En présence du champ φ, l’action du champ gravitationnel libre et du champ
scalaire s’écrit avec une composante SEH [g µν ] pour la géométrie et Smat [g µν , φ] pour
la matière
S[g µν , φ] = SEH [g µν ] + Smat [g µν , φ]
Z
Z
√
c4
4 √
=−
d x −gR +
d4 x −gLmat
16πG
où le lagrangien de matière est donné par
Lmat = 21 h̄2 ∂µ φ ∂ µ φ − 12 m2 c2 φ2
= 21 h̄2 g µν ∂µ φ ∂ν φ − V (φ)
où l’on a généralisé à un potentiel quelconque
(113)
. La variation
δS[g µν , φ]
=0
δg µν
donne les équations d’Einstein alors que la variation
δS[g µν , φ]
=0
δφ
conduit à l’équation de mouvement de l’inflaton. Par définition (c’est-à-dire pour
retrouver Tµν au second membre des équations d’Einstein), la variation de l’action
de matière définit le tenseur énergie-impulsion associé,
Z
Z
µν
√
√
δ
4
1
−gLmat δg ≡ 2
δSmat =
d x µν
d4 x −gTµν δg µν ,
δg
d’où l’on déduit
Tµν = 2(−g)−1/2
√
δL
δ
−gLmat = 2 mat
− gµν Lmat .
µν
δg
δg µν
√
En effectuant le calcul de manière explicite, et en utilisant l’identité δ −g =
√
− 21 −ggµν δg µν , on obtient
Tµν = 2
δ 1 2 κλ
h̄
g
∂
φ
∂
φ
− gµν 12 h̄2 g κλ ∂κ φ ∂λ φ + gµν V (φ)
κ
λ
δg µν 2
= h̄2 ∂µ φ ∂ν φ − 21 h̄2 gµν ∂κ φ ∂ κ φ + gµν V (φ)
= h̄2 ∂µ φ ∂ν φ − 12 gµν [h̄2 ∂κ φ ∂ κ φ − 2V (φ)]
(113)
On note que s’agissant d’un champ scalaire, Lmat (φ, Dµ φ) = Lmat (φ, ∂µ φ).
151
On peut également noter que la définition usuelle
Tµν =
∂L
φ − gµν L
∂φ,µ ,ν
qui découle d’une variation par rapport à φ plutôt que par rapport à la métrique,
donne le même résultat (114) .
Dans la métrique FRW, où
2
2
2
2
ds = c dt − a (t)
dσ 2
2
2
+ σ dΩ ,
1 − kσ 2
on pose dxµ = (cdt, dσ, dθ, dϕ) et σ = r/a(t), soit
g00 = 1,
g11 = −
a2
,
1 − kσ 2
g22 = −a2 σ 2 ,
g33 = −a2 σ 2 sin2 θ
et g µµ = 1/gµµ . On a également ∂µ = (c−1 ∂t , ∂σ , ∂θ , ∂ϕ ), de sorte que
∂κ φ ∂ κ φ = g κλ ∂κ φ ∂λ φ
= g 00 (∂0 φ)2 + g 11 (∂σ φ)2 + g 22 (∂θ φ)2 + g 33 (∂ϕ φ)2
= (∂0 φ)2 −
1 − kσ 2
1
1
(∂σ φ)2 − 2 2 (∂θ φ)2 − 2 2 2 (∂ϕ φ)2 .
2
a
a σ
a σ sin θ
Le tenseur énergie-impulsion devient finalement
h h̄2
2
2 1 − kσ
2
(∂
φ)
−
h̄
(∂σ φ)2
t
c2
a2
i
1
1
− h̄2 2 2 (∂θ φ)2 − h̄2 2 2 2 (∂ϕ φ)2 − 2V (φ) .
a σ
a σ sin θ
Tµν = h̄2 ∂µ φ ∂ν φ − 12 gµν
Dans le cas d’un problème à symétrie sphérique, les dérivées du champ par
rapport à θ et à ϕ n’interviennent pas et cette expression se simplifie pour la partie
diagonale en
Tµµ = h̄2 ∂µ φ ∂µ φ − 12 gµµ h̄2
h1
(φ̇)2 −
c2
i
1 − kσ 2
−2
2
(∂
φ)
−
2h̄
V
(φ)
.
σ
a2
En rappelant que le tenseur énergie-impulsion admet également la forme hydrodynamique habituelle
Tµν = (ρ + p/c2 )vµ vν − pgµν ,
(114)
On note bien le facteur 2 dans
∂L
∂φ,µ
=
1 2
h̄ 2φ,µ .
2
152
on peut calculer la densité d’énergie et la pression associées au champ scalaire φ au
repos dans le référentiel comobile (vµ = (c, ~0)).
h
i
1 − kσ 2
2
T00 = ρφ c2 = 12 h̄2 (∂0 φ)2 +
+ V (φ),
(∂
φ)
σ
a2
T11 =
pφ a2
a2
a2
2
2
1 2
1 2
=
h̄
(∂
φ)
+
h̄
(∂
φ)
−
V (φ).
σ
2
2
1 − kσ 2
1 − kσ 2 0
1 − kσ 2
On peut alors écrire les équations de Friedmann en négligeant toute autre forme
de matière-énergie que celle associée au champ scalaire φ. On considère en général
le cas d’un champ spatialement uniforme, de sorte qu’il ne reste que la dépendance
temporelle et le terme d’énergie potentielle V (φ),
G00 =
3k
8πG
3ȧ2
+ 2 = 4
a2 c2
a
c
G11 = −
2
1 2
2 h̄ (∂0 φ)
8πG
k + 2aä/c2 + ȧ2 /c2
= 4
1 − kσ 2
c
+ V (φ) ,
1 2
2 h̄ 1
a2
a2
(∂0 φ)2 −
V (φ) .
2
2
− kσ
1 − kσ
Equation de mouvement de l’inflaton
L’action de matière dépend évidemment du champ φ de sorte que l’on peut effectuer
une variation par rapport à ce champ. En reprenant l’expression de Lmat dans le
référentiel comobile et en supposant la symétrie sphérique, on a
√
−gLmat = 21 h̄2 √
a3 σ 2
a3 σ 2
1 − kσ 2
2
√
(∂
φ)
−
(∂0 φ)2 −
V (φ)
σ
a2
1 − kσ 2
1 − kσ 2
de sorte que la variation de Smat [g µν , φ] par rapport à φ conduit à
√
∂
δSmat
∂ √
=
( −gLmat ) − ∂µ
( −gLmat ) = 0
δφ
∂φ
∂(∂µ φ)
ou encore, sous une forme plus “symétrique”,
√
1
∂
∂
(Lmat ) − √ ∂µ
( −gLmat ) = 0.
∂φ
−g ∂(∂µ φ)
En effectuant le calcul, on trouve
a3 σ 2 dV
∂ √
( −gLmat ) = − √
,
∂φ
1 − kσ 2 dφ
√
∂
h̄2 σ 2
( −gLmat ) = − √
(3a2 ȧφ̇ + a3 φ̈),
2
2
∂(∂0 φ)
c 1 − kσ
p
√
∂
−∂σ
( −gLmat ) = h̄2 σ 2 1 − kσ 2 a(∂σ φ)2
∂(∂σ φ)
p
+ h̄2 ∂σ (σ 2 1 − kσ 2 )a∂σ φ,
−∂0
153
d’où l’équation de Lagrange
3h̄2
h̄2
1
H
φ̇
+
φ̈ − h̄2 (1 − kσ 2 ) 2 ∂σ2 φ = 0
2
2
c
c
a
V ′ (φ) +
que l’on simplifie dans le cas d’un champ φ spatialement uniforme (∂σ φ = 0),
3h̄2
h̄2
H
φ̇
+
φ̈ = 0.
c2
c2
V ′ (φ) +
Cette équation peut aussi se retrouver à partir des expressions de ρφ et de pφ
injectées dans l’équation de continuité,
ρ̇φ c2 + 3(ρφ c2 + pφ )
ȧ
=0
a
en prenant garde au terme V̇ (φ) = V ′ (φ)φ̇. De ce fait, elle n’est pas une équation
indépendante des deux premières.
La phase de de Sitter
Les équations de Friedmann et de Raychaudhuri, et l’équation de mouvement de
l’inflaton dans le cas d’un champ scalaire réel uniforme s’écrivent donc
H2 +
kc2
8πG h̄2 2 1
=
φ̇ + 2 V (φ) ,
2
2
2
a
3c 2c
kc2 + 2Ḣa2 + 3ȧ2 = −
V ′ (φ) +
4πG h̄2 2
φ̇ − V (φ)
2
2
c
c
3h̄2
h̄2
H
φ̇
+
φ̈ = 0
c2
c2
et sont aussi associées à une densité et une pression de la forme
ρφ c2 =
h̄2 2
φ̇ + V (φ),
2c2
pφ =
h̄2 2
φ̇ − V (φ).
2c2
La seconde équation (de Raychaudhuri) n’est généralement pas discutée (les trois
équations étant liées, il est plus simple de raisonner sur la première et la troisième).
Il s’agit maintenant de contraindre le potentiel pour espérer produire la phase
d’inflation. On fait généralement l’approximation du roulement lent qui permet de
trouver une limite où l’équation d’état se réduise à wφ = −1, ce qui conduit à une
phase de de Sitter :
φ̈ ≪ 3H φ̇,
et
φ̇2 ≪
c2
V (φ).
h̄2
154
La seconde condition (énergie cinétique faible devant le potentiel, condition déjà
imposée pour que wφ ≃ −1) suppose un potentiel variant très lentement. Une
forme possible est celle d’un potentiel en φ4 juste au-dessous de la température
de transition, lorsque le terme quadratique est très légèrement négatif.
Figure 10.1 L’approximation du roulement lent.
Dans les conditions du roulement lent, le potentiel varie très peu et T00 ≃ V (φ)
peut être approximé par sa valeur au temps de Planck (nous sommes dans les phases
primordiales de l’Univers),
T00 ≃ 12 V (φPl. ) ≃ ρPl. c2 =
c7
.
h̄G2
L’analyse dimensionnelle permet en effet de former à partir des constantes G, h̄
et c, des quantités homogènes respectivement à une masse, MPl. = (h̄c/G)1/2 ≃
2.2 10−8 kg, à un temps, TPl. = (Gh̄/c5 )1/2 ≃ 5.4 10−44 s et à une longueur, LPl. =
(Gh̄/c3 )1/2 ≃ 1.6 10−35 m. La densité lagrangienne ayant pour dimensions celles du
−2
c7
potentiel, [L] = ML−1 T−2 , on obtient en effet LPl. ≃ V (φPl. ) ≃ MPl. L−1
Pl. TPl. = h̄G2 .
Les dimensions du champ se déduisent de celles du lagrangien et sont données par
c2
.
[φ] = M−1/2 T−3/2 = G1/2
h̄
5
4πc
L’équation de Friedmann donne dans ces conditions H 2 = 4πG
3c2 V (φPl. ) = 3Gh̄ où
l’on a négligé √
le terme en kc2 /a2 en raison de la croissance rapide de a, et il vient
−1
H ≃ HPl. = 4π3TPl.
. Cela conduit bien à une phase de de Sitter d’expansion
exponentielle du facteur d’échelle, car HPl. = const. = (1/a)da/dt admet pour
solution
a(t) = aPl. exp(HPl. t).
155
Figure 10.2 Comparaison entre un scenario ordinaire et un scenario avec phase
d’inflation.
On ajuste les paramètres tf et ti de début et de fin de la phase d’inflation pour
156
rendre compte de la valeur d’homogénéité du CMB observée aujourd’hui.
Les conditions du roulement lent permettent l’établissement d’une période
d’inflation, mais pour que celle-ci se termine, il faut que le champ évolue vers
un puits de potentiel où il puisse acquérir une énergie cinétique de l’ordre de
l’énergie potentielle, modifiant l’équation d’état associée qui redevient analogue à
celle de la matière ordinaire (permettant à la gravitation de redevenir attractive).
L’expansion reprend ainsi une forme en loi de puissance telle que celle que l’on
connaı̂t aujourd’hui.
Solutions à certains problèmes cosmologiques
Le problème de la platitude est automatiquement résolu, car pendant l’inflation,
Ω(t) − 1 = a2kH 2 ∼ e−2HPl. t peut avoir été aussi petit qu’on le souhaite. Pour être
compatible avec les valeurs observées aujourd’hui, l’inflation doit avoir provoqué une
croissance du facteur d’échelle telle que
a(tf )
∼ e100 = 1043 .
a(ti )
Cette phase a également produit une dilution extrême qui résoud du même
coup le problème des reliques massives. Le problème de l’horizon et celui des
grandes structures finalement sont résolus également. La figure ci-dessous illustre
la résolution du problème de l’horizon.
Figure 10.3 Solution au problème de l’horizon par la phase d’inflation.
Les scenarios-type
Il existe de nombreux scenarios conduisant à une phase d’inflation. On peut
les regrouper essentiellement en trois classes : les scenarios comprenant un champ
scalaire couplé à un potentiel tel que ce que nous avons décrit dans ce chapitre,
les scenarios à dérivées plus élevées comme les théories f (R) et les modèles de
k−inflation dans lesquelles l’énergie cinétique du champ scalaire prend une forme
157
non traditionnelle (les p−théories). Les deux dernières classes conduisent de manière
effective à un champ scalaire couplé à la gravitation et soumis à un potentiel.
Le cas des théories f (R) est bien connu. La théorie d’Einstein est la plus
simple des théories métriques de Rla gravitation.
L’action du champ gravitationnel
√
libre se réduit à celle d’Hilbert, d4 x −gR. C’est la seule théorie qui conduise
dans l’espace-temps à 4d à des équations du mouvement du second ordre. Toute
modification de cette action génère des dérivées d’ordre plus élevé, ce qui entraı̂ne
qu’en plus du graviton de spin 2, la théorie contient génériquement un degré
de liberté supplémentaire, un champ de spin nul, c’est-à-dire un champ scalaire.
Considérons le cas de l’action
Z
√
1
S = 2 d4 x −gf (R).
Les équations de mouvement du champ libre deviennent
′
f ′ (R)Rµν − 12 gµν f (R) + gµν [f ′ (R)],α
,α − [f (R)];µν = 0.
Si l’on applique une transformation conforme (dilatation locale) gµν −→ g̃µν = F gµν ,
le tenseur de Ricci se transforme également et l’on obtient les équations d’Einstein
R̃µν − 12 R̃g̃µν = T̃µν
avec le tenseur T̃µν associé à un champ scalaire effectif φ(x) = ln F (R) (avec
F (R) = f ′ (R)) soumis à un potentiel V (φ) = (f (R) − Rf ′ (R))/[f ′ (R)]2 . Une théorie
de la gravitation ayant des dérivées plus élevées que 2 est conformément équivalente
à une théorie d’Einstein couplée à un champ scalaire.
Les p−théories sont des théories du type Born-Infeld. S’il existe un champ décrit
par l’action
Z
√
S = d4 x −g p(X, φ)
avec X = 12 ∂µ φ ∂ µ φ où le lagrangien p joue le rôle de pression effective et où
ρc2 = 2X(∂p/∂X) − p, vµ = (2X)−1 ∂µ φ dans Tµν . En jouant sur la forme de p,
on peut obtenir une phase d’inflation.
Ce qu’il importe de conclure dans ce chapitre, c’est qu’il existe une grande variété
- ici limitée aux champs scalaires - de candidats à l’inflation, mais qui ont en commun
de conduire à un même scenario générique. En l’absence de moyens de vérification
observationnelle, il importe peu de savoir quel candidat a le plus de chances d’être
réalisé dans notre univers.
158
Cosmologie
159
11
Cosmologies alternatives
Motivations
Le modèle cosmologique standard souffre d’un grand nombre de défauts,
communément appelés les problèmes cosmologiques, comme le problème de la
constante cosmologique, de la matière noire, de l’horizon, des reliques, etc. La
résolution de ces problèmes passe par des théories ingénieuses, mais hautement
spéculatives comme l’inflation, par l’espoir que des campagnes d’observations futures
mettront en évidence de nouvelles formes de matière comme les WIMPS ou d’énergie
comme la quintessence, ou pourquoi pas, par une remise en question des fondements
comme la gravitation. On se propose d’ébaucher quelques pistes dans ce court
chapitre polémique !
Parmi les alternatives éventuelles, il y a essentiellement deux classes de
modifications : les théories alternatives de la gravitation dont il sera davantage
question dans ce chapitre, ou les dynamiques modifiées par rapport au schéma
communément admis (MOND pour MOdified Newtonian Dynamics, etc) (115) .
Si l’on se penche sur internet, on trouve rapidement des pages proposant
des théories de la gravitation alternatives (théorie scalaire de Nordström, théorie
scalaire-tensorielle de Brans et Dicke, théorie conforme de Weyl, généralisations à 5
dimensions avec l’approche de Kaluza et Klein, etc). Par exemple sur Wikipedia.
(115)
Ces dernières sont susceptibles de résoudre l’anomalie observée dans la dépendance avec la
distance au centre des vitesses radiales des étoiles dans les bras de galaxies. En effet, si l’on
suppose une modification de la loi fondamentale de la dynamique faisant apparaı̂tre une accélération
~ = m~af (|~a|/a0 ) avec f (x) → x dans une limite convenable, il en résulte
caractéristique a0 , F
2
2
GM/r = a /a0 = v 4 /a0 r 2 , soit v 4 = GM a0 ce qui permettrait d’expliquer le plateau observé
dans les courbes de vitesse. Tout le problème consiste ensuite à donner à a0 la valeur requise, puis
à explorer les autres conséquences de cette modification en souhaitant qu’elles ne contredisent pas
des succès antérieurs.
160
Figure 11.1 Théories de la gravitation sur Wikipedia.
On se propose de discuter plus en détail de ces théories relativistes de la
gravitation qui offrent une alternative à la relativité générale.
Les ingrédients du modèle cosmologique standard
Passons rapidement en revue les éléments essentiels au modèle cosmologique
standard, avant de proposer des formulations alternatives. Un tel modèle suppose
- de travailler à très grande échelle, typiquement 1024 − 1026 m,
- une théorie de la gravitation, c’est-à-dire essentiellement une géométrie dans
les théories métriques, soit un objet tel que Gµν pour la relativité générale,
- des données (sinon des hypothèses) sur le contenu matériel et énergétique de
l’Univers, Tµν ,
- des hypothèses de symétrie qui contraignent gµν de manière à permettre
d’exprimer à la fois Gµν et Tµν .
Cosmologie
161
Le modèle cosmologique standard est fondé sur le principe cosmologique qui
restreint la métrique à celle proposée par Friedmann, Robertson et Walker, soit avec
xµ = (ct, r, θ, ϕ),
dσ 2
2
2
ds2 = c2 dt2 − a2 (t)
,
+
σ
dΩ
1 − kσ 2
avec σ = r/a(t) la coordonnée comobile et a(t) le facteur d’échelle de l’Univers,
k = 0, ±1 sa courbure. La théorie de la gravitation appliquée dans ce modèle est
celle d’Einstein, appelée aussi relativité générale, soit
1
Gµν = Rµν − gµν Rαα
2
où le tenseur de Ricci Rµν comprend des dérivées premières et secondes de gµν .
Enfin, pour ce qui concerne le contenu matériel de l’Univers, il s’agit d’un “fluide
cosmique”
Tµν = (ρ + p/c2 )vµ vν − pgµν
avec diverses composantes obéissant à des équations d’état de la forme
pw = wρc2 .
Pour rendre le modèle compatible avec les mesures, on distingue essentiellement trois
composantes, la matière froide pM = 0, le rayonnement pR = 31 ρc2 et la constante
cosmologique pΛ = −ρΛ c2 .
Avec l’ensemble de ces “ingrédients”, la dynamique de l’Univers, régie par les
équations d’Einstein,
8πG
1
Rµν − gµν Rαα = 4 Tµν ,
2
c
conduit aux équations de Friedmann
1 ȧ2
kc2
1
4
+
− Λc2 = πGρ,
2
2
2a
2a
6
3
ä ȧ2
kc2
8πG
2 + 2 + 2 − Λc2 = − 2 p.
a a
a
c
Ce qui valide l’utilisation de la relativité générale (GTR) comme théorie de la
gravitation dans l’esprit du modèle cosmologique standard, c’est le schéma suivant :
Tableau 11.1 L’“esprit” du modèle cosmologique standard.
Théorie
Gravité newtonienne
~∇2 φ(~
r) = ρ(~
r)
⇑
GTR
Gµν = κTµν
Solution
−→
−→
Potentiel newtonien
φ(~
r ) = − const.
|~
r|
⇑
Métrique de Schwarzschild gµν
φ = solution newtonienne + corrections
162
dans lequel les corrections au comportement newtonien sont faibles dans le domaine
où la gravité newtonienne était efficace et sont confirmées par l’expérience (les “trois
tests classiques” dans le système solaire). Ces corrections en revanche n’ont aucune
raison d’être faibles dans les domaines nouvellement accessibles, tant qu’elles ne se
heurtent pas à des réultats d’expérience.
On effectue ensuite un inventaire des composants essentiels de l’Univers sur la
base des observations accessibles, pour répertorier les diverses formes de matièreénergie. Les mesures les plus significatives dans le plan ΩΛ − ΩM conduisent à une
proportion très importante de formes de matière-énergie (dite sombre) qui sont
encore très mal connues à l’heure actuelle, mais dont la présence est indispensable
dans le cadre du modèle cosmologique standard pour expliquer les paramètres
“cinématiques” (constante de Hubble, paramètre de décélération, . . . ) observés. On
arrive ainsi aux données récapitulées dans le chapitre précédent et présentées dans
la figure suivante :
Figure 11.2 Composition essentielle de l’Univers dans le plan ΩΛ − ΩM .
Notons que les cosmologistes ont envisagé bien d’autres formes d’énergie.
Mentionnons à côté du rayonnement (w = 1/3), de la matière (w = 0) et de
la constante cosmologique (w = −1), des formes plus exotiques comme l’énergie
ultralégère (ultralight, w > 1/3), les cordes cosmiques (cosmic strings, w = −1/3),
les parois de domaines (domain walls, w = −2/3) ou l’énergie fantôme (phatom
energy, w < −1) (116) .
Théories alternatives de la gravitation
(116)
R.J. Nemiroff and B. Patla, Adventures in Friedmann cosmology: A detailed expansion of the
cosmological Friedmann equations, Am. J. Phys. 76 265 (2008).
Cosmologie
163
⊲ Extensions “métriques” de la relativité générale. Il existe des extensions
de la relativité générale qui entrent dans le cadre évoqué ici avec le tableau précédent.
Rappelons que la relativité générale est fondée sur l’action d’Einstein-Hilbert (en
l’absence de matière-énergie),
SEH = −
Z
√
d4 x −g Rαα ,
de sorte que par variation de l’action on obtient
δSEH
= 0 entraı̂ne
δg µν
1
Gµν ≡ Rµν − gµν Rαα = 0.
2
La relativité générale, basée sur l’action SEH , est la plus simple des théories
métriques de la gravitation. De nombreuses généralisations en ont été proposées,
telles que
- théories f (R)
S=−
S=−
Z
Z
d4 x(−g)1/2 (Rαα )2 ,
d4 x(−g)1/2 Rαβ Rαβ ,
Sf (R) = −
Z
d4 x(−g)1/2 f (Rαα ),
-
théories incluant davantage de champs, comme la théorie scalaire-tenseur de
Brans et Dicke
Z
SBS = − d4 x(−g)1/2 (φRαα − wφ−1 φ;µ )φ;µ ),
-
théories incluant davantage de dimensions, comme la théorie de Kaluza et Klein
ds2 = gM N dxM dxN = dw2 + gµν dxµ dxν .
Toutes ces théories admettent la relativité générale comme limite.
⊲ Schéma d’un modèle cosmologique au-delà du modèle cosmologique
standard. Pour envisager des théories alternatives en toute généralité, il est
bon d’étendre le schéma proposé. En effet, ce schéma est trop restrictif car il est
parfaitement possible qu’une théorie ne redonne jamais la théorie newtonienne (ou
par extension la relativité générale) dans aucune limite, sans toutefois être exclue
si les solutions de la nouvelle théorie sont susceptibles de redonner à la limite
non relativiste la solution newtonienne, ou dans le contexte relativiste, la solution
einsteinienne avec éventuellement des corrections nouvelles, à condition que celles-ci
soient négligeables à l’échelle du système solaire où la gravitation d’Einstein a passé
les tests observationnels avec succès.
Le tableau initial doit donc être remplacé par un schéma analogue avec une
contrainte au niveau des solutions uniquement.
164
Tableau 11.2 Les contraintes pour des théories alternatives de la gravitation.
Théorie
Solution
Gravité newtonienne
~∇2 φ(~
r) = ρ(~
r)
−→
Gravitation relativiste alternative
Wµν = κTµν
−→
Potentiel newtonien
φ(~
r) = − const.
|~
r|
⇑
Métrique généralisée gµν
φ = solution newtonienne + corrections GTR
+ autres corrections
Ici, Wµν est un nouvel objet à construire. Le fait que l’on retrouve les corrections
de relativité générale à la limite faiblement relativiste garantit que les trois tests
classiques soient satisfaits si les nouvelles corrections sont négligeables à l’échelle du
système solaire. A des échelles plus importantes en revanche, on peut espérer que
ces corrections puissent jouer un rôle déterminant et construire ainsi une nouvelle
cosmologie
⊲ Exemples dans un contexte classique. La gravité newtonienne est régie
par exemple par l’équation de Poisson,
~ 2 φ(~r) = ρ(~r).
∇
Dans le cas d’une distribution de masse à symétrie sphérique, limitée par une taille
caractéristique R, le potentiel newtonien à l’extérieur de la distribution de masse
s’en déduit :
Z
1 R ′ ′2 ′
dr r ρ(r )
φr>R (~r) = −
r 0
=−
const.
.
r
On pourrait très bien imaginer une théorie basée sur une équation locale différente,
par exemple
~ 4 φ(~r) = µ(~r).
∇
Dans cette équation, µ(~r) est une quantité reliée à la densité de masse et définie
de sorte que φ(~r) soit toujours le potentiel gravitationnel. Cette équation ne peut
pas redonner l’équation de Poisson traditionelle, mais ses solutions dans le cas de la
symétrie sphérique, de la forme
1
φr>R (~r) = − r
2
Z
R
0
1
dr r µ(r ) −
6r
′ ′2
C
= −C1 × r − 2
r
′
Z
R
4
dr ′ r ′ µ(r ′ )
0
admettent le potentiel newtonien comme limite à courte distance. Le premier terme,
qui varie linéairement avec la distance, est susceptible de donner lieu à une nouvelle
physique à grande distance.
C’est le même type de démarche que l’on peut envisager dans le contexte des
théories métriques et l’exemple de la théorie de Weyl fait l’objet du paragraphe
suivant.
Cosmologie
165
Modification de la géométrie, la théorie conforme de Weyl
⊲ L’action de Weyl. (117) Weyl a envisagé une généralisation de la relativité
générale, éventuellement susceptible de décrire également l’électromagnétisme, en introduisant au-delà des changements arbitraires de coordonnées, des transformations
“de jauge” locales : les transformations conformes, ou dilatations locales,
gµν (x) → e2α(x) gµν (x),
Aµ (x) → Aµ (x) − e∂µ α(x).
L’action SEH n’étant pas invariante par ces transformations, Weyl a construit un
tenseur qui reste inchangé, Cλµνκ , et une action invariante de Lorentz, Cλµνκ C λµνκ
et invariante conforme,
Z
1
1 α 2
4
1/2
λµνκ
µν
SW = −
d x(−g)
Rλµνκ R
− 2Rµν R + (R α )
4
3
conduisant aux équations du mouvement
λµνκ
W µν ≡ 2C;λ;κ
− C λµνκ Rλκ = T µν .
⊲ Solution possible au problème des bras de galaxies. En l’absence
de matière-énergie, Tµν = 0, et l’équation du mouvement Wµν = 0 se réduit à
Rµν = 0, de sorte que l’on retrouve la solution de Schwarzschild, et par conséquent
les prévisions habituelles de la relativité générale en ce qui concerne les trois tests
classiques. La solution de Schwarzschild est donc bien une solution de la théorie
conforme de Weyl dans une certaine limite, bien qu’il soit impossible de retrouver
Gµν à partir de Wµν dans cette limite. La limite non relativiste donne en effet un
intervalle
ds2 = B(r)c2 dt2 −
avec
dr 2
+ r 2 dΩ2 ,
B(r)
~ 4 B(~r) = ρ(~r)
∇
de sorte qu’à l’exterieur d’une distribution de masse sphérique
B(r > R) = g00 = −
1
2β
+ γr.
=1−
g11
r
Le potentiel gravitationnel croı̂t à grande distance, c’est-à-dire typiquement dans
les régions dans lesquelles la matière sombre est habituellement introduite (les halos
galactiques), voire aux distances auxquelles la constante cosmologique joue son rôle
répulsif !
Les anomalies observées dans les courbes de vitesse de rotation des étoiles
lontaines dans les bras des galaxies peuvent être modélisées en utilisant la gravitation
conforme sans avoir recours à l’introduction de halos galactiques constitués de
matière sombre.
(117)
P. Mannheim, astro-ph/0505266
166
Figure 11.3 L’anomalie des vitesses de rotation des étoiles dans les bras de
galaxies. La contribution en tirets est celle de la gravittaion ordinaire, celle en
pointillé (croissante) est due au terme supplémentaire dans la garvitation de Weyl.
Aucune des deux contributions ne nécessite d’introduire de forme de matière autre
que celle qui est visible.
Cosmologie
167
⊲ Cosmologie conforme. Supposons un modèle simple dans lequel l’Univers
est composé d’une espèce non massive de fermions ψ(x) couplée de manière
covariante à la gravitation,
iψ̄γ µ (x)∂µ ψ → iψ̄γ µ (x)[∂µ + Γµ (x)]ψ
et d’un champ scalaire de Higgs φ(x) couplé au champ de fermions ∼ hφψ̄ψ et
également couplé minimalement à la gravitation,
1
∂µ φ∂ µ φ +2m φ2 + λφ4 → φ;µ φ;µ − Rαα φ2 + λφ4 .
6
Au total, l’action prend la forme
SW + SM
1
=−
4
Z
d4 x(−g)−1/2 Cλµνκ (x)C λµνκ (x)
1
+ φ;µ φ;µ − Rαα φ2 + λφ4
6
+ iψ̄γ µ (x)[∂µ + Γµ (x)]ψ − hφψ̄ψ
Dans le cas de la métrique de FRW, on montre que Cλµνκ = 0 et en
introduisant le tenseur énergie-impulsion de la matière (fermionique ici) les équations
du mouvement de la cosmologie conforme deviennent
1
1
Tµν = (ρ + p/c2 )vµ vν + pgµν − φ20 (Rµν − gµν R) − gµν λφ40 = 0.
6
2
Le coefficient 16 φ20 joue le rôle d’une constante de gravitation univeselle effective,
gouvernée par le boson de Higgs,
Geff = −
3c4
.
4πφ20
Cette constante de gravitation négative pourrait éviter l’introduction de matière
noire à l’échelle cosmologique, comme la solution approchée appliquée aux bras de
galaxies a déjà permis d’en faire l’économie. Le terme en φ40 joue le rôle de constante
cosmologique
Λ = λφ40 ,
et peut rendre compte pour sa part de l’accélération de l’expansion cosmologique.
168
Figure 11.4 Comparaison entre la comsologie standard et la cosmologie conforme
pour l’affinement des données issues des SNIa.
On voit à partir de ces exemples simplifiés comment la théorie de Weyl de la
gravitation est susceptible d’apporter une vision différente de l’Univers, sans être
obligé d’introduire des formes exotiques et non observées de matière-énergie. Il
resterait cependant à vérifier que cette théorie est capable de rendre compte des faits
observés sans multiplier les paramètres. C’est une question qui n’est pas tranchée à
l’heure actuelle.
Cosmologie
169
12
Vers la cosmologie quantique
Le problème de l’origine de l’Univers est partiellement résolu moyennant l’hypothèse
d’une naissance par effet tunnel. On élabore pour cela une approche quantique de
la cosmologie.
Formulation lagrangienne et hamiltonienne des équations de Friedmann
Il s’agit de déterminer les équations de Friedmann à partir d’une formulation
variationnelle, soit d’un lagrangien, puis de construire l’hamiltonien et l’impulsion
associée. C’est une présentation simplifiée de l’approche de Wheeler-DeWitt. Partons
des équations de Friedmann,
2
ȧ
8πG
kc2
Λc2
−
ρ+ 2 −
= 0,
a
3
a
3
2
ä 1 ȧ
Λc2
4πGp
kc2
+
+
= 0.
+ 2 −
a 2 a
2a
2
c2
En injectant la première dans la seconde, on reformule la seconde équation comme
Λc2
ä 4πGp
+
(ρ + 3p/c2 ) −
= 0.
a
3
2
La formulation de Wheeler-DeWitt est facilement appliquée en l’absence de matière
et pour un Univers fermé (k = +1), soit dans ce cas
2
ȧ
Λc2
kc2
= 0,
+ 2 −
a
a
3
ä Λc2
−
= 0.
a
2
170
Construisons un lagrangien dont la légitimité vient de ce qu’il permet de
retrouver les équations de Friedmann comme équations du mouvement,
" #
2
ȧ
Λc2
kc2
3
L=a
− 2 +
≡ L(a, ȧ).
a
a
3
On en déduit le moment conjugué au facteur d’échelle,
p=
∂L
= 2aȧ
∂ ȧ
en notant que
∂L
= ȧ2 − kc2 + Λc2 a2 ,
∂a
l’équation d’Euler-Lagrange donne l’équation du mouvement suivante
0 = ṗ −
∂L
∂a
= 2ȧ2 + 2aä − ȧ2 + kc2 − Λc2 a2 ,
soit finalement l’une des équations de Friedmann,
ä 1
+
a 2
2
ȧ
Λc2
kc2
= 0.
+ 2 −
a
2a
2
On peut maintenant construire l’hamiltonien associé (qu’on note H pour ne pas
confondre avec la constante de Hubble),
H = pȧ − L
!
2
2
2
ȧ
Λc
kc
= a3
+ 2 −
a
a
3
≡ 0.
Il est identiquement nul en raison de la première équation de Friedmann. Exprimé
en fonction de p, l’hamiltonien devient
Λc2 a3
p2
+ kc2 a −
4a
3
1 1 2
2 2 4
2 2
=
p + 2kc a − Λc a
2a 2
3
H=
= 0.
Il ne faut pas confondre l’hamiltonien et l’énergie totale, proportionnelle à −k. La
signification de H ne me semble d’ailleurs pas bien claire, mais par le biais de la
Cosmologie
171
quantification canonique, cela conduit à chercher des fonctions propres d’énergie
nulle.
Quantification canonique des équations de Friedmann et équation de
Wheeler-DeWitt
On applique ensuite le principe de correspondance
∂
∂t
∂
p → −ih̄ .
∂a
H → ih̄
pour obtenir l’équation de Wheeler-DeWitt,
h̄2 ∂ 2 ψ(a)
2 2 4
2 2
−
+ 2kc a − Λc a ψ(a) = 0,
2 ∂a2
3
soit une équation de Schrödinger pour un potentiel de la forme
2 2 4
2 2
V (a) = 2kc a − Λc a
3
qui présente une barrière à l’origine au travers de laquelle doit “transiter” la fonction
d’onde pour parvenir à une zone classique de facteur d’échelle fini.
Figure 12.1 Passage par effet tunnel à travers une barrière de potentiel (emprunté
à D. Atkatz, Am. J. Phys. 62, 619 (1994).
Cette approche permet d’éviter que l’Univers ne soit créé par une singularité au
moment du Big Bang. Il apparaı̂t par effet tunnel avec un facteur d’échelle non nul
à partir duquel l’expansion peut se développer.
172
Cosmologie
Bibliographie
173
174
175
Eléments de bibliographie
Incontournables...
L.D. Landau et E. Lifshitz, Théorie des champs, 3ème édition, Editions MIR,
Moscou 1970.
Texte de référence, la relativité restreinte y est présentée dans les chapitres 1 à
4 et 8 (pour le rayonnement des charges accélérées), la relativité générale dans
les chapitres 10 à 12.
Edward W. Kolb et Michael S. Turner , The early universe, Addison-Wesley,
Redwood City, 1990.
C’est le texte de référence par excellence en cosmologie.
John A. Peacock, Cosmological Physics, Cambridge University Press, 1999.
Plus récent que le précédent c’est aussi un classique.
I.R. Kenyon, General relativity, Oxford University Press, New York 1990.
Ouvrage très accessible sur la relativité générale. Mérite vraiment qu’on s’y
attarde (à conserver sur sa table de nuit !).
M.V. Berry, Principles of cosmology and gravitation, Institute of Physics Publishing,
Bristol 1989.
Passionnant ouvrage d’introduction à la relativité générale et à la cosmologie. n
ouvrage très intéressant.
W. Pauli, Theory of relativity, Dover, New York 1958.
C’est un texte classique tout d’abord écrit à la demande de Sommerfeld par
Wolfgang Pauli alors âgé de 21 ans, puis à peine repris et complété en 1955,
à l’occasion du cinquantenaire des premiers articles d’Einstein sur la relativité.
C’est devenu un texte de référence considéré comme très complet. A noter qu’il
emploie d’abord la métrique de Minkowski avant d’introduire la distinction entre
les tenseurs contravariants et covariants comme dans les premières éditions de
Landau et Lifshitz.
P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press,
Princeton 1993.
S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972.
Parmi les textes qui font autorité en matière de relativité générale, c’est
probablement le plus célèbre, . . .
C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, Freeman, San Francisco
1973.
. . . avec celui-ci qui est une mine d’informations.
Pour prolonger la réflexion. . .
E. Harrisson, Cosmology, 2nd edition, Cambridge University Press, Cambridge
2000.
Un ouvrage passionnant sur la cosmologie, de l’antiquité aux théories actuelles.
Très accessible, la relativité y joue un rôle en de multiples endroits.
176
Bibliographie
M. Longair, Theoretical concepts in physics, Cambridge University Press, Cambridge
2003.
Auteur qui revendique et assume l’aspect théorique de la physique.
P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005.
Ouvrage récent en français, remarquable et très complet, notamment en matière
de données issues de mesures. Ce livre est incontestablement appelé à devenir
un classique !
P.A.M. Dirac, General theory of relativity, Princeton University Press, Princeton
1996.
Ouvrage d’une concision étonnante sur la relativité générale. Présentation très
formelle.
J.V. Narlikar, An introduction to Cosmology, Cambridge University Press, Cambridge 2002.
S. Weinberg, Cosmology, Oxford University Press, 2008.
L. Ryder, Introduction to General Relativity, Cambridge University Press, Cambridge 2009.
Du Ryder !
V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press,
Cambridge 2005.
M.P. Hobson; G. Efstathiou and A.N. Lasenby, General Relativity, an introduction
for physicits, Cambridge University Press, Cambridge 2006.
A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics,
and Cosmology Springer-Verlag, New-York 1992.
Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . .
M. Lachièze-Rey, Initiation à la cosmologie, Masson, Paris 1992.
Ouvrage très accessible (et en français !). Très intéressant, avec quelques prises
de positions parfois assez critiques vis à vis de la communauté, malheureusement
pas mal de redondances.
J. Rich, Fundamentals of cosmology, Springer, Berlin 2001.
La cosmologie moderne. Certaines parties sont accessibles assez facilement.
A. Einstein, Œuvres choisies, Vol. 2 et 3, Seuil, CNRS Éditions, Paris 1993.
Représente une somme ! Contient de nombreux textes d’Einstein et correspondances traduits en français et commentés.
G.F.R. Ellis and R.M. Williams, Flat and curved space-times, 2nd edition, Oxford
University Press, Oxford 2000.
Dans le même esprit que Harrisson. Très agréable à parcourir.
W. Rindler, Relativity, Special, general and cosmological, Oxford University Press,
Oxford 2001.
A. Guth et P. Steinhardt, l’Univers inflationniste in La Nouvelle Physique, ed. par
P. Davies, Sciences Flammarion, Paris 1993.
Bel ouvrage de vulgarisation sur les grands domaines de la physique.
M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford
2004.
Ouvrage parfaitement accessible et très à jour.
177
A. Liddle, An introduction to modern cosmology, John Wiley and Sons, Chichester
2003.
Texte assez court, très facile à lire, en chapitres courts et agréablement structuré.
Absolument recommendable !
T.P. Chen, Relativity, Gravitation, and Cosmology: A Basic Introduction, Oxford
Encore un très bon texte récent.
A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil,
Paris 1997.
Présentation (et traduction si nécessaire) des textes fondateurs de Friedmann et
de Lemaı̂tre sur la cosmologie.
Des ouvrages et articles sur la théorie des champs. . .
D.J. Gross, Gauge Theory-Past, Present, and Future? Chinese Journal of Physics
30 955 (1992)
L.H. Ryder, Quantum field theory, Cambridge University Press, Cambridge 1985.
Texte pédagogique célèbre, assez court.
C. Quigg, Gauge theory of the strong, weak, and electromagnetic interactions,
Westwiew Press, 1997.
Des qualités comparables au Ryder.
S. Weinberg, The quantum theory of fields, Vol. I and II, Cambridge University
Press, Cambridge 1996.
Une somme, du Weinberg!
T.-P. Cheng and L.-F. Li, Gauge theory of elementary particle physics, Oxford
B. Felsager, Geometry, particles and fields, Odense University Press, Gylling 1981.
M. E. Peskin and D. V. Schroeder, An Introduction to Quantum Field Theory,
(ABP) 1995.
Devenu un classique !
Des articles pédagogiques sur des sujets ponctuels
R.J. Adler, B. Casey and O.C. Jacob, Vacuum catastrophe: an elementary
exposition of the cosmological constant problem, Am. J. Phys. 63, 620 (1995).
D. Atkatz, Quantum cosmology for pedestrians Am. J. Phys. 62, 619 (1994).
Ph. Brax, The cosmological constant problem, Contemp. Phys. 45, 227 (2004).
Exposé à jour sur les problèmes suscités par la valeur de la constante
cosmologique et la matière noire.
C. Callan, R.H. Dicke and P.J.E. Peebles, Cosmology and newtonian mechanics, Am.
J. Phys. 33, 105 (1965).
C.F. Chyba, Kaluza-Klein unified field theory and apparent four-dimensional spacetime, Am. J. Phys. 53, 863 (1985).
V. Faraoni, A new solution for inflation, Am. J. Phys. 69, 372 (2001).
Une présentation simplifiée de la théorie de l’inflation, où un champ scalaire
conduit à des effets analogues à la constante cosmologique et produit une
expansion exponentielle de l’Univers.
V. Faraoni, Solving for the dynamics of the universe, Am. J. Phys. 67, 732 (1999).
178
Bibliographie
O. Gron, A new standard model of the universe, Eur. J. Phys. 23, 135 (2002).
Une présentation assez détaillée de la dynamique du modèle de FriedmannLemaı̂tre.
A. Harvey, Cosmological models, Am. J. Phys. 61, 901 (1993).
A. Harvey and E. Schucking, Einstein’s mistake and the cosmological constant, Am.
J. Phys. 68, 723 (2000).
Le titre est explicite. Très intéressant.
J.W. Norbury, From Newton’s laws to the Wheeler-DeWitt equation, Eur. J. Phys.
19, 143 (1998).
Présentation détaillée de la cosmologie newtonienne, jusqu’à une introduction à
la gravité quantique avec l’équation de Wheeler-DeWitt.
P. Pesic and S. P. Boughn, The Weyl-Cartan theorem and the naturalness of general
relativity, Eur. J. Phys. 24, 261 (2003).
Le théorème de Weyl-Cartan (démontré indépendamment à la même période par
ces deux auteurs) stipule que le scalaire de Ricci est le seul invariant relativiste
construit à partir du tenseur métrique, de ses dérivées premières et qui dépende
linéairement de ses dérivées secondes. Cela entraı̂ne que la théorie d’Einstein est
la seule construite de cette manière à partir du tenseur métrique.
W. Rindler, General relativity before special relativity: an unconventional overview
of relativity theory, Am. J. Phys. 62, 887 (1994).
B. Stefanski and D. Bedford, Vacuum gravity, Am. J. Phys. 62, 638 (1994).
A.J. Schwarz and N.A. Doughty, Kaluza-Klein unification and the Fierz-Pauli weak
field limit Am. J. Phys. 60, 150 (1992).
N. Straumann, The mystery of the cosmic vacuum energy density and the accelerated
expansion of the Universe, Eur. J. Phys. 20, 419 (1999).
Présentation historique du rôle de la constante cosmologique (et des hésitations
qu’elle a suscitées) et des problèmes que pose sa valeur actuelle extrêmement
faible.
Cours en ligne
M. Le Bellac, Relativité générale pour débutants,
http://cel.ccsd.cnrs.fr/cours/cel-33/cel-33.pdf
Nick Kaiser, Notes de cours d’astrophysique,
http://www.ifa.hawaii.edu/~kaiser/lectures/content.html
Ned Wright, Astronomy 275 lecture notes,
http://www.physics.ucla.edu/class/05S/275 WRIGHT/notes/index.html
T. F. Jordan, Cosmology calculations almost without general relativity
astro-ph/0309756
Mark Trodden, Sean M. Carroll, TASI Lectures: Introduction to Cosmology,
astro-ph/0401547
Juan Garcia-Bellido, Cosmology and Astrophysics,
astro-ph/0502139
Juan Garcia-Bellido, Astrophysics and Cosmology,
hep-ph/0004188
Júlio César Fabris, Introduction à la cosmologie,
gr-qc/0412017

Bertrand Berche - Groupe de Physique Statistique

Transcription

Documents pareils

Forces d`inertie et ondes d`inertie

Commission Cosmologie

A.1) Tension Superficielle A.1.1) Le nombre de

´Equations diophantiennes et courbes elliptiques

09_la_croisade_des_enfants_-_jacques_higelin ( PDF

Algorithme de résolution du mastermind

Cyrano a de grandes oreilles

Fiche PDF Château Lamouroux

Exercice 2 : Spectres d`émission Exercice 3 : Configurations

Séminaire BOURBAKI Novembre 2008 61`eme