Bertrand Berche - Groupe de Physique Statistique
Transcription
Bertrand Berche - Groupe de Physique Statistique
Master Sciences Physiques et Matériaux M1 Physique Interactions fondamentales et Cosmologie Bertrand Berche Groupe de Physique Statistique Université Henri Poincaré, Nancy 1 2 Interactions fondamentales et Cosmologie i Interactions fondamentales et Cosmologie Sommaire Chap. 1 : Définir la cosmologie . . . . . . . . . . . . . . . . . . . . . . 1 Cosmologie relativiste . . . . . . . . . . . . . . . . . . . . . . 5 Chap. 2 : Bases empiriques de la cosmologie . . . . . . . . . . . . . . Introduction Isotropie et homogénéité de l’Univers à grande échelle Récession des galaxies, hypothèse de Hubble 7 Chap. 3 : Parenthèse : notions de relativité . . . . . . . . . . . . . . Quadrivecteurs Tenseurs Définition des grandeurs physiques et expression covariante des lois physiques Formulation covariante de l’électromagnétisme 19 Chap. 4 : Relativité générale et Cosmologie . . . . . . . . . . . . . . Préambule Gravitation relativiste Application à la cosmologie Histoire sommaire de l’Univers 29 Chap. 5 : Le modèle Lambda-CDM . . . . . . . . . . . . . . . . . . . Les éléments essentiels du modèle ΛCDM Paramètres mesurables L’inventaire cosmique 55 ii Le rôle particulier de Λ Chap. 6 : Les “problèmes” cosmologiques . . . . . . . . . . . . . . . La matière sombre Le “problème” de la constante cosmoλogique ou de l’énergie sombre Le problème de la platitude Le problème de l’horizon Autres difficultés 71 Théories des champs . . . . . . . . . . . . . . . . . . . . . . . 95 Chap. 7 : Théories quantiques relativistes . . . . . . . . . . . . . . . Equation de Schrödinger Equation de Pauli Equation de Klein-Gordon Equations de Weyl Equation de Dirac Equation relativiste pour le photon 97 Chap. 8 : Classical gauge field theory . . . . . . . . . . . . . . . . . . 117 Introduction Abelian U (1) gauge theory Non-Abelian (Yang-Mills) SU (2) gauge theory Chap. 9 : Spontaneous symmetry breaking . . . . . . . . . . . . . . . 133 Spontaneous breaking of global gauge symmetries Spontaneous breaking of local symmetries The Anderson mechanism Gauge symmetric electroweak SU (2)W × U (1)Y theory The Higgs mechanism L’Univers primordial . . . . . . . . . . . . . . . . . . . . . . . 145 Chap. 10 : L’inflation cosmologique . . . . . . . . . . . . . . . . . . . 147 Introduction Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann associées Equation de mouvement de l’inflaton La phase de de Sitter Solutions à certains problèmes cosmologiques Les scenarios-type Chap. 11 : Cosmologies alternatives . . . . . . . . . . . . . . . . . . . 159 Interactions fondamentales et Cosmologie iii Motivations Les ingrédients du modèle cosmologique standard Théories alternatives de la gravitation Modification de la géométrie, la théorie conforme de Weyl Chap. 12 : Vers la cosmologie quantique . . . . . . . . . . . . . . . . 169 Formulation lagrangienne et hamiltonienne des équations de Friedmann Quantification canonique des équations de Friedmann et équation de WheelerDeWitt Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Chap. Eléments de bibliographie . . . . . . . . . . . . . . . . . . . . . 175 Incontournables... Pour prolonger la réflexion. . . Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . . Des ouvrages et articles sur la théorie des champs. . . Des articles pédagogiques sur des sujets ponctuels Cours en ligne 1 Définir la cosmologie La cosmologie est l’étude de l’Univers dans son ensemble à très grande échelle, lorsque la composition et la nature précise du contenu matériel de l’Univers importent peu et que ce contenu peut être remplacé par un milieu continu ayant des propriétés moyennes. Plutôt que de chercher à définir davantage ce dont il s’agit, je cite ci-dessous deux ouvrages récents, en français. Tout d’abord un extrait des pages d’introduction du livre de Peter et Uzan (1) qui permet de comprendre les enjeux de la cosmologie et sa place particulière parmi les théories physiques : Malgré (. . . ) l’abondance des observations, la cosmologie garde (. . . ) un statut différent comparé aux autres sciences. En effet nous n’observons qu’un seul Univers et qui plus est à partir d’une position unique de l’espace et du temps. La plupart des observations sont donc cantonnées à notre cône de lumière passé. La cosmologie ne fait donc pas l’économie d’hypothèses invérifiables comme par exemple le Principe Cosmologique qui a des implications fortes concernant les symétries des espace-temps cosmologiques. La construction d’un modèle cosmologique repose principalement sur trois hypothèses : (1) le choix d’une théorie de la gravitation, (2) des hypothèses sur la nature de la matière présente dans notre Univers et (3) une hypothèse de symétrie. Il faut souligner que les observations cosmologiques ne peuvent être interprétées indépendamment de ces hypothèses théoriques. Ainsi on ne cherche pas à prouver la validité d’un modèle, mais à établir un accord entre les observations et le cadre théorique dans lequel elles sont interprétées. Ceci n’empêche pas la cosmologie d’exclure les modèles dont les prédictions sont incompatibles avec les observations, comme dans tout autre domaine de la physique. (1) P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005. 1 2 Mis à jour le 14 Décembre 2012 Paru récemment également, un ouvrage collectif (2) comprend une contribution de F. Bouchet intitulée Cosmologie dont je recommande vivement la lecture : La cosmologie a pour objet les propriétés globales de l’Univers. Elle ne s’intéresse pas aux objets de l’Univers en tant que tels, et cherche à ne retenir que ce qui n’appartient à aucun d’entre eux en particulier. C’est une science physique, au sens où on utilise la démarche, les méthodes et les lois de la physique. Mais les investigations cosmologiques doivent utiliser les méthodes de l’astronomie, qui est une science naturelle d’observation. Les systèmes observés sont à prendre “comme ils sont”, sans pouvoir modifier à volonté leur environnement pour en comprendre les mécanismes et valider les modèles qui les décrivent. La validation scientifique est donc toujours plus délicate, puisqu’elle n’a pas accès à l’expérience directe dans des conditions contrôlées ; d’autant plus que dans le cas de la cosmologie, nous n’avons par définition qu’un seul système, qui de surcroı̂t ne peut être observé que de l’intérieur ! La cosmologie moderne pose les principes suivants : 1. Une cosmologie scientifique a un sens. En d’autres termes il existe effectivement des propriétés d’ensemble, à découvrir. 2. Les lois de la physique sont bien des lois universelles, qui doivent être valables en tous temps et en tous lieux. 3. L’Univers est globalement identique partout, aucun lieu d’observation n’est privilégié. Tous ces postulats seront jugés à leurs fruits. A commencer par l’intelligibilité de l’Univers en tant que tel. Le deuxième principe nous enjoint d’appliquer à distance les lois validées dans notre environnement. La difficulté est que les lois de la physique sont établies, pour un certain domaine d’échelle, de temps, d’énergie, d’accélération, etc., par des expériences multiples dans ce domaine-là. Or, la cosmologie contemporaine est précisément une entreprise où l’on considère des conditions jamais rencontrées auparavant et qui risque de requérir une modification de nos lois communes dans ces conditions extrêmes. C’est une difficulté, mais c’est aussi une chance de forger une meilleure approximation de la réalité. Le troisième principe, connu sous le nom de principe cosmologique, énonce l’homogénéité et l’isotropie de l’espace. Néanmoins notre environnement immédiat est à l’évidence très inhomogène. On entend donc par homogénéité de l’espace que les propriétés moyennes d’un morceau d’Univers de suffisamment grand volume seront identiques à celles de tout autre morceau de l’Univers. L’isotropie est l’identité des propriétés dans toutes les directions autour de l’observateur. L’objet de la cosmologie étant défini, il me semble utile de déflorer dès maintenant le sujet ! Pendant longtemps, la cosmologie a été un champ scientifique essentiellement spéculatif, en raison des difficultés inhérentes au sujet, notamment en termes d’observations. Depuis une dizaine d’année s’est imposé un modèle cosmologique standard. Derrière ce terme on entend qu’un consensus s’est dégagé au sein de la communauté des cosmologistes. Ce consensus est fondé en grande partie sur les mesures très fines des propriétés du fond de rayonnement cosmologique (notamment ses “irrégularités”) et sur les campagnes d’observations de supernovæ très lointaines. On a pu en déduire avec une précision remarquable les valeurs des paramètres cosmologiques qui déterminent la composition et la dynamique de l’Univers. Le modèle cosmologique standard est encore appelé modèle ΛCDM BBN et on précise en général qu’il est interprété dans le cadre du paradigme de l’inflation. Ces termes techniques cachent les propriétés essentielles de l’Univers : il (2) M. Leduc et M. Le Bellac eds., Einstein aujourd’hui, CNRS Editions, Paris 2005. Cosmologie 3 est dominé par la constante cosmologique Λ et la matière froide (c’est-à-dire non relativiste), mais celle-ci est invisible (cold dark matter), les abondances relatives des éléments légers dans l’Univers sont conformes aux prédictions du Big Bang (Big Bang Nucleosynthesis) et enfin les théories cadre de l’inflation apportent des réponses à un certain nombre de difficultés fondamentales qu’on appelle couramment les “problèmes cosmologiques”, le problème de l’horizon, le problème de l’Univers plat, le problème des reliques, . . . On se propose de donner dans ce cours quelques notions de cosmologie afin de comprendre en partie le modèle cosmologique standard. Les lecteurs intéressés par davantage de physique sont encouragés, ne serait-ce que pour butiner, à se reporter à la bibliographie (3) . (3) Notamment les ouvrages (mentionnés dans la bibliographie) de Kenyon, de Berry, de Liddle ou de Longair, mais aussi le remarquable Harrisson ou encore à un niveau plus élevé, Peebles, Peacock ou Rich, ou encore Kolb et Turner. 4 Mis à jour le 14 Décembre 2012 Cosmologie Cosmologie relativiste 5 6 Mis à jour le 14 Décembre 2012 Cosmologie 7 2 Bases empiriques de la cosmologie Introduction La cosmologie est l’étude de l’Univers dans son ensemble. C’est un champ disciplinaire qui a été initié par Einstein lorsqu’il s’est penché sur les implications de la relativité générale à très grande échelle. D’autres noms sont associés à la naissance de la cosmologie, de Sitter, Friedmann, Lemaı̂tre, Robertson, Walker, Eddington, Gamow, Hoyle et d’autres, mais c’est encore Einstein qui a joué un rôle précurseur, même s’il a assez rapidement abandonné ce domaine d’étude. J.P. Luminet résume l’évolution de la cosmologie de la façon suivante : . . . Friedmann et Lemaı̂tre sont de plus en plus reconnus comme des novateurs s’inscrivant dans la lignée de Ptolémée, Copernic, Kepler, Galilée, Newton et Einstein. (. . . ) Les contributions respectives des hommes de science ayant participé à l’élaboration du nouveau paradigme cosmologique se clarifient enfin : Einstein a créé la théorie de la relativité générale et écrit les équations gouvernant les propriétés physicogéométriques de l’univers ; Friedmann a découvert les solutions non statiques de ces équations, décrivant la variation temporelle de l’espace, et entrevu son possible commencement par une singularité ; Lemaı̂tre a relié l’expansion théorique de l’espace au mouvement observé des galaxies, et jeté les bases physiques du Bing Bang ; Hubble, enfin, a démontré la nature extragalactique des nébuleuses spirales et confirmé expérimentalement la loi de proportionnalité entre leur vitesse de récession et leur distance. in A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil, Paris 1997. Le fait que ce soit la relativité générale qui soit pertinente à l’échelle de l’Univers provient de ce que la gravitation est la seule interaction effective entre constituants de l’Univers dans cette limite. Le programme consiste en principe à extraire des équations d’Einstein la géométrie et la dynamique de l’Univers (4) . Il faut pour (4) La discussion qui suit est empruntée à A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics, and Cosmology Springer-Verlag, New-York 1992. 8 Mis à jour le 14 Décembre 2012 Figure 2.1 La voie lactée observée à diverses fréquences électromagnétiques. cela connaı̂tre les sources des champs, soit les composantes de T µν de même que certaines conditions aux limites. La difficulté réside dans le fait que l’on ignore à peu près tout de la distribution de matière et d’énergie, des contraintes et des vitesses dans l’Univers. Il est vrai qu’à l’époque actuelle, les observations astronomiques nous renseignent en partie sur ces distributions, mais elles semblent si irrégulières et discontinues à première vue qu’une description mathématique s’avère horriblement compliquée. De plus les observations sont limitées au cône de lumière, elles sont donc très locales. Deux hypothèses peuvent ici être avancées : celle d’un Univers hiérarchique (discontinu et imbriqué à toute les échelles (5) ) et celle d’un Univers continu à des échelles extrêmement grandes, au-delà des amas et super-amas galactiques, de l’ordre (5) Les galaxies sont un peu les unités de base, ce sont les plus grandes structures bien comprises dans l’Univers. Au voisinage de notre galaxie (la voie lactée), une quinzaine d’autres galaxies dont celle d’Andromède forment le groupe local dans un volume d’environ 1 Mpc3 . Au-delà on trouve l’amas de la Vierge (Virgo) à 10 Mpc et dans une échelle de quelques dizaines de Mpc plusieurs amas forment le superamas local de Virgo. L’Univers se structure en de tels superamas de taille typique de l’ordre de 20 Mpc. Ces superamas semblent parfois reliés par des “ponts” de matière et entre eux se trouvent d’immenses espaces apparemment vides de matière (comme dans la constellation du Bouvier, à 150 Mpc, un vide d’une trentaine de Mpc). Il semblerait qu’à une échelle encore plus grande un grand “mur” formé de feuillets se dessine sans qu’on ait la moindre idée pour le moment sur son origine. Ces éléments sont empruntés à M. Lachièze-Rey. Cosmologie 9 de quelques centaines de millions d’années-lumière. A cette échelle, la description “hydrodynamique” prévaut (les galaxies sont l’analogue des molécules d’un liquide pour lequel à une échelle assez grande devant l’échelle moléculaire, une description continue en termes de densité ρ(r), de champs et d’équations différentielles est valide). C’est cette vision hydrodynamique qui convainct actuellement la communauté. Le problème des conditions aux limites est aussi assez particulier. En électromagnétisme en général, on résoud un problème en supposant une distribution de charge finie et en imposant aux champs de s’annuler à l’infini. Il serait étrange de considérer ici que toute la distribution de matière et d’énergie de l’Univers est concentrée dans notre “voisinage” et baigne dans un grand vide, ce qui donne au problème des conditions aux limites une importance particulière. Isotropie et homogénéité de l’Univers à grande échelle En fondant la cosmologie moderne en 1917, Einstein a introduit des hypothèses naturelles, mais assez arbitraires pour résoudre ces difficultés. L’absence de conditions aux limites est compensée en supposant un Univers homogène et isotrope. L’idée d’un Univers homogène (c’est le principe cosmologique) est guidée par le souci de ne pas être anthropique en attribuant une place privilégiée à la Terre. Par ailleurs on sait maintenant, notamment grâce aux observations fines du fond de rayonnement cosmique que l’Univers est essentiellement isotrope et s’il doit être isotrope partout, il est alors également homogène. Einstein a également supposé un Univers statique, ce en quoi il avait tort, mais cela l’a conduit à introduire la constante cosmologique Λ qui se révèle maintenant indispensable dans tous les modèles cosmologiques. Les anecdotes autour de cette constante sont d’ailleurs très instructives. Einstein a tout d’abord introduit la constante cosmologique comme la simplification la plus simple qu’il puisse faire aux équations de la gravitation (respectant les symétries du problème, mais introduisant une nouvelle constante fondamentale de la physique) de sorte que l’Univers soit statique. Il a d’ailleurs combattu les solutions non statiques de Friedmann. Quelques années plus tard, les observations, notamment de Hubble, mettaient en évidence l’évolution de l’Univers (en l’occurrence son expansion), ce qui a pour un temps laissé penser à Einstein que la constante cosmologique était la “plus grosse erreur de sa vie” (6) . Cette constante est de nos jours une pièce maı̂tresse des modèles d’évolution de l’Univers, même si sa détermination précise est un problème ouvert, notamment l’interprétation de la valeur mesurée reste problématique et à l’origine d’un spectaculaire désaccord théorie-expérience (7) . Les observations de l’Univers à des échelles de plusieurs centaines de millions d’années-lumière font état d’une distribution de matière et de rayonnement remarquablement isotropes. A des échelles inférieures, l’Univers apparaı̂t composé de structures complexes, étoiles, galaxies (les galaxies sont séparées les unes des (6) La littérature fait état du terme anglais “blunder”, c’est-à-dire “bévue”, rapporté par G. Gamow, voir cependant à ce sujet A. Harvey and E. Schucking, Einstein’s mistake and the cosmological constant, Am. J. Phys. 68, 723 (2000) ou A. Pais (‘Subtle is the Lord...’: The Science and the Life of Albert Einstein, Oxford University Press, New-York 1982) qui cite une lettre d’Einstein à Weyl dans laquelle après avoir pris connaissance des données astronomiques en faveur de l’expansion de l’Univers, il s’exprime ainsi “If there is no quasi-static world, then away with the cosmological term!”. (7) La constante cosmologique a mis du temps à s’imposer. Encore assez récemment, elle ne faisait pas l’unanimité ; Feynman en 1963 par exemple écrivait dans R.P. Feynman, Lectures on gravitation, Penguin Books, 1995, qu’elle lui semblait inutile et Landau non plus n’était pas favorable à l’introduction de cette constante cosmologique, pas plus qu’à aucune modification de la théorie de la relativité générale qu’il considérait “la plus magnifique des théories physiques existantes” cité par V.L. Ginzburg, Physics Today May 1989, p.54. 10 Mis à jour le 14 Décembre 2012 Figure 2.2 Les échelles de longueur dans la nature, du noyau à l’Univers. A l’échelle de la cosmologie, le système solaire est vu comme le noyau atomique à notre échelle ! Cosmologie 11 Figure 2.3 Distribution de matière visible à grande échelle dans l’Univers. L’intensité lumineuse en termes de niveaux de gris révèle la densité de matière “baryonique”. Certaines grandes structures filamentaires sont encore perceptibles, mais la figure est grossièrement isotrope. autres de 1 Mpc en moyenne, leur densité est de l’ordre de 2.10−24 kg.m−3 ), amas de galaxies, super-amas,. . . , mais au-delà, il semble qu’une certaine description de nature hydrodynamique devienne valide, dans laquelle l’Univers est vu comme un fluide isotrope caractérisé par une densité, une pression et une équation d’état. Si l’on admet que la Terre n’occupe aucune position privilégiée, l’isotropie doit être admise pour tout autre observateur, ce qui entraı̂ne également l’homogénéité de l’Univers. Figure 2.4 Le photographie de la zone “la plus grande jamais observée”. Chacun des 9325 points est une galaxie analogue à la notre qui contient quelques centaines ou milliers de milliards d’étoiles comme le soleil (tiré du serveur sur les puissances de 10 au CERN, http://microcosm.web.cern.ch/Microcosm/p10/french/ 12 Mis à jour le 14 Décembre 2012 Le rayonnement fossile à 3 K ou fond de rayonnement cosmique (8) est également remarquablement isotrope (les fluctuations relatives sont de l’ordre de 10−5 seulement), une fois effectuées les corrections Doppler dues à la vitesse de la Terre, ou celle du satellite d’observation par rapport au référentiel propre du CBR (9) . Figure 2.5 Le rayonnement électromagnétique émis par l’Univers en échelle loglog. Cette observation confirme l’hypothèse que la distribution d’énergie ou de matière dans l’Univers, quelle que soit sa nature, est isotrope. Il semble même que les fluctuations observables dans le fond de rayonnement cosmique puissent être corrélées aux fluctuations de la distribution de matière visible. (8) On rencontre les acronymes anglais CMB pour Cosmic Microwave Background, CBR pour Cosmic Backgroung Radiation ou MBR pour Microwave Backgroung Radiation. (9) Le satellite COBE est animé d’une vitesse de 8 km.s−1 par rapport à la Terre, le mouvement saisonnier de la Terre autour du Soleil est de 30 km.s−1 , le système solaire se déplace à 220 km.s−1 autour de centre galactique, la voie lactée à 80 km.s−1 par rapport au groupe local et le groupe local de galaxies a une vitesse de 630 km.s−1 dans la direction de la constellation Hydra. Cosmologie 13 Figure 2.6 L’isotropie du fond diffus de rayonnement cosmique, une fois effectuées les corrections relatives aux mouvements locaux des satellites d’observation. Figure 2.7 Distribution essentiellement isotrope du fond de rayonnement cosmique (CMB pour Cosmic Microwave Background ou CBR pour Cosmic Backgroung Radiation) dans l’Univers. La figure du dessus provient du satellite COBE et celle du dessous, de résolution nettement meilleure, de WMAP. 14 Mis à jour le 14 Décembre 2012 Récession des galaxies, hypothèse de Hubble La mesure du déplacement vers le rouge par effet Doppler de raies caractéristiques émises par des sources lointaines (galaxies, quasars. . . ) est la preuve d’un Univers en expansion, et donne un moyen de mesurer la vitesse de récession de ces objets éloignés. En faisant appel à des modèles cosmologiques, on peut tirer des informations sur la distance de ces sources à la Terre et même une estimation de l’âge de l’Univers depuis le Big Bang. On mesure le déplacement vers le rouge des raies d’un spectre connu dont les longueurs d’onde propres (mesures et émission effectuées sur Terre) sont λ0 , et celles émises par la source et détectées sur Terre, λ′ . Cette mesure est caractérisée par le paramètre z= λ′ − λ0 . λ0 (2.1) Si la vitesse d’éloignement de la source par rapport à la Terre n’est pas trop grande, cz est une bonne approximation de la vitesse de récession radiale |v|. En effet au premier ordre en |v|/c, λ′ ≃ λ0 (1 + |v|/c), ′ 0 soit λ λ−λ = z = |v|/c 0 Doppler, λ′ = λ0 (10) s (2.2) . On pourrait utiliser ici les expressions exactes de l’effet 1 + |v|/c , 1 − |v|/c d’où l’on tire |v| = c (z + 1)2 − 1 . (z + 1)2 + 1 Les mesures de distances sont beaucoup plus délicates à réaliser. Les distances les plus courtes, dans notre voisinage immédiat jusqu’à quelques centaines de pc, sont obtenues par parallaxe (différence angulaire entre des observations faites à 6 mois d’intervalle). Ensuite il faut faire appel à des calibrations successives. On identifie un type d’étoile brillante (en fonction de l’abondance d’éléments chimiques et des raies spectrales qui les caractérisent) qui sert d’étalon. Connaissant la distance d’un tel objet (étoile, puis galaxie) par mesure de parallaxe et mesurant sa luminosité apparente Lapp. on en déduit sa luminosité absolue L0 = 4πd2 Lapp . Il faut ensuite identifier dans des galaxies plus éloignées (puis dans les amas plus lointains) des objets de même nature et de la mesure de leur luminosité apparente on déduit leur distance. Ces étalons (candles) sont d’abord des étoiles ordinaires (jusqu’à 0.2 Mpc), puis les Céphéides (jusqu’à 2 Mpc), les amas globulaires (jusqu’à 50 Mpc) et les galaxies brillantes (jusqu’à 1000 Mpc). Il est évident qu’une telle méthode de calibrations successives est très délicate et la précision est incertaine. (10) S’il s’agissait d’un mouvement de rapprochement, le signe de |v|/c serait opposé. Cosmologie 15 Figure 2.8 Déplacement des raies spectrales émises par diverses étoiles. On en déduit le décalage spectral z, puis la vitesse d’éloignement. 16 Mis à jour le 14 Décembre 2012 Figure 2.9 Les raies spectrales émises par le soleil. Chaque étoile ou galaxie a une “signature” propre. Des mesures spectrales faites dans le cas de la galaxie NGC7619 donnent par exemple z = 0.0126. La valeur approchée de la vitesse radiale |v| donne cz ≃ 3779 km.s−1 alors que la valeur exacte est 3756 km.s−1 . Des mesures effectuées indépendamment par d’autres méthodes basées sur la luminosité donnent une distance de d = 65 Mpc (1Mpc vaut 3.26 a.l. et le terme “parsec” provient de parallax second) entre la Terre et NGC7619. Partant du modèle du Big Bang (hypothèse qu’à l’origine, tous les objets cosmiques se trouvaient en un même point, donc que leurs distances relatives étaient nulles), et admettant que la vitesse de récession radiale est et a toujours été uniforme, on peut estimer que cette distance est d = |v|t où t est une estimation de l’âge de l’Univers. On obtient ainsi t ≃ 16.9 × 109 ans, soit de l’ordre de grandeur de la dizaine de milliards d’années, proche des estimations couramment admises actuellement. Notons que selon les modèles de dynamique de l’Univers, l’expression d = |v|t est changée, mais d/|v| donne toujours un ordre de grandeur dimensionné de l’âge de l’Univers. Le modèle du Big Bang a pour origine les nombreuses observations faites par Edwin Hubble (11) à partir de 1929 : le calcul précédent, répété pour de nombreuses sources cosmiques donne toujours, aux erreurs expérimentales près, le même résultat. Une des conséquences du modèle est que plus la source est éloignée, plus sa vitesse de récession par rapport à la Terre est grande, et que la relation entre cette distance d et la vitesse radiale |v| est linéaire : |v| = Hd. (2.3) Le coefficient de proportionnalité H est en fait une fonction du temps, et est appelé constante de Hubble (12) . La valeur numérique précédente donne H = |v|/d ≃ (11) En fait la première apparition de la loi de Hubble est due à Lemaı̂tre en 1927, mais son article, publié en français, est longtemps resté méconnu et sa traduction en anglais par Eddington ne comporte pas ce passage où la loi de proportionnalité distance-vitesse est établie. Les données étudiées par Hubble en 1929 provenaient d’observations faites par Slipher. Récemment, la sincérité de Hubble a été mise en doute dans cette affaire de traduction de la contribution de Lemaı̂tre. Voir à ce sujet Nature, July 11, 2011 , le papier original , sa traduction et le papier qui soulève la polémique. (12) La dénomination de constante de Hubble est justifiée dans le sens où la variation dans le temps est extrêmement faible aux échelles du système solaire et par ailleurs la valeur est la même en tout point de l’espace à un instant donné. L’image classique du ballon de baudruche donne un sens à la dépendance temporelle. Cosmologie 17 57.8 km.s−1 Mpc−1 , compatible avec la fourchette admise actuellement de 40 < H < 100 km.s−1 Mpc−1 . (2.4) Notons par ailleurs que la Terre ne devant pas occuper de position privilégiée dans l’espace, on devra s’attacher à retrouver une loi de même forme en choisissant une origine arbitraire. Figure 2.10 Les données analysées par Hubble en 1929 (à gauche) et celles issues d’observations actuelles (à droite). Les résultats analysés à l’origine par Hubble étaient relativement peu convaincants, comme le montre la figure ci-dessus, mais les données accumulées depuis sont sans ambigüité. On peut noter à propos des données de 1929 que les distances mises en jeu sont probablement encore assez faibles par rapport aux échelles de longueur typiques de la cosmologie. La dispersion observée sur la figure historique peut donc provenir de l’imprécision des mesures de l’époque, mais aussi simplement du fait qu’elles mettent encore en jeu des mouvements locaux (13) et pas uniquement le mouvement de récession générale. Les mesures plus récentes en revanche valident sans doute possible la loi de Hubble. Plutôt que le diagramme de Hubble, on reporte maintenant la brillance effective d’un certain type d’objet bien identifié (par exemple les SNIa) en fonction de leur redshift z. La première quantité varie comme l’inverse de la distance au carré (le flux ou la brillance effective d’une classe d’objets de luminosité L vaut L/(4πd2 ) et la seconde est proportionnelle à la vitesse (v ≃ cz). (13) Le groupe local auquel appartient la voie lactée est par exemple animé d’une vistesse de 630 km.s−1 par rapport au référentiel du rayonnement cosmique. 18 Mis à jour le 14 Décembre 2012 Figure 2.11 Représentation dans un diagramme de Hubble des données issues de observations récentes de supernova de type Ia. Cosmologie 19 3 Parenthèse : notions de relativité Quadrivecteurs La théorie de la relativité repose sur l’expression d’un invariant quadridimensionnel, ds2 = c2 dt2 − dx2 − dy2 − dz 2 , analogue à l’expression du théorème de Pythagore qui donne la distance (ici infinitésimale) entre deux points de l’espace euclidien. Les signes − qui apparaissent traduisent la nature un peu différente de l’espace-temps de la relativité (on parle de métrique de Minkowski). Pour permettre une généralisation de cet invariant à des espaces quelconques (ou simplement en restant dans l’espace de Minkowski, mais en travaillant avec les coordonnées locales et non plus cartésiennes), on introduit la notion de tenseur ou plus simplement d’abord de quadrivecteur contravariant (ou tenseur de rang 1 contravariant). En coordonnées cartésiennes, les composantes contravaraintes du quadrivecteur sont simplement les composantes ordinaires, par exemple dxµ = (c dt, dx, dy, dz) et le jeu de 4 composantes (14) xµ , µ = 0, 1, 2, 3 forme un quadrivecteur si ces 4 composantes obéissent par changement de référentiel inertiel (15) à la transformation de Lorentz : x′µ = Λµν xν , (14) Un indice grec, µ par exemple, court sur quatre valeurs, de 0 à 3. La composante 0 est aussi appelée composante temporelle et les trois autres composantes sont les composantes spatiales (on utilise parfois un indice latin, i par exemple, qui court alors de 1 à 3, ou bien la notation vectorielle). (15) Par défaut, le changement de référentiel inertiel est toujours tel que le référentiel R′ se déplace à la vitesse u = βc parallèlement à l’axe 1 (axe Ox, commun à Ox′ ) par rapport au référentiel R. 20 Mis à jour le 14 Décembre 2012 où la matrice de transformation de Lorentz est définie par γ −βγ 0 0 −βγ γ 0 0 [Λµν ] = 0 0 1 0. 0 0 0 1 Il est très important de noter quelques règles de lecture de la transformation cidessus : Lorsqu’un même indice apparaı̂t comme c’est le cas ici en position haute et basse (on parle de positions contravariante et covariante), cela signifie qu’une somme sur les quatre valeurs permises pour cet indice est sous-entendue. C’est la convention de sommation des indices muets d’Einstein qui allège considérablement l’écriture. On dit que l’indice est contracté, il a donc explicitement disparu de l’expression considérée après sommation. Pour le reste, on doit voir apparaı̂tre des deux côtés de l’égalité les mêmes indices non contractés dans les mêmes positions, contravariantes ou covariantes. L’introduction de la matrice de transformation Λµν est une commodité d’écriture. Si l’on note de manière très générale qu’au quadrivecteur xν exprimé dans R, il correspond un quadrivecteur x′µ exprimé dans R′ , et que celui-ci est une fonction de xν , alors, si la transformation de l’un à l’autre est linéaire, le développement de Taylor de x′µ (xν ) ne laisse subsister que le terme du premier ordre, x′µ = ∂x′µ ν x . ∂xν Pour que l’indice ν soit en bonne position (covariante), on écrit aussi ∂ = ∂ν , ∂xν ∂ ~ ce qui définit la dérivée covariante, ∂ν = 1c ∂t , ∇ . La justification d’un indice “en bas” est la suivante : une grandeur scalaire Q fonction des coordonnées d’espace∂Q µ temps varie d’une quantité δQ = ∂x si les coordonnées varient. Pour assurer µ δx ∂Q que δQ soit un scalaire, il faut contracter l’indice µ et donc le terme ∂x µ doit avoir un indice covariant, c’est-à-dire s’écrire comme ∂µ Q. L’origine de la transformation de Lorentz est à chercher dans la nécessité de trouver une loi de transformation des composantes spatio-temporelles qui généralise celle de Galilée, ct′ = ct x′ = −βct + x y′ = y z′ = z devenue inacceptable car elle ne préserve pas la forme des équations de Maxwell et n’assure donc pas l’invariance des phénomènes liés à l’électromagnétisme par changement de référentiel inertiel. La généralisation cherchée doit être linéaire afin d’assurer que si le principe d’inertie est satisfait dans un référentiel donné, il le soit Cosmologie 21 automatiquement dans tout autre référentiel en translation uniforme par rapport au premier. De plus les composantes transverses doivent être inchangées dans la transformation (16) , on écrit donc en toute généralité ct′ = Dct − Ex x′ = −Aβct + Bx ce qui conduit à la transformation des vitesses sous la forme v ′ /c = Bv−Aβc Dc−Ev . ′ ′ ′ Appliquée à l’origine de R (v = 0 et v = u), à l’origine de R (v = −u et v = 0) et à la lumière (v ′ = v = c), on obtient trois contraintes soit, ct′ = A(u)(ct − βx) x′ = A(u)(−βct + x) La quatrième contrainte est assurée par la condition A(−u) = A(u) (le signe de la vitesse est pris en compte dans β), ce qui fait qu’en combinant cette transformation à la transformation inverse on obtient 1 −β ct ct′ = A(u) −β 1 x x′ 1 β 1 −β ct′ , ct′ = 1 0 = A(u)A(−u) ′ 0 1 β 1 −β 1 x′ x qui impose A(u) = γ ≡ (1 − β 2 )−1/2 . Ayant maintenant défini un quadrivecteur contravariant comme la donnée de 4 composantes qui se transforment par changement de référentiel inertiel conformément à la transformation linéaire de Lorentz, on peut construire une norme à ce quadrivecteur, qui s’avère invariante par changement de référentiel inertiel, ce qui lui confère un rôle privilégié dans la théorie de la relativité. Reprenons le cas de l’intervalle. On a défini dxµ = (c dt, dr) et ds2 = (c dt)2 − | dr|2 . Introduisant les composantes covariantes associées à dxµ , soit dxµ = (c dt, − dr), on peut écrire ds2 = dxµ dxµ = (c dt)2 − | dr|2 . On introduit encore le tenseur métrique qui fait passer des composantes contravariantes aux composantes covariantes, gµν dxµ = dxν , (16) ds2 = gµν dxµ dxν 1 0 0 −1 [gµν ] = 0 0 0 0 0 0 −1 0 0 0 0 −1 On note r⊥ les coordonnées transverses à u. La seule transformation acceptable est de la forme r′⊥ = K(u)r⊥ avec K(0) = 1 et K(−u) = K(u) (ce sont des coordonnées transverses). On a donc r′⊥ = K(u)r⊥ = K(−u)K(u)r′⊥ , soit K(−u)K(u) = K 2 (u) = 1, ou en définitive K(u) = 1. 22 Mis à jour le 14 Décembre 2012 en coordonnées cartésiennes. On joue avec gµν ou g µν pour élever ou abaisser des indices, par exemple pour transformer les composantes covariantes x′µ = Λµν xν = ∂x′µ x ∂xν ν avec Λµν = gµσ g τ ν Λστ , ce qui revient à préserver la composante si l’on élève ou l’on abaisse une composante temporelle et à changer le signe s’il s’agit d’une composante spatiale. Il est clair que toute contraction (norme) d’un quadrivecteur, Aµ Aµ définit un scalaire invariant par transformation de Lorentz. Tenseurs On généralise les notions précédentes à des objets ayant davantage de composantes. Ainsi par exemple, le jeu de 16 composantes Aµν obéissant par changement de référentiel inertiel à la transformation A′ µν = Λµσ Λν τ Aστ définit un tenseur de rang 2 deux fois contravariant. De manière équivalente, le tenseur deux fois covariant associé se transforme comme A′ µν = Λµσ Λν τ Aστ et un tenseur mixte, comme ν A ′ µ = Λ µσ Λ ν τ A σ τ . Il est bon de noter que tout objet muni d’indices ne forme pas nécessairement un tenseur. Par exemple Λµν caractérise un changement de référentiel, mais pas une quantité physique dans un référentiel donné. De même, la loi de transformation étant linéaire si un objet n’a que des composantes nulles dans un référentiel inertiel, il doit en être de même dans tous s’il s’agit d’un tenseur. Définition des grandeurs physiques et expression covariante des lois physiques Pour définir une quantité physique dans le formalisme tensoriel, il est naturel de partir d’une expression classique, par exemple vectorielle, puis d’en chercher la généralisation évidente sous forme de quadrivecteur. On peut ensuite écrire explicitement les composantes du quadrivecteur pour leur donner un sens. On obtient du même coup la loi de transformation des composantes et des invariants (par contraction) qui peuvent s’avérer très utiles. Prenons le cas de la vitesse, v= dr dt −→ vµ = dxµ . dτ Le temps n’étant plus un invariant, on a choisi de paramétrer la trajectoire (on parle de ligne d’univers) par le temps propre, tel qu’il s’écoule dans le référentiel propre de l’objet d’étude, défini par ds2 = dxµ dxµ = c2 dτ 2 , p dτ = dt 1 − |v|2 /c2 Cosmologie 23 La quadrivitesse v µ est bien un tenseur de rang 1 car xµ en est un et τ est un dt dr invariant. Ses composantes, c dτ et dτ ou encore v µ = (γc, γv), γ ≡ (1 − |v|2 /c2 )−1/2 se transforment comme v ′ µ = Λµν v ν , ce qui conduit notamment à la loi habituelle de composition des vitesses qui remplace celle de Galilée. L’invariant associé est µ dx 2 vµ v µ = dτµ dx dτ = c . On peut maintenant généraliser p = mv pour définir le quadrivecteur énergieimpulsion, pµ = mv µ = (γmc, γmv) dont la première composante est homogène à une énergie divisée par c, p0 = E/c et de sorte que l’on ait d’une part la loi de transformation, p′µ = Λµν pν et d’autre part l’invariant très important (17) , pµ pµ ≡ E 2 /c2 − |p|2 = m2 c2 . Cette quantité est utile en particulier dans l’étude des collisions, où la quadriimpulsion totale se conserve. Exprimées à l’aide des tenseurs, les lois physiques prennent une forme dite manifestement covariante car leur validité est assurée dans tout référentiel inertiel, moyennant les règles de transformation des tenseurs. Un exemple est fourni par la généralisation de la loi fondamentale de la dynamique que l’on écrit m dv µ = Φµ dτ d où Φµ définit la quadri-force, Φµ = γ dt (E/c, p), soit Φ0 = La loi de transformation s’ensuit également, Φ′µ = Λµν Φν . γ dE c dt ~ =γ et Φ dp dt = γF. Formulation covariante de l’électromagnétisme Les lois de l’électromagnétisme prennent également une forme plus élégante et compacte à l’aide de la notation tensorielle. Commençons par la loi de conservation de la charge, div j + ∂ρ = 0. ∂t Si elle vaut pour un système donné étudié dans un certain référentiel, on souhaite évidemment qu’elle soit vraie aussi pour tout autre observateur. La forme de cette équation suggère l’introduction du quadrivecteur j µ = (ρc, j), qui n’est rien d’autre que la généralisation de j = ρv de sorte que ∂µ j µ = (17) 1 ∂ρc + div j = 0. c ∂t Attention, ici p = γmv et non pas mv. 24 Mis à jour le 14 Décembre 2012 Le fait que cette expression soit une contraction nous assure de sa validité dans tous les référentiels inertiels. C’est une expression manifestement covariante. Pour les potentiels on procède de manière analogue. On sait que les équations de Maxwell dans le vide, div E = ρ/ε0 div B = 0 rot E = − ∂B ∂t ∂E ∂t et la relation entre champs et potentiels, rot B = µ0 j + ε0 µ0 ~ − E = −∇φ ∂A ∂t B = rot A. entraı̂nent les équations de propagation des potentiels, 2 ~ 2A − 1 ∂ A = − 1 j ∇ c2 ∂t2 ε0 c2 2 ~ 2 φ − 1 ∂ φ = −ρ/ε . ∇ 0 c2 ∂t2 si l’on impose la jauge de Lorenz-Lorentz (18) 1 ∂φ = 0. c2 ∂t La forme même de la jauge de Lorenz suggère l’introduction d’un quadripotentiel div A + Aµ = (φ/c, A) de sorte qu’elle apparaisse comme une contraction invariante, 1 ∂ φ µ ∂µ A = + div A = 0. c ∂t c Les équations de propagation s’obtiennent de même de manière covariante au moyen de l’opérateur d’Alembertien, 1 ∂ ~ , ∇) c ∂t 1 ∂ ~ , −∇) ∂µ = ( c ∂t ∂µ = ( ∂µ ∂ µ = ( (18) 1 ∂2 ~ 2) , −∇ c2 ∂t2 Cette relation, très importante puisqu’il s’agit d’une jauge covariante, est due au danois Ludvig Valentin Lorenz, mais elle fut popularisée par un quasi-homonyme, le physicien hollandais incontournable, Hendrik Antoon Lorentz, auquel l’usage en a attribué la paternité. Cosmologie 25 soit ∂µ ∂ µ Aν = µ0 j ν , µ0 = 1/ε0 c2 . On cherche ensuite à définir un tenseur représentant le champ électromagnétique (qu’on appelle souvent tenseur de Faraday). On sait que Aµ est un 4-vecteur. Par ailleurs la relation B = rot A contient des termes de la forme Bx = ∂Ay ∂Az − ∂y ∂z qui suggèrent de définir un tenseur de rang 2 antisymétrique F µν = ∂ µ Aν − ∂ ν Aµ . On a trivialement des zéros sur la diagonale, F 00 = F ii = 0 et F µν = −F νµ ou encore Fµν = −Fνµ . Les composantes non nulles du tenseur deux fois contravariant (19) s’expriment explicitement en fonction des champs E et B. F µν = ∂ µ Aν − ∂ ν Aµ = 0 E x /c [F µν ] = Ey /c Ez /c ∂Aµ ∂Aν − . ∂xµ ∂xν −Ex /c −Ey /c 0 −Bz Bz 0 −By Bx −Ez /c By −Bx . 0 On définit également un tenseur champ électromagnétique dual (19) (20) . Le tenseur deux fois covariant Fµν = gµσ gντ F στ s’en déduit en conservant le signe de F00 = F 00 et des composantes purement spatiales, Fij = F ij et en changeant le signe des composantes mixtes F0j = −F 0j : 0 −Ex /c [Fµν ] = −Ey /c −Ez /c (20) Ex /c 0 Bz −By Ey /c −Bz 0 Bx Ez /c By . −Bx 0 Celui-ci est formé au moyen du tenseur de Levi-Civita ǫµνστ = +1 −1 0 si µ, ν, σ, τ = 0, 1, 2, 3 et permutations paires si permutations impaires si deux indices ou plus sont égaux En particulier on a ǫµνστ = −ǫµνστ . On définit le tenseur dual F̄ µν par la contraction F̄ µν = 1 µνστ ǫ Fστ . 2 26 Mis à jour le 14 Décembre 2012 Utilisant les règles de transformation des tenseurs, on obtient aisément les transformations des champs électromagnétiques par changement de référentiel inertiel. F µν étant un tenseur de rang deux, deux fois contravariant, il se transforme par définition selon F′ µν = Λµσ Λν τ F στ , et sous forme condensée on écrit : E′k = Ek , B′k = Bk , E′⊥ = γu (E⊥ + βu c ∧ B⊥ ) B′⊥ = γu (B⊥ − (βu /c) ∧ E⊥ ). En réalisant des contractions sur tous les indices, on obtient les invariants du champ électromagnétique : 1 − F µν Fµν = E2 /c2 − B2 , 2 1 − F̄ µν Fµν = E · B/c. 4 Construisons les contractions du tenseur champ électromagnétique, par exemple ∂µ F µν . Pour ν = 0, on a ∂µ F µ0 = ∂0 F 00 + ∂1 F 10 + ∂2 F 20 + ∂3 F 30 =0+ = ∂ ∂ ∂ (Ex /c) + (Ey /c) + (E /c) ∂x ∂y ∂z z 1 1 div E = ρc c ε0 c2 = µ0 j 0 . Pour ν = 1, on a de même ∂µ F µ1 = ∂0 F 01 + ∂1 F 11 + ∂2 F 21 + ∂3 F 31 = ∂ ∂ 1 ∂ (−Ex /c) + 0 + Bz + (−By ) c ∂t ∂y ∂z =− 1 ∂Ex + (rot B)ux c2 ∂t = µ0 j 1 , Ses composantes s’obtiennent à partir de celles de F µν en changeant E/c en B et B en −E/c : 0 Bx µν [F̄ ] = By Bz −Bx 0 −Ez /c Ey /c −By Ez /c 0 −Ex /c −Bz −Ey /c Ex /c 0. Cosmologie 27 et les deux dernières composantes spatiales s’en déduisent par permutation. On a donc ∂µ F µν = µ0 j ν , (3.1) expression qui regroupe les deux équations de Maxwell avec sources, div E = ρ ε0 1 ∂E = µ0 j. rot B − 2 c ∂t (3.2) Le second couple d’équations de Maxwell s’obtient plus aisément après l’introduction du tenseur champ électromagnétique dual. Examinons la contraction ∂µ F̄ µν . Pour ν = 0, on a ∂µ F̄ µ0 = ∂0 F̄ 00 + ∂1 F̄ 10 + ∂2 F̄ 20 + ∂3 F̄ 30 =0+ ∂By ∂Bx ∂Bz + + ∂x ∂y ∂z = div B. Pour ν = 1, on a de même ∂µ F̄ µ1 = ∂0 F̄ 01 + ∂1 F̄ 11 + ∂2 F̄ 21 + ∂3 F̄ 31 = ∂ ∂ 1 ∂ (−Bx ) + 0 + (−Ez /c) + (E /c) c ∂t ∂y ∂z y =− 1 ∂Bx 1 − (rot E)ux . c ∂t c On en déduit l’expression unifiée du second couple d’équations de Maxwell, les équations sans second membre, ∂µ F̄ µν = 0. (3.3) Les équations de Maxwell manifestement covariantes s’écrivent donc : ∂µ F µν = µ0 j ν , ∂µ F̄ µν = ∂µ F νλ + ∂ν F λµ + ∂λ F µν = 0. (3.4) 28 Mis à jour le 14 Décembre 2012 Cosmologie 29 4 Relativité générale et Cosmologie On se propose de donner dans ce chapitre quelques éléments de cosmologie relativiste. Il faut pour cela tout d’abord disposer d’une théorie relativiste de la gravitation, la plus célèbre étant la théorie de la relativité générale dont on présentera les ingrédients avant de passer à son application à la cosmologie. Les lecteurs intéressés par davantage de physique sont encouragés, ne serait-ce que pour butiner, à se reporter à la bibliographie (21) . Préambule Rappelons succintement quelques notions sur les tenseurs qui seront utiles à la compréhension de ce qui suit. On repère un événement de l’espace-temps par ses coordonnées, e.g. xµ = (ct, r, θ, ϕ) et l’intervalle élémentaire entre deux événements voisins s’écrit ds2 = gµν dxµ dxν où gµν est le tenseur métrique, tel que gµν g µν = 1. Placé “en haut”, l’indice µ = 0, 1, 2, 3 est appelé contravariant. En position basse, il est dit covariant et l’on passe de l’un à l’autre au moyen du tenseur métrique, xµ = gµν xν . La répétition des indices (“en haut” et “en bas”) s’appelle une contraction, et elle signifie que l’indice en question est sommé sur ses quatre valeurs. De manière (21) Notamment les ouvrages de Kenyon, de Berry ou de Longair, mais aussi le remarquable Harrisson ou encore à un niveau plus élevé, Peacock, Peebles, Kolb et Turner ou Rich. 30 Mis à jour le 14 Décembre 2012 générale, un tenseur obéit à une loi de transformation linéaire par changement de référentiel inertiel (représenté par la loi Λµν ) et peut avoir autant d’indices que nécessaire, chaque indice induisant la loi de transformation, e.g. µ µ x′ = Λµν xν , Λ µν = ∂x′ ∂xν R′ µν = Λµρ Λνσ Rρσ , λ R′ µνo = Λλρ Λµσ Λντ Λoυ Rρστ υ . On introduira de nombreux tenseurs par construction à partir de tenseurs existants, comme v µ = dxµ / dτ où τ est le temps propre, ds2 = c2 dτ 2 , et on rencontrera également des objets qui ne sont pas des tenseurs, mais portent des indices, comme les symboles de Christoffel. Dans ce cas cependant, les “règles pour monter ou descendre les indices” sont les mêmes que pour les tenseurs. Gravitation relativiste Nous allons tout d’abord établir le cas particulier de la métrique de Schwarzschild avant de donner quelques justifications aux équations d’Einstein. ⊲ Le décalage spectral gravitationnel. En , Einstein a montré, à partir du principe d’équivalence, que les radiations électromagnétiques sont affectées par la présence d’un champ gravitationnel(22) . Le raisonnement utilise simplement l’effet Doppler et le principe d’équivalence qui stipule en particulier que la lumière se propage à la vitesse c dans un référentiel tangent au référentiel en chute libre (i.e. dans le référentiel animé d’une vitesse uniforme coı̈ncidant à l’instant donné avec la vitesse du référentiel en chute libre, et ceci à condition que la durée de l’expérience soit suffisamment brève et que l’étendue spatiale du référentiel soit petite). Considérons une capsule de longueur dr en chute (23) libre dans le champ de gravitation g = − GM . Une r 2 ur créé par une masse M source lumineuse placée au bas de la capsule émet une onde électromagnétique captée ensuite par un détecteur situé au plafond de la capsule. Conformément au principe d’équivalence, la vitesse de propagation de l’onde, c, est constante dans toutes les directions dans la capsule en chute libre. Le pulse de lumière émis par la source atteint le détecteur après une durée dt = dr/c. Pour un observateur extérieur, immobile par rapport à la source du champ de gravitation, l’onde est détectée avec un décalage Doppler dû à l’éloignement de la source à la vitesse instantanée v = g dt. Au premier ordre en vc , la variation de fréquence vaut(24) dν v g dr dν g = − = − 2 , ou = − 2 ν. ν c c dr c A l’altitude r+ dr, un observateur externe mesure une fréquence modifiée ν(r+ dr) = ν(r) + dr dν dr : g dr GM ν(r + dr) = ν(r) 1 − 2 = ν(r) 1 − 2 2 dr . c r c (22) A. Einstein, Principe de Relativité et Gravitation, §V, op. cit., pp. 115-119. I.R. Kenyon, General Relativity (Oxford University Press, Oxford 1990), p. 15. (24) Il s’agit de l’effet :si la source S s’éloigne à la vitesse v de l’observateur q Doppler longitudinal (23) O, on a νO = νS 1−v/c 1+v/c ≃ νS 1− v c +O v2 c2 redonne le résultat classique de l’effet Doppler. . Au premier ordre en v , c la relativité restreinte Cosmologie 31 D g t(r+dr) dr S v t(r) Figure 4.1 Le temps propre dépend du champ de gravitation. Pour le mettre en évidence, on considère une capsule en chute libre dans le champ de gravitation g supposé uniforme. Une source située sur le sol de la capsule émet une onde électromagnétique détectée par un récepteur placé au plafond. On compare les fréquences mesurées par un observateur lié à la capsule et un observateur fixe par rapport à la source de gravitation. Si chaque “pulse” de l’onde est utilisé comme unité de temps, les horloges situées 1 tels que : aux distances r et r + dr indiquent des temps t(r) ∼ ν(r) GM t(r + dr) = t(r) 1 + 2 2 dr r c au premier ordre. Avec t(r + dr) = t(r)+ dt dr dr, on en déduit l’équation différentielle GM dt = 2 2 dr t r c que l’on intègre de l’infini, où le champ de gravitation n’est plus sensible, jusqu’à r, soit : ∞ t(∞) GM 1 GM ln = 2 − = t(r) c r r rc2 (4.1) 2 GM t(r) = t(∞) × e−GM/rc ∼ t(∞) 1 − . rc2 Cette expression est parfois écrite en fonction du potentiel gravitationnel ψ(r) = −GM/r : ψ(r) t(r) = t(∞) 1 + 2 c . Comme ψ(r) est toujours négatif, t(∞) > t(r), les horloges sont accélérées par le champ de gravitation. 32 Mis à jour le 14 Décembre 2012 L’équation précédente a été obtenue en partant de l’effet Doppler au premier ordre en vc . A cet ordre, les résultats classique et relativiste coı̈ncident, ce qui suppose que la vitesse d’éloignement de la source reste faible par rapport à c, ou encore, que le champ de gravitation n’est pas trop important (ce qui légitime le développement au premier ordre. Il est commode d’introduire ici la notation propre à la notion d’intervalle. t(r) représente le temps propre local, plus généralement noté τ . Dans la limite des faibles champs de gravitation, on a donc au premier ordre : 2GM , (4.2) dτ 2 = dt2 1 − rc2 qui fournit la composante g00 du tenseur métrique. ⊲ Courbure de l’espace-temps dans un champ de gravitation statique et isotrope. La courbure de l’espace-temps au voisinage d’une source de champ gravitationnel s’obtient facilement grâce à la déviation géodésique (La déviation géodésique exprime le fait que deux corps lancés avec une même vitesse initiale d’un même point, dans deux directions distinctes, voient leur distance relative croı̂tre selon une loi non linéaire si l’espace-temps n’est pas plat. De ce point de vue, l’effet d’un champ de gravtitation est localement équivalent à une courbure.). Une géodésique de l’espace-temps plat est une ligne droite, c’est-à-dire la trajectoire d’une particule libre dans un référentiel inertiel. Les lignes géodésiques de l’espace-temps courbe doivent être, par extension, les trajectoires de particules tests en chute libre. FB Α t r FA ξ α M r FB Β Figure 4.2 On calcule la courbure de l’espace-temps grâce à la déviation géodésique. On considère pour cela deux masses tests attirées par une même source de gravitation M et l’on calcule l’accélération relative des deux corps d’épreuve. Considérons deux objets A et B, de masses identiques m (on néglige leur interaction gravitationnelle mutuelle), en chute libre dans le champ de gravitation d’une même masse M située à l’origine des coordonnées. Nous allons éliminer le champ de gravitation créé par M et le remplacer par un effet de géométrique de courbure. Du fait de leur mouvement, les deux corps A et B se rapprochent l’un de l’autre et on se propose de calculer leur accélération relative, dans une direction perpendiculaire à la géodésique (direction tangentielle), Ft = m d2 ξ , dt2 Cosmologie 33 où ξ = αr est l’abscisse curviligne dans la direction tangentielle. Dans le référentiel en chute libre A, la force apparente(25) s’exerçant sur A, projetée dans la direction tangentielle t s’écrit Ft = −FB sin α ≃ −FB α. En écrivant FB = GM m , r2 α= ξ , r on obtient l’accélération différentielle GM d2 ξ =− 3 ξ 2 dt r qui ne peut disparaı̂tre que si le champ de gravitation est uniforme. Pour un mouvement supposé non relativiste, ds2 = c2 dτ 2 ≃ c2 dt2 , on obtient d2 ξ 1 d2 ξ GM = 2 2 = − 3 2 ξ = Kξ 2 ds c dt r c (4.3) par définition de la courbure K dans un continuum hyperbolique (on modifie simplement le signe pour tenir compte de la signature des coordonnées spatiales dans l’équation métrique(26) ) : K =− GM . r 3 c2 (4.4) Cette quantité représente la courbure de l’espace-temps en présence d’un champ de gravitation statique et à symétrie sphérique. On constate que c’est la distribution de matière, à l’origine des champs gravitationnels, qui est responsable de la courbure de l’espace-temps. Figure 4.3 La distribution de matière est à l’origine de la courbure de l’espacetemps (tiré de Gamow, op. cit., p. 106). (25) On néglige l’interaction entre les corps A et B, cette force apparente résulte donc de l’existence d’une accélération relative entre A et B. (26) Il s’agit en fait de la composante Kφt du tenseur de courbure car l’accélération est transverse par rapport au mouvement de A qui se fait au cours du temps. 34 Mis à jour le 14 Décembre 2012 ⊲ La métrique de Schwarzschild. − Tenseur métrique pour un champ statique à symétrie sphérique : Le “redshift gravitationnel” nous donne la partie temporelle de l’équation métrique au voisinage d’un objet massif. Si l’on considère un champ de gravitation à symétrie sphérique, la partie angulaire est également connue et l’on a 2GM 2 2 2 2 ds = c dτ = c 1 − dt2 + grr dr 2 − r 2 dΩ2 rc2 2GM 2 = c 1− dt2 + grr dr 2 − r 2 dθ2 − r 2 sin2 θ dϕ2 , rc2 il manque néanmoins une information sur la partie radiale. Dans le cas d’une répartition de matière à symétrie sphérique, l’espace-temps doit être isotrope, c’est-à-dire que la courbure obtenue au paragraphe précédent doit être la même dans toutes les directions. De plus, celle-ci détermine la partie radiale du tenseur métrique par l’intermédiaire de l’“excellent théorème de Gauss”(27) . On a donc ici, en ne considérant que l’espace tridimensionnel, donc en ignorant les signes négatifs dans les composantes du tenseur métrique (cela signifie que l’on pose ici ′ ′ ′ ds2 = grr dr 2 + gθ′ dθ2 + gϕϕ dϕ2 , avec gij = −gij où les gij sont finalement les composantes cherchées) ′ GM 1 dgrr =− 3 2, ′2 dr 2rgrr r c K= ′ soit, par intégration entre le point courant et l’infini où grr = 1 (espace euclidien), ′ 2GM dr dgrr , 2 = − c2 ′ r2 grr r r 1 2GM − ′ = , grr ∞ rc2 ∞ 1− 2GM 1 , = ′ grr rc2 et finalement ′ = grr 1 1− 2GM rc2 . (4.5) La métrique purement spatiale est donc de la forme ds2espace = (27) dr 2 + r 2 dΩ2 . 1 − 2GM 2 rc Le Theorema Egregium (“théorème remarquable” en latin) est un important théorème énoncé par Carl Friedrich Gauss et portant sur la courbure des surfaces. Il dit que celle-ci peut être entièrement déterminée en mesurant les angles et les distances d’une surface, c’est-à-dire qu’elle ne dépend pas de la manière dont la surface peut être plongée dans l’espace tridimensionnel (wikipedia). Cosmologie 35 On en déduit, en rétablissant les signes, l’équation métrique et le tenseur métrique de Schwarzschild(28) : 2GM dr 2 2 2 2 2 2 − r 2 dΩ2 , (4.6a) ds = c dτ = 1 − c dt − rc2 1 − 2GM rc2 gµν = 1− 2GM rc2 0 0 0 0 − 1− 2GM −1 rc2 0 0 0 0 −r 2 0 0 0 . 0 2 2 −r sin θ (4.6b) qui redonnent bien les expressions de Minkowski dans les limites r → ∞ ou M = 0. Si l’on introduit le potentiel gravitationnel ψ(r) = −GM/r, les composantes du tenseur métrique s’écrivent g00 = − 2ψ(r) 1 . =1+ g11 c2 Les effets de courbure (donc de relativité générale) sont importants si pas négligeable devant 1. La quantité 2GM rc2 n’est 2GM c2 donne l’ordre de grandeur des distances auxquelles les effets relativistes sont sensibles. A titre indicatif, à la surface de la Terre ou du Soleil, on a respectivement rg = Terre : rg⊕ /R⊕ = 1.4 · 10−9 , Soleil : rg⊙ /R⊙ = 4.2 · 10−6 . − Equation géodésique dans la métrique de Schwarzschild : Dans le cadre de la relativité restreinte, on sait que l’action de la particule libre est proportionnelle à la longueur de la géodésique(29) , soit, avec la métrique de Minkowski : Z Z S = −mc ds = L dλ, 1/2 dxµ dxν ds = ηµν dx dx = ηµν dλ, dλ dλ 1/2 dxµ dxν L = −mc ηµν , dλ dλ µ (28) ν 1/2 (4.7) La métrique en présence d’un champ de gravitation statique à symétrie sphérique a été obtenue par la résolution des équations d’Einstein, moins de deux mois après la parution de l’article d’Einstein, par K. Schwarzschild, On the Gravitational Field of a Point Mass According to Einstein’s theory, Sitzber. Preuss. Akad. Wiss., Physik-Math. K1, 189 (1916) 189, traduit dans Black Holes, Selected Reprints, Am. Ass. Physics Teachers, december 1982, p.19 ou encore dans arXiv:physics/9905030. (29) F. Rohrlich, Classical Charged Particles (Addison-Wesley, Redwood City 1990), p. 277, P.J.E. Peebles, Principles of Physical Cosmology (Princeton University Press, Princeton 1993), p. 244. 36 Mis à jour le 14 Décembre 2012 où λ est un paramètre arbitraire permettant de paramétrer la trajectoire de la 1/2 2 si λ est le temps particule libre. On retrouve bien entendu L = −mc2 1 − |v| 2 c t mesuré par un observateur. En présence d’une énergie potentielle U (r), l’observateur fixe pourra définir un lagrangien par l’expression(30) 2 L = −mc |v|2 1− 2 c 1/2 − U (r), et les équations du mouvement découlent des équations d’Euler-Lagrange appliquées à ce lagrangien, mais en gravitation relativiste, l’énergie potentielle sera automatiquement incluse dans les composantes gµν du tenseur métrique, et l’étude du mouvement d’un corps d’épreuve se réduit à un problème purement géométrique. Tandis que, chez Newton, les équations des trajectoires doivent être postulées à part, tout à fait indépendamment de la structure de l’espace, le principe géodésique édicte ici, d’une manière extraordinairement naturelle, que les trajectoires des particules d’épreuve ne sont rien d’autre que les géodésiques de l’espace(∗) . L’espace une fois esquissé, après que les équations de champ ont été résolues, les trajectoires sont toutes et totalement définies, contenues, tracées, creusées dans la structure même de l’espace qui va s’en trouver précisé. (. . .) Qui plus est, le principe géodésique s’appuie sur le principe d’inertie qu’il généralise. A tel point que l’expression de l’un s’applique à l’autre : un corps abandonné à lui-même persiste dans son état de mouvement. Mais tandis que, pour Galilée, cet état se réduit au mouvement rectiligne uniforme, il couvre désormais l’ensemble des mouvements purement gravitationnels possibles. Ainsi les corps sont-ils abandonnés à eux-mêmes, libérés de toute contrainte sinon de celle que leur trace l’espace lui-même. L’espace qui n’est guère plus que l’ensemble des mouvements possibles (31) . (∗) Il ne s’agit ici que des particules d’épreuve et non pas des trajectoires des corps participant au champ gravitationnel dans lequel ils naviguent. La généralisation de l’action en relativité générale conduit naturellement à la définir par l’élément curviligne le long de la courbe géodésique. Celle-ci est bien invariante par changement arbitraire de système de coordonnées(32) . Z Z µ ν 1/2 S = −mc ds, ds = gµν dx dx , δ ds = 0. (4.8) On peut alors effectuer le calcul variationnel en conservant le formalisme covariant. On note pour cela que δ( ds2 ) = δ(gµν dxµ dxν ) = 2 ds δ( ds) = dxµ dxν δgµν + 2gµν dxµ δ( dxν ). On obtient δ( ds) = (30) 1 dxµ ν ∂gµν ρ dxµ dx δx + g d(δxν ). µν 2 ds ∂xρ ds L. Brillouin, L’atome de Bohr (Presses Universitaires de France, Paris 1931), p. 105. J. Eisenstaedt, Trajectoires et Impasses de la Solution de Scwarzschild, Arch. Hist. Exact Sci. 37 (1988) 275, p.283. (32) P.J.E. Peebles, op. cit., p. 245. (31) Cosmologie 37 µ µν , ce qui conduit à et gµν,ρ = ∂g ∂xρ 1 µ ν ρ µ d ν δ( ds) = ẋ ẋ gµν,ρ δx + gµν ẋ (δx ) ds 2 ds dx ds On pose ẋµ = dont l’intégrale sur la ligne d’univers doit s’annuler, Z Z Z 1 µ ν ν ρ µ d ds = δ ẋ ẋ gµν,ρ δx ds + (δx ) ds gµν ẋ ds Ligne 2 Ligne Ligne | } R{z d [gµν ẋµ δxν ]∂L − = Z Ligne (gµν ẋ L ds µ )δxν ds 1 µ ν d µ ẋ ẋ gµν,ρ − (g ẋ ) δxρ ds. 2 ds µρ Comme d’habitude, on a annulé le terme de bords aux extrémités de la ligne d’univers. La variation est arbitraire, de sorte que l’intégrant doit être nul, soit 1 µ ν ẋ ẋ gµν,ρ − gµρ ẍµ − gµρ,ν ẋµ ẋν = 0. 2 On arrange les termes en multipliant par g σρ et en notant que dans le dernier terme ci-dessus on peut permuter les indices contractés µ et ν, soit gµρ,ν ẋµ ẋν = 1 µ ν ν µ 2 (gµρ,ν ẋ ẋ + gνρ,µ ẋ ẋ ), d’où 1 1 σρ µ σρ 1 gµν,ρ − gµρ,ν − gνρ,µ ẋµ ẋν . g gµρ ẍ = g 2 2 2 | {z } ẍσ En définissant le symbole de Christoffel ou connexion affine Γσµν = (33) (contraction sur ρ), 1 σρ g [gµρ,ν + gνρ,µ − gµν,ρ ], 2 on obtient l’équation de mouvement (34) (33) Ce n’est pas un tenseur car il est identiquement nul dans un référentiel localement inertiel et la loi linéaire de transformation des tenseurs exigerait sinon qu’il soit identiquement nul dans tout référentiel. (34) On peut noter à ce sujet que la notion de dérivée covariante permet d’écrire directement l’équation géodésique. La dérivée covariante est donnée par dq σ dxν Dq σ = + Γσµν q µ . Ds ds ds En présence d’un champ de force F µ , l’équation de mouvement devient Dpσ = Fσ Dτ soit dans le cas du mouvement de chute libre 0= d2 xσ dxµ dxν Dpσ σ =m + mΓ . µν Dτ dτ 2 dτ dτ Précisons également des notations anciennes pournles connexions affines (symboles de Christoffel o ρ ρ ρσ de 1ère et 2ème espèces) : Γµν,ρ = [µν, ρ], Γ µν = µν = g [µν, σ]. 38 Mis à jour le 14 Décembre 2012 d2 xσ dxµ dxν σ = −Γ . µν ds2 ds ds (4.9) On peut introduire la dérivée covariante (au sens des théories de jauge cette fois) Dκ qσ = ∂κ qσ + Γσµκ qµ et la propriété D D ∂xκ = Ds Dxκ ∂s pour retrouver l’équation de déviation géodésique ∂xκ Dqσ = Dκ q σ Ds ∂s ∂xκ ∂xκ = ∂κ q σ + Γσµκ qµ ∂s ∂s κ σ ∂x ∂q + Γσµκ qµ , = ∂s ∂s ou encore D ẋσ = Dκ ẋσ ẋκ = ẍσ + Γσµν ẋµ ẋκ . Ds ⊲ Les équations d’Einstein. On présente dans cette section la forme générale des équations d’Einstein. Il ne s’agit pas de démontrer les expressions mises en jeu, mais de pousser encore un peu le formalisme. − Sur la difficulté d’une analogie avec l’électromagnétisme : Les équations d’Einstein constituent une généralisation de l’équation de Poisson pour le potentiel gravitationnel ψ(r), ~ 2 ψ(r) = 4πGρ(r), ∇ défini en fonction de la densité de masse locale ρ(r). Cette équation est analogue à celle que l’on rencontre en électromagnétisme où les équations de Maxwell relient le tenseur de Faraday F µν aux sources, les densités de charges et de courant électrique sous la forme ∂µ F µν = µ0 j ν où j ν = (ρc, j). La partie temporelle de cette équation conduit à l’équation de Poisson une fois utilisée la définition du tenseur de Faraday F µν = ∂ µ Aν − ∂ ν Aµ et celle du quadri-potentiel Aµ = (φ/c, A), ~ 2 φ(r) = − 1 ρ(r). ∇ ε0 L’analogie avec le potentiel gravitationnel est évidente et il est tentant de chercher une généralisation des équations de Maxwell (on parle d’équations gravitomagnétiques). Il faut pour cela un 4−courant gravitationnel j µ et un tenseur Cosmologie 39 analogue au tenseur de Faraday, [−−]µν qui soient reliés par une équation de la forme ∂µ [−−]µν = const×j ν . La densité de masse ρ(r) serait déterminée par la composante j 0 . Nous allons voir que cette définition n’est pas possible, car la densité de masse n’a pas les bonnes propriétés. En effet, elle se transforme comme on va le voir un peu plus loin comme la composante d’un tenseur de rang 2 et doit donc être identifiée à la composante 00 d’un tenseur plus général. Pour remplacer les équations de Maxwell, il faut donc une équation tensorielle de rang 2, écrite symboliquement Géométrie µν = Matière µν . Le rôle du potentiel ψ(r) est joué par le tenseur métrique (rappelons par exemple dans le cas de la métrique de Schwarzschild que g00 = −1/g11 = 1 + 2ψ/c2 ) et celui de la densité de masse par le tenseur énergie impulsion (35) . Le contenu matériel, par l’intermédiaire de ρ(r) intervient dans l’objet Matière µν , le tenseur énergieimpulsion T µν et détermine de ce fait les propriétés spatio-temporelles données en termes de la métrique g µν qui intervient dans l’objet Géométrie µν . L’équation d’Einstein est donc une équation différentielle pour les composantes du tenseur métrique, dont les sources sont données par le tenseur énergie impulsion. Une équation plausible serait de la forme ∂σ Γσµν = Tµν . Elle possède bien deux indices explicites, et la géométrie apparaı̂t par une dérivée de la connexion affine, c’est-à-dire qu’elle contient des dérivées secondes du tenseur métrique, indispensables pour explorer l’écart au comportement minkowskien. Nous verrons cependant que les équations d’Einstein sont plus complexes que cela. − Tenseur de Riemann : On cherche tout d’abord à caractériser la courbure d’un espace arbitraire (l’espace-temps) au moyen d’un tenseur. Rappelons qu’il est toujours possible de trouver en un point quelconque un référentiel localement tangent qui soit inertiel (le référentiel en chute libre), c’est-à-dire tel que gµν = ηµν ∂gµν = 0. ∂xρ Ici, ηµν est le tenseur métrique de Minkowski ηµν = diag(1, −1, −1, −1). L’information sur la courbure provient donc des dérivées d’ordre supérieur du tenseur métrique. Ce qui distingue notamment un espace courbe d’un espace plat, c’est que dans le premier, les référentiels localement tangents en x et en x + ∆x diffèrent, de sorte que les variations du tenseur métrique sont du second ordre. L’information cherchée réside dans un tenseur de rang 4 contenant des termes comme gµν,ρσ , le tenseur de Riemann Rµνρσ , défini par les connexions affines (36) , Rµνρσ = Γµνσ,ρ − Γµνρ,σ + Γµλρ Γλνσ − Γµλσ Γλνρ . Dans un référentiel localement inertiel, les connexions affines sont nulles mais pas nécessairement leurs dérivées et il vient Rµνρσ = Γµνσ,ρ − Γµνρ,σ . On définit aussi la forme totalement covariante Rµνρσ = gµλ Rλνρσ telle que dans un référentiel inertiel 2Rµνρσ = gµσ,νρ − gνσ,νρ + gνρ,µσ − gµρ,νσ . Notons que le tenseur de Riemann (35) (36) Dans les ouvrages en anglais on utilise en général le terme de stress energy tensor. On rappelle que Γσµν = 21 g σρ [gµρ,ν + gνρ,µ − gµν,ρ ]. 40 Mis à jour le 14 Décembre 2012 possède 256 composantes dont en fait seulement 20 sont indépendantes en raison des symétries. − Tenseur énergie impulsion : Energie et impulsion sont deux aspects d’un même objet, la 4-impulsion pµ telle que E 2 − c2 |p|2 = m2 c4 . Voyons maintenant comment construire le tenseur énergie impulsion en généralisant la densité de masse ρ. Considérons un nuage de poussière. Dans le référentiel R dans lequel il est au repos, il possède une densité d’énergie ρc2 = mnc2 = E/V s’il est constitué de grains de masses m et de densité n (dans R). Ici V est le volume occupé par le gaz et E son énergie. Dans un autre référentiel R′ , on aura une augmentation de l’énergie E → E ′ = γE et une contraction du volume, V → V ′ = γ −1 V à cause de la transformation des longueurs longitudinales, rk → rk′ = γ −1 rk de sorte que ρ → ρ′ = γ 2 ρ. Il est donc évident que ρc2 ne peut ni être un scalaire ni une composante de quadrivecteur, mais doit être la composante d’un tenseur de rang 2 (37) . On définit ainsi le tenseur énergie impulsion T µν pour un gaz dilué, T µν = ρv µ v ν . Dans le référentiel R, on a la quantité cherchée T 00 = ρc2 . Si l’on prend la pression en compte, l’expression devient T µν = (ρ + p/c2 )v µ v ν − g µν p. Une définition qui s’applique à des systèmes plus complexes que le nuage de poussière considéré ici est que T µν représente le flux de la composante µ du 4-vecteur énergie impulsion pµ le long de la direction ν. Il obéit à une loi de conservation (38) , T µν,ν = 0. Finalement, on retiendra que T µν - est un tenseur de rang 2, - s’annule en l’absence de matière, - a toutes ses divergences nulles, - est symétrique. − Tenseur d’Einstein : Einstein a identifié le tenseur énergie impulsion comme la source de la courbure de l’espace-temps et a ainsi suggéré la forme la plus simple possible de relation entre l’énergie Tµν et la courbure Gµν , soit KTµν = Gµν où K est une constante à déterminer pour restaurer la limite newtonienne et Gµν , le tenseur d’Einstein, décrit la courbure. Gµν est de rang 2 et de divergence nulle (à cause de ces mêmes propriétés satisfaites par Tµν ). Il doit être construit à partir du tenseur de Riemann. Celui-ci est de rang 4, il faut donc une double contraction (39) , c’est le tenseur de Ricci Rµν = Rρµρν = g ρσ Rσµρν . (37) Revenant à la discussion évoquée plus haut sur la forme des équations d’Einstein, c’est pour cette raison que l’on ne peut pas construire une théorie de la gravitation calquée sur l’électromagnétisme, car la densité de charge se transformant avec un seul facteur γ, elle est la composante d’un 4vecteur, la 4-densité de courant j µ et le tenseur de Faraday obéit à ∂µ F µν = µ0 j ν . Dans une théorie analogue de la gravitation, le second membre est nécessairement un tenseur de rang 2, ce qui complique l’équation cherchée. (38) En relativité générale, cette loi de conservation est étendue à un référentiel arbitraire en passant à la dérivée covariante, T µν;ν = 0. (39) On peut montrer que d’autres contractions donnent des résultats équivalents. Cosmologie 41 Le tenseur de Ricci n’est pas de divergence nulle, ce que l’on rétablit par soustraction 1 Gµν = Rµν − gµν R, 2 où R = g µν Rµν est le scalaire de Ricci. L’équation d’Einstein peut maintenant s’écrire Gµν = 8πG T . c4 µν Une généralisation apportée par Einstein lors d’applications en cosmologie consiste en l’introduction d’une nouvelle constante fondamentale, la constante cosmologique Λ, de sorte que l’équation d’Einstein devient alors Gµν − Λgµν = 8πG T . c4 µν Cette constante a pour effet de produire une courbure de l’espace-temps même en l’absence de toute forme de matière ou de radiation (40) . Elle joue un rôle central en cosmologie et dans la compréhension actuelle de l’Univers. ⊲ Action d’Einstein - Hilbert. Une formulation alternative de l’équation d’Einstein repose sur la définition d’une action, proposée initialement par Hilbert. Il faut tout d’abord exprimer un élément d’intégration invariant dans un système de coordonnées arbitraire. Dans l’espace de Minkowski l’élément d4 x = dx0 dx1 dx2 dx3 est un invariant en raison de la compensation des facteurs γ qui interviennent dans c dt et dans drk . Si l’on cherche à former un élément d’intégration invariant dans un système de coordonnées quelconque, il apparait le déterminant du tenseur métrique. Considérons les systèmes de coordonnées x et x′ . On a ∂x 4 ′ d x = ′ d x ∂x 4 ∂x où le jacobien de la transformation, ∂x ′ , est le déterminant de la matrice des ∂xµ dérivées partielles ∂x′ν . De la loi de transformation ′ = gµν ∂xρ ∂xσ g ∂x′µ ∂x′ν ρσ (on rappelle que g ′ µν = Λµρ Λν σ g ρσ et g ′ µν = Λµρ Λν σ g ρσ avec Λµρ = ∂x′ µ /∂xρ 2 et Λ ρ = ∂xρ /∂x′ µ ) on déduit que g ′ = g ∂x′ où g est le déterminant (négatif) µ (40) ∂x C’est pour cette raison d’ailleurs qu’Eddington argumentait sur le rôle indispensable de la constante cosmologique. C’est la seule façon, d’après lui, d’introduire en physique une longueur intrinsèque, le rayon de courbure de l’Univers dans la limite d’un Univers vide, comme c est une constante fondamentale de la physique, la vitesse de propagation de particules non massives dans le vide. (A. Eddington, The Expanding Universe, Cambridge University Press, Cambridge 1933, chap. IV.). 42 Mis à jour le 14 Décembre 2012 de gµν , soit pour l’élément d’intégration d4 x = invariant est donné par p √ −g d4 x = −g ′ d4 x′ . p g ′ /g d4 x′ et finalement l’élément √ L’action d’Einstein-Hilbert est formée en intégrant sur −g d4 x un scalaire invariant décrivant la courbure de l’espace-temps. Nous avons vu que le scalaire de Ricci est défini par contractions successives du tenseur de Riemann, il forme donc le bon lagrangien et l’action est donnée par Z √ c4 SEH = − R −g d4 x. 16πG Omettant pour un instant la constante inessentielle à ce niveau, on cherche à minimiser l’action(41) Z √ S = R −g d4 x avec δgµν = 0 sur une 3−surface envoyée à l’infini. Comme R est fonction des gµν et de leurs dérivées premières et secondes, les équations d’Euler-Langrange sont formellement données par ∂ √ ∂ √ ∂ √ −gR − ∂κ −gR + ∂κ ∂λ −gR = 0. ∂gµν ∂gµν,κ ∂gµν,κλ Cette forme est nénamoins difficilement exploitable. On a défini antérieurement R = g µν Rµν , Rµν = g ρσ Rρµνσ = Γρµσ Γσρν − Γρµν Γσρσ + Γρµρ,ν − Γρµν,ρ . Il vient alors pour δS δS = 0 = Z √ √ √ d4 x δRµν g µν −g + Rµν δg µν −g + Rµν g µν δ −g . R √ Le premier terme s’annule par intégration par parties (il apparaı̂t d3 xRµν g µν −g nul car le tenseur de Ricci est R nul à l’infini √ et le terme restant disparaı̂t grâce à des propriétés difficiles de d4 xRµν δ(g µν −g)). Par ailleurs, on a la propriété (également difficile à montrer !) δg = −ggµν δg µν √ qui permet d’écrire δ −g = − 12 (−g)−1/2 δg et d’obtenir Z √ 1 4 ρσ δS = d x Rµν − Rρσ g gµν δg µν −g = 0 2 (41) On pourra consulter wikipedia http://en.wikipedia.org/wiki/Einstein-Hilbert action. Cosmologie 43 pour une variation arbitraire de la métrique si 1 Rµν − Rgµν = 0. 2 Gµν = Rµν − 12 gµν R est bien le tenseur d’Einstein. Lorsque la gravité interagit avec la matière il faut ajouter un nouveau terme invariant décrivant les champs de matière et de radiation dont la variation par rapport aux composantes du tenseur métrique fait apparaı̂tre le tenseur énergie impulsion. S= Z √ −g d4 x Lm − c4 R , 16πG et la forme précise de Lm dépend du problème considéré, mais définit le tenseur énergie impulsion par (42) la définition Z Z µν √ √ δ 4 1 d4 x −gTµν δg µν , δSmat. = d x µν −gLmat δg ≡ 2 δg d’où l’on déduit Tµν 2 = √ −g √ √ ∂( −gLm ) ∂ ∂( −gLm ) . − ∂g µν ∂xρ ∂g µν,ρ La variation de l’action conduit à Z √ 1 c4 1 4 µν T − (R − g R) , δS = −g d x δg 2 µν 16πG µν 2 µν et il vient 1 8πG Rµν − Rgµν = 4 Tµν . 2 c L’introduction de la constante cosmologique nécessite un terme supplémenatire dans l’action, Z √ −g d4 x, Λ et la variation conduit cette fois à 8πG 1 Rµν − Rgµν − gµν Λ = 4 Tµν . 2 c (42) voir par exemple S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972, chap. 12 ; P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press, Princeton 1993, p.259 ; A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics, and Cosmology Springer-Verlag, New-York 1992, p.47. 44 Mis à jour le 14 Décembre 2012 Application à la cosmologie ⊲ Le modèle de Friedmann, Robertson et Walker. Le modèle de Robertson et Walker, ou encore de Friedmann, Robertson et Walker (FRW) donne la forme générale de la métrique, puis établit les équations de Friedmann régissant la dynamique de l’Univers par application des équations d’Einstein. − La métrique de Robertson et Walker : Cherchons la métrique d’un Univers homogène, isotrope, et dont la courbure (qui pourra être positive, négative ou nulle), K(t) = k/a2 (t) est la même en tout point en vertu du principe cosmologique et ne dépend que du temps cosmique t. a(t) est un facteur d’échelle qui fixe l’amplitude de la courbure et k définit le signe, k = +1, 0 ou −1. La métrique cherchée est a priori de la forme ds2 = c2 dt2 − dl2 où dl2 est la métrique tridimensionnelle de l’espace ordinaire, éventuellement courbe. Lorsque k est positif, on obtient un espace à courbure positive et dans ce cas, par analogie avec la surface de la sphère, plongée dans IR3 , on introduit une coordonnée supplémentaire, w, pour plonger l’espace tridimensionnel à courbure positive dans IR4 , x2 + y2 + z 2 +w2 = a2 (t). {z } | r2 On a donc r 2 + w2 = a2 (t), soit (r dr)2 = (w dw)2 à un instant donné, ou encore dw2 = r2 dr 2 . a2 (t) − r 2 Deux points voisins sont distants de dl2 = dr 2 + r 2 dΩ2 + dw2 = a2 (t) dr 2 + r 2 dθ2 + r 2 sin2 θ dϕ2 . a2 (t) − r 2 On a bien un espace homogène (la courbure est la même partout) et isotrope (dépendance angulaire de la métrique en r 2 dΩ2 ). On introduit en général une variable sans dimension σ = r/a(t), de sorte que dσ 2 2 2 . + σ dΩ dl2 = a2 (t) 1 − σ2 On en déduit la métrique de Robertson et Walker, introduite indépendamment par ces deux auteurs en 1936, mais déjà connue de Friedmann, en généralisant à √ des courbures éventuellement nulles ou négatives en remplaçant a par a/ k et en incorporant la coordonnée temporelle, dσ 2 2 2 2 2 2 2 + σ dΩ . (4.10) ds = c dt − a (t) 1 − kσ 2 Cosmologie 45 On en déduit la forme du tenseur métrique, dxµ = (c dt, dσ, dθ, dϕ), et ds2 = gµν dxµ dxν , soit 1 0 [gµν ] = 0 0 02 a − 1−kσ 2 0 0 0 0 −a2 σ 2 0 0 0 0 −a2 σ 2 sin2 θ . (4.11) g µν et gµν ne sont plus représentés par la même matrice. En effet, comme dxµ = gµν dxν et dxµ = g µν dxν l’intervalle s’écrit ds2 = dxµ dxµ = gµν g µν dxν dxν , | {z } ds2 soit gµν g µν = 1 d’où l’on déduit g µν = 1 µν G g où g est le déterminant de gµν et Gµν la matrice de ses cofacteurs (gµν étant symétrique, il n’est pas nécessaire de transposer la matrice des cofacteurs) (43) . On a donc 1 0 2 0 0 0 − 1−kσ 0 0 a2 . [g µν ] = 0 0 − a21σ2 0 1 0 0 0 − a2 σ2 sin2 θ − Référentiel comobile : Les coordonnées intervenant dans la métrique de Robertson-Walker sont xµ = (ct, σ, θ, ϕ) où t est le temps cosmique et σ la coordonnée spatiale radiale ramenée au facteur d’échelle de l’Univers. Tout point se déplaçant dans l’Univers de sorte que ses coordonnées spatiales xi = σ, θ, ϕ soient constantes suit une ligne d’Univers particulière. En effet on a dans ce cas xi = const., soit d2 xi dxi = = 0, ds ds2 et comme la métrique est diagonale, les connexions affines Γσµν = 1 σρ g [gµρ,ν + gνρ,µ − gµν,ρ ] 2 spatio-temporelles deviennent Γi 00 = 1 iρ 1 g (2∂0 g0ρ − ∂ρ g00 ) = g ii (2∂0 g0i −∂i g00 ) = 0. 2 2 |{z} |{z} 0 (43) 1 On pourrait plus simplement ici utiliser le fait qu’il s’agit de matrices diagonales, les éléments de la matrice produit sont alors les produits des éléments diagonaux. 46 Mis à jour le 14 Décembre 2012 On en déduit automatiquement que le point en question obéit à l’équation dxµ dxν d2 xi i + Γ =0 µν 2 {z } |{z} | ds{z ds} | ds 0 c’est-à-dire nul si µν=00 nul si µν6=00 Dpi = 0. Ds (4.12) Les coodonnées σ, θ, ϕ sont appelées coordonnées comobiles et le référentiel dans lequel elles restent constantes est le référentiel comobile. L’origine du référentiel comobile obéit à l’équation de la particule libre dans un référentiel inertiel, le référentiel comobile est donc un référentiel en chute libre. Par ailleurs, dans ce référentiel la métrique de Robertson-Walker se réduit à ds2 = c2 dt2 c’est-à-dire que le temps cosmique est le temps propre du référentiel comobile. − Dynamique : les équations de Friedmann : Pour obtenir les équations de Friedmann (44) qui régissent la dynamique de l’Univers, on part du tenseur énergie impulsion du fluide cosmique, Tµν = (ρ + p/c2 )vµ vν − pgµν (4.13) et de la métrique de Robertson-Walker pour écrire les équations d’Einstein. Les composantes du tenseur métrique valent g00 = g 00 = 1, g11 = 1/g 11 = −a2 /(1 − kσ 2 ), g22 = 1/g 22 = −a2 σ 2 , g33 = 1/g 33 = −a2 σ 2 sin2 θ. Les sources sont définies par Tµν . Dans le référentiel comobile, v µ = (c, 0, 0, 0) et le tenseur énergie impulsion se simplifie en composantes diagonales, T00 = ρc2 , T11 = pa2 /(1 − kσ 2 ), T22 = pa2 σ 2 , T33 = pa2 σ 2 sin2 θ. La géométrie est déterminée par le tenseur d’Einstein. Les connexions affines se déduisent de gµν , Γσµν = 1 σρ 1 g (gµρ,ν + gνρ,µ − gµν,ρ ) = g σσ (gµσ,ν + gνσ,µ − gµν,σ ) 2 |{z} 2 diag (44) Pour un commentaire sur l’orthographe de Friedmann, voir la note 11 p. 83 dans A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil, Paris 1997. Cosmologie 47 soit en particulier Γ101 = ∂g 1 1 − kσ 2 2aȧ ȧ 1 1 11 g (g01,1 +g11,0 − g01,1 ) = g 11 110 = = 2 2 2 2 ∂x 2c a 1 − kσ ac |{z} |{z} =0 =0 et on calcule également Γ011 = c−1 aȧ/(1 − kσ 2 ), Γ022 = c−1 σ 2 aȧ, Γ033 = c−1 σ 2 sin2 θaȧ, Γ101 = Γ110 = c−1 ȧ/a, Γ111 = kσ/(1 − kσ 2 ), Γ133 = −σ(1 − kσ 2 ) sin2 θ, Γ122 = −σ(1 − kσ 2 ), Γ202 = c−1 ȧ/a, Γ212 = 1/σ, Γ303 = c−1 ȧ/a, Γ313 = 1/σ, Γ233 = − sin θ cos θ, Γ323 = cot θ. La composante R1010 du tenseur de Riemann est donnée par R1010 = −Γ101,0 − Γ110 Γ101 ∂Γ101 =− − ∂x0 ȧ ac 2 = (ȧ2 /a2 c2 − ä/ac2 ) − ȧ2 /a2 c2 = −ä/ac2 . De même les autres composantes valent R2020 = R3030 = −ä/ac2 et R0000 = 0. On en déduit la composante 00 du tenseur de Ricci, R00 = R0000 + R1010 + R2020 + R3030 = −3ä/ac2 et de même R11 = R0101 + R1111 + R2121 + R3131 = T /(1 − kσ 2 ) avec T = 2k + aä/c2 + 2ȧ2 /c2 . Les autres composantes diagonales valent R22 = T σ 2 et R33 = T σ 2 sin2 θ. Cela permet de calculer le scalaire de Ricci, R = g µν Rµν = g 00 R00 + g 11 R11 + g 22 R22 + g 33 R33 = −6S/a2 avec S = k + aä/c2 + ȧ2 /c2 . Finalement, le tenseur d’Einstein, Gµν = Rµν − 12 gµν R, a pour composantes 00 et 11 G00 = 3ȧ2 /a2 c2 + 3k/a2 , G11 = − k + 2aä/c2 + ȧ2 /c2 . 1 − kσ 2 48 Mis à jour le 14 Décembre 2012 On en déduit les composantes correspondantes des équations d’Einstein, 3 ȧ2 (t) c2 + 3k 2 − c2 Λ = 8πGρ(t), 2 a (t) a (t) c2 ä(t) ȧ2 (t) − 2 −k 2 + c2 Λ = 8πGp(t)/c2 . −2 a(t) a (t) a (t) (4.14) Les autres composantes n’apportent pas d’information supplémentaire. Ces équations ont été découvertes par Friedmann en 1922 dans le cas p = 0 puis généralisées à pression non nulle par Lemaı̂tre en 1927. On réserve parfois le terme d’équation de Friedmann à la première équation seulement aussi appelée équation de l’énergie, la seconde étant alors appelée équation de Raychaudhuri ou équation de l’accélération. Il est remarquable de noter que les équations de Friedmann prennent une forme identique à celle des équations obtenues dans le cadre purement newtonien (45) . Les deux équations ci-dessus peuvent effectivement être écrites 1 2 4 1 1 ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2 2 3 6 2 1 4 ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t). 3 3 La première exprime la conservation de l’énergie totale et la seconde la loi fondamentale de la dynamique. Ces équations montrent que le paramètre de courbure k est analogue (au signe près) à la densité d’énergie totale et que la (45) Rappelons les grandes lignes du raisonnement : Considérons une sphère comobile avec le fluide cosmique, de rayon σa. Si la courbure et les vitesses locales sont faibles, la dynamique newtonienne et la gravitation newtonienne peuvent s’appliquer, de sorte que l’énergie cinétique par unité de masse d’un point de la sphère vaut 12 (σ ȧ)2 . De même, la densité d’énergie gravitationnelle due au contenu de la sphère vaut −M (σa)G/σa avec M (σa) = 43 πρσ 3 a3 la masse de la sphère comobile (ce qui est à l’extérieur ne contribue pas en symétrie sphérique en raison du théorème de Gauss, ou plutôt du théorème de Birkhoff dans le contexte de la relativité générale). La conservation de l’énergie totale locale s’écrit 21 σ 2 ȧ2 − 34 πGρσ 2 a2 = const. Si l’on choisit d’écrire la constante 2 2 const. = − 21 kσ 2 c2 , on obtient 3 ȧ + 3k ac 2 = 8πGρ. On voit que k détermine le signe de la courbure a2 de l’Univers, mais dans la limite newtonienne, c’est également k qui détermine le signe de l’énergie totale de la matière dans l’Univers. Tableau 4.1 Courbure et énergie totale de l’Univers pour des modèles à pression nulle et sans constante cosmologique. k courbure énergie totale +1 0 −1 positive plate négative négative nulle positive Si l’on multiplie cette dernière équation par a3 et que l’on différentie par rapport à t, il vient d 6äȧa + 3ȧ3 + 3kc2 ȧ = dt (8πGρa3 ), soit, en utilisant aussi la seconde équation de Friedmann qui montre que le membre de gauche s’annule, d dt 4πGρa3 3 = 0. Cette équation exprime que la masse totale dans la sphère comobile est constante. En d’autres termes, les équations de Friedmann à pression nulle et sans constante cosmologique sont équivalentes, dans la limite newtonienne, à la conservation de l’énergie et à l’équation de continuité. Cosmologie 49 constante cosmologique joue le rôle d’une force répulsive (“énergie potentielle” dont le minimum est rejeté en a → ∞), comme on l’obtient facilement dans un traitement newtonien. Il reste à résoudre le problème de la dépendance de la pression avec la densité et pour cela il faut encore une équation d’état p = p(ρ) qui suppose une forme particulière de matière dominant l’Univers ou la connaissance des diverses formes possibles d’énergie dans l’Univers. On obtient alors (cf. l’histoire sommaire de l’Univers ci-après) les évolutions en a(t) ∼ t2/3 pour le modèle MDU (Matter Dominated Universe), en a(t) ∼ t1/2 pour le modèle RDU (Radiation Dominated Universe), et en exponentielle pour le modèle “ΛDU” (cf. ci-dessous). On définit la densité critique ρc (t) dans l’Univers à un instant donné comme celle qui correspond à une énergie totale (ou courbure) nulle (cas limite entre un Univers fermé (cette énergie totale serait négative) et un Univers ouvert (elle serait positive)), en l’absence de constante cosmologique, soit ρc (t) = 3H 2 (t)/8πG, H(t) ≡ ȧ(t)/a(t). Pour obtenir l’équation de conservation, on peut dériver la première des deux équations ci-dessus, on obtient un terme en ȧä que l’on divise par aȧ pour pouvoir utiliser la seconde équation de Friedmann dans laquelle le terme en ȧ2 /a2 est ensuite éliminé à l’aide de la première équation de Friedmann. Il reste finalement l’équation de continuité ρ̇(t) + 3(ρ(t) + p(t)/c2 ) ȧ(t) = 0. a(t) Histoire sommaire de l’Univers ⊲ Univers dominé par la matière (MDU). Dans le cas d’un Univers “de poussière”, c’est-à-dire composé de matière non relativiste uniquement, la relation de continuité devient d (ρ(t)a3 ) = ρ̇(t)a3 + 3ρ(t)a2 ȧ = 0. dt Cette expression traduit la conservation de la masse contenue dans la sphère en expansion. Elle permet de donner une forme asymptotique simplifiée de l’évolution temporelle de a. Supposons une forme a(t) ∼ tα , la compatibilité des deux termes dans l’expression de conservation de l’énergie, avec la dépendance ρ(t) ∼ a−3 déduite de la loi de conservation, conduit à une énergie cinétique en t2(α−1) et une énergie potentielle en t−3α+2α . On en déduit α = 2/3, a ∼ t2/3 . Cette expression est satisfaite par les modèles d’Univers dominés par la matière, c’est-à-dire lorsque ρ(t) = ρM (t) est la densité de matière (non relativiste comme on le verra un peu plus loin). La puissance α < 1 traduit la décélération de l’expansion de l’Univers (les courbes a(t) ont une courbure négative). 50 Mis à jour le 14 Décembre 2012 Figure 4.4 Diverses dynamiques d’univers permises (Harrisson). Cosmologie 51 ⊲ Dynamique d’un Univers dominé par le rayonnement (RDU). En négligeant la matière non relativiste, on peut considérer le cas d’un Univers ne comportant comme énergie que celle associée au rayonnement électromagnétique (ce p cas décrit également la matière ultra-relativiste pour laquelle E = |p2 |c2 + m2 c4 ≃ |p|c.). Dans ce cas, la densité d’énergie est donnée par la loi de Stefan ρR c2 = σT 4 (l’indice R est ici pour rayonnement ou pour relativiste) et l’équation d’état du fluide de photons par p= 1 4 1 σT = ρR (t)c2 . 3 3 L’équation de continuité tenant compte de la pression devient ρ̇R (t) = −4ρR (t) ȧ a d’où l’on déduit une variation ρR (t) ∼ a−4 , différente de ρM (t) ∼ a−3 pour la densité de matière non relativiste. Dans les deux cas, l’expansion conduit à une dilution de la densité d’énergie. Le comportement asymptotique de a(t) se déduit de nouveau de la compatibilité de la conservation de l’énergie avec une loi en tα qui demande cette fois que les deux termes en t2(α−1) et t−4α+2α soient comparables, soit α = 1/2 et a ∼ t1/2 . Un Univers dominé par le rayonnement voit également son expansion décélérer, mais la dynamique est différente de celle de l’Univers dominé par la matière. ⊲ Le rôle de la constante cosmologique (ΛDU). Ce qu’Einstein a initialement conçu comme une difficulté des modèles cosmologiques est le fait qu’ils soient non statiques. Il a alors introduit la constante cosmologique. La limite newtonienne des équations d’Einstein conduit ainsi à l’équation de Poisson modifiée ~ 2 ψ(a) = 4πGρ(a) − Λc2 . ∇ La contribution ψΛ (a) de la constante cosmologique au potentiel gravitationnel est d2 2 alors solution de a1 da 2 (aψΛ (a)) = −Λc , soit encore 1 ψΛ (a) = − Λc2 |a|2 . 6 Il correspond à ce potentiel un champ de gravitation répulsif si Λ > 0, GΛ (a) = (c’est aussi la force par unité de masse). La constante Λ joue ainsi le rôle d’une force source d’expansion qui peut s’opposer à la gravitation et permet de restaurer un Univers statique. En effet, pour une énergie totale nulle (Univers plat), la conservation de l’énergie devient + 13 Λc2 a 1 2 4πGρa2 1 ȧ − − Λc2 a2 = 0, 2 3 6 de sorte que la constante de Hubble peut être nulle si l’on impose la valeur de p 8πGρ/3(1 + Λc2 /8πGρ)1/2 = 0. Une dizine d’années après Λ, ȧ/a = H = 52 Mis à jour le 14 Décembre 2012 l’introduction par Einstein de la constante cosmologique (1917), l’observation montrera que l’Univers n’est pas statique, mais en expansion (Slipher 1925, Lemaı̂tre 1927, Hubble 1929) et la condition ci-dessus deviendra caduque. ⊲ Histoire de l’Univers. Les quelques éléments fournis dans les sections précédentes permettent de discuter en termes simples de l’histoire de l’Univers. Dans le cas k ≤ 0 qui nous intéresse davantage car on verra que les observations favorisent ce scénario pour notre Univers, le facteur d’échelle a(t) est une fonction monotone, croissante, mais dont la vitesse diminue (on peut définir un paramètre de décélération q = −äa/ȧ2 ∼ −(α−1)/α > 0 si α < 1 (46) .). Dans le passé, a(t) était donc plus petit que sa valeur actuelle. L’Univers actuel est dominé par la matière, mais lorsqu’on remonte dans le passé, comme ρR (t) a décru plus rapidement que ρM (t), l’Univers a été dominé par le rayonnement. Il y a eu un moment particulier qu’on appelle découplage matière-rayonnement ou recombinaison où les deux formes de densité d’énergie ont été du même ordre (47) . L’Univers a donc été plus dense, plus chaud, d’abord gouverné par une expansion en a ∼ t1/2 à l’époque où le rayonnement et les particules relativistes étaient responsables de la dynamique de l’Univers, puis par une expansion un peu plus rapide en a ∼ t2/3 après la recombinaison lorsque c’est la matière non relativiste qui a joué un rôle dominant pour la dynamique. Notons que lors de la phase dominée par le rayonnement, la vitesse d’expansion a divergé à l’origine, puisque ȧ ∼ (2t)−1/2 → ∞ lorsque t → 0. Ce serait une difficulté essentielle dans une interprétation newtonienne car dans la phase primordiale de l’Univers, la vitesse relative des objets aurait dépassé celle de la lumière, en contradiction avec la causalité relativiste. On est alors amené à supposer que la validité du modèle ne s’étend pas, en remontant le temps, aux instants initiaux. Cette difficulté précise est levée dans le cadre relativiste car la vitesse en question est celle de l’expansion du facteur d’échelle qui caractérise la dynamique de l’espacetemps, mais cela ne permet pas de communiquer entre différentes régions spatiales à des vitesses supérieures à c. Notons que cela soulèvera un autre problème appelé problème de l’horizon. En revanche on se heurtera toujours à une impossibilité d’étendre la théorie à t → 0, mais cette fois pour des raisons d’invalidité des théories quantiques, non testées à ces énergies, davantage que de causalité. ⊲ Paramétrisation Ω. Si l’on rejette le terme cosmologique du côté matière (au second membre de l’équation d’Einstein), on peut l’écrire comme dû à un fluide équivalent de densité ρΛ et de pression pΛ tel que Λg µν = 8πG [(ρΛ + pΛ /c2 )v µ v ν − pΛ g µν ] c4 à condition de poser l’équation d’état pΛ = −ρΛ c2 , ρΛ = Λc2 . 8πG Il est alors possible d’écrire les équations de Friedmann et l’équation de continuité (cette dernière étant d’ailleurs inchangée) en faisant uniquement intervenir les (46) Nous verrons cependant que des mesures récentes montrent que q < 0 pour notre Univers. Ici encore en toute rigueur on doit distinguer la recombinaison, c’est-à-dire la disparition des électrons libres et la formation d’états liés avec les noyaux (les atomes !) et le moment de la transition d’un Univers dominé par la rayonnement à un Univers dominé par la matière. Cependant ces deux phases de l’Univers sont très proches (environ 105 ans après le Big Bang) et donc assimilables en première approximation. (47) Cosmologie 53 densités, soit 1 2 4 1 ȧ (t) − πG(ρ(t) + ρΛ )a2 (t) = − kc2 2 3 2 4 ä(t) = − πG(ρ(t) + ρΛ + 3(p(t) + pΛ )/c2 )a(t), 3 ȧ(t) = 0. ρ̇(t) + 3(ρ(t) + p(t)/c2 ) a(t) Figure 4.5 Evolution de l’Univers. On peut maintenant exprimer la première équation de Friedmann en termes de la paramétrisation en Ω qui ramène les densités à leur valeur critique, avec la densité critique de référence à l’époque actuelle ρc0 = ρc (t0 ) = 3H02 /8πG. On écrit la première équation de Friedmann comme ȧ2 (t) = (8πG/3)[(ρM (t) + ρR (t) + ρΛ (t))a2 (t) − 3kc2 /8πG] où la densité ordinaire a été décomposée en matière et rayonnement, puis on exprime ces densités comme ρM (t) = ρM (t0 )(a(t0 )/a(t))3 = ρc (t0 )ΩM (t0 )(a(t0 )/a(t))3 , ρR (t) = ρR (t0 )(a(t0 )/a(t))4 = ρc (t0 )ΩR (t0 )(a(t0 )/a(t))4 , ρΛ (t) = ρΛ (t0 ) = ρc (t0 )ΩΛ (t0 ). On peut également définir un paramètre Ωk associé à la courbure, de sorte que −3kc2 /8πGa2 (t) = ρc (t0 )Ωk (t0 )(a(t0 )/a(t))2 . Finalement, on pose ΩM (t0 ) = 8πGρM (t0 ) , 3H02 ΩR (t0 ) = 8πGρR (t0 ) , 3H02 Ωk (t0 ) = − k , H02 a20 ΩΛ (t0 ) = Λc2 , 3H02 et l’équation de Friedmann devient a40 a20 a30 2 2 + ΩR (t0 ) 4 + Ωk (t0 ) 2 + ΩΛ (t0 ) . H (t) = H0 ΩM (t0 ) 3 a (t) a (t) a (t) 54 Mis à jour le 14 Décembre 2012 Une conséquence immédiate de cette équation est qu’elle s’écrit comme une “règle de somme cosmique” à l’instant présent, ΩM (t0 ) + ΩR (t0 ) + Ωk (t0 ) + ΩΛ (t0 ) = 1. Les cosmologistes établissent une classification des divers modèles possibles d’univers en fonction des valeurs prises par les paramètres caractéristiques, notamment la courbure et la constante cosmologique. C’est la comparaison entre les éléments dynamiques issus de l’observation (constante de Hubble et paramètre de décélération notamment) et les prédictions déduites des divers modèles qui permet ensuite de valider tel modèle et par conséquent tel contenu énergétique de l’Univers. Cosmologie 55 5 Le modèle Lambda-CDM On se propose ici de montrer comment les paramètres de l’Univers sont mesurables et de souligner le rôle particulier joué par la constante cosmologique, puis d’insister sur la situation singulière de l’Univers actuel. Les éléments essentiels du modèle ΛCDM Le modèle d’Univers est essentiellement gouverné par les paramètres – de courbure, k, – de densité de matière, ρ, pour laquelle on distingue en général la matière relativiste ou rayonnement (on parle également de matière chaude, hot matter, ρHM ), et la matière non relativiste (on parle également de matière froide, cold matter, ρCM ), – de constante cosmologique, Λ. On choisit en général d’écrire la constante cosmologique sous la forme d’une densité ρΛ = Λ/8πG de sorte qu’il apparaı̂t trois contributions essentielles à la densité, chacune obéissant à une équation d’état différente, ρ(t) = ρHM (t) + ρCM (t) + ρΛ (t), 1 ρ c2 , 3 HM = 0, pHM = pCM pΛ = −ρΛ c2 . Pour chaque modèle d’Univers (c’est-à-dire des proportions relatives des trois types de matière), on calcule la dynamique que l’on compare aux mesures pour sélectionner les caractéristiques de l’Univers actuel. 56 Mis à jour le 14 Décembre 2012 Paramètres mesurables On considère une étoile située en σ dans le référentiel comobile, observée depuis la Terre à σ = 0. La métrique est celle de FLRW, ds2 = c2 dt2 − a2 (t) dσ 2 2 2 . + σ dΩ 1 − kσ 2 L’axe Terre-étoile est choisi comme référence de sorte que θ = ϕ = 0 et l’intervalle devient ds2 = c2 dt2 − a2 (t) dσ 2 . 1 − kσ 2 ⊲ Les distances. Une première notion de distance est la distance propre dp (t). Comme en relativisté restreinte, c’est la distance entre deux points “mesurée” au dσ 2 même instant, soit ds2 = −a2 (t) 1−kσ 2 . La distance propre définie positive (disons à t0 ) entre l’étoile et la Terre vaut Z σ Z p dσ √ = a(t0 )Ak (σ) − ds2 = a(t0 ) dp (t0 ) = 1 − kσ 2 0 où Ak (σ) = ( Arcsin σ σ Argsinh σ si k = 1 si k = 0 si k = −1 On peut ensuite en déduire la loi de Hubble de la manière suivante : d˙p (t0 ) = ȧ(t0 )Ak (σ) = H0 dp (t0 ) avec H0 = ȧ(t0 )/a(t0 ). On en déduit notamment la distance de Hubble qui mesure l’Univers observable, comme la distance dH (t0 ) au-delà de laquelle la vitesse de récession des galaxies dépasse c, soit dH (t0 ) = c/H0 . Avec la valeur H0 = 70 ± 7 km.s−1 .Mpc−1 , on obtient dH (t0 ) = 4300 ± 430 Mpc. Une autre expression de la distance propre peut être obtenue en considérant maintenant que l’étoile en σ émet un signal lumineux à t = tém. reçu sur Terre à t0 . dσ 2 Il s’agit d’une trajectoire radiale du genre lumière, soit ds2 = c2 dt2 −a2 (t) 1−kσ 2 = 0 ou encore c dt dσ =√ . a(t) 1 − kσ 2 R σ dσ = Ak (σ) et dp (t0 ) = a(t0 )Ak (σ), on peut ré-exprimer Comme par ailleurs 0 √1−kσ 2 dp (t0 ) = a(t0 ) Z t0 tém. c dt . a(t) Cosmologie 57 Il est conventionnel de donner un nom aux premiers coefficients du développement de Taylor du facteur d’échelle, a(t) = a(t0 ) + (t − t0 )ȧ(t0 ) + 12 (t − t0 )2 ä(t0 ) + . . . = a(t0 )(1 + H0 (t − t0 ) − 21 q0 H02 (t − t0 )2 + . . .) en ajoutant des indices 0 aux valeurs présentes. q0 est le paramètre (sans dimension) de décélération, q0 ≡ −ä(t0 )a(t0 )/ȧ2 (t0 ) = −ä(t0 )/H02 a(t0 ). (5.1) On peut effectuer R t0 c dt un développement de Taylor de l’inverse du facteur d’échelle pour exprimer t a(t) en puissances de t0 − tém. , ém. a−1 (t) = a−1 (t0 )(1 − H0 (t − t0 ) + (1 + q0 2 )H0 (t − t0 )2 + . . .) 2 On en déduit 1 q 1 dp (t0 ) = c(t0 − tém. ) + cH0 (t0 − tém. )2 + (1 + 0 )cH02 (t0 − tém. )3 + . . . 2 3 2 La valeur du “redshift” z est également accessible à l’expérience, z= λobs − λém λém et sa forme en fonction de tobs − tém fait intervenir des paramètres fondamentaux. Pour montrer cela, considérons comme précd́edemmant que nous sommes à l’origine du référentiel comobile, σ = 0, et qu’un signal lumineux issu d’une galaxie située en σém (fixé) émis à l’instant tém nous parvient à tobs . Le signal émis à la période suivante est émis à l’instant tém +∆tém et nous arrive à tobs +∆tobs . Ces deux signaux parcourent des intervalles de genre lumière, 0 = dt2 − a2 (t) dσ 2 /c2 (1 − kσ 2 ) de sorte qu’il vient les deux égalités Z tobs tém dt 1 =− a(t) c Z 0 σém dσ √ 1 − kσ 2 et Z tobs +∆tobs tém +∆tém dt 1 =− a(t) c Z 0 σém dσ √ . 1 − kσ 2 On voit que cela entraı̂ne l’égalité des deux premiers membres, et comme les intervalles ∆t sont arbitrairement petits, on peut négliger la dépendance temporelle du facteur d’échelle dans les intégrales et il vient simplement tobs t t + ∆tobs t + ∆tém − ém = obs − ém a(tobs ) a(tém ) a(tobs ) a(tém ) 58 Mis à jour le 14 Décembre 2012 soit ∆tobs ∆tém − = 0. a(tobs ) a(tém ) En multipliant les ∆t par c pour avoir les longueurs d’onde, on obtient le redshift z = (λobs − λém )/λém , z = a(tobs )/a(tém ) − 1. (5.2) On peut ainsi réexprimer le redshift z = H0 (t0 − tém ) + (1 + 12 q0 )H02 (t0 − tém )2 . En formant également z 2 , cette expression est inversible, pour donner t0 − tém = H0−1 z(1 − (1 + q0 )z) + O(z 3 ) 2 soit finalement la distance propre exprimée en fonction du redshift dp (t0 ) = 1 + q0 cz 1− z + O(z 2 ) . H0 2 On constate que la relation linéaire dp ∼ z vaut uniquement dans la limite où les 2 . redshifts sont faibles, typiquement z ≪ 1+q 0 Les observations astronomiques ne permettent pas la détermination directe de la distance propre qui nous sépare d’une étoile ou d’une galaxie. On mesure la luminosité apparente ℓ, luminosité par unité de surface vue depuis la Terre, ce qui permet de définir une quantité homogène à une longueur, la distance de luminosité, dl , par la relation L = 4πd2l ℓ à condition de connaı̂tre une estimation de la luminosité absolue ou intrinsèque, L. Cette estimation est possible pour les chandelles standard, que nous discuterons p au paragraphe suivant. La quantité dl = L/4πℓ prend effectivement le sens de distance à laquelle un objet de luminosité absolue L produit une luminosité par unité de surface de ℓ dans un espace euclidien statique. Dans le cas d’un espace éventuellement courbe et en expansion, deux corrections sont nécessaires. D’une part l’effet de courbure, qui produit une correction géométrique et d’autre part l’effet de l’expansion. Pour exprimer la correction géométrique, considérons le cas d’une sphère de rayon a sur laquelle on trace un cercle autour de l’axe des pôles. Le périmètre de ce cercle est donné par 2πa sin σ si σ est l’angle d’un point du cercle par rapport à l’axe des pôles, soit en fonction du “rayon” r = aσ mesuré sur la surface sphérique, 2πa sin(r/a). Ce résultat vaut pour un espace de courbure positive. Dans le cas général, on a un périmètre de 2πrSk (σ) avec Sk (σ) = σ −1 sin σ pour k = 1, 1 pour k = 0 et σ −1 sinh σ pour k = −1. On peut généraliser cette relation à une relation similaire entre distance de luminosité et distance propre, dl (t0 ) = dp (t0 )Sk (σ). Une seconde correction provient de l’expansion de l’Univers. Il y a tout d’abord un effet d’augmentation des longueurs d’onde, puisqu’un photon de longueur d’onde λém Cosmologie 59 émis lorsque le facteur d’échelle de l’Univers est a(tém ) à tém est mesuré à t0 avec une longueur d’onde λ0 telle que λ0 /a(t0 ) = λém /a(tém ), soit λ0 = (1 + z)λém . Les énergies hc/λ varient dans les proportions inverses, soit E0 = Eém /(1 + z). Un deuxième effet de l’expansion vient s’ajouter si l’on tient compte du changement de distances entre l’émission et la reception de deux photons successifs. Supposons deux photons émis par la galaxie lointaine à des instants séparés de ∆tém . Il correspond à ces deux instants un intervalle dsém = c∆tém qui, comme la longueur d’onde, sera augmenté par l’expansion par un facetur 1 + z au moment de la réception à t0 , soit ds0 = c∆tém (1 + z). Cela signifie que les deux photons sont absorbés sur Terre à des intervalles ∆tém (1 + z). Lorsque l’on combine les deux effets liés à l’expansion, on voit que la luminosité apparente est diminuée d’un facteur (1 + z)2 par rapport à sa valeur en l’absence d’expansion. Courbure et expansion permettent donc d’écrire la luminosité apparente comme ℓ(t0 ) = L L = 2 2 2 4πdl (t0 ) 4πdp (t0 )Sk (σ)(1 + z)2 et finalement, il vient entre la distance de luminsoité et la distance propre la relation dl (t0 ) = dp (t0 )Sk (σ)(1 + z). Connaissant le développement de la distance propre en fonction du redshift, on a dl (t0 ) = cz 1 − q0 1+ z + O(z 2 ) . H0 2 Les deux distances coı̈ncident aux z petits. ⊲ Magnitudes. La magnitude est définie par m = −2.5 log10 ℓ ℓx où ℓx = 2.53 10−8 W.m−2 est une luminosité de référence. Le choix des facteurs numériques dans cette expression permet de classer les étoiles visibles à l’œil nu sur une échelle de 1 à 6, comme cela avait été imaginé par Ptolémée et Hipparcos sur la base de l’observation d’un millier d’étoiles. Si l’on passe à une expression en fonction de la distance de luminosité, on obtient m = 2.5 log10 4π 2.53 10−8 cz 1 − q0 + 5 log10 dl + 5 log10 z) + 5 log10 (1 + L H0 2 de sorte que la courbe de m en fonction de z donne accès, pour peu que l’on connaisse la luminosité intrinsèque L, aux paramètres cosmioques H0 et q0 . A titre d’exemple; les SNIa ont un luminosité intrinsèque de L = 12.1 1035 W (soit 4.109 L⊙ ). Une SNIa de redshift z = 0.2 a une luminosité apparente de ℓ = 1.328 10−16 W.m−2 . Cela correspond dans un espace plat à d = l = 871 Mpc, dp = 725 Mpc, m = 20.7. Pour une SNIa de redshift z = 1 a une luminosité apparente de ℓ = 3.041 10−18 W.m−2 . Cela correspond à d = l = 5760 Mpc, dp = 2880 Mpc, m = 24.8. 60 Mis à jour le 14 Décembre 2012 ⊲ Chandelles standard. Les chandelles standard sont des “objets” (étoiles, galaxies) dont la luminosité intrinsèque est calibrée, de sorte que de la mesure de leur luminosité apparente on peut déduire leur distance. Les Céphéı̈des sont des étoiles variables géantes ou supergéantes jaunes (4 M⊙ − 15 M⊙ , 100 L⊙ − 30 000 L⊙ ). Leur éclat varie de 0.1 à 2 magnitudes de manière périodique en raison de variations de surface et de température de surface (période comprise entre 1 et 135 jours) et la période est directement corrélée à la luminosité. La distance des Céphéı̈des les plus proches est accessible à des mesures de parallaxe, de sorte que l’on peut calibrer la luminosité intrinsèque sur la la périodicité de l’éclat. Figure 5.1 gauche). Variation de luminosité apparente d’une Céphéı̈de (δ−Céphéı̈de à Figure 5.2 Relation période-luminosité pour les Céphéı̈des du super amas de la Vierge. Les campagnes d’observations de SNe Ia sont basées sur le fait que ce sont des chandelles incroyablement lumineuses. Leur signature spectrale est parfaitement caractérisée et même à des distances extrêmement grandes, elles sont suffisamment brillantes pour être observables. Cosmologie 61 Figure 5.3 L’étude des supernovæ Ia résulte de campagnes d’observation systématique du ciel (figure extraite des Images de la Physique 2008). Figure 5.4 Les supernovæ Ia sont des objets extrêmement lumineux et qui ont des signatures spectrales caractéristiques comme en atteste la figure (extraite des Images de la Physique 2008). Les supernovæ Ia sont formées à partir d’étoiles doubles associant une naine blanche d’une masse de l’ordre de la masse solaire, qui “aspire” de la matière de son compagnon de sorte que la naine blanche atteint la limite de Chandrasekhar, 1.3M⊙ , où elle se transforme en supernova selon un mécanisme suffisamment connu pour que la luminosité intrinsèque soit appréciée convenablement à 4.109 L⊙ , c’est-à-dire à peu près aussi brillante qu’une petite galaxie ! 62 Mis à jour le 14 Décembre 2012 Figure 5.5 Une supernova presque aussi lumineuse que sa galaxie. A des échelles intermédiaires entre les Céphéı̈des et les SNIa, certaines galaxies servent également de chandelles standard et leur calibration est assurée au moyen d’une relation connue comme loi de Tully-Fisher. ⊲ Paramètres mesurés. Plutôt que les courbes v vs d de Hubble, les astronomes reportent en général aujourd’hui la magnitude effective m(z), m = 2.5 log10 4π 2.53 10−8 cz 1 − q0 + 5 log10 dl + 5 log10 z), + 5 log10 (1 + L H0 2 pour les chandelles standard en fonction du redshift. H0 dL (z) est donné par une intégrale (48) déterminée par la métrique FRW, soit 1+z Sk H0 dL (z) = p |Ωk | "Z p |Ωk | dz ′ z 0 p (1 + z ′ )2 (1 + z ′ ΩM ) − z ′ (2 + z ′ )ΩΛ # avec la fonction Sk (x) = x si k = 0, sin x si k = +1 et sinh x si k = −1 et où ΩM = 8πGρM , 3H02 ΩΛ = Λ , 3H02 Ωk = − k , a20 H02 en négligeant complètement la contribution du rayonnement. De la mesure des magnitudes, on peut par consq́uent déduire les paramètres cosmologiques H0 et q0 . (48) cf. hep-ph/0004188. Cosmologie 63 Figure 5.6 Illustration de la loi de Hubble déduite de l’observation des Céphéı̈des dans le cadre du “Hubble Key Project” et comparaison avec d’autres chandelles standard. 64 FAINTER (Farther) (Further back in time) Mis à jour le 14 Décembre 2012 Perlmutter, et al. (1998) 24 effective mB 22 Flat Supernova Cosmology Project Λ=0 (ΩΜ,ΩΛ) = ( 0, 1 ) (0.5,0.5) (0, 0) ( 1, 0 ) (1, 0) (1.5,–0.5) (2, 0) 26 20 18 Calan/Tololo (Hamuy et al, A.J. 1996) 16 14 0.02 0.05 0.1 redshift z 0.2 0.5 1.0 MORE REDSHIFT (More total expansion of universe since the supernova explosion) In flat universe: ΩM = 0.28 [± 0.085 statistical] [± 0.05 systematic] Prob. of fit to Λ = 0 universe: 1% Figure 5.7 Diagramme de Hubble en 1998. Il est à noter que l’estimation de ces paramètres a beaucoup évolué au cours du XXème siècle. Cosmologie 65 Figure 5.8 Evolution de l’estimation de la constante de Hubble. Les paramètres H0 , q0 , de même que la courbure k, la valeur du rapport Ω de la densité de l’Univers à la densité critique et la valeur de la constante cosmologique Λ sont les paramètres qui définissent l’Univers. Précisons les valeurs présentes, actuellement admises (49) : H0 = 72 ± 8 km s−1 Mpc−1 Hubble Key Project − 0.02 ≤ kc2 /a20 H02 ≤ 0.02 fluctuations du rayonnement cosmique à 3 K τ0 = H0−1 = 1.36 ± 0.15 1010 années ΩM = Ω0 = 8πGρ0 /3H02 = 0.3 ± 0.1 ΩΛ = λ0 = Λ/3H02 = 0.7 ± 0.2 structures à grande échelle supernovæ Ia Nous avons déjà précisé le rôle des campagnes de mesures basées sur l’observation de supernovæ distantes dans la détermination des paramètres caractérisant la dynamique de l’Univers et en particulier la qualité de la valeur obtenue pour la constante cosmologique. On peut se reporter aux articles suivants : Cosmic Concordance, [astro-ph/9505066], puis First Year Wilkinson Microwave Anisotropy Probe (WMAP) Observations: Determination of Cosmological Parameters, [astroph/0302209] et plus récemment, Wilkinson Microwave Anisotropy Probe (WMAP) Three Year Results: Implications for Cosmology, [astro-ph/0603449]. Les campagnes de mesures précises des paramètres Ω sont essentiellement basées, outre l’analyse fine du fond de rayonnement cosmique, sur l’étude des grandes structures et l’étude des supernovæ Ia a fort “redshift”. De ces mesures combinées, il ressort les valeurs admises des paramètres de densité ΩM = 0.275 ± 0.033 ΩR = 0.0010 ± 0.0005 ΩΛ = 0.72 ± 0.03 Ωk = 0.000025 ± 0.006500 d’où l’appellation de modèle Λ-CDM (49) Tirées de M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford 2004. Nous reviendrons sur ces paramètres. 66 Mis à jour le 14 Décembre 2012 Figure 5.9 Les zones de confiance dans le plan ΩΛ − ΩM d’après les campagnes de mesures de supernovæIa. Figure 5.10 Les zones de confiance dans le plan ΩΛ −ΩM d’après les campagnes de mesures combinées des supernovæIa, les fluctuations du fond diffus de rayonnement cosmique et l’étude des grandes structures. Cosmologie 67 L’inventaire cosmique On a indiqué précédemment les valeurs expérimentales présentes, soit k ≃ 0, ΩHM ≃ 0, ΩCM ≃ 0.3, ΩΛ ≃ 0.7. L’Univers est ainsi actuellement dominé par la constante cosmologique et la matière froide. Comme la valeur de ΩCM est très largement supérieure à la quantité visible de matière froide, on considère que cette matière froide est sombre (ne rayonne pas) et on parle de cold dark matter (cf. le chapitre sur les problèmes cosmologiques). Les candidats à cette matière froide invisible sont hypothétiques (naines brunes, WIMPS (weakly interacting massive particles), MACHOS (Massive Compact Halo Objects), . . . ). L’origine de la constante cosmologique étant également sujette à interrogations, on parle souvent d’énergie sombre (dark energy) car d’autres formes d’énergie qu’une simple constante cosmologique Λ peuvent produire l’effet voulu (par exemple la quintessence). Le modèle d’Univers qui prévaut actuellement est ainsi appelé modèle ΛCDM. On reproduit ci-dessous certains de résultats obtenus par les analyses fines du fond de rayonnement cosmologique extraits de astro-ph/0603449. Tableau 5.1 Définition des paramètres cosmologiques [astro-ph/0603449]. Parameter Description Definition H0 ωb ωc fν P Hubble expansion factor Baryon density Cold dark matter density Massive neutrino fraction Total neutrino mass (eV) Effective number of relativistic neutrino species Spatial curvature Dark energy density Matter energy density Dark energy equation of state H0 = 100h Mpc−1 km s−1 ωb = Ωb h2 = ρb /1.88 × 10−26 kg m−3 ωc = Ωc h2 = ρc /18.8 yoctograms/ m−3 fν = Ων /Ωc P mν = 93.104Ων h2 mν Nν Ωk ΩDE Ωm w For w = −1, ΩΛ = ΩDE Ωm = Ωb + Ωc + Ων w = pDE /ρDE Tableau 5.2 ΛCDM Model. WMAP+ SDSS WMAP+ LRG WMAP+ SNLS WMAP + SN Gold WMAP+ CFHTLS 2.233+0.062 −0.086 0.1329+0.0056 −0.0075 2.242+0.062 −0.084 0.1337+0.0044 −0.0061 2.233+0.069 −0.088 0.1295+0.0056 −0.0072 2.227+0.065 −0.082 0.1349+0.0056 −0.0071 2.255+0.062 −0.083 0.1408+0.0034 −0.0050 0.085+0.028 −0.032 0.950+0.015 −0.019 0.079+0.028 −0.034 0.946+0.015 −0.019 0.088+0.026 −0.032 0.953+0.015 −0.019 Parameter 100Ωb h2 Ωm h2 0.709+0.024 −0.032 0.813+0.042 −0.052 0.723+0.021 −0.030 0.808+0.044 −0.051 τ ns 0.079+0.029 −0.032 0.948+0.015 −0.018 0.709+0.016 −0.023 0.816+0.042 −0.049 σ8 Ωm 0.772+0.036 −0.048 0.266+0.026 −0.036 0.781+0.032 −0.045 0.267+0.018 −0.025 0.758+0.038 −0.052 0.249+0.024 −0.031 h A 0.082+0.028 −0.033 0.951+0.014 −0.018 0.701+0.020 −0.026 0.827+0.045 −0.053 0.784+0.035 −0.049 0.276+0.023 −0.031 0.687+0.016 −0.024 0.846+0.037 −0.047 0.826+0.022 −0.035 0.299+0.019 −0.025 68 Mis à jour le 14 Décembre 2012 Tableau 5.3 The Cosmic Energy Inventory (beginning)d’après M. Fukugita et P. J. E. Peebles, arXiv:astro-ph/0406095. Content Componentsa dark sector dark energy dark matter primeval gravitational waves 0.72 ± 0.03 0.23 ± 0.03 < 10−10 primeval thermal remnants electromagnetic radiation neutrinos prestellar nuclear binding energy 10−4.3±0.0 10−2.9±0.1 −10−4.1±0.0 baryon rest mass warm intergalactic plasma intracluster plasma main sequence stars (spheroids and bulges) (disks and irregular) white dwarfs neutron stars black holes substellar objects HI + HeI molecular gas planets condensed matter sequestered in massive black holes 0.040 ± 0.003 0.0018 ± 0.0007 0.0015 ± 0.0004 0.00055 ± 0.00014 0.00036 ± 0.00008 0.00005 ± 0.00002 0.00007 ± 0.00002 0.00014 ± 0.00007 0.00062 ± 0.00010 0.00016 ± 0.00006 10−6 10−5.6±0.3 10−5.4 (1 + ǫn ) primeval gravitational binding energy virialized halos of galaxies clusters large-scale structure binding energy from gravitational settling baryon-dominated parts of galaxies main sequence stars and substellar objects white dwarfs neutron stars stellar mass black holes galactic nuclei (early type) (late type) poststellar nuclear binding energy main sequence stars and substellar objects diffuse material in galaxies white dwarfs clusters intergalactic poststellar radiation resolved radio-microwave far infrared optical X-γ ray gravitational radiation (stellar mass binaries) (massive black holes) a Based on Hubble parameter h = 0.7. Totalsa 0.954 ± 0.003 0.0010 ± 0.0005 0.045 ± 0.003 −10−6.1±0.1 −10−7.2 −10−6.9 −10−6.2 −10−4.9 −10−8.8±0.3 −10−8.1 −10−7.4 −10−5.2 −10−4.2 ǫs −10−5.6 ǫn −10−5.8 ǫn −10−5.2 −10−5.8 −10−6.5 −10−5.6 −10−6.5 −10−6.2±0.5 10−5.7±0.1 10−10.3±0.3 10−6.1 10−5.8±0.2 10−7.9±0.2 10−9±1 10−7.5±0.5 Cosmologie 69 Tableau 5.4 The Cosmic Energy Inventory (end). Componentsa Content Totalsa 10−5.5 stellar neutrinos nuclear burning white dwarf formation core collapse 10−6.8 10−7.7 10−5.5 +0.6 −8.3−0.3 cosmic rays and magnetic fields 10 kinetic energy in the intergalactic medium 10−8.0±0.3 a Based on Hubble parameter h = 0.7. Tableau 5.5 Joint Data Set Constraints on Geometry and Vacuum Energy. Data Set ΩK ΩΛ WMAP + h = 0.72 ± 0.08 −0.003+0.013 −0.017 −0.037+0.021 −0.015 −0.0057+0.0061 −0.0088 −0.010+0.011 −0.015 −0.015+0.020 −0.016 −0.017+0.022 −0.017 0.758+0.035 −0.058 WMAP + SDSS WMAP + 2dFGRS WMAP + SDSS LRG WMAP + SNLS WMAP + SNGold 0.650+0.055 −0.048 0.739+0.026 −0.029 0.728+0.020 −0.028 0.719+0.021 −0.029 0.703+0.030 −0.038 Le rôle particulier de Λ Revenons sur les solutions dans les cas simples et sur le succès de l’approche newtonienne. A l’époque actuelle, la dynamique de l’Univers est dominée par la matière froide, sans pression, et par la constante cosmologique. Les équations de Friedmann et la loi de continuité prennent la forme générale 1 2 4 1 1 ȧ (t) − πGρ(t)a2 (t) − Λc2 a2 (t) = − kc2 2 3 6 2 4 1 ä(t) = − πG(ρ(t) + 3p(t)/c2 )a(t) + Λc2 a(t), 3 3 a(t) + 3(ρ(t) + p(t)/c2 ) = 0. ρ̇(t) ȧ(t) Nous avons vu que les valeurs admises des paramètres cosmologiques sont en faveur d’un Univers plat k = 0 avec une constante cosmologique positive. Dans ce cas, la première équation s’écrit encore a30 2 2 + ΩΛ (t0 ) . H (t) = H0 ΩM 0 3 a (t) a3 0 ≫ ΩΛ0 dans l’Univers MDU soit Aux instants t ≪ t0 , ΩM 0 a3 (t) a(t)3 H(t)2 ≡ ȧ2 (t)a30 = H02 ΩM 0 a30 qui admet comme on l’a vu une solution de la forme 2/3 t a(t) = a0 , 4/9t20 = H02 ΩM 0 . t0 70 Mis à jour le 14 Décembre 2012 a3 0 En revanche aux temps t ≫ t0 , ΩM 0 a3 (t) ≪ ΩΛ0 , l’équation de Friedmann devient H 2 (t) = H02 ΩΛ0 soit ȧ(t)/a(t) = H0 p ΩΛ0 qui admet comme solution a(t) = a0 exp H0 p ΩΛ0 t. Il est important de noter que le rôle de Λ est de produire tôt ou tard (dès que la constante cosmologique l’emporte sur les formes ordinaires de gravitation) une accélération de l’expansion de l’Univers. Le paramètre de décélération q doit donc passer d’une valeur positive à une valeur négative et il est particulièrement singulier de noter que ce changement dans notre Univers se produit précisément à notre époque ! Etant donnée l’incertitude sur les valeurs des paramètres cosmologiques, les ouvrages de cosmologie établissent en général une classification (appelée Friedmanologie par Rich) des modèles d’Univers et de leur dynamique (modèles plats (k = 0), modèles sans constante cosmologique (Λ = 0), modèles vides (ρ = 0), etc). Nous nous limitons ici à un Univers plat avec constante cosmologique positive et densité de matière sous-critique. Cosmologie 71 6 Les “problèmes” cosmologiques Il reste de nombreux problèmes et controverses en suspens en cosmologie (notamment concenant le contenu de l’Univers - voir figure ci-dessous) et les hypothèses pour y apporter des réponses sont parfois hardies. Nous évoquons dans ce chapitre quelques-uns de ces problèmes. 72 Mis à jour le 14 Décembre 2012 Figure 6.1 Evolution du contenu de l’Univers dans le modèle ΛCDM (Hiranya V. Peiris). La matière sombre La quantité de matière non relativiste compatible avec la dynamique de l’Univers est de l’ordre de ΩM ≃ 0.30. Or on n’en observe qu’une infime partie sous forme d’étoiles ou de galaxies, Ωvisible ≃ 0.003. L’essentiel de la matière non relativiste est donc sombre (dark matter), mais reste à être identifiée. La présence de matière sombre (c’est-à-dire non visible par des moyens directs d’observation) dans les galaxies est attestée par les anomalies de courbes de rotation des étoiles périphériques. En effet, les étoiles (brillantes) très périphériques ont une vitesse essentiellement indépendante de leur distance au centre galactique. Si l’essentiel de la masse d’une galaxie était concentré au voisinage de son centre, on attendrait de la relation fondamentale de la dynamique v 2 (r)/r = GM (r)/r 2 qu’elle implique une loi de variation en inverse de la racine carrée de la distance au centre, v(r) ≃ r −1/2 . Ce n’est pas du tout conforme à l’observation, et pour rendre compatibles les observations avec la distribution de masse dans les galaxies, on est amené à supposer l’existence de halos galactiques composés de matière sombre distribuée suivant une loi empirique de la forme ρ(r) = const/(r 2 + r02 ). Figure 6.2 Courbe de vitesse des étoiles périphériques. Il reste encore à chercher (et à trouver) la matière dont ces halos sont constitués. Parmi les candidats, les naines brunes sont des étoiles en fin de vie qui ont brulé leur “carburant nucléaire” et sont donc à peine visibles dans le spectre électromagnétique. Ces étoiles peuvent toutefois être mises en évidence de manière indirecte par les Cosmologie 73 mirages gravitationnels qu’ils peuvent produire(50) . Une estimation réaliste de la densité de matière associée à ces MACHOS (Massive Halo Compact Objects) reste cependant très en-dessous de ce qui manque, ΩMACHOS ≃ 0.04. Finalement, il existe une autre façon d’estimer la quantité totale de matière non relativiste dans l’Univers, à partir des modèles de nucléosynthèse primordiale (BBN pour Bing Bang Nucleosynthesis) qui conduisent à des abondances relatives pour les éléments légers paramétrés par la densité baryonique totale. Les abondances observées sont compatibles avec Ωbaryons ≃ 0.045. Au total, on constate que la matière baryonique constitue à peine plus de 10% de la matière froide qu’il semble nécessaire d’introduire dans l’Univers pour rendre compte de sa dynamique à très grande échelle. Les physiciens, rarement à court d’idées, ont alors émis l’hypothèse que d’autre particules, de nature non baryonique, doivent peupler l’Univers en nombre. On les appelle des WIMPS (Weakly Interacting Massice ParticleS), mais là encore; il reste à les trouver ! (50) Si une étoile brune passe sur la ligne de visée depuis la Terre d’un rayon lumineux issu d’une galaxie plus lointaine, elle est susceptible de courber la trajectoire suivie par les photons 74 Mis à jour le 14 Décembre 2012 Figure 6.3 Abondances relatives des éléments légers en fonction de la densité baryonique de l’Univers. Le “problème” de la constante cosmoλogique ou de l’énergie sombre On s’intéresse à nouveau dans cette section à l’histoire de la constante cosmologique,(51) évoquée précédemment. On pose tout d’abord les éléments factuels, puis on donne les estimations quantitatives d’un désaccord maintenant célèbre (52) . Rappelons qu’Einstein a modifié les équations de la gravitation relativiste, Gµν = 8πG T , c4 µν par l’introduction au premier membre d’un terme −Λgµν qui respecte la covariance relativiste(53) et compense l’effet de gravitation (si Λ > 0) permettant ainsi de trouver des solutions pour un Univers statique à condition de fixer pour Λ une valeur bien précise dépendant de la densité de l’Univers. La constante cosmologique est homogène à l’inverse d’une longueur au carré et fixe une échelle universelle de longueurs : la courbure d’un Univers vide de matière (la solution de de Sitter). Rapidement, Friedmann puis Lemaı̂tre établiront que l’Univers statique d’Einstein est instable. Au contraire, les équations d’Einstein admettent (avec ou sans Λ) des solutions dynamiques pour un Univers en expansion ou en contraction. L’observation de l’expansion (à partir du décalage systématique vers le rouge des galaxies éloignées) par Slipher et Hubble fera dire à Einstein que la constante cosmologique est inutile. Après Einstein, de nombreux physiciens théoriciens adopteront la même attitude à l’égard de la constante cosmologique et s’en désintéresseront. Les astronomes et cosmologistes seront en revanche attachés à l’existence du terme cosmologique, notamment Eddigton, car sans sa présence les modèles conduisent à un Univers trop jeune, plus jeune même que la Terre, et seule l’introduction du paramètre supplémentaire Λ peut “vieillir” suffisamment l’Univers. Récemment (1997) des mesures effectuées sur des supernovae lointaines (supernova cosmology project) ont montré sans doute possible que l’expansion de l’Univers s’accélère. Pour rendre compte d’une telle expansion accélérée, il est indispensable d’avoir recours à la constante cosmologique, ce qui a suscité un regain d’intérêt pour ce Λ, sa détermination expérimentale et son interprétation théorique. Le terme cosmologique −Λgµν peut être rejeté au second membre sous la forme +Λgµν = 8πG 2 c4 ρΛ c gµν Gµν = avec ρΛ = Λc2 8πG pour donner aux équations d’Einstein la forme 8πG (Tµν + ρΛ c2 gµν ). c4 Nous sommes en mesure d’estimer facilement une borne supérieure de ρΛ en notant que la gravitation newtonienne est une très bonne approximation à l’échelle du système solaire. Comme les effets de la constante cosmologique sont susceptibles de (51) S. Weinberg, The cosmological constant problem, Rev. Mod. Phys. 61, 1 (1989), P.J.E. Peebles and B. Ratra, The cosmological constant and dark energy, Rev. Mod. Phys. 75, 559 (2003), N. Straumann, On the cosmological constant problems and the astronomical evidence for a homogeneous energy density with negative pressure, astro-ph/0203330. (52) Je conseille également le site http://super.colorado.edi/~michaele/Lambda pour une très agréable présentation des problèmes suscités par la constante cosmologique. (53) A l’origine, Einstein a utilisé la notation λ. Cosmologie 75 se faire sentir aux grandes distances, on aura une valeur maximale en écrivant que l’effet de ρΛ est négligeable devant celui de l’attraction gravitationnelle du Soleil à l’échelle de Pluton par exemple. Le champ de gravitation exercé par le Soleil au niveau de l’orbite de Pluton, rP = 5.9 · 1012 m, vaut G⊙ (rP ) = GM⊙ /rP2 . Celui qu’exercerait une masse volumique uniforme ρΛ à cette même distance s’exprime par GΛ (rP ) = GMΛ (rP )/rP2 = 4πρΛ GrP /3. En écrivant que cette seconde contribution est négligeable devant la première, on obtient la borne supérieure suivante à la densité de masse associée à la constante cosmologique, ρΛ ≪ 3M⊙ . 4πrP3 En introduisant les valeurs numériques on trouve(54) ρΛ ≪ 2.3 · 10−9 kg.m−3 = 6.56 · 10−27 f −4 . Des estimations beaucoup plus strictes se déduisent d’observations astronomiques au-delà du simple système solaire et on admet une valeur de l’ordre de ρΛ ≪ 10−26 kg.m−3 = 2.9 · 10−44 f −4 . Revenons aux équations d’Einstein en présence du terme cosmologique. Le dernier terme ρΛ c2 gµν est exactement la forme que prendrait le tenseur énergieimpulsion Tµν d’un fluide au repos(55) de pression pΛ = −ρΛ c2 . Il se trouve que cette équation d’état est précisément celle que l’on attend de la densité (d’énergie) associée au vide quantique(56) . En effet, si l’on exige que le vide quantique (54) Digression sur les unités “naturelles” (R.J. Adler, B. Casey and O.C. Jacob, Vacuum catastrophe: an elementary exposition of the cosmological constant problem, Am. J. Phys. 63, 620 (1995)). On utilise fréquemment en physique des particules les unités naturelles dans lesquelles les constantes c et h̄ valent toutes les deux 1. Cela permet en outre de n’avoir plus qu’une seule unité fondamentale au lieu des trois dimensions usuelles M, L et T. Choisissons par exemple la longueur comme dimension fondamentale et le fermi (1 f = 10−15 m) comme unique unité. On peut alors introduire comme unité de temps le “jiffy” (j), durée que met la lumière pour parcourir 1 f (Notons qu’historiquement, le jiffy a été introduit par le chimiste Lewis qui avait déjà forgé le terme de photon. C’était une unité de temps fantaisiste associée à la durée nécessaire à la lumière pour parcourir 1 cm.). On a alors c = 1f.j−1 soit encore 1 j = 10−15 /3.108 s. Si l’on pose maintenant c = 1 (sans dimension), alors les longueurs se mesurent en f, mais également les durées car il faut que 1 j = 1 f pour que c soit adimensionnée. Considérons maintenant le cas de h̄. Plutôt que les J.s, on peut choisir d’exprimer les durées en j (temporairement avant de les éliminer de nouveau au profit des f) et les énergies en MeV, bien plus adaptés à l’échelle de la physique subatomique. On a donc h̄ = 1.053 · 10−34 J.s = 1.053 × 3 · 10−11 J.j = 197 MeV.j. On peut fixer une nouvelle unité d’énergie, le “blip” (b), telle que 1 b = 197 MeV. On a h̄ = 1 b.j. Si l’on impose maintenant que h̄ = 1 (sans dimension), cela nécessite que 1 b = 1 j−1 = 1 f −1 . On n’a plus que le fermi comme unité fondamentale. Les fréquences (E/h̄) se mesurent comme les énergies en f−1 , les masses (E/c2 ) également, . . . . Les conversions utiles sont 1 m = 1015 f, 1 s = 3.1023 f, 1 J = 3.17 · 1010 f −1 . Pour exprimer une densité par exemple, on procède comme suit, 1 J = 1 kg.m2 s−2 = 3.17 · 1010 f −1 , soit 1 kg = 3.17 · 1010 × 10−30 × 9 · 1046 f −1 = 28.5 · 1026 f −1 . On a ensuite 1 kg.m−3 = 28.5 · 1026 × 10−45 f −4 = 28.5 · 10−19 f −4 . (55) Rappelons que pour un fluide Tµν = (ρ + p/c2 )vµ vν − pgµν . (56) En mécanique quantique, les inégalités d’Heisenberg interdisent à tout système physique, particule ou de manière générale degré de liberté quelconque, d’être au repos. Il s’ensuit que même dans l’état de plus basse énergie subsiste une énergie résiduelle appelée énergie de point zéro. On parle des fluctuations du vide quantique et pour des raisons fondamentales (invariance de Lorentz), la densité d’énergie associée correspond à une équation d’état p = −ρc2 . 76 Mis à jour le 14 Décembre 2012 satisfasse aux contraintes relativistes, le tenseur énergie-impulsion associé, Tµν = (ρ+p/c2 )vµ vν −pgµν , doit être covariant par transformation de Lorentz. Notamment en considérant le référentiel tangent au référentiel propre du vide (vµ = (c, ~0)) dans lequel la métrique est minkowskienne, gµν = ηµν = diag (1, −1, −1, −1), on a Tµν 1 0 2 = (ρc + p) 0 0 0 0 0 0 1 0 0 − p0 0 0 0 0 0 0 0 0 0 −1 0 0 0 0 −1 0 0 ρc2 0 = 0 0 0 −1 0 0 p 0 0 0 0 0 0 p 0 0 p soit finalemant Tµν = ρc2 ηµν , si p = −ρc2 . Cette équation d’état assure que le vide est invariant de Lorentz. Cette particularité fait du vide quantique un concept très différent de la matière ordinaire ou du rayonnement. Dans les autres domaines de la physique où seules les différences d’énergie interviennent, l’énergie du vide n’a pas d’effet direct mais la situation est très différente lorsque la gravitation intervient, puisque toutes les formes d’énergie contribuent à la structure de l’espace-temps par le biais du tenseur énergie-impulsion dans les équations d’Einstein. Cette observation très encourageante, formulée pour la première fois par Pauli (57) , donne l’espoir de relier la constante cosmologique (et les échelles de longueur de l’ordre de 1023 m) aux interactions fondamentales qui régissent la physique des particules (et des échelles de l’ordre de 10−15 m). La constante cosmologique trouverait ainsi une interprétation. L’illusion est de courte durée, car la valeur estimée de la contribution de la densité d’énergie du vide est 10120 fois plus importante que l’estimation associée à la constante cosmologique mesurée par observations astronomiques. Pour la densité d’énergie du vide quantique, on peut fournir une borne inférieure en précisant que la théorie quantique des champs est vérifiée jusqu’à des échelles d’énergie de l’ordre de 1014 GeV, puisque l’on mesure de telles énergies pour des photons issus du rayonnement cosmique. Le vide possède donc une énergie 12 h̄ω par degré de liberté (oscillateurs harmoniques) et l’on doit sommer sur ces oscillateurs pour obtenir Evide = X1 k 2 h̄ωk , où les ωk sont tels que h̄2 ωk2 = h̄2 k 2 c2 + m2 c4 , soit en unités naturelles ωk2 = k 2 + m2 . Dans la limite des très hautes énergies (limite ultrarelativiste) on peut négliger la masse. En considérant le vide établi dans une boı̂te cubique de taille L3 , la somme sur les modes peut se calculer par une intégrale X k (57) L3 → (2π)3 Z kmax 4πk 2 dk 0 Voir l’article de N. Straumann, arXiv:0810.2213 ou celui de Bernardeau et Uzan dans les Images de la Physique 2008. Cosmologie 77 où le préfacteur tient compte de la quantification des valeurs permises pour k pour garantir des conditions aux limites périodiques. On a alors Evide = X1 k 2 ωk = Z L3 (2π)3 kmax 0 Z kmax ≃ L3 4π 2 = k4 L3 max2 . 16π 1 4πk 2 dk (k 2 + m2 )1/2 2 k 3 dk 0 La coupure à 1014 GeV correspond à 5.1014 f −1 , soit une densité d’énergie associée au vide de Evide > 4.2 × 1056 f −4 . L→∞ L3 ρvide = lim Cette valeur est évidemment sans aucun rapport avec celle de ρΛ . De nombreux physiciens pensent même que le paramètre de coupure pertinent jusqu’où appliquer les théories quantiques des champs est plutôt l’énergie de Planck de l’ordre de 1019 GeV, ce qui donne à la densité d’énergie de vide une borne inférieure encore plus dramatique, ρvide > 1076 f −4 ! Ce désaccord est la plus grande contradiction connue en physique et probablement dans toutes les sciences. Pour tenter de lever la difficulté, de nombreuses hypothèses - répondant aux jolis noms de “supersymétrie”, “quintessence” - ont été avancées, sans succès jusqu’à présent. Les théories de supersymétrie par exemple élimineraient la difficulté d’un vide possédant une énergie considérable, car par un mécanisme de compensation entre les fermions et les bosons en nombre identique dans le cadre supersymétrique, l’énergie du vide est rigoureusement nulle. De nombreux théoriciens estiment très prometteuse cette voie à tel point qu’on en revient à l’idée d’une constante cosmologique nulle ! A la question : How can the cosmological constant be so close to zero but not zero?, Edward Witten (58) répond par exemple : I really don’t know. It’s very perplexing that astronomical observations seem to show that there is a cosmological constant. It’s definitely the most troublesome, for my interests, definitely the most troublesome observation in physics in my lifetime. In my career that is. Le problème de la platitude A l’aide de la paramétrisation en Ω, on a vu qu’il était possible d’écrire l’équation de Friedmann (de “conservation” de l’énergie) comme une contrainte à tout instant sur les diverses contributions rapportées aux valeurs critiques, ΩM + ΩR + ΩΛ − 1 = (58) k a2 H 2 . Edward Witten est l’un des physiciens théoriciens les plus en vogue, récompensé par les mathématiciens déjà avec la médaille Fields. 78 Mis à jour le 14 Décembre 2012 2 Cela découle en effet de la forme H 2 = 38 πG(ρ + ρΛ ) − kc a2 dans laquelle ρ représente les formes ordinaires de matière et de rayonnement et où l’on pose une 3kc2 contribution de courbure ρk = − 8πGa 2 . A chaque densité ρ est associé un rapport 8πGρ Ω = 3H 2 d’où l’équation proposée. Or, on observe qu’actuellement la valeur de ΩM (t0 ) + ΩR (t0 ) + ΩΛ (t0 ) ≃ 1 de sorte que le premier membre ΩM + ΩR + ΩΛ − 1 est essentiellement égal à zéro à l’époque actuelle. Au second membre a2 H 2 = ȧ2 ∼ t2(α−1) se comporte comme t−2/3 pour un univers MDU et comme t−1 dans le cas RDU. Dans les deux cas, cela signifie que |Ω(t) − 1| ∼ |k|t2(1−α) est une fonction croissante du temps (linéaire ou en t2/3 ) qui prend une valeur très proche de zéro aujourd’hui, il faut donc qu’elle ait pris une valeur extraordinairement proche de zéro dans le passé. Par exemple au moment de la nucléosynthèse promordiale ou dans les tout débuts de l’Univers à l’échelle du temps de Planck, il faut avoir connu des valeurs telles que Ω(tNS ) = 1 ± 10−15 Ω(tPl ) = 1 ± 10−60 pour conduire aux valeurs observées aujourd’hui. Ces valeurs, bien que non impossibles formellement présentent un problème sérieux (dit de fine tuning), car tout écart infime (par exemple à la quatorzième décimale) aurait comme conséquence qu’à l’époque présente l’univers serait totalement différent de celui que nous observons. Reformulé différemment, pour que l’univers actuel soit plat comme on l’observe actuellement, il faut qu’il ait été plat dans le passé avec un degré de précision inexpliquable. Ce problème de condition initiale très particulière, s’il n’est pas rédhibitoire en soi, doit pouvoir être expliqué par une modèle cosmologique consistent. Le problème de l’horizon Le problème de l’horizon est d’une nature assez voisine, puisqu’il s’agit également d’un problème de conditions initiales ad hoc. Lorsque l’on observe le fond diffus de rayonnement cosmologique, il apparait d’une remarquable isotropie (une fois effectuées les corrections Doppler dues aux mouvements locaux de la Terre). Or, si l’on considère le cône de lumière passé d’un point situé ici et maintenant, et son extension au moment où a été émis le fond de rayonnement cosmologique (on parle de la surface de dernière diffusion), celle-ci est beaucoup plus étendue que la région causale à la même époque. Cela soulève alors le problème de comprendre pourquoi le fond de rayonnement cosmologique est si homogène, puisque deux régions du ciel (typiquement distantes de plus de 1 ou 2 degrés) ne peuvent jamais avoir été en contact causal et donc ne peuvent pas être en équilibre thermique. Pour préciser quelques chiffres, la distance comobile parcourue par la lumière 2 (ds = c2 dt2 − a2 dσ 2 = 0 pour un univers plat) entre l’époque de l’émission du CMB, tCMB et l’époque présente, t0 , est donnée par σ0 = c Z t0 tCMB dt a(t) et la distance propre correspondante à tCMB (σ est analogue à un angle) vaut d0 = a(tCMB )σ0 . Cosmologie 79 Entre tCMB et t0 , on peut considérer que l’Univers est dominé par la matière, a(t) ∼ t2/3 , de sorte qu’en écrivant a(t) = a(tCMB )(t/tCMB )2/3 il vient Z t0 dt 1 1 (tCMB )2/3 (tCMB )2/3 [3t1/3 ]tt0CMB σ0 = c = 2/3 a(tCMB ) a(t ) t tCMB CMB et la distance propre vaut 1/3 d0 ≃ 3c(tCMB )2/3 t0 . En utilisant les valeurs numériques tCMB ≃ 3.105 ans, t0 ≃ 13.7 109 ans et 1 pc=3.26 al, il vient d0 ≃ 32 Mal = 9.9 Mpc. C’est la taille de la zone qui à l’époque du CMB a produit la totalité de l’Univers actuellement observable. En revanche, la taille de l’horizon causal à tCMB est dominée par la dynamique antérieure à cette époque, soit par l’Univers dominé par le rayonnement, a(t) ∼ t1/2 . On en déduit Z tCMB 1 1 dt 1/2 σh = c = (tCMB ) (t )1/2 [2t1/2 ]t0CMB 1/2 a(tCMB ) a(tCMB ) CMB t 0 pour une distance propore associée valant dh = a(tCMB )σh = 2ctCMB . Cela donne une valeur numérique de dh = 6 Mal = 1.8 Mpc. Cette dernière valeur correspond à la zone causale d’extension maximale à l’époque de l’émission du CMB. En d’autres termes, il est impossible d’expliquer que des points au-delà de cette distance puissent être à la même température, sauf à invoquer des conditions initiales telles qu’il en soit fortuitement ? ainsi. 80 Mis à jour le 14 Décembre 2012 Figure 6.4 Le problème de l’horizon. Les valeurs numériques ne correspondent pas à celles du texte, mais elles sont du même ordre. Autres difficultés Il existe encore un certain nombre d’autres difficultés assez célèbres. Le problème des grandes structures, voisin du problème de l’horizon, réside dans l’interprétation des grandes structures observées (amas ou super-amas de galaxies) comme prenant leur origine dans les inhomogénéités du fonds de rayonnement cosmologique. Encore une fois, pour expliquer l’extension des grandes structures aujourd’hui, ces inhomogénéités doivent avoir été bien plus grandes que les régions causales ! Le problème des reliques est de nature différente. Il s’agit des particules massives et défauts topologiques (monopôles notamment) prédits par les théories de grande unification des interactions fondamentales avec des densités telles que l’on devrait en observer à l’époque actuelle, ce qui n’est pas le cas. La difficulté consiste ici à comprendre pourquoi l’expansion a dilué davantage l’Univers que ce que suppose le modèle comsologique standard. Le problème des coı̈ncidences enfin interroge le fait que les valeurs de ΩM et ΩΛ soient très voisines aujourd’hui, faisant de notre époque un moment très particulier où l’Univers est en train de passer d’une phase d’expansion ralentie à une phase d’expansion accélérée, sans que l’on sache si une raison profonde explique cette coı̈ncidence. Dicke a élaboré de principe anthropique, stipulant qu’il doit en être ainsi pour que l’Univers connaisse des conditions propices au développement de la vie. Cosmologie 81 Parenthèse On reproduit ci-joint un article de vulgarisation présentant un état des lieux sur la constante comsologique. 82 Mis à jour le 14 Décembre 2012 Cosmologie 83 84 Mis à jour le 14 Décembre 2012 Cosmologie 85 86 Mis à jour le 14 Décembre 2012 Cosmologie 87 88 Mis à jour le 14 Décembre 2012 Cosmologie 89 90 Mis à jour le 14 Décembre 2012 Cosmologie 91 92 Mis à jour le 14 Décembre 2012 Cosmologie 93 94 Mis à jour le 14 Décembre 2012 Cosmologie Théories des champs 95 96 Mis à jour le 14 Décembre 2012 Interactions fondamentales 97 7 Théories quantiques relativistes Note : dans ce chapitre on réserve la notation ϕ ou χ pour un champ scalaire complexe et ψ pour un ensemble de plusieurs champs scalaires complexes réunis en un vecteur (spineur). On notera avec une flèche un vecteur dans l’espace ordinaire et on utilisera les caractères gras pour représenter des matrices agissant dans ~ et l’espace “interne” des composantes du spineur. Par exemple p~ϕ = −ih̄∇ϕ ~ ~pψ = p~ 1lψ = −ih̄∇1lψ. Equation de Schrödinger ⊲ Equation de Schrödinger. Guidés par la “dualité ondes-particules”, ancienne appelation donnée à une série de concepts dus entre autres à de Broglie (59) et résumés dans les relations E = hν = h̄ω, p~ = h ~u = h̄~k, λ k nous cherchons une formulation ondulatoire de la mécanique. p ~2 Le cas le plus simple est celui de la particule libre, d’énergie H = 2m , que i(~ k~ r−ωt) l’on peut logiquement représenter par une onde plane u~k (~r, t) = A~k e dans la mesure où une telle onde est totalement délocalisée et donc a priori à même de (59) L. de Broglie, La longueur d’onde associée à la matière, CRAS 177, 507-510 (1923), reproduit dans J. Leite-Lopes et B. Escoubès, Sources et Evolutions de la Physique Quantique, Masson, Paris 1995, p.92. 98 Mis à jour le 14 Décembre 2012 représenter une particule qui a une égale probabilité de se trouver en tout point de l’espace. A quelle équation obéit l’onde plane ? On pourrait bien entendu écrire 2 ~ 2 u~ − 12 ∂ u2~k = 0 (soit ω = v|~k|), mais on cherche ici une l’équation des ondes, ∇ v ∂t k équation du premier ordre en dérivée temporelle pour satisfaire au déterminisme. Utilisant les correspondances rappelées ci-dessus, on écrit plutôt p ~ E u~k (~r, t) = A~k ei( h̄ ~r− h̄ t) d’où on extrait E en faisant Eu~k (~r, t) = ih̄ ∂ u~ (~r, t) ∂t k et p~ de même ~ ~ (~r, t). p~u~k (~r, t) = −ih̄∇u k L’équation E = p~2 /2m devient alors ih̄ h̄2 ~ 2 ∂ u~k (~r, t) = − ∇ u~k (~r, t). ∂t 2m Pour une particule soumise à un potentiel V (~r), on généralise pour obtenir l’équation de Schrödinger pour la fonction d’onde ϕ(~r, t), ∂ ih̄ ϕ(~r, t) = ∂t h̄2 ~ 2 − ∇ + V (~r) ϕ(~r, t). 2m (7.1) Nous ne discuterons pas davantage ici les conséquences de cette équation qui constitue l’approche non relativiste traditionnelle de la mécanique quantique. Retenons simplement que la physique est décrite par une fonction d’onde ϕ(~r, t) dont l’équation de Schrödinger régit la dynamique et que cette fonction d’onde obéit à une équation de continuité, ∂ ρ(~r, t) + div ~j(~r, t) = 0 ∂t où les densités de probabilité de présence et de courant de probabilité sont définies par ρ(~r, t) = ϕ∗ (~r, t)ϕ(~r, t), ~ r , t) − ϕ(~r, t)∇ϕ ~ ∗ (~r, t)). ~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~ 2mi ⊲ Lagrangien de Schrödinger. En théorie des champs, on définit le lagrangien L à partir d’une densité lagrangienne Z ~ d3 r L(ϕ, ϕ̇, ∇ϕ) L= 3 IR Interactions fondamentales 99 où ϕ(~r, t) est un champ qui varie dans l’espace et le temps. L’intégration porte sur l’espace IR3 ou sur une partie de cet espace dont la frontière est notée ∂IR3 . ~ de la densité lagrangienne reflète l’existence d’interactions à La dépendance en ∇ϕ courte portée. La minimisation de l’action Z Z t2 Z ~ d3 r dt ~ d3 r ≡ L(ϕ, ϕ̇, ∇ϕ) S= dt 3 L(ϕ, ϕ̇, ∇ϕ) Ω IR t1 conduit aux équations d’Euler-Lagrange si l’on a imposé des conditions assez douces aux variations de ϕ aux limites ∂IR3 de IR3 . On effectue en effet la variation " !# Z t2 Z ∂L ∂L ∂L ∂ ~ −∇ δS = 0 = dt 3 d3 r − δϕ ~ ∂ϕ ∂t ∂ ϕ̇ ∂(∇ϕ) IR t1 t2 Z t2 I Z 3 ∂L ~ ∂L δϕ δϕ dS + dt + d r 3 3 ~ ∂ ϕ̇ ∂(∇ϕ) ∂ IR t1 IR t1 et en supposant que les termes de bords sont tous nuls, il vient ! ∂ ∂L ∂L ∂L ~ − = 0. −∇ ~ ∂ϕ ∂t ∂ ϕ̇ ∂(∇ϕ) Dans le cas de l’équation de Schrödinger, la densité lagrangienne associée fait intervenir un champ scalaire complexe. Cette densité (due à Jordan et Wigner) est donnée par 2 ~ ∇ϕ ~ ⋆ ) = ih̄ϕ⋆ ϕ̇ − h̄ (∇ϕ ~ ⋆ ) · (∇ϕ) ~ L(ϕ, ϕ⋆ , ϕ̇, ϕ̇⋆ , ∇ϕ, − V (~r, t)ϕ⋆ ϕ. 2m On note encore les termes en gradients sous la forme LSchr. = ih̄ϕ⋆ ϕ̇ − 1 (~ pϕ)⋆ (~ pϕ) − V (~r, t)ϕ⋆ ϕ. 2m Les champs ϕ et ϕ⋆ sont fonction de l’espace et du temps, ϕ = ϕ(~r, t). Par application des équations d’Euler-Lagrange à ϕ, on obtient − ih̄ϕ̇⋆ = − h̄2 ~ 2 ⋆ ∇ ϕ + V (~r, t)ϕ⋆ 2m et par application à ϕ⋆ , ih̄ϕ̇ = − h̄2 ~ 2 ∇ ϕ + V (~r, t)ϕ, 2m c’est-à-dire l’équation de Schrödinger et sa conjuguée. Le moment canonique est donné par π= ∂L = ih̄ϕ⋆ ∂ ϕ̇ 100 Mis à jour le 14 Décembre 2012 et la densité hamiltonienne H = π ϕ̇ − L = i −ih̄ ~ ~ (∇π) · (∇ϕ) − V (~r, t)πϕ. 2m h̄ L’hamiltonien (classique) total vaut Z 2 h̄ ~ ⋆ ⋆ ~ (∇ϕ ) · (∇ϕ) + V (~r, t)ϕ ϕ d3 r. H= 2m Par intégration par parties du premier terme on obtient la forme habituelle Z h̄2 ~ 2 ⋆ H= ϕ − ∇ + V (~r, t) ϕ d3 r = hϕ|Ĥ|ϕi. 2m On retrouve ainsi l’élément de matrice de l’Hamiltonien de Schrödinger dans l’état |ϕi, résultat finalement très naturel. Equation de Pauli ⊲ Introduction du spin et des spineurs de Pauli. L’étude de systèmes sous champ magnétique a mis en évidence de nouvelles particularités de la mécanique quantique. Outre la correspondance classique (qu’on appelle couplage minimal) ~ r , t) sous un champ qui fait passer de H à H − qφ(~r, t) et de ~p à p~ − qA(~ ~ électromagnétique (A(~r, t), φ(~r, t)), Pauli a proposé d’introduire un degré de liberté interne supplémentaire, appelé le spin, ayant dans le cas de l’électron des propriétés analogues à celles d’un moment cinétique 21 . La fonction d’onde ϕ(~r, t) est remplacée par un spineur (60) , objet à deux composantes (spineur de Pauli) ϕ↑ (~r, t) ψ = ϕ (~r, t) ↓ pour décrire les degrés de liberté de spin en plus des degrés de liberté d’espace. On obtient alors l’équation de Pauli, incluant le couplage de la charge et du spin au champ magnétique (termes paramagnétique et de Zeeman), qh̄ ~ 1 ∂ 2 ~ ~ ~ B(~r, t)ψ. σ (−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) ψ − ih̄ ψ = ∂t 2m 2m ~ . Dans cette Le spin est introduit au moyen du vecteur des matrices de Pauli, σ expression, on omet la matrice identité à deux dimensions agissant dans l’espace des composantes du spineur lorsque cela semble non ambigu. On devrait écrire en ∂ ~ − qA(~ ~ r , t))2 1lψ pour insister sur toute rigueur des termes comme ih̄ ∂t 1lψ ou (−ih̄∇ le caractère matriciel de l’équation. Sous forme développée on écrit, ϕ↑ (~r, t) 1 ∂ ϕ↑ (~r, t) 2 ~ ~ (−ih̄∇ − qA(~r, t)) + V (~r) + qφ(~r, t) 1l ϕ (~r, t) = ih̄ ∂t ϕ↓ (~r, t) 2m ↓ (7.2) ϕ↑ (~r, t) qh̄ ~ ~ B(~r, t) − σ ϕ↓ (~r, t) , 2m (60) Nous ne nous attarderons pas sur la définition précise d’un spineur, qui obéit à des règles de transformation particulières. Interactions fondamentales 101 ~ r, t) = σ B + σ B + σ B , avec les matrices de Pauli ~ B(~ où σ x x y y z z 1 0 0 −i 0 1 [σx ] = 1 0 , [σy ] = i 0 , [σz ] = 0 −1 . Les matrices de Pauli obéissent à l’algèbre de Lie [σi , σj ] = 2iεijk σk ou encore σi σj = δij 1l + iεijk σk . La quantité ~s = 12 h̄~ σ est appelée spin. Dans le cas de l’électron, on a q = −|qe | dans l’équation de Pauli. Le moment magnétique associé au spin de l’électron vaut q e |h̄ ~ s = g 2m ~s = − |q2m ~ (le facteur de Landé de l’lectron g = 2) de sorte que le terme µ σ ~ = |qe |h̄ σ ~ Les matrices de Pauli forment ~ B. Zeeman prend la forme indiquée −~ µs B 2m avec l’identité une base pour la représentation des matrices 2 × 2, car a b = 1 (a + d)1l + 1 (a − d)σ + 1 (b + c)σ + 1 i(b − c)σ . z x y c d 2 2 2 2 Pour écrire l’équation de Pauli en termes de composantes, on développe (en omettant l’identité, en utilisant pi = −ih̄∂i et avec la convention de sommation sur les indices répétés (avec une métrique euclidienne)) ~ 2 ψ = (p − qA )(p − qA )ψ (~ p − qA) i i i i = pi pi ψ − q(Ai pi ψ + pi Ai ψ) + q2 Ai Ai ψ = −h̄2 ∂i ∂i ψ + ih̄q(2Ai (∂i ψ) + (∂i Ai )ψ) + q2 Ai Ai ψ d’où l’équation complète ih̄∂t ψ = − h̄2 ih̄q q2 qh̄ ∂i ∂i ψ + (2Ai (∂i ψ) + (∂i Ai )ψ) + Ai Ai ψ − qφψ − σ B ψ. 2m 2m 2m 2m i i On peut retrouver cette équation par des arguments très simples. Bien entendu, tout comme l’équation de Schrödinger, cette équation n’est pas relativiste (61) , mais elle fait apparaı̂tre la nécessité, pour inclure le spin dans la théorie, de chercher une équation agissant sur des objets à plusieurs composantes. Une fonction scalaire complexe n’admet pas de structure interne suffisamment riche pour décrire le spin (62) . Considérons donc que l’on cherche l’hamiltonien d’une particule libre non relativiste de spin 12 , sachant que l’on doit pour cela enrichir la structure interne de la fonction d’onde à des “doublets” complexes. Observant que les matrices de Pauli satisfont à la propriété (63) ~ (~ σ · ~a)(~ σ · ~b) = ~a · ~b 1l + i(~a × ~b) · σ (61) On a l’habitude de considérer que le spin est une conséquence de l’aspect relativiste de la théorie car l’équation de Pauli apparaı̂t comme limite non relativiste de l’équation de Dirac. Il n’est cependant pas nécessaire d’avoir un cadre relativiste pour introduire le spin. (62) Notons que le caractère complexe de la fonction d’onde est lié à la charge électrique comme on le verra plus tard avec l’application du théorème de Noether. (63) Pour le montrer, on utilise la notation en composantes, (σi ai )(σj bj ) = ai bj (δij + iεijk σk ) = ai bi + iεkij ai bj σk . 102 Mis à jour le 14 Décembre 2012 soit en particulier (~ σ · p~)2 = (~ σ · p~)(~ σ · p~) = p2 1l2×2 , on généralise H= (~ σ · p~)2 p2 −→ H = . 2m 2m En présence d’un champ magnétique, la substitution du couplage minimal donne ~ 2 (~ σ · (~ p − qA)) 2m ~ 2 1 (~ p − qA) ~ × (~ ~ ·σ ~ 1l + i (~ p − qA) p − qA) = 2m 2m ~ 2 qh̄ (~ p − qA) ~ ~ ·B σ 1l − = 2m 2m H= c’est-à-dire l’hamiltonien de Pauli, avec l’apparition automatique du terme de ~ ~ = −q(~ ~ ~ pψ) = ih̄q(∇× ~ A)ψ) ~ Zeeman (on a utilisé (64) (~ p −qA)×(~ p −qA)ψ p ×(Aψ)+ A×~ et notamment le facteur de Landé valant g = 2. ⊲ Lagrangien de Pauli. Comme pour l’équation de Schrödinger, on peut construire une densité lagrangienne à partir de laquelle les équations d’EulerLagrange conduisent à l’équation de Pauli. En nous guidant sur l’expression de Jordan et Wigner dans le cas d’un champ scalaire complexe, on généralise au cas de spineurs de Pauli sous la forme LPauli = ih̄ψ † ψ̇ − 1 † ~ ~ (~ σ · (~ p − qA)ψ) (~ σ · (~ p − qA)ψ) − qφ(~r, t)ψ † ψ. 2m Il apparaı̂t les termes (65) σi (pi − qAi )ψ † σj (pj − qAj )ψ = (δij + iεijk σk )(pi ψ † − qAi ψ † )(pj ψ − qAj ψ) = (−ih̄∂i ψ † − qAi ψ † )(−ih̄∂i ψ − qAi ψ) + iεkij σk [(−ih̄)2 ∂i ψ † ∂j ψ + ih̄q(Ai ψ † ∂j ψ + (∂i ψ † )Aj ψ) + q2 Ai ψ † Aj ψ] Dans le dernier crochet, le premier et le dernier terme sont nuls après contraction avec le tenseur totalement antisymétrique. Finalement, il vient les trois dérivées (64) ~ × (~ ~ → εijk (pj − qAj )(pk − qAk )ψ = On développe en composantes : (~ p − q A) p − q A) −qεijk (pj Ak ψ + Aj pk ψ) = ih̄qεijk ((∂j Ak )ψ + Ak ∂j ψ + Aj ∂k ψ) = ih̄qεijk (∂j Ak )ψ. (65) En toute rigueur on devrait noter ψ † σi (pi − qAi ) (le dagger ne porte que sur ψ) plutôt que σi (pi − qAi )ψ † , mais la notation présente (et courante) est compéhensible. Interactions fondamentales 103 partielles 1 ∂L = ih̄∂t ψ − qφ(~r, t)ψ − qA (ih̄∂i ψ + qAi ψ − h̄qεijk σk ∂j ψ), † ∂ψ 2m i ∂t ∂L = 0, ∂ ψ̇ † ∂i 1 ∂L =− [(ih̄)2 ∂i ∂i ψ + ih̄q(Ai ∂i ψ + (∂i Ai )ψ) − h̄qεijk σk ((∂i Aj )ψ + Aj ∂i ψ)]. † ∂(∂i ψ ) 2m En regroupant tous les termes, on obtient bien l’équation de Pauli sous sa forme développée, avec notamment l’énergie Zeeman issue des termes − h̄q h̄q εkij σk ∂i Aj = − σ B . 2m 2m k k Equation de Klein-Gordon ⊲ Etablissement de l’équation de Klein-Gordon. Une généralisation immédiate de l’équation de Schrödinger a été proposée très rapidement après l’équation de Schrödinger elle-même (en 1926), indépendamment par Gordon, Fock (66) , Klein, Kudar, de Donder et Van Dungen (67) . Schrödinger lui-même avait obtenu cette équation avant de considérer le cas non relativiste, davantage conforme aux résultats expérimentaux sur le spectre de l’atome d’hydrogène. Il suffit d’effectuer les correspondances ∂ ∂t ~ p~ → −ih̄∇ E → ih̄ dans l’expression relativiste donnant l’énergie cinétique (au terme mc2 près), E 2 − |~ p|2 c2 = m2 c4 pour obtenir l’équation de Klein-Gordon de la particule libre, 2 2 2 ~ 2 ϕ(~r, t) − 1 ∂ ϕ(~r, t) = m c ϕ(~r, t). ∇ c2 ∂t2 h̄2 (7.3) De nouveau, on travaille avec un champ scalaire complexe ϕ (une fonction d’onde). On retrouve l’équation des ondes habituelle, mais avec un terme de masse. Sous (66) (67) Landau et Lifshitz par exemple se réfèrent à Klein et Fock et pas Klein et Gordon. Voir S. Schweber, Relativistic quantum field theory, Harper and Row, New-York 1961. 104 Mis à jour le 14 Décembre 2012 ~ on écrit cette équation comme forme manifestement covariante (∂µ = (c−1 ∂t , ∇) 2 2 2 2 4 (E − c |~ p| )ϕ = m c ϕ, soit (E/c, −~ p) E/c ϕ = pµ pµ ϕ = m2 c2 ϕ p~ (68) c’est-à-dire finalement ∂µ ∂ µ + (mc/h̄)2 ϕ = 0, où l’on a défini (69) pµ = ih̄ ∂ = ih̄∂ µ , ∂xµ pµ = ih̄ ∂ = ih̄∂µ . ∂xµ Là encore, nous ne nous étendrons pas sur les conséquences cette équation, mais indiquons seulement qu’il n’est pas possible de définir une densité de probabilité positive conservée au cours du temps, ce qui invalide en partie la théorie basée sur l’équation de Klein-Gordon. On forme la différence entre ϕ∗ ×KG et son complexe conjugué pour obtenir une équation de continuité, ∂ ρ(~r, t) + div ~j(~r, t) = 0 ∂t où les densités de probabilité de présence et de courant de probabilité sont cette fois définies par ∂ ∗ ih̄ ∂ ∗ ϕ(~ r , t) − ϕ(~ r , t) ϕ (~ r , t) , ρ(~r, t) = ϕ (~ r , t) 2mc2 ∂t ∂t ~ r , t) − ϕ(~r, t)∇ϕ ~ ∗ (~r, t)). ~j(~r, t) = h̄ (ϕ∗ (~r, t)∇ϕ(~ 2mi (68) Pour le lecteur n’ayant ! pas lu le chapitre 3 sur les notions de calcul tensoriel, il suffit ici de savoir ct x que l’on note xµ = un tenseur contravariant de rang 1 (ici la coordonnée spatio-temporelle), y z c’est-à-dire la donnée de 4 nombres qui se transforment par changement de référentiel inertiel par ! γ −βγ 0 0 −βγ γ 0 0 , que l’on introduit la transformation de Lorentz x′µ = Λµν xν où [Λµν ] = 0 0 1 0 0 0 0 1 ! 1 −1 le tenseur métrique [gµν ] = de sorte que gµν xµ = xν = (ct, −x, −y, −z) −1 −1 est le tenseur covariant correspondant à xν . L’intervalle élémentaire est alors ds2 = c2 dτ 2 = ! cdt gµν dxµ dxν = dxµ dxµ = (cdt, −dx, −dy, −dz) dx = c2 dt2 − dx2 − dy 2 − dz 2 . On généralise dy dz ensuite à d’autres grandeurs telles que v µ = dxµ , dτ pµ = mv µ = E/c p ~ , etc de sorte que l’invariant 2 2 µ 2 2 relativiste E 2 /c2 − |~ p|2 = m c n’est autre que la contraction pµ p = m c . La généralisation du gradient est notée ∂ µ = 1 ∂ c t . ~ −∇ (69) On note la disparition du signe moins due au changement de signe de la partie spatiale entre les définitions de pµ et ∂µ . Interactions fondamentales 105 On note que la densité de probabilité de présence est bien une forme analogue à la densité de courant, mais avec des dérivées temporelles à la place des dérivées spatiales. Les deux expressions sont rassemblées dans la forme covariante jµ = ih̄ ∗ (ϕ ∂µ ϕ − ϕ∂µ ϕ∗ ). 2m Cette théorie reposant sur des champs complexes scalaires, elle convient après seconde quantification à la description de bosons massifs de spin nul (70) . ⊲ Lagrangien de Klein-Gordon. En procédant comme pour les sections précédentes, on peut supposer la forme de la densité lagrangienne qui permet de retrouver l’équation de Klein-Gordon LKG = (pµ ϕ)⋆ (pµ ϕ) + m2 c2 ϕ⋆ ϕ = −h̄2 (∂µ ϕ⋆ )(∂ µ ϕ) + m2 c2 ϕ⋆ ϕ. ⊲ Couplage minimal, particules et antiparticules. Si les particules décrites par l’équation de Klein-Gordon possèdent une charge électrique e, elles interagissent avec le champ électromagnétique par le biais du couplage minimal, (ih̄∂µ − eAµ )(ih̄∂ µ − eAµ )ϕ − m2 c2 ϕ = 0 et on constate, si l’on écrit le conjugué complexe de cette équation, que ϕ∗ obéit strictement à la même équation, avec une même masse m, mais une charge électrique opposée −e. Les fonctions d’onde ϕ et ϕ∗ décrivent des particules chargées de spin nul et les antiparticules correspondantes. Des particules neutres de spin nulles sont décrites par une fonction d’onde réelle. En notant de plus que dans le cas d’une particule libre, la fonction d’onde de la particule est une onde plane, i i ϕ(~r, t) = Ae h̄ (~p~r−Et) , celle de l’antiparticule est donc ϕ∗ (~r, t) = A∗ e h̄ ((−~p)~r−(−E)t) et l’antiparticule a donc une énergie négative (si l’énergie de la particule est positive) et se déplace en sens inverse. ⊲ Limite non relativiste et équation à deux composantes. Pour retrouver 2 i l’équation de Schrödinger à la limite non relativiste, on pose φ(~r, t) = ϕ(~r, t)e− h̄ mc t et on examine la limite où E ′ = E − mc2 est petit. Il est facile de montrer qu’on retrouve alors l’équation de Schrödinger pour la fonction d’onde φ. Une autre façon de retrouver la limite non relativiste est d’écrire l’équation de Klein-Gordon sous la forme d’une équation du premier ordre en dérivées temporelles à deux composantes, ih̄∂t ψ = Hψ ϕ+ (~r, t) où ψ possède deux composantes, ψ = ϕ− (~r, t) , reliées à ϕ et ∂t ϕ et H 1 est un hamiltonien matriciel 2 × 2. On pose ϕ+ = √2m (ih̄∂t + mc2 )ϕ, ϕ− = (70) En seconde quantification l’équation (de Schrödinger, de Klein-Gordon, de Dirac) est traitée comme une équation d’onde classique et la quantification est opérée en promouvant la fonction d’onde au statut d’opérateur de champ obéissant à des régles de commutation particulières. Ces opérateurs de champs sont associés à la création ou l’annihilation de particules, qui dans le cas KG sont des bosons massifs de spin nul. 106 Mis à jour le 14 Décembre 2012 √ 1 (−ih̄∂ t 2m + mc2 )ϕ et on montre que l’équation de Klein-Gordon prend la forme ci-dessus avec |~ p|2 |~ p|2 2 H = mc + iτ τ3 + 2m 2m 2 où τ3 et τ2 sont les matrices de Pauli ordinaires (que l’on ne dénote pas avec le σ conventionnel pour éviter toute confusion avec le spin, nul dans le cas présent). Cette équation prend une structure très intéressante, voisine de celle de Schrödinger, mais à deux composantes, a priori en raison de l’existence de particules scalaires (de spin nul) et des antiparticules associées. Si l’on calcule la charge associée dans ce formalisme, on a en effet Z 3 ∗ ∗ d r(ϕ (ih̄∂t ϕ) − (ih̄∂t ϕ )ϕ) = = Z Z d3 rψ † τ3 φ d3 r(|φ+ |2 − |φ− |2 ) ce qui associe φ+ et φ− respectivement aux particules et antiparticules. On définit également le “KG-adjoint” à partir de l’adjoint complexe, φ̄ = φ† τ3 pour écrire la densité de charge proportionnelle à φ̄φ. L’inconvénient de cette approche à deux composantes est en revanche que la nature relativiste de cette équation n’est plus manifeste. Equations de Weyl ⊲ Recherche des équations pour des particules sans masse de spin 12 . On cherche maintenant une équation relativiste pour décrire des fermions sans masse de spin 12 . On doit s’attendre à retrouver l’équation des ondes sous la forme ~2 ∇ 2 . = 0, . − 1 ∂ 2 2 . . c ∂t c’est-à-dire agissant sur des objets ayant a priori deux composantes, des spineurs. En effet, on a vu avec l’équation de Pauli que l’introduction du spin nécessitait de travailler sur des objets plus élaborés que de simple champs scalaires complexes. On a vu également dans le cas relativiste que la difficulté d’interprétation de la densité de probabilité de présence (non définie positive) découlait de ce que l’équation de Klein-Gordon est du second ordre en dérivées temporelles, on doit donc chercher une équation du premier ordre,comme celle de Schrödinger. ϕ1 On notera en général ψ = ϕ un spineur à deux composantes. Il faut donc 2 une équation matricielle (matrices 2 × 2) comportant des dérivées du premier ordre ∂ ~ en t, soit, pour être compatible avec ∂µ = ( 1c ∂t , ∇), l’apparition d’un objet tel que 1 ∂ ~ ~ ·∇ 1l ±σ c ∂t 2×2 ϕ1 ϕ2 . Interactions fondamentales 107 On a utilisé le fait mentionné plus haut que les matrices de Pauli, avec l’identité, ∂ permettent d’exprimer n’importe quelle matrice 2 × 2. Si c1 ∂t apparaı̂t, on s’attend ~ Comme on veut faire agir sur des spineurs à deux composantes, à voir également ∇. ~ . Pour avoir une forme manifestement on soupçonne l’apparition de 1l2×2 et de σ covariante, ∂µ doit être contracté. On introduit pour cela une certaine généralisation de l’identité sous la forme d’un tenseur de rang 1 (dontles “éléments” sont des 1l2×2 matrices 2 × 2) que l’on note provisoirement γ µ = (cette notation γ µ sera ~ σ ensuite réservée à un autre “vecteur contravariant” 1 assez voisin de celui-ci). On peut ∂ ~ A ce niveau, le ~ · ∇. ainsi former γ µ ∂µ = γµ ∂ µ = (1l2×2 , −~ σ ) c t = c1 1l2×2 ∂t + σ ~ −∇ µ choix du signe contraire pour la partie spatiale de γ serait parfaitement licite, i.e. 1l2×2 ~ et rien ne nous ~ ·∇ γµ = . La contraction conduirait alors à 1c 1l2×2 ∂t − σ −~ σ permet de trancher entre les deux cas proposés. On dispose donc de deux équations également valables, conduisant à cette norme, 1 ~ ~ · ∇ ψ (+) = 0, ih̄ 1l ∂ + σ c 2×2 t 1 ~ ~ · ∇ ψ (−) = 0. ih̄ 1l ∂ − σ c 2×2 t Ce sont les équations de Weyl. Elles agissent sur des champs de spineurs ψ (+) et ψ (−) distincts que l’on interprétera un peu plus loin. On peut ainsi conjecturer une équation manifestement covariante du premier ordre (en rétablissant le facteur ih̄), ih̄γ µ ∂µ ψ = 0. Pour retrouver l’équation des ondes, formons la contraction 1 ∂2 ~ σ · ∇) ~ ψ 1 l − (~ σ · ∇)(~ {z } c2 ∂t2 2×2 | ~ 2 1l2×2 ∇ . 2 1 ∂ ~ 2 1l −∇ = 2×2 ψ = 0, c2 ∂t2 Cette équation prenant la forme d’une norme invariante de Lorentz. ⊲ Equation covariante. Nous venons d’introduire de manière intuitive 4 matrices γ dont il convient maintenant de préciser les propriétés algébriques. Utilisons un raisonnement un peu différent pour introduire l’équation de Weyl sous forme covariante adaptée à l’équation de Dirac (c’est-à-dire en conservant la masse) que nous allons ensuite établir. On a vu avec l’équation de Klein-Gordon que la dérivée seconde par rapport à t posait quelques difficultés, puisqu’elle ne permettait pas d’introduire une densité de probabilité définie positive. Au lieu de partir de pµ pµ = m2 c2 dans le cas classique (non quantique), qui fait apparaı̂tre cette dérivée 108 Mis à jour le 14 Décembre 2012 seconde par la substitution pµ → +ih̄∂µ , essayons de former une contraction du type γ µ pµ ψ = mcψ, avec dans le cas de fermions non massifs, m = 0. Il faut alors que γ µ soit comme on l’a anticipé un “quadri-vecteur” contravariant sans dimension physique, c’est-à-dire une certaine généralisation de 1, mais que ses 4 composantes spatio-temporelles (γ 0 , ~γ ) soient des matrices, pour pouvoir agir sur des objets à plusieurs composantes (a priori des spineurs de Pauli, mais peut-être des objets plus complexes encore). Si alors on généralise le carré de γ µ pµ à une forme convenablement symétrisée avec la propriété 21 (γ µ pµ γ ν pν + γ ν pν γ µ pµ ) = 1 µ ν ν µ µν µ 2 (γ γ + γ γ )pµ pν = g pµ pν = pµ p , on retrouve l’équation cherchée sous la forme pµ pµ ψ = m2 c2 ψ. Il est clair que cette notation est encore assez ambiguë, mais g µν est à prendre au sens g µν × 1ln×n où n est le nombre de composantes du spineur. Notons que l’on a symétrisé le produit γ µ γ ν car on sait en mécanique quantique que la commutation des objets n’est pas nécessairement assurée. Supposons que les γ µ soient des scalaires. On obtient rapidement une inconsistence, car pour µ = 0, ν = 0 on doit avoir γ 0 = ±1 et pour µ = 1, ν = 1 on doit avoir γ 1 = ±i, ce qui ne permet pas de satisfaire la contrainte γ 0 γ 1 = 0 pour µ = 0, ν = 1. De même, des matrices 2 × 2 ne conviennent pas non plus. En effet on aurait par exemple γ 0 = ±1l et γ 1 = ±σ3 qui ne permet pas non plus de réaliser γ 0 γ 1 + γ 1 γ 0 = 0. On voit que cette algèbre impose aux composantes de γ µ d’être au moins des matrices 4 × 4 et on peut finalement écrire pµ pµ ψ = −h̄2 ∂µ ∂ µ ψ = m2 c2 ψ. Reprenons maintenant le raisonnement en admettant d’emblée qu’il faille travailler sur des spineurs à 4 composantes. Cela ne doit pas surprendre outre mesure, puisqu’on a vu avec l’équation de Pauli que le spin 21 recquiert un doublement des composantes, mais aussi que la description de particules et antiparticules dans une équation en dérivée première par rapport au temps demande de même un doublement des composantes. On introduit le spineur de Dirac (71) ψ= ψ (+) ψ (−) ψ1 ψ = ψ2 3 ψ4 (un spineur à quatre composantes dont deux sont en fait associées aux particules et deux aux antiparticules comme on va le voir) et des matrices 4 × 4 (appelées les matrices de Dirac, ici dans la représentation chirale) γ µ = (γ 0 , ~ γ ), 0 1l2×2 0 γ = 1l , 0 2×2 ~γ = 0 ~ σ −~ σ 0 de sorte que les équations de Weyl se combinent sous une forme unique, µ γ ∂µ ψ = (71) 0 1 ∂ c ∂t 1l2×2 1 ∂ 1l c ∂t 2×2 0 ! ψ (+) ψ (−) + 0 ~ ~ ·∇ σ ~ −~ σ·∇ 0 ψ (+) ψ (−) = 0. On ignore ici les lois de transformation de tels spineurs par transformation de Lorentz. Interactions fondamentales Les matrices de Dirac obéissent à 109 (72) γ µ γ ν + γ ν γ µ = 2g µν . Les matrices ci-dessus obéissent bien à l’algèbre demandée, mais d’une part ce ne sont pas les seules et il existe d’autres représentations par des matrices 4 × 4, d’autre part on pourrait trouver des représentations par des matrices de dimensions paires plus élevées. Le fait que les matrices de Dirac soient ici des matrices 4 × 4 et qu’il y ait 4 valeurs pour les indices spatio-temporels µ = 0, . . . 3 est une coı̈ncidence fortuite : les γ µ agissent sur les composantes des spineurs et lorsque l’on représente g µν par une matrice, elle agit dans l’espace-temps ! Il est instructif de pousser plus avant la forme covariante de l’équation de Weyl, ih̄γ µ ∂µ ψ = 0, pour chercher à définir le carré invariant. Sur l’équation de Weyl, manifestement covariante, ih̄γ µ ∂ψ = 0, ∂xµ faisons agir l’opérateur ih̄γ ν ∂ν = ih̄γ ν (∂/∂xν ) : 0 = −h̄2 γ ν γ µ ∂2 ψ ∂xν ∂xµ 1 = − h̄2 (γ µ γ ν + γ ν γ µ )∂ν ∂µ ψ 2 = −h̄2 g µν ∂ν ∂µ ψ = (ih̄∂ µ )(ih̄∂µ )ψ = pµ pµ ψ. On obtient ainsi une forme très satisfaisante, µ pµ p ψ = E2 2 − p~ 1l4×4 ψ = 0. c2 (7.4) Il est important de noter que l’équation de Weyl, sous sa forme manifestement covariante, ih̄γ µ ∂µ ψ = 0 n’est pas un simple scalaire de Lorentz car γ µ est un objet à quatre composantes (comme un 4−vecteur), mais ses composantes sont des matrices 4 × 4 et ∂µ ψ est un objet à 4 composantes scalaires, de sorte que la contraction donne au total un objet à 4 composantes scalaires. C’est le prix qu’il a fallu payer pour quantifier la (72) Attention, dans cette expression, les γ µ sont des matrices 4 × 4, donc pour chaque valeur des indices µ et ν, le résultat est une matrice et on doit considérer que le second membre est en fait 2g µν 1l4×4 . Il faut noter que dans la littérature on n’utilise pas de caractères gras pour les matrices de Dirac, ce qui est risque supplémentaire de confusion. 110 Mis à jour le 14 Décembre 2012 théorie, puisqu’en physique quantique on travaille sur des objets qui en général ne commutent pas. L’équation de continuité peut s’écrire sous la forme habituelle en définissant la densité de probabilité de présence et la densité de courant de probabilité comme ρ = ψ † ψ = ψ̄γ 0 ψ, ~j = cψ̄~ γ ψ, avec ψ̄ = ψ † γ 0 soit sous forme covariante ∂µ j µ = 0, j µ = (cρ, ~j) = cψ̄γ µ ψ. On peut utiliser pour cela la propriété des matrices de Dirac (γ µ )† = γ 0 γ µ γ 0 . ⊲ Particule non massive libre. Si l’on fait agir sur la solution libre A1 (+) A2 h̄i pµ xµ χ = A e ψ= χ(−) 3 A4 on obtient ih̄γ µ ∂µ ψ = 0 E ~ c 1l2×2 + σ · p E c 1l2×2 − σ · p~ 0 ! ψ = 0. (7.5) L’équation est homogène ; pour avoir une solution non nulle il faut donc annuler le déterminant, ! E 0 1l2×2 − σ · p~ c Det E ~ 0 c 1l2×2 + σ · p E E = 1l2×2 − σ · p~ × 1l2×2 + σ · ~p c c E − p3 −p1 + ip2 Ec − p3 +p1 − ip2 c = 1 × E E −p − ip2 + p3 p1 + ip2 + p3 c c 2 = (E/c)2 − (p3 )2 − ((p1 )2 + (p2 )2 ) 2 2 E 2 = − p~ = 0, c2 soit finalement E = ±|~ p|c. L’équation de Weyl pour la particule libre admet quatre solutions indépendantes, dont deux avec une énergie positive E = |~ p|c (ce sont les deux composantes de spin Interactions fondamentales 111 de la particule non massive que nous souhaitions modéliser) et deux (associées aux deux composantes de spin de l’antiparticule) avec une énergie négative E = −|~ p|c. ⊲ Lagrangien de Weyl. Pour définir une densité lagrangienne appropriée, on introduit comme précédemment avec l’équation de Klein-Gordon à deux composantes l’“adjoint de Dirac” qui a permis la définition de la densité conservée, ψ̄ = ψ † γ 0 , ψ † = (ψ1∗ , ψ2∗ , ψ3∗ , ψ4∗ ), et on pose pour la particule libre (en l’absence de champ électromagnétique) LWeyl = ih̄ψ̄γ µ ∂µ ψ. Avec cette forme, les équations d’Euler-Lagrange se réduisent à ∂L = ih̄γ µ ∂µ ψ = 0. ∂ ψ̄ Equation de Dirac ⊲ Equation covariante pour des fermions massifs de spin 21 . Pour obtenir l’équation relativiste de l’électron (73) et plus généralement pour des fermions massifs de spin 12 , il suffit de généraliser l’équation de Weyl covariante. Partons de la contraction, ce qui est plus immédiat, 2 µ E 2 2 2 2 2 − ~p − m c 1l4×4 ψ = 0. p pµ − m c 1l4×4 ψ = c2 Cela suggère de coupler les équations pour χ(+) et χ(−) par un terme de masse pour obtenir l’équation covariante de Dirac (74) ih̄γ µ ∂ψ = γ µ pµ ψ = mcψ, ∂xµ (7.6) (on omet l’opérateur identité), soit, sous forme développée, ! 1 ∂ ~ (+) (+) ~ 0 − σ · ∇ χ χ c ∂t = mc . ih̄ 1 ∂ χ(−) χ(−) ~ ~ 0 c ∂t + σ · ∇ (73) P.A.M. Dirac, L’équation d’onde relativiste de l’électron, Proc. Roy. Soc. A 117, 610-624 (1928), traduit dans J. Leite-Lopes et B. Escoubès, op. cit., p.194. (74) Une notation “slash” a été introduite (par Feynman) pour simplifier légèrement l’écriture. On définit a / ≡ γ µ aµ , ce qui permet d’écrire l’équation de Dirac par exemple comme (ih̄/ ∂ − mc)ψ = (/ p − mc)ψ = 0. 112 Mis à jour le 14 Décembre 2012 Dans le cas d’une particule libre, on a 0 E − c~ σ · p~ χ(+) = mc χ(+) . E + c~ σ · p~ 0 χ(−) χ(−) Il existe d’autres représentations des matrices de Dirac, notamment la représentation de Dirac obtenue par transformation unitaire à partir de la représentation chirale, γ µ → U γ µ U † où U = 2−1/2 1l 1l , 1l −1l γ µ = (γ 0 , γ), 1l2×2 0 γ0 = 0 −1l2×2 , ~γ = 0 −~ σ ~ σ 0 . Cette fois on obtient dans le cas de la particule libre l’équation u =0 E − mc2 −c~ σ · ~p v c~ σ · ~p −E − mc2 (+) (−) u , où u et v sont des spineurs à deux χ + χ −1/2 avec ψ = 2 = v χ(+) − χ(−) composantes. L’équation aux valeurs propres conduit à 2 −c~ σ · p~ Det E − mc = c2 p~2 − (E 2 − m2 c4 ) = 0, c~ σ · p~ −E − mc2 ou encore pour les particules et les antiparticules, p E = ± |~ p|2 c2 + m2 c4 . (7.7) Dans le cas de l’électron, l’antiparticule est le positron. Le positron a été découvert en 1932 par Anderson. On trouve fréquemment dans la littérature une formulation alternative (ou plutôt des notations alternatives pour les matrices de Dirac). On définit les 4 matrices hermitiennes ~ 0 σ 1l 0 ~ = ~ β = 0 −1l , α σ 0 , ~ = ~γ , β † = β, α ~† = α ~ . On a ensuite directement c’est-à-dire que l’on a β = γ 0 et β α ih̄ ∂ h̄ ~ + βmc2 )ψ ψ = Hψ = (c~ α ∇ ∂t i 2 = (c~ αp~ + βmc )ψ ou encore, par action sur une onde plane, (E − c~ αp~)ψ = βmc2 ψ. (7.8) Interactions fondamentales 113 ⊲ Equation de Dirac covariante sous champ. L’équation de Dirac sous champ s’obtient par couplage minimal, pµ → pµ − qAµ , soit ih̄γ µ ∂µ ψ = mcψ qu’on écrit encore γ µ pµ ψ = mcψ, que l’on transforme en γ µ (pµ − qAµ )ψ = ih̄γ µ ∂µ ψ − qγ µ Aµ ψ = mcψ. (7.9) Pour comparer cette forme à l’équation de Klein-Gordon sous champ par exemple, on multiplie par γ ν (pν − qAν ) : γ µ γ ν (pµ − qAµ )(pν − qAν )ψ = m2 c2 ψ, où l’on introduit les matrices 1 i(γ µ γ ν − γ ν γ µ ), 2 γ µ γ ν = g µν − iΣ µν . Σ µν = L’opérateur Σ µν est antisymétrique, on obtient des représentations matricielles particulières en appliquant Σ µν = iγ µ γ ν − ig µν 1l4×4 . Dans la représentation chirale on a par exemple 2 0 1l2×2 1l2×2 0 Σ 00 = i(γ 0 )2 − i1l4×4 = i 1l − i = 0, 0 0 1l 2×2 Σ 01 0 1 = iγ γ = i 0 1l2×2 1l2×2 0 2×2 0 σx −σx 0 =i σx 0 0 −σx . Les matrices Σ µν = 12 i[γ µ , γ ν ] sont liées aux transformations de Lorentz (les rotations et les “boosts” (ou rotations hyperboliques)), soit par conséquent aux composantes du spin S k , i 1 1 0i 1 0 i σ 0 , Σ = i[γ , γ ] = i 0 −σ i 2 4 2 1 ij 1 i j 1 ijk σ k 0 ≡ ǫijk S k /h̄. Σ = i[γ , γ ] = ǫ 0 σk 2 4 2 Il faut faire attention au fait que les grandeurs en général ne commutent pas en mécanique quantique. On peut alors ré-écrire le premier membre de l’équation de Dirac au carré, (g µν − iΣ µν )(pµ − qAµ )(pν − qAν ) =(pµ − qAµ )(pµ − qAµ ) 1 − i(Σ µν − Σ νµ )(pµ − qAµ )(pν − qAν ) 2 =(pµ − qAµ )(pµ − qAµ ) 1 − iΣ µν [pµ − qAµ , pν − qAν ]. 2 114 Mis à jour le 14 Décembre 2012 Le commutateur se développe [pµ − qAµ , pν − qAν ] = q[pν , Aµ ] − q[pµ , Aν ] = −ih̄q(∂µ Aν − ∂ν Aµ ) et on obtient finalement 1 (pµ − qAµ )(pµ − qAµ )ψ + qh̄Σ µν Fµν ψ = m2 c2 ψ, 2 (7.10) ce qui fait apparaı̂tre très naturellement le tenseur de Faraday, et où le terme Zeeman dû au spin est automatiquement inclus dans le couplage avec Fµν . ⊲ Lagrangien de Dirac. En présence d’un champ électromagnétique on a cette fois LDirac = ψ̄γ µ (ih̄∂µ − qAµ )ψ − mψ̄ψ, avec le spineur adjoint ψ̄ = ψ † γ 0 . Equation relativiste pour le photon Habituellement on ne passe pas par une équation à une particule pour le photon. Les théories quantiques des champs consistent à quantifier des théories considérées comme classiques en remplaçant la fonction d’onde par des opérateurs de champ (création et annihilation de particules). C’est le cas des équations de Schrödinger, de Klein-Gordon ou de Dirac et pour le photon des équations de Maxwell. Dans ces conditions, une équation à une particule pour le photon ne s’impose pas, mais c’est un intermédiaire intéressant que nous nous proposons d’établir ici. Le photon ayant une polarisation, on travaillera sur un objet à plusieurs composantes. Les équations de Maxwell dans le vide (en l’absence de sources) s’écrivent ~E ~ = 0, ∇ ~B ~ =0 ∇ ~ ~ ×E ~ = − ∂B , ∇ ∂t ~ ~ ×B ~ = 1 ∂E ∇ 2 c ∂t ~ + iλcB), ~ λ = ±1. La combinaison iλc~ ~ p × F~λ (avec ~p = −ih̄∇ On pose F~λ = √12 (E un opérateur) s’écrit à l’aide des équations de Maxwell ∂ F~ iλc~ p × F~λ = ih̄ λ . ∂t Il est naturel dans ces conditions de la noter H, où de ce fait, H est une matrice 3 × 3 agissant sur les composantes de F~λ = col (F1 , F2 , F3 ) (vecteur colonne avec les trois composantes cartésiennes de F~λ ), 0 H F~λ = iλc pz −py −pz 0 px py −px 0 F1 F2 F3 ! . R 3 ∗ La quantité d r F~λ (~r)F~λ (~r) définit l’énergie électromagnétique totale Ue.m. (dans un volume de référence quelconque). On définit une fonction d’onde vectorielle ψλ (~r) = col (ψ1 , ψ2 , ψ3 ) en fonction de F~λ en divisant par cette énergie de référence Interactions fondamentales 115 pour assurer la normation à l’unité. Les fonctions d’onde doivent satisfaire à la condition de transversalité p~ · ψλ = 0 et l’équation des ondes se déduit de l’action de H 2 : 2 ~ ×∇ ~ × ψ = −c2 h̄2 ∇ ~ 2 ψ = −h̄2 ∂ ψ . H 2 ψ = λ2 c2 h̄2 ∇ ∂t2 ~ i(~k~r−ωt) conduit à L’action sur une onde plane ψ = Ae ~ = h̄~k ψ, p~ψ = −ih̄ ∇ψ Hψ = ih̄ ∂ψ = h̄ω ψ. ∂t On peut noter que sous cette forme, les équations de Maxwell sont très voisines de l’équation de Dirac (ou plutôt de l’équation de Weyl en l’occurrence) (75) , ∂ ih̄ ∂t ψ = (c~ α · ~p + βmc2 )ψ, car on peut écrire (pour λ = +1) ih̄ ∂ ψ = c(~ τ · p~) ψ, ∂t où les trois matrices τ (analogues aux matrices de Dirac) sont données par τx = (75) 0 0 0 0 0 0 −i i 0 ! , τy = 0 0 −i 0 i 0 0 0 0 ! , τz = 0 −i i 0 0 0 0 0 0 ! . C’est une observation due à Oppenheimer (Phys. Rev. 38 725 (1931)) et également à Majorana (voir à ce propos S. Esposito, Foundations of Physics 37 956 (2007)). 116 Mis à jour le 14 Décembre 2012 Interactions fondamentales 117 8 Classical gauge field theory Introduction ⊲ Classical field theories. Consider as an example the free particle KleinGordon equation (76) (∂µ ∂ µ + m2 )φ = 0 which follows from the conservation equation pµ pµ − m2 = 0 with the correspondence pµ → i∂µ . We use the convention gµν = diag (+1, −1, −1, −1) for the metric tensor. For later use, we choose the ~ ≡ (φ, A), ~ where MKSA conventions, e.g. pµ = (E/c, p~) ≡ (E, p~) and Aµ = (φ/c, A) ∂ ~ ≡ ( ∂ , −∇). ~ , −∇) an bold font denotes a vector in ordinary space, or ∂ µ = ( c1 ∂t ∂t Most of the time, h̄ and c are fixed to unity. The Lagrangian density from which this equation follows must satisfy (77) Z δ ∂L ∂L − ∂µ = 0, d4 x L(φ, φ∗ , ∂µ φ, ∂µ φ∗ ) = ∗ ∗ δφ ∂φ ∂(∂µ φ∗ ) ∂L = −m2 φ, ∂φ∗ ∂µ ∂L = ∂µ ∂ µ φ. ∂(∂µ φ∗ ) The first condition is fulfilled if L = −m2 φ∗ φ + terms in ∂µ φ∗ ∂ µ φ, (76) (77) We forget about factors h̄ and c in this chapter. We consider complex scalar fields. For real fields, factors of 1 2 would appear here and there. 118 Mis à jour le 14 Décembre 2012 and the second if (78) L = ∂µ φ∗ ∂ µ φ + terms in φ∗ φ. Eventually the Klein-Gordon Lagrangian is given by L = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ. The first term is usually referred to as kinetic energy, although the space part (79) is reminiscent from local interactions in the context of classical field theory, and the second term to the mass term, since it corresponds to the mass of the particles after quantization. The quantization procedure, not discussed here, consists in the promotion of the classical fields into creation (or annihilation) field operators which obey, together with the corresponding conjugate momenta, to canonical commutation relations. We will stay here at the level of classical field theory, which means that although the fields correspond to the wave functions of quantum objects in the first-quantized form of the theory, they are treated by classical field theory (e.g. Euler-Lagrange equations) and no quantum fluctuations are allowed. ⊲ The idea behind non-Abelian gauge theory. According to Salam and Ward, cited by Novaes in hep-ph/0001283: Our basic postulate is that it should be possible to generate strong, weak, and electromagnetic interaction terms ... by making local gauge transformations on the kinetic-energy terms in the free Lagrangian for all particles. or Yang and Mills cited in A.C.T. Wu and C.N. Yang, Int. J. Mod. Phys. Vol. 21, No. 16 (2006) 3235: The conservation of isotopic spin points to the existence of a fundamental invariance law similar to the conservation of electric charge. In the latter case, the electric charge serves as a source of electromagnetic field. An important concept in this case is gauge invariance which is closely connected with (1) the equation of motion of the electromagnetic field, (2) the existence of a current density, and (3) the possible interactions between a charged field and the electromagnetic field. We have tried to generalize this concept of gauge invariance to apply to isotopic spin conservation. It is worth noticing that Klein and Pauli were pionners in this field, although they did not publish their results (80) . In an attempt to generalize Kaluza-Klein theory to the non-Abelian case, Pauli was in trouble with the fact that the new bosons associated to the non-Abelian gauge fields were non massive: One will always obtain vector mesons with rest-mass zero (and the rest-mass if at all finite will always remain zero by all interactions with nucleons permitting the gauge group). In a letter to Pais, he was nevertheless writing . . . I would like to ask in this connection whether the transformation group with constant phases can be amplified in a way analogous to the gauge group of electromagnetic potentials in such a way that the meson-nucleon interaction is connected with the amplified group. . . . ⊲ The origin of gauge invariance (81) . The idea of “gauging” a theory, i.e. making local the symmetries, is due to E. Noether, but gauge invariance was (78) We develop to obtain ∂µ ∂(∂∂Lφ∗ ) = ∂0 ∂(∂∂Lφ∗ ) + ∂i ∂(∂∂Lφ∗ ) = ∂µ ∂ µ φ = (∂0 ∂ 0 + ∂i ∂ i )φ = µ 0 i (∂0 ∂0 − ∂i ∂i )φ, the solution L = ∂0 φ∗ ∂0 φ − ∂i φ∗ ∂i φ = ∂0 φ∗ ∂ 0 φ + ∂i φ∗ ∂ i φ = ∂µ φ∗ ∂ µ φ (up to terms in φ∗ φ) follows. 2 (79) ~ 2 , and only the time derivatives − |∇φ| We have a space and a time part in ∂µ φ∂ µ φ = c12 ∂φ ∂t are reminiscent of a kinetic energy. (80) See N. Straumann, Wolfgang Pauli and modern physics, arXiv:0810.2213. (81) See Cheng and Li pp235-236, and Gross p956 Interactions fondamentales 119 introduced by Weyl when he tried to incorporate electromagnetism into geometry through the idea of local scale transformations. From one point of space-time to an other at a distance dxµ , the scale is changed from 1 to (1 + Sµ dxµ ) in such a way that a space-time dependent function (of dimension of a length) f (x) is changed according to f (x) → f (x + dx) = (f + ∂µ f dxµ ))(1 + Sµ dxµ ) ≃ f + [(∂µ + Sµ )f ]dxµ . The original idea of Weyl was to identify Sµ to the 4−potential Aµ , but with the advent of quantum mechanics and the correspondence between pµ and i∂µ , it was later realized that the correct identification is Sµ ↔ ieAµ . Weyl nevertheless retained his original terminology of gauge invariance as an invariance under a change of length scaled, or a change of the gauge. Abelian U (1) gauge theory ⊲ The complex nature of the field as an internal structure. The prototype of gauge theory is the theory of electromagnetism, or Abelian U (1) theory, where charge conservation is deeply connected to global phase invariance in quantum mechanics (a connection probably made first by Hermann Weyl). The complex scalar field ϕ(x) (Schrödinger or Klein-Gordon field) can be modified by a global phase transformation ϕ(x) → exp(ieα)ϕ(x) (Abelian U (1) gauge transformation) which leaves the matter Lagrangian L = ∂µ ϕ∗ ∂ µ ϕ − V (|ϕ|2 ) unchanged. We anticipate and introduce already the charge e which couples the (82) 1 2 particle to the electromagnetic field . Let us write ϕ = φ + iφ and introduce a 1 real two-component field φ(x) = φ2 . The gauge transformation now appears as φ an Abelian rotation in a two-dimensional (internal) space. ⊲ Noether theorem and matter current density. Consider the Langrangian density L0 = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ). For later use, we will call this Lagrangian the function L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ). For any symmetry transformation, δL0 = δϕ∗ ∂L0 ∂L0 + δ(∂µ ϕ∗ ) + ϕ∗ → ϕ = 0. ∗ ∂ϕ ∂(∂µ ϕ∗ ) The notation ϕ∗ → ϕ means that we add a similar term with all complex numbers replaced by their conjugate. The global phase transformation ϕ → ϕ′ = ϕeieα being (82) Here we set h̄ = 1. In most of the relations, h̄ is restored through the substitution e → e/h̄, g → g/h̄, or i∂µ → ih̄∂µ . 120 Mis à jour le 14 Décembre 2012 such a symmetry, we put δϕ = ieαϕ and δ(∂µ ϕ) = ieα∂µ ϕ (to linear order in the expansion of eieα ) in the expression of δL0 to have " # ∂L0 + ∂µ ϕ δL0 = −ieα + ϕ∗ → ϕ ∂(∂µ ϕ∗ ) " # ∂L0 ∗ = −ieα∂µ ϕ + ϕ∗ → ϕ ∂(∂µ ϕ∗ ) ∂L ϕ∗ ∗0 ∂ϕ ∗ = −α∂µ j µ where use has been made of the Euler-Lagrange equation. It follows that the Noether current " ∂L0 ∂L0 j µ = −ie ϕ − ϕ∗ ∂(∂µ ϕ) ∂(∂µ ϕ∗ ) # is conserved, ∂µ j µ = 0. The electric charge conservation thus appears as the consequence of the invariance of the theory under global phase changes, this is called a global gauge symmetry. Note that in the case of the Klein-Gordon Lagrangian, the conserved current takes the form (83) j µ = −ie(ϕ∂ µ ϕ∗ − ϕ∗ ∂ µ ϕ). ⊲ Local gauge symmetry. Extending the gauge symmetry to local transformations requires the introduction of a (vector) gauge field which will be seen later as the vector potential of electromagnetism. In other words, making local the gauge symmetry builds the electromagnetic interaction. Let us assume that the gauge transformation is local, i.e. ϕ → ϕ′ = ϕeieα(x) ≡ G(x)ϕ. We note that now ∂µ ϕ → ∂µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ 6= G(x)∂µ ϕ, and the derivative of the field does not transform like the field itself does. Let us define the covariant derivative (84) Dµ ≡ ∂µ + ieAµ where Aµ is still to be defined by its transformation properties. Like ϕ′ = G(x)ϕ, we demand that Dµ ϕ → (Dµ ϕ)′ ≡ G(x)Dµ ϕ. (83) Note that at this point, the sign in front of the current density was arbitrary, but if one wants to recover the usual expression of probability density current in quantum mechanics, e.g. in the h̄ ~ + ϕ∗ → ϕ, it leads to the present charge current density after Schrödinger case, ~j = 2mi ϕ∗ ∇ϕ being multiplied by e. (84) The term covariant refers to covariance with respect to the introduction of the local transformation, and not to covariant-contravariant indices. Interactions fondamentales 121 Since we have (Dµ ϕ)′ = (∂µ ϕ)′ + ieA′µ ϕ′ = G(x)∂µ ϕ + (∂µ G(x))ϕ + ieA′µ G(x)ϕ and G(x)Dµ ϕ = G(x)∂µ ϕ + ieAµ G(x)ϕ, we must require that ieA′µ G(x) = ieAµ G(x) − ∂µ G(x) or, multiplying by G−1 (x), i A′µ = Aµ + G−1 (x)∂µ G(x) = Aµ − ∂µ α(x). e Demanding the invariance property of the kinetic term (according to Salam and Ward cited above) in the Lagrangian density under a local gauge transformation requires the introduction of a vector field which obeys the usual transformation law of the vector potential of electromagnetism through gauge transformations. These transformations which appeared before as a kind of mathematical curiosity of Maxwell theory are now necessary in order to preserve local gauge invariance. In a sense, the interaction is “created” by the principle of local gauge symmetry, while the principle of global gauge symmetry implies the conservation of the electric charge. The interaction of matter (as described by the Lagrangian density L0 ) with the electromagnetic field can be built in through essentially two different approaches. In a first approach, we successively add terms to L0 in order to get at the end a locally gauge invariant Lagrangian. Since the prescription of local gauge invariance induces Maxwell interactions, this should automatically incorporate interaction terms in L. Starting with the observation that L0 is no longer gauge invariant through local transformations, since δL0 = −α(x)∂µ j µ −(∂µ α(x))j µ now contains the second term, we have to kill this last term by the introduction of something new (85) L1 = −jµ Aµ . ~ This again generates The sign here is also coherent with the expression −(ρφ − ~j A). one more contribution in δ(L0 + L1 ), which is canceled if we add L2 = e2 Aµ Aµ ϕ∗ ϕ. The combination L0 + L1 + L2 = L0 + Lint is now locally gauge invariant. In a shorter approach, called minimal coupling, we simply replace the kinetic term ∂µ ϕ∗ ∂ µ ϕ in L0 by (Dµ ϕ)∗ (D µ ϕ) which was especially constructed in order to be gauge invariant (under local gauge transformations). The interaction terms are recovered from (here in the Klein-Gordon case): (Dµ ϕ)∗ (D µ ϕ) = (∂µ ϕ + ieAµ ϕ)∗ (∂ µ ϕ + ieAµ ϕ) = ∂µ ϕ∗ ∂ µ ϕ − ieAµ ϕ∗ ∂ µ ϕ + ieAµ ϕ∂µ ϕ∗ + e2 Aµ Aµ ϕ∗ ϕ = ∂µ ϕ∗ ∂ µ ϕ + ie(ϕ∂µ ϕ∗ − ϕ∗ ∂µ ϕ)Aµ + e2 Aµ Aµ ϕ∗ ϕ. One also has to add the pure field contribution LA = − 14 Fµν F µν to get the full Lagrangian density (86) Ltot = L0 + Lint + LA ≡ F (ϕ, ϕ∗ , (Dµ ϕ), (Dµ ϕ)∗ ) + LA = (Dµ ϕ)∗ (D µ ϕ) − V (ϕ∗ ϕ) + LA . Note that being the kinetic energy of the free gauge field, LA is expected to be quadratic in Aµ , and requiring that it is written in terms of the physical fields (85) (86) Note that here j µ is the current which was conserved in the absence of gauge interaction Remember that we call L0 = F (ϕ, ϕ∗ , ∂µ ϕ, ∂µ ϕ∗ ). 122 Mis à jour le 14 Décembre 2012 instead of the gauge fields, we form Fµν F µν which has the advantage of being gauge invariant. The full Lagrangian is thus L = ∂µ ϕ∗ ∂ µ ϕ − V (ϕ∗ ϕ) − jµ Aµ + e2 Aµ Aµ ϕ∗ ϕ − 14 Fµν F µν . Now, since the functional form of the interacting matter Lagrangian is the same as the form of the free Lagrangian with Dµ instead of ∂µ , the conserved Noether current in the presence of gauge interaction reads as (87) J µ = ieϕ∗ ∂L0 + ϕ∗ → ϕ ∂(Dµ ϕ)∗ = ieϕ∗ D µ ϕ + ϕ∗ → ϕ. = j µ − 2e2 ϕ∗ ϕAµ , the last two lines being valid for the KG case. The interaction term can now be written, up to second order terms (88) in Aµ , as Lint = −Jµ Aµ . The equations of motion follow from Euler-Lagrange equations, ∂Ltot ∂Ltot δStot = 0, = − ∂ν δAµ ∂Aµ ∂(∂ν Aµ ) which simply yield ∂Lint ∂LA . = ∂ν ∂Aµ ∂(∂ν Aµ ) The l.h.s. is ∂Lint = −j µ + 2e2 ϕ∗ ϕAµ = −J µ ∂Aµ while at the r.h.s. we have ∂LA ∂ = − 41 F F αβ = − 14 ∂(∂ν Aµ ) ∂(∂ν Aµ ) αβ ∂Fαβ ∂F αβ F αβ + Fαβ ∂(∂ν Aµ ) ∂(∂ν Aµ ) ! Both terms in parenthesis are equal to F νµ −F µν = −2F µν and eventually we obtain after multiplication by − 14 , (89) ∂ν F µν = −∂ν F νµ = −J µ (87) See e.g. V. Rubakov, Classical Theory of Gauge fields, Princeton University Press 2002, pp21-27. These terms are particularly important, since they restore gauge invariance of the interaction Lagrangian which otherwise would not exhibit this gauge invariance property in the present form. Indeed, Jµ is gauge invariant, but Aµ is not. (89) Note again that our choice of sign for the current density makes the expression coherent with the usual Maxwell equations. (88) . Interactions fondamentales 123 and, since F µν is antisymmetric, we recover the conservation equation for J µ , ∂µ J µ = 0. Non-Abelian (Yang-Mills) SU (2) gauge theory ⊲ Internal structure. The global phase transformation ϕ(x) → exp(ieα)ϕ(x) as mentioned above appears as an Abelian rotation in a two-dimensional (internal) space. This gauge transformation, when extended to local phase transformations α → α(x), generates the electromagnetic interaction. It is possible to generalize to non-Abelian gauge transformations by extending the internal (isospin) structure. The field is for example a 3-component real scalar field φ1 φ(x) = φ2 φ3 and the transformation corresponds to a rotation in the internal space corresponding charge is now written g) (90) (the φ(x) → exp(igτ α)φ(x), with τ the generators (which do not commute, hence the name of non-Abelian) of the rotations in three dimensions(91) ! ! ! 0 −i 0 0 0 i 0 0 0 3 2 1 0 0 0 , τ = i 0 0 . τ = τ = 0 0 −i , 0 0 0 −i 0 0 0 i 0 Use of bold font stands for vectors in the internal space and the scalar product (with the dot · omitted) τ α is a 3 × 3 matrix, τα = 0 iα3 −iα2 −iα3 0 iα1 iα2 −iα1 0 ! . The transformation (being a rotation in 3 dimensions) is non Abelian and it can be rewritten as (92) φ(x) → φ(x) − α × φ(x) or φa (x) → φa (x) − εabc αb φc (x) in component form. Here we use the Latin indices of the beginning of the alphabet, a, b, , c, . . ., to denote the internal space components, and α is a vector in the internal space whose length α is the angle of rotation and whose direction is the (90) See Weinberg II p3. The rotation matrix is 3 × 3 due to the three components of the field and there are three such matrices because there are three possible rotation axis in three dimensions. The notation is here with the imaginary i for convenience. Usually an infinitesimal rotation matrix in 3d is ! 0 ωz −ωy . −ωz 0 ωx ωy −ωx 0 (91) (92) See Ryder p108. 124 Mis à jour le 14 Décembre 2012 rotation axis. When needed, µ is still the index refering to space-time components in Minkowski space. Rotations in three space dimensions are equivalent to SU (2) transformations acting on complex two-component spinors (93) . The field is now represented by such a spinor, ψ(x) = ϕ↑ (x) ϕ↓ (x) . Each component is complex, but due to a normalization constraint we still have three independent real scalar fields. Under a rotation in the internal space, ψ(x) changes into 1 2 igσα ψ(x) → exp ψ(x) where σ are the three Pauli matrices, 1 σ = 0 1 1 0 , 2 σ = 0 i −i 0 , 3 σ = 1 0 0 −1 , which obey the Lie algebra [σ a , σ b ] = 2iεabc σ c with εabc the totally antisymmetric tensor, and σα is a 2 × 2 matrix σα = α3 α1 + iα2 α1 − iα2 −α3 Here 21 σ a are the generators of SU (2) transformations. Here, σ and α are still written in bold font since they both have three components in the 3d−internal space. All objects acting on 2−component spinors on the other hand are 2 × 2 matrices, e.g. in (1 + 12 igσα)ψ, 1 has to be understood as the 2 × 2 identity matrix. The two representations can be written (94) in a unified way in component form. The (infinitesimal) transformation of the field (let say Ψ(x), for φ or ψ) is written δΨl (x) = igαa (ta )l m Ψm (x). The αa ’s are now the parameters of the infinitesimal transformation. The superscript a is used as internal space index, l and m denote the 2 components (resp. 3) in the SU (2) representation (resp SO(3)) and t stands for the generator (σ (resp. τ )). Together with the internal degrees of freedom, the fields of course depend on space-time position xµ . (93) An O(3) transformation on φ corresponds to an SU (2) transformation on ψ = φ1 = 12 (ϕ2↓ − ϕ2↑ ), φ2 = See Weinberg II p2. (94) 1 (ϕ2↑ 2i + ϕ2↓ ), φ3 = ϕ↑ ϕ↓ , see Ryder pp32-38. ϕ↑ (x) ϕ↓ (x) with Interactions fondamentales 125 ⊲ Pure matter field and Noether current. From now on, we choose the SU (2) representation. Let L0 be a gauge invariant matter Lagrangian density L0 = ∂µ ψ † ∂ µ ψ − V (ψ † ψ) where ψ † (x) = (ϕ∗↑ (x), ϕ∗↓ (x)) and V (ψ † ψ) is a potential to be defined later. The variation of the Lagrangian density yields δL0 = δψ † ∂L0 ∂L0 ∂L0 ∂L0 + δ(∂µ ψ † ) + δψ + δ(∂µ ψ). ∂ψ † ∂(∂µ ψ † ) ∂ψ ∂(∂µ ψ) With the infinitesimal transformation δψ(x) = 21 igσαψ(x), δψ † (x) = − 12 igψ † (x)σα, which can be written in matrix form, ϕ↑ (x) α1 − iα2 ϕ↓ (x) −α3 3 1 2 ∗ ∗ ∗ ∗ α α + iα 1 (δϕ↑ (x), δϕ↓ (x)) = − 2 ig(ϕ↑ (x), ϕ↓ (x)) , α1 − iα2 −α3 δϕ↑ (x) δϕ↓ (x) = 12 ig α3 1 α + iα2 and using the equations of motion ∂L0 ∂L0 − ∂µ = 0, ∂ψ ∂(∂µ ψ) ∂L0 ∂L0 − ∂µ =0 ∂ψ † ∂(∂µ ψ † ) we obtain the variation of the Lagrangian density δL0 = − 12 igψ † σα ∂µ = −α∂µ jµ ∂L0 ∂L0 † 1 ig∂ ψ σα + − + (ψ † → ψ) µ 2 ∂(∂µ ψ † ) ∂(∂µ ψ † ) where the Noether current jµ = − − 12 igψ † σ ∂L0 ∂L0 − † ∂(∂µ ψ ) ∂(∂µ ψ) 1 2 igσψ is conserved, ∂µ jµ = 0, since the variation of the Lagrangian density vanishes for a symmetry. The current density is a vector in internal space (isospin current density) (95) . With the Lagrangian density given above in the Klein-Gordon case, the conserved (95) See Quigg p34 126 Mis à jour le 14 Décembre 2012 current is explicitly given by jµ = 21 igψ † σ∂ µ ψ − ∂ µ ψ † 12 igσψ ϕ 0 1 ∗ ∗ 1 = 2 ig(ϕ↑ , ϕ↓ ) 1 0 ∂ µ ϕ↑ i − ()∗ → () ↓ + 12 ig(ϕ∗↑ , ϕ∗↓ ) + 0 i −i 0 1 ig(ϕ∗↑ , ϕ∗↓ ) 2 ∂µ 1 0 ϕ↑ ∗ ϕ↓ j − () → () 0 ∂ µ ϕ↑ k − ()∗ → () ϕ↓ −1 = 21 ig(ϕ∗↑ ∂ µ ϕ↓ + ϕ∗↓ ∂ µ ϕ↑ )i − ()∗ → () + 12 ig(−iϕ∗↑ ∂ µ ϕ↓ + iϕ∗↓ ∂ µ ϕ↑ )j − ()∗ → () + 12 ig(ϕ∗↑ ∂ µ ϕ↑ + ϕ∗↓ ∂ µ ϕ↓ )k − ()∗ → () where i, j et k are the unit vectors in isospin space. In component form, we have jaµ = 21 igψ † σa ∂ µ ψ − ∂ µ ψ † 12 igσa ψ. ⊲ Introduction of a gauge potential (96) . Now we extend the formalism to local gauge transformations ψ ′ (x) = exp 12 igσα(x) ψ(x) ≡ G(x)ψ(x), (where G(x) = exp 21 igσα(x) is a 2 × 2 matrix) or locally to δψ(x) = 12 igσα(x)ψ(x), but a problem occurs which will make the Lagrangian density L0 not gauge invariant. The fact that ∂µ ψ does not obey the same gauge transformation than ψ itself corrupts the transformation of the kinetic energy. We have ∂µ ψ ′ = (∂µ G)ψ+G(∂µ ψ). Let us introduce a covariant derivative (97) Dµ ≡ ∂µ + igBµ . Here as before we use the short notation ∂µ for ∂µ 1l with 1l the 2 by 2 identity matrix. The context suffices to distinguish between ∂µ and ∂µ 1l. Bµ = 12 σBµ = 21 σ a Bµa (summation over a understood) is another 2 by 2 matrix (in fact there is one such matrix for each of the 4 space-time components, Bµ is a gauge potential with three internal components which all are 4−space-time vectors). We demand the following transformation Dµ ψ(x) → Dµ′ ψ ′ (x) = G(x)(Dµ ψ(x)). (96) See Quigg pp55-57 In analogy with electromagnetism where the covariant derivative ih̄Dµ is given by pµ − eAµ with pµ = ih̄∂µ , which yields Dµ = ∂µ + i h̄e Aµ . (97) Interactions fondamentales 127 We obtain Dµ′ ψ ′ = (∂µ + igBµ′ )ψ ′ = (∂µ G)ψ + G(∂µ ψ) + igBµ′ Gψ. From the requirement above, this quantity should be equal to G(∂µ + igBµ )ψ = G(∂µ ψ) + igG(Bµ ψ). It follows an equation for the transformation of Bµ , igBµ′ Gψ = igG(Bµ ψ) − (∂µ G)ψ. Written in terms of operators, this equation is Bµ′ G = GBµ + gi ∂µ G. We multiply both sides by G−1 on the right to get Bµ′ −1 = GBµ G i −1 i −1 + (∂µ G)G = G Bµ + G (∂µ G) G−1 . g g In the case of electromagnetism, the local gauge transformation is performed by the operator (now an ordinary function) GEM (x) = exp(ieα(x)) with α(x) some function, and leads to the known transformation of the gauge potential of electromagnetism, i −1 A′µ = GEM Aµ G−1 EM + (∂µ GEM )GEM = Aµ − ∂µ α. e With the transformation of Bµ = 12 σBµ , we can deduce the gauge transformation of Bµ as well. Consider an infinitesimal gauge transformation G(x) = 1l + 12 igσα(x), we have (to linear order in αi ) ′ 1 2 σBµ = 21 σBµ + 14 ig((σα) (σBµ ) − (σBµ ) (σα)) − 21 ∂µ (σα). The term in the middle, written in components, has the form 1 ig((σ a αa )(σ b Bµb ) 4 − (σ b Bµb )(σ a αa )) = 41 igαa Bµb (σ a σ b − σ b σ a ) = 41 igαa Bµb 2iεabc σ c = 21 gεcab αa Bµb σ c = 21 g(α × Bµ ) · σ and it follows that ′ 1 2 σBµ = 21 σBµ + 12 g(α × Bµ ) · σ − 21 ∂µ (σα). Another common expression uses the identity (α × Bµ ) · σ = −2i that 1 1 ′ 1 1 1 − 2 ∂µ (σα). = σB σB + ig σα, σB µ µ µ 2 2 2 2 We can also write directly B′µ = Bµ + gα × Bµ − ∂µ α. 1 σα, σB such µ 2 2 1 128 Mis à jour le 14 Décembre 2012 The gauge transformation of Bµ appears as a gradient term (like in electromagnetism) plus a rotation in internal space. ⊲ The field-strength tensor and field equations (98) . Let us introduce a field-strength tensor by the 2 by 2 matrix Fµν = 21 σFµν from which we construct the gauge-invariant kinetic energy (99) Lfield = − 14 Fµν Fµν . a Using the identity Tr(σ a σ b ) = 2δ ab , we form − 14 Fµν Fµν = − 41 Fµν F aµν = 11 1 a bµν ab a a b bµν − 4 Fµν F δ = − 2 4 Tr(σ Fµν σ F ) and eventually Lfield = − 12 Tr(Fµν F µν ). The field-strength tensor is an observable quantity. It is thus supposed to be a “gauge scalar”, that is to be independent of the choice of gauge (100) : ′ = GFµν G−1 . Fµν A simple transcription of the QED Faraday tensor Fµν = ∂µ Aν − ∂ν Aµ is not satisfactory, but if we note that the QED Faraday tensor can also be written as Fµν = 1 [D , D ] = ∂µ Aν − ∂ν Aµ + ie[Aµ , Aν ] ie µ ν (the commutator vanishes in the Abelian case), we can define Fµν = 1 [D , D ] = ∂µ Bν − ∂ν Bµ + ig[Bµ , Bν ]. ig µ ν It is easy to check that this definition has the correct gauge invariance property. In terms of “isovectors”, the same relation becomes 1 σFµν = 21 σ∂µ Bν − 12 σ∂ν Bµ + ig 21 σBµ , 12 σBν 2 Fµν = ∂µ Bν − ∂ν Bµ − gBµ × Bν , where we used 21 σBµ , 12 σBν = 12 i(Bµ × Bν ) · σ. The non-Abelian character of the theory is obvious in the definition of the field-strength tensor. Written in full component form, the field-strength tensor reads as Fµν a = ∂µ Bνa − ∂ν Bµa − gǫabc Bµb B c ν. (98) See Quigg pp58-59 This kinetic energy has the same form as in QED, LU (1) field = − 41 Fµν F µν . (100) In the same sense than a Lorentz scalar (i.e. a contraction) does not depend on the reference frame. (99) Interactions fondamentales 129 From the field Lagrangian and the Euler-Lagrange equations " # ∂Lfield ∂Lfield − ∂ν = 0, ∂Bµa ∂(∂ν Bµa ) one can deduce the equations of motion (equivalent to the Maxwell equations in the absence of charged matter current): ∂ 1 1 (− Fκλ b F bκλ ) = g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd ), a ∂Bµ 4 2 " # ∂ 1 b bκλ ∂ν (− F F ) = −∂ν F aµν . ∂(∂ν Bµa ) 4 κλ It appears a term (the first line) which does not exist in the case of electromagnetic theory. This term is a current density, which is present even in the absence of matter fields. Hence, the equations of motion are not as simple as the familiar Maxwell equations which are linear. The Yang-Mills equations of motion are not linear, and this is due to the fact that the gauge field carries the charge associated to the interaction. Written in vector form, one has ∂ µ Fµν − gBµ × Fµν = 0. In the massive case (which is not gauge invariant), a term m2 Bµ Bµ would be added to the Lagrangian density and the (Proca-like) equations of motion become ∂ µ Fµν − gBµ × Fµν = m2 Bν . ⊲ Construction of a gauge-invariant interaction (101) . Since α(x) depends on space-time, the variations δ(∂µ ψ) (or δ(∂µ ψ † )) contain an extra term which contributes to δL0 # " ∂L0 † 1 δL0 = − 2 igψ σα(x) ∂µ ∂(∂µ ψ † ) + − 21 ig∂µ ψ † σ α(x) − 21 ig∂µ [α(x)] ψ † σ ∂L0 + (ψ † → ψ) ∂(∂µ ψ † ) = −α(x)(∂µ jµ ) − (∂µ α(x))jµ (101) This section may be omitted. It presents step by step the construction of a gauge invariant Lagrangian which is obtained faster by the minimal coupling requirement presented later. The approach used here follows the presentation of Ryder pp96-98 in the case of Abelian U (1) gauge symmetry. 130 Mis à jour le 14 Décembre 2012 The first term vanishes thanks to Noether theorem, but the second term, −(∂µ α(x))jµ persists, so L0 is not gauge invariant under local gauge transformations. In order to compensate this new term, we must add another contribution to the Lagrangian, L1 = −jµ Bµ and demand that Bµ obeys the gauge transformation. Now, δL0 + δL1 = −α(∂µ jµ ) − (∂µ α)jµ − jµ δBµ − δjµ Bµ , where only the first term vanishes identically. Performing the variation of jµ yields −δjµ = − 12 igδψ † σ∂ µ ψ − 21 igψ † σδ(∂ µ ψ) + (ψ † → ψ) = − 12 ig − 21 igψ † σα σ∂ µ ψ − 21 igψ † σ 12 igσ∂ µ αψ + 21 igσα∂ µ ψ + (ψ † → ψ) = 14 g 2 ψ † [σ, σα] ∂ µ ψ + 14 g 2 ∂ µ ψ † [σ, σα] ψ + 14 g 2 ψ † {σ, σ∂ µ α} ψ = − 21 ig 2 ψ † σ × α∂ µ ψ − 21 ig 2 ∂ µ ψ † σ × αψ + 12 g 2 ∂ µ αψ † ψ We have used the identities [σ, σα] = −2iσ × α and {σ, σ∂ µ α} = 2∂ µ α which are proven by the use of Pauli matrices properties [σ a , σ b ] = 2iεabc σ c and {σ a , σ b } = 2δab 1l. The three remaining terms are equal to −(∂µ α)jµ = − 21 igψ † σ∂µ α∂ µ ψ + (ψ † → ψ), −jµ δBµ = −gjµ · (α × Bµ ) − jµ ∂µ α, −δjµ Bµ = − 21 ig 2 ψ † (σ × α) · Bµ ∂ µ ψ − 21 ig 2 ∂ µ ψ † (σ × α) · Bµ ψ + 12 g 2 ∂ µ αBµ ψ † ψ = +gjµ · (α × Bµ ) + 21 g 2 ∂ µ αBµ ψ † ψ, where we have used the cyclic property (σ × α) · Bµ = (α × Bµ ) · σ. The sum eventually gives only δL0 + δL1 = 12 g 2 ∂ µ αBµ ψ † ψ We still have to add another term which should eventually make the whole Lagrangian gauge invariant, L2 = 14 g 2 ψ † Bµ Bµ ψ = 41 g 2 Bµ Bµ ψ † ψ. The variation of L2 reads as δL2 = 41 g 2 (Bµ δBµ ψ † ψ + δBµ Bµ ψ † ψ + Bµ Bµ δ(ψ † ψ)) = 12 g 2 Bµ δBµ ψ † ψ = − 12 g 2 Bµ (g(α × Bµ ) + ∂ µ α)ψ † ψ = − 12 g 2 Bµ ∂ µ αψ † ψ Interactions fondamentales 131 and we obtain the expected vanishing variation δL0 + δL1 + δL2 = 0 which proves that the gauge invariant interaction in the presence of gauge fields contains two terms, L1 + L2 = −jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ. The kinetic energy of the gauge field itself was not included, and the free particle contribution is also missing. ⊲ Covariant derivative, minimal coupling. The introduction of the gauge covariant derivative facilitates the calculations. The action should not depend on the gauge choice, since the equations of motion are independent of the gauge. The Lagrangian density should thus be a gauge scalar. The potential term is already a gauge scalar, since it depends only on ψ † ψ which transforms covariantly according to ψ ′† ψ ′ = (ψ † G−1 )(Gψ). In order to become manifestly gauge covariant, the kinetic term should be written as (Dµ ψ)† (D µ ψ), since the covariant derivative of the field Dµ ψ was constructed for the purpose of obeying the same gauge transformation than the field itself, (Dµ ′ ψ ′ )† (D µ ′ ψ ′ ) = (Dµ ψ)† G−1 G(D µ ψ). The minimal coupling is the prescription that the interaction with the gauge field is obtained by the replacement ∂µ ψ → Dµ ψ in the Lagrangian density (102) : L = (Dµ ψ)† (D µ ψ) − V (ψ † ψ) = ∂µ − 21 igσBµ ψ † ∂ µ + 12 igσBµ ψ − V (ψ † ψ) = ∂µ ψ † ∂ µ ψ − 12 igψ † σBµ ∂ µ ψ + 21 ig∂ µ ψ † σBµ ψ + 14 g 2 ψ † (σBµ )(σBµ )ψ − V (ψ † ψ) = ∂µ ψ † ∂ µ ψ − jµ Bµ + 14 g 2 Bµ Bµ ψ † ψ − V (ψ † ψ) where in the last term use has been made of the identity (σBµ )(σBµ ) = (σ a Bµa )(σ b B bµ ) B1 B 1 + B2 B 2 + B3 B 3 = 0 0 B1 B 1 + B2 B 2 + B3 B 3 = Bµ Bµ 1l. This operation is called gauging the Lagrangian. Note that in the case of fermionic particles, we have to use the Dirac Lagrangian density iψ̄γ µ ∂µ ψ, with ψ̄ = ψ † γ 0 the adjoint spinor and γ µ the Dirac matrices (103) instead of the kinetic energy ∂µ ψ † ∂ µ ψ, and the gauge invariant Lagrangian becomes L = ψ̄(iγ µ Dµ − m)ψ − 41 Fµν Fµν . In an expression such that ∂µ − 12 igσBµ ψ † , it is understood that σBµ acts on ψ † on the (102) left. (103) See e.g. Ryder pp43-46 132 Mis à jour le 14 Décembre 2012 ⊲ Conserved current in the presence of gauge fields. In the presence of gauge fields, the conserved Noether current can be written in terms of the covariant derivative, Jµ = − − 21 igψ † σ ∂L0 ∂L0 − † ∂((Dµ ψ) ) ∂(Dµ ψ) 1 2 igσψ In the case of the SU (2) Lagrangian, it becomes Jµ = 12 igψ † σD µ ψ − (D µ ψ)† 21 igσψ = 12 igψ † σ ∂ µ ψ + 12 igσBµ ψ − ∂ µ ψ † − 21 igσBµ ψ † 12 igσψ = jµ − 14 g 2 ψ † [σ, σBµ ] ψ. We see that the conserved current in the presence of gauge fields has two contributions, one coming from the ordinary matter current and the other from the gauge field itself. Using the identity [σ, σBµ ] = −2iσ × Bµ , we get Jµ = jµ + 21 ig 2 ψ † σ × Bµ ψ. In component form we have 1 J aµ = j aµ − ig 2 ψ † εabc σ b B cµ ψ. 2 The current density Jµ is conserved in the ordinary sense (104) , µ ∂µ J = 0 while jµ satisfies a gauge-covariant conservation law Dµ jµ = 0. Now, the Euler-Lagrange equations of the matter field in the presence of the gauge field contain a new term, " # ∂Lint ∂Lfield ∂Lfield + − ∂ν = 0, ∂Bµa ∂Bµa ∂(∂ν Bµa ) and lead to the equations of motion in the presence of charged matter: 1 1 1 − g(ψ † σ a ∂ µ ψ − ∂ µ ψ † σ a ψ) + 2g 2 ψ † B aµ ψ 2 2 2 1 + g(ǫbca F bκµ Bκc + ǫbad F bµλ Bλd ) 2 = ∂ν F aµν This can be rewritten in vector form, specifying Jν as the matter current only, as ∂ µ Fµν − gBµ × Fµν = Jν . (104) See Weinberg II pp12-13 Interactions fondamentales 133 9 Spontaneous symmetry breaking The question considered in this chapter is that of the mass of the particles which carry the fundamental interactions (gauge bosons). As we have seen, local gauge symmetry constrains the field Lagrangian density to contain only massless terms − 14 F F , since massive terms like −m2X X 2 for a gauge field X would not be locally gauge invariant. This constraint does not apply to the fermionic sector, since terms such as −m2φ φ2 are invariant under local gauge transformations (although the problem of a non zero mass of fermions will also occur for other reasons). The above observation does not introduce any trouble in the case of U (1) gauge symmetry, since its physical realization, the electromagnetic interaction is carried by massless gauge particles, namely the photons. This is not true for the SU (2) counterpart, a priori realized by the weak interaction for which the gauge bosons are known to be the massive particles W ± and Z 0 . The question thus arises to find the origin of the appearence of a non zero mass in the gauge sector of the theory. The notion of spontaneously broken symmetry, as encountered in the physics of second-order phase transitions and critical phenomena will help in solving the problem. This solution is called in the context of particle physics Higgs mechanism. Spontaneous breaking of global gauge symmetries ⊲ Discrete symmetries. Let us first consider spontaneous breaking of a global discrete symmetry. It is illustrated by the case of the real scalar field, L = 12 ∂µ φ∂ µ φ − V (φ(x)), where V (φ(x)) is a potential which depends on the field configuration. We will consider two cases λ µ2 V (φ) = φ4 ± φ2 , λ, µ2 > 0. 4 2 134 Mis à jour le 14 Décembre 2012 Case 1 with the sign + corresponds to a scalar field theory with square mass µ2 . Let us first build the Hamiltonian, H = 21 (∂0 φ)2 + 21 (∇φ)2 + V (φ). The field with the lowest energy (also called the ground state configuration, which would be denoted φ0 = hΩ|φ̂|Ωi in the quantized version of the theory) is a constant field which minimizes the potential. In case 1, it corresponds to a vanishing field φ0 = 0. The discrete Z2 symmetry φ → −φ of the Lagrangian is also a symmetry of the ground state. In case 2, with sign − in the potential, the constant ground state field is given by µ φ0 = ± √ = ±v. λ While the Lagrangian still possesses the φ → −φ symmetry, in any of the two degenerate ground states, this Z2 symmetry is broken. This situation occurs in the low temperature phase of second order phase transitions, when an ordered ground state emerges (for example a ferromagnetic ground state), which does not respect the full symmetry of the Hamiltonian (e.g. the “up-down” symmetry in an Ising model, or rotational symmetry (this is a continuous symmetry in this case) in the case of an Heisenberg model). It is instructive to study the field fluctuations around the ground state. For this purpose, we let φ = v + h, h ≪ v, (v is chosen positive without loss of generality) and we remind that V ′ (φ) = λφ3 − µ2 φ, V ′′ (φ) = 3λφ2 − µ2 , V ′′′ (φ) = 6λφ, and V ′′′′ (φ) = 6λ. The potential is now V (φ) = V (v) + hV ′ (v) + 12 h2 V ′′ (v) + 16 h3 V ′′′ (v) + 1 4 ′′′′ (v) 24 h V √ µ4 + 0 + 12 2µ2 h2 + λµh3 + 14 λh4 . λ √ We note that the new field h acquired a mass 2µ (the coefficient of the quadratic term in h is now positive). ⊲ Continuous symmetries. Spontaneous breaking of a global continuous symmetry can be encountered in the SO(2) model (rotations in the plane). We consider now a theory with two real scalar fields φ1 (x) and φ2 (x), and with the potential = − 14 V (φ1 , φ2 ) = 14 λ(φ21 + φ22 − v 2 )2 = 41 λ(|φ|2 − v 2 )2 . The fields φ1 and φ2 are massless (the coefficients of the quadratic terms are negative) and the theory is invariant under rotations in the plane, φ′1 φ′2 = cos θ − sin θ sin θ cos θ φ1 φ2 . Interactions fondamentales 135 Figure 9.1 The “Mexican hat potential” (from E.A. Paschos, Electroweak theory, Cambridge University Press, Cambridge 2007. The minima of the potential lie on the circle |φ0 |2 = φ210 + φ220 = v 2 . As a result of the continuous symmetry, they are infinitely degenerate. In order to analyze the field fluctuations around the minimum, we choose a particular vacuum state φ10 = v, φ20 = 0 and denote the fluctuations by φ1 = v + h1 , φ2 = h2 in terms of which the potential becomes V (h1 , h2 ) = 14 λ(h21 + h22 + 2vh1 )2 . Expansion of this potential shows that h1 becomes massive while h2 remains massless, and the appearance of cubic terms breaks the original SO(2) symmetry. The massless field is called a Goldstone mode (or Nambu-Goldstone mode). It is easy to understand why h2 remains massless while h1 acquired a mass: close to the minimum which we have selected, φ1 fluctuations have to survive to the potential growth, these are amplitude fluctuations in a polar representation of the model, while φ2 fluctuations correspond to phase fluctuations which do not cost any energy. Spontaneous breaking of local symmetries A new phenomenon occurs with local gauge theories, where the selection of a particular minimum and the fluctuations around this minimum lead to massive gauge fields which would otherwise be forbidden, since mass terms for the gauge field would break gauge invariance. At the same time, the Goldstone mode disappears. We consider the Lagrangian density of U (1) gauge theory, L = − 41 Fµν F µν + (Dµ φ)∗ (D µ φ) − V (φ∗ φ), with the potential V (φ∗ φ) = −µ2 φ∗ φ + λ(φ∗ φ)2 . 136 Mis à jour le 14 Décembre 2012 As we have seen before, the theory is invariant under the gauge transformation corresponding to a local rotation of the scalar field in the complex plane φ(x) → eieα(x) φ(x) Aµ (x) → Aµ (x) − ∂µ α(x). Let us define two real fields θ(x) and h(x), associated to the phase and the amplitude fluctuations around a particular (chosen real) minimum √12 v = (µ2 /2λ)1/2 , 1 φ(x) = eiθ(x)/v √ (v + h(x)). 2 The local gauge transformation defined by eα(x) = −θ(x)/v eliminates θ(x), since 1 φ′ (x) = e−iθ(x)/v φ(x) = √ (v + h(x)), 2 1 A′µ (x) = Aµ (x) + ∂µ θ(x). ev The net effect in the Lagrangian density is the following, ′ F′ L = − 14 Fµν µν µ + (D ′ µ φ′ )∗ (D ′ φ′ ) + 12 µ2 (v + h2 (x))2 − 14 λ(v + h(x))4 , with D ′ µ = ∂µ + ieA′µ . When rewritten in terms of the transformed gauge field, the kinetic energy term generates the mass for the gauge field A′µ : µ µ (D ′ µ φ′ )∗ (D ′ φ′ ) = 12 ∂µ h∂ µ h + 12 e2 A′µ A′ (v 2 + 2hv + h2 ), and, as we announced, the Goldstone mode θ(x) was absorbed in the re-definition of the gauge field. This mechanism is not at work in the case of the free electromagnetic field (photons are massless gauge bosons of U (1) interaction), but it is known in condensed matter physics as the Anderson mechanism (see next section), and it occurs in superconductivity, where the non-zero mass (which also defines a characteristic length scale) of the gauge field is responsible for the Meissner effect (the fact that the magnetic field is expelled from the bulk of the material). In particle physics, this mechanism enables to give a mass to the gauge bosons, as we discuss below. This is known in this context as the Higgs mechanism. The Anderson mechanism We will first reproduce all the generic arguments given before in the relativistic U (1) case before considering the application to superconductivity. ⊲ Gauge invariance in non relativistic quantum mechanics. Since we are interested in this section by non relativistic quantum mechanics, we will not distinguish between contravariant and covariant indices, i.e. xi = x, y, z and ∂ ∂i = ∂x . Summation is understood as soon as an index is repeated in an expression. i The space part of an expression like ∂µ ψ ∗ ∂ µ ψ will thus simply be denoted as ~ 2 ψ. Due to this non-covariant notation, ∂i ψ ∗ ∂ i ψ = −∂i ψ ∗ ∂i ψ, and ∂i ∂i ψ stands for ∇ Interactions fondamentales 137 there are other minus signs here and there, for instance in the definition of the field tensor Fij = −(∂i Aj − ∂j Ai ). The Lagrangian density for non relativistic quantum mechanics is given by an expression due to Jordan and Wigner (here written in a symmetric form) L0 = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) − h̄2 ∂ ψ ∗ ∂i ψ − V ψ ∗ ψ. 2m i The Euler-Lagrange equation (variation with respect to ψ ∗ ) indeed leads the Schrödinger equation, ∂L0 = 21 ih̄ψ̇ − V ψ, ∂ψ ∗ ∂L0 = − 12 ih̄ψ̇, ∂t ∗ ∂ ψ̇ h̄2 ∂L0 = − ∂ ∂ ψ. ∂i ∂(∂i ψ ∗ ) 2m i i and we have ih̄ψ̇ = − h̄2 ∂ ∂ ψ + V ψ. 2m i i Once we have noticed that the Lagrangian density is a function of ψ, ψ̇, and ∂i ψ (as well as their complex conjugates), its variation under an infinitesimal global gauge transformation δψ = h̄i eαψ leads to ∂L0 ∂L0 i ∂L ∂L0 ∗ ∗ + ψ ∂t + ∂i ψ ∗ δL0 = − eα ψ ∂i + ψ̇ ∗ 0 h̄ ∂(∂i ψ ∗ ) ∂(∂t ψ ∗ ) ∂(∂i ψ ∗ ) ∂ ψ̇ ∗ − (ψ ∗ ←→ ψ) = −α[∂i ji + ∂t ρ], (use has been made of the equations of motion) where eh̄ (ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) , 2mi ρ = eψ ∗ ψ. ji = Notice that this continuity equation is usually written in the standard form ~ ~j + ∂ρ = 0. ∇ ∂t In the presence of an electromagnetic field (relativistic in essence), we use the minimal coupling D i = ∂i + i eA h̄ i 138 Mis à jour le 14 Décembre 2012 and we add the field Lagrangian contribution (for further purpose, we will only consider the magnetic contribution and only in a static situation, i.e. − 14 Fij Fij ) (Fij = −(∂i Aj − ∂j Ai )), L = 12 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) − h̄2 (D ψ)∗ (Di ψ) − V ψ ∗ ψ − 14 Fij Fij . 2m i The gauge field Ai is changed by a local gauge transformation, i ψ ′ (x) = ψ(x)e h̄ eα(x) , A′i (x) = Ai (x) − ∂i α(x), but the field tensor Fij is unaffected. The equations of motion in the presence of the gauge field are modified (105) , ∂i e2 eh̄ ∗ ∂L [ψ (∂j ψ) − (∂j ψ ∗ )ψ] − Aj ψ ∗ ψ, = ∂Aj 2mi m ! ∂ ∂L 1 (F F ) = − ∂i ∂(∂i Aj ) 4 ∂(∂i Aj ) kl kl = ∂i Fij , leading to Maxwell equations ∂i Fij = Jj , where the current density is also recovered from the expression Ji = = eh̄ (ψ ∗ (Di ψ) − (Di ψ)∗ ψ) 2mi eh̄ e2 (ψ ∗ (∂i ψ) − (∂i ψ ∗ )ψ) − Ai ψ ∗ ψ. 2mi m The Schrödinger equation follows from the variation w.r.t. ψ ∗ , h̄2 i e2 ∂L 1 = 2 ih̄ψ̇ − V ψ − eA ∂ ψ + 2 Ai Ai ψ , ∂ψ ∗ 2m h̄ i i h̄ ∂L0 = − 12 ih̄ψ̇, ∂t ∂ ψ̇ ∗ h̄2 i ∂L0 =− ∂i ∂i ψ − e∂i Ai ψ . ∂i ∂(∂i ψ ∗ ) 2m h̄ (105) Note here a modification in the usual signs. Interactions fondamentales 139 Collecting the different terms, we get ih̄ψ̇ = V ψ + 1 [−ih̄∂i − eAi ][−ih̄∂i − eAi ]ψ 2m provided that the Coulomb gauge ∂i Ai = 0 is chosen. ⊲ Gauge symmetry breaking. We will now suppose that the gauge symmetry is spontaneously broken, i.e. the uniform ground state wave function which minimizes the potential energy is allowed to amplitude and phase fluctuation (for convenience, the phase fluctuations are removed by a local gauge transformation) and the amplitude fluctuations couple to the gauge field in such a way that the gauge field becomes massive. The initial Lagrangian density L = 21 ih̄(ψ ∗ ψ̇ − ψ̇ ∗ ψ) − h̄2 (D ψ)∗ (Di ψ) − V (ψ ∗ ψ) − 14 Fij Fij 2m i is gauge invariant. The potential energy has a minimum |ψ0 | (e.g. in the p following µ2 /2λ) calculations V (ψ ∗ ψ) = −µ2 ψ ∗ ψ + λ(ψ ∗ ψ)2 has a minimum at |ψ0 | = which can be chosen real positive ψ0 . We now allow for local amplitude and phase fluctuations around this minimum, ψ(x) = (ψ0 + h(x))eiθ(x) , with h(x) and θ(x) two real functions (and h(x) small w.r.t. ψ0 ). A convenient gauge transformation i ψ ′ (x) = ψ(x)e h̄ eα(x) , e α(x) = −θ(x) h̄ makes the analysis simpler, since it eliminates the phase fluctuations, ψ ′ (x) = ψ0 + h(x) and also changes the gauge field A′i (x) = Ai (x) + h̄ ∂ θ(x). e i The Lagrangian density is left unchanged by the gauge transformation, but written in terms of the gauged variables it reads ∗ ∗ L = 12 ih̄(ψ ′ ψ̇ ′ − ψ̇ ′ ψ ′ ) − h̄2 ∗ (D ′ ψ ′ )∗ (Di′ ψ ′ ) − V (ψ ′ ψ ′ ) − 41 Fij′ Fij′ . 2m i The first term is identically zero, the second term once expanded leads to e2 ′ ′ h̄2 2 ∂i h∂i h + 2 Ai Ai (ψ0 + h) , − 2m h̄ the third term to − µ2 (ψ0 + h)2 + λ(ψ0 + h)4 140 Mis à jour le 14 Décembre 2012 (or any other form depending on the potential), and the last gauge invariant term − 14 Fij′ Fij′ has the usual form for the field kinetic energy, but here given in terms of the gauged vector potential. The essential novelty stands in the second term where an extra dependence of the gauge field occurs, ∼ ψ0 A2i , coupled to the ground state expectation value. This is a mass term which is also denoted as 1 2 2 mA = e2 2 ψ0 . h̄2 Variation of L w.r.t. h(x) leads to the equation of motion known as the GinzburgLandau equation in the context of superconductivity, ∂L ∂L = ∂i , ∂h(x) ∂(∂i h(x)) h̄2 e2 ′ 2 Ai (x)(ψ0 + h(x)) + 2µ2 (ψ0 + h(x)) − 4λ(ψ0 + h(x))2 = ∂i ∂i h(x). m m This equation contains information about the Cooper pair wave function ψ0 + h(x) and it involves a characteristic length scale known as the coherence length, ξ −2 = 2mµ2 . h̄2 The coherence length ξ is for example a measure of the length scale needed to attain the condensate wave function in the bulk of a superconductor from a free surface. Variation of L w.r.t. the gauge field leads to ∂L ∂L = ∂i , ∂A′j (x) ∂(∂i A′j (x)) − e2 ′ A (x)(ψ0 + h(x))2 = ∂i Fij′ . m i The l.h.s. corresponds to the London current density Jj (proportional to the gauge field instead of the usual Ohm law Jj = σEj in a normal metal). This equation also involves a typical length scale κ inversely proportional to the Cooper pair wave function, κ−2 = e2 2 ψ . m 0 This parameter gives an information about the length scale needed to expel the gauge field from the bulk of a superconductor, a phenomenon known as the Meissner effect. h̄2 It is completely governed by the gauge field mass, κ−2 = 2m m2A . The phenomenology of type I and type II superconductors is essentially described in terms of the two length scales ξ and κ. If κ ≪ ξ, the magnetic field does not Interactions fondamentales 141 penetrate at all in the bulk of a superconductor (type I), while in the other limit, there exist regions of normal phase with non zero magnetic field (Abrikosov vortices) inside superconducting regions (mixed phase of type II superconductors). Gauge symmetric electroweak SU (2)W × U (1)Y theory The electroweak symmetry breaking scenario (106) discovered by Salam and Weinberg describes the emergence of the present structure of electromagnetic and weak interactions as the broken gauge symmetry phase of a symmetric (unbroken) phase SU (2)W × U (1)Y which existed in earlier times (higher energy scales) of the Universe. With the spontaneous symmetry breaking scenario, some of the bosonic degrees of freedom (the gauge fields) acquire mass. In the symmetric phase, the relevant (non massive) fermionic particles (the electron and the neutrino) consist in a right-handed (107) electron R = eR in an (weak) isospin singlet IW = 0 and an isospin doublet IW = 21 made of the left-handed electron and the unique (leftν handed) neutrino L = e e . The bosons are all non massive. The charges carried L 3 by the leptons follow from their weak isospin component IW and their hypercharge Y, 3 + Q = IW Y . 2 The hypercharge of the doublet is thus YL = −1 and that of the singlet is YR = −2. Under the non-Abelian weak isospin gauge transformation SU (2)W , the fields change according to R −→ R, SU (2)W L −→ exp SU (2)W 1 2 igσα L, and under the Abelian U (1)Y symmetry, they become R −→ exp(−ig ′ β)R, U (1)Y L −→ exp(−ig ′ β/2)L. U (1)Y Note that the isospin coupling is g while the hypercharge coupling is conventionally called g ′ /2. SU (2)W × U (1)Y is made a local gauge symmetry through the introduction of gauge fields Wµ and Xµ with the covariant derivative Dµ L = ∂µ L + 12 igσWµ L − 12 ig ′ Xµ L, Dµ R = ∂µ R − ig ′ Xµ R, (106) See Ryder pp307-312 In the Dirac Lagrangian iψ̄γ µ ∂µ ψ − mψ̄ψ, the right-handed and left-handed spinors are defined as R = 12 (1 + γ5 )ψ and L = 21 (1 − γ5 )ψ. Since γ5 and γµ commute, it follows that iψ̄γ µ ∂µ ψ = iL̄γ µ ∂µ L + iR̄γ µ ∂µ R. (107) 142 Mis à jour le 14 Décembre 2012 where Wµ is a weak triplet gauge (non-massive) boson IW = 1 with hypercharge zero and Xµ is also a non-massive boson which has zero hypercharge, but is in an isospin singlet IW = 0. We consider non massive fermions, otherwise a term like m2 L̄L would assign the same mass to the electron and the neutrino (108) . If we forget about the pure gauge field contributions, the kinetic part of the Lagrangian in the minimal coupling is given by Dirac Lagrangian (the leptonic particles are fermions with spin 12 ) i.e. L = iR̄γ µ ∂µ − ig ′ Xµ R + iL̄γ µ ∂µ + 12 igσWµ − 21 ig ′ Xµ L The weakness of the gauge invariant formulation is obviously that it contains 4 massless gauge fields, while Nature (at the present energy scales) has only one, and that the fermions are similarly all non massive (if the electron would have a non zero mass in this theory, the corresponding neutrino would share the same mass, since it appears as the second component of an isospin doublet). The spontaneous symmetry breaking scenario leads to 3 massive gauge fields and at the same time, the electron acquires mass as well (but not the neutrino!). The Higgs mechanism The symmetry is broken by introduction of a (bosonic) complex Higgs field + 1 θ1 + iθ2 φ φ= =√ . φ0 2 θ3 + iθ4 This is an isospin doublet IW = 1 2 with hypercharge unity Yφ = 1, Dµ φ = ∂µ + 12 igσWµ + 12 ig ′ Xµ φ, and a Lagrangian of the form LHiggs = (Dµ φ)† (D µ φ) − m2 φ† φ − λ(φ† φ)2 + interaction with leptons. The potential V (|φ|) = m2 φ† φ spontaneous symmetry breaking field, the choice θ3 = v is made other θi ’s. Fluctuations around v 1 φ(x) = √ 2 + λ(φ† φ)2 is chosen such √ that it gives rise to with |φ|2 = −m2 /2λ = v/ 2. For the classical and a local gauge transformation eliminates the are introduced through 0 v + h(x) . Acting with the covariant derivative gives 1 Dµ φ = √ 2 (108) 1 ig(Wµ1 − iWµ2 )(v + h(x)) 2 ∂µ h − 12 i(gWµ3 − g ′ Xµ )(v + h(x)) ! Particles in an isospin multiplet have approximately the same mass. This is the case for the strong isospin already, e.g. the proton and the neutron which form an isospin doublet, or the π−mesons which form an isoispin triplet. Interactions fondamentales 143 and reported in the Lagrangian density, this leads to (up to cubic terms) LHiggs = 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4 + 14 g 2 v 2 (Wµ1 W µ1 + Wµ2 W µ2 ) + 41 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ )v 2 = 21 ∂µ h∂ µ h − 12 m2 (v + h(x))2 − 41 λ(v + h(x))4 2 Wµ+ W −µ + 21 MZ2 Zµ Z µ , + MW where the charged massive vector bosons are √ Wµ± = (Wµ1 ∓ iWµ2 )/ 2 2 with masses MW = 14 g 2 v 2 and the neutral massive boson is such that µ 2 1 2 MZ Zµ Z (109) = 81 v 2 (gWµ3 − g ′ Xµ )(gW µ3 − g ′ X µ ) 2 3µ g −gg ′ 3∗ ∗ W 1 2 = 8 v (Wµ , Xµ ) Xµ −gg ′ g′ 2 3µ 2 ∗ ∗ 0 Z M 1 Z . = 2 (Zµ , Aµ ) 0 0 Aµ The last line is obtained by a diagonalization of the mass matrix by an orthogonal transformation Zµ = cos θW Wµ3 − sin θW Xµ Aµ = sin θW Wµ3 + cos θW Xµ , and the masses of the neutral fields are 2 MZ2 = 41 v 2 (g 2 + g ′ ) MA2 = 0. The coupling constant of the (charged) leptons and the electromagnetic gauge field gets the value e = g sin θW . With the symmetry breaking scenario, the coupling between the Higgs fields and the leptons of the theory (Yukawa term which forms a Lorentz scalar by the coupling between a Dirac spinor with a scalar field) in − Ge (R̄φ∗ L + L̄φR) similarly leads to massive electrons √ me = Ge v/ 2. (109) See Cheng and Li p351 See Quigg p110 (110) (110) 144 Mis à jour le 14 Décembre 2012 Interactions fondamentales L’Univers primordial 145 146 Mis à jour le 14 Décembre 2012 Interactions fondamentales et Cosmologie 147 10 L’inflation cosmologique Un certain nombre de problèmes cosmologiques sont résolus au prix de l’hypothèse que dans son histoire primordiale, l’Univers a connu une phase d’expansion extrême. Cette phase peut prendre naissance sous l’effet d’un champ scalaire ayant des propriétés bien déterminées. C’est ce que la théorie de l’inflation permet de réaliser. Introduction Nous avons vu que le modèle cosmologique standard - dont l’évolution “friedmanienne” est gouvernée par les trois formes principales d’énergie, Radiation, Cold Matter et Λ - souffre de certaines difficultés. Parmi ces difficultés, celles qui sont liées à la nature très particulière des conditions initiales, ou celles qui sont liées aux problèmes de dilution d’objets ultramassifs peuvent être résolues grâce à un scénario ingénieux, a priori artificiel, mais qui en fait est extrêmement générique. Ce scénario est celui de l’inflation. Avant d’en présenter les grandes lignes, revenons rapidement sur ces problèmes de conditions initiales. Le problème de l’horizon peut être vu comme un problème de conditions initiales relatives aux positions(111) . L’univers observable actuellement, d’une taille de l’ordre de ct0 , est homogène à mieux que 10−5 près en valeur relative. A un instant antérieur t< dans l’histoire de l’Univers, cet Univers homogène avait une extension spatiale dans un rapport a(t< )/a0 , soit lh ≃ ct0 a(t< )/a0 . Or, à cet instant antérieur, la taille de la région causale était de l’ordre de lc ≃ ct< . En supposant pour simplifier que le passé de l’Univers est essentiellement dominé par le rayonnement, le facteur d’échelle varie comme l’inverse de la température, a ∼ T −1 (car a ∼ ρ−1/4 et ρc2 ∼ T 4 ), de sorte que le rapport de ces deux longueurs vaut (111) V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press. 148 Mis à jour le 14 Décembre 2012 lh /lc ≃ t T 1017 1 t0 a(t< ) ∼ 0 0 ≃ −43 32 ≃ 1028 t < a0 t < T< 10 10 en prenant pour instant antérieur l’échelle de Planck. Il n’est pas crucial de fixer cette échelle. On pourrait par exemple choisir celle de la brisure de symétrie électrofaible, le nombre obtenu serait moins gigantesque, mais serait tout de même démesuré. Si l’on interprète ce résultat, cela signifie que notre Univers homogène actuel est le résultat de l’évolution friedmanienne d’une ‘bulle’ initiale composée typiquement de 1084 domaines non connectés causalement ! Dans ces conditions, l’homogénéité (c’est-à-dire le fait que la température actuelle du CMB soit partout de l’ordre de 3 kelvins à des fluctuations près de l’ordre de 10−5 en valeur relative) est difficile à comprendre autrement que par un jeu de conditions initiales très particulier. Il faut ensuite trouver un mécanisme conduisant de façon plus ou moins inévitable à ces conditions initiales. Pour ce qui concerne les conditions initiales sur la distribution des vitesses, on peut faire une estimation grâce au raisonnement suivant : l’énergie mécanique totale (d’un élément de covolume) est conservée, soit KE< + V< = KE0 + V0 . Or, les énergies cinétiques sont dans le rapport des vitesses d’expansion au carré, KE< /KE0 ∼ (ȧ< /ȧ0 )2 , de sorte que l’on peut écrire, en divisant par KE< , |V | KE0 − V0 |V | 1− < = =1− 0 KE< KE< KE0 ȧ0 ȧ< 2 . Les rapports de vitesses d’expansion sont de l’ordre de ȧ0 /ȧ< ≃ (a0 /a< )(t< /t0 ) ≃ 1032 10−43 /1017 = 10−28 , soit 1− |V< | |V | = 1 − 0 10−56 KE< KE0 et à l’époque actuelle, l’Univers est plat avec une très bonne approximation, ce qui signifie que KE0 et |V0 | sont du même ordre de grandeur. Il faut donc que KE< et |V< | aient été gigantesques, mais égaux à mieux que 56 décimales au temps de Planck pour expliquer leurs valeurs prises aujourd’hui ! Ce problème est lié à celui de la platitude. Ces deux problèmes seraient résolus si l’on pouvait invoquer un mécanisme qui conduise de manière typique à ces conditions initiales apparemment si particulières. Il faut pour cela que le facteur d’échelle actuel de l’Univers soit considérablement plus grand (le rapport lh /lc serait alors plus petit d’autant), au moins d’un facteur 1032 , et de même, il faut que la vitesse d’expansion actuelle soit considérablement plus élevée dans un rapport approximativement du même ordre. L’inflation est une phase d’expansion exponentielle du facteur d’échelle. Pour obtenir cette phase, considérons un champ scalaire φ (appelé l’inflaton) dont nous allons chercher les équations du mouvement. On veut produire une phase de l’Univers dans laquelle ä(t) > 0, ce qui nécessite ρφ c2 + 3pφ < 0, soit 1 pφ = wφ ρφ c2 < − ρφ c2 . 3 Bien que l’on cherche des effets similaires à ceux produits par la constante cosmologique (wΛ = −1), celle-ci ne peut pas convenir car au début de l’Univers, sa Interactions fondamentales et Cosmologie 149 contribution à la dynamique est parfaitement négligeable (ΩR ≫ ΩM ≫ ΩΛ ). Un champ scalaire en revanche peut jouer le rôle voulu, car comme on va le voir, ρφ c2 ≃ pφ ≃ h̄2 2 φ̇ + V (φ), 2c2 h̄2 2 φ̇ − V (φ), 2c2 de sorte que l’on peut espérer trouver des conditions qui permettent d’atteindre wφ ≃ −1 pour peu que le potentiel ait des propriétés convenables. Dans un espace-temps de Minkowski, l’équation de mouvement d’un champ scalaire réel (non chargé) libre s’écrit (Klein-Gordon) m2 c2 ∂µ ∂ + 2 h̄ µ φ = 0. Le d’Alembertien, ∂µ ∂ µ φ, que l’on peut aussi écrire η µν φ,µν , devient, dans un espacetemps courbe de métrique définie par g µν , g µν φ,µν − Γαµν φ,α . C’est une forme de couplage minimal du champ scalaire à la métrique(112) , de sorte que l’équation de Klein-Gordon devient g µν φ,µν − Γαµν φ,α + m2 c2 φ = 0. h̄2 En appliquant ces équations (auxquelles on ajoute un terme d’énergie potentielle 2 2 V (φ) plus général que le simple terme de masse 21 mh̄2c φ2 et dont on précisera les propriétés ultérieurement) au cas de la métrique de Friedmann-Robertson-Walker, la première équation de Friedmann devient celle d’un oscillateur harmonique amorti par l’expansion de l’Univers : h̄2 h̄2 ȧ φ̈ + 3 φ̇ + V ′ (φ) = 0 c2 ac2 Dans la suite nous allons établir cette équation d’une autre manière, et établir également les équations de Friedmann. 1 σρ (gµρ,ν +gνρ,µ −gµν,ρ ) Rappels sur la dérivée covariante : les symboles de Christoffel Γσ µν = 2 g permettent de généraliser la dérivée ordinaire ∂κ à la dérivée covariante Dκ . Appliquée à un champ α de vecteurs, on a ∂κ Aµ ≡ Aµ,κ et Dκ Aµ ≡ Aµ;κ = Aµ,κ − Γα µκ Aα = ∂κ Aµ − Γµκ Aα . Dans le cas d’un tenseur de rang 2, on forme par exemple la combinaison (Aµ Bν ) dont on calcule la dérivée covariante en distribuant les opérations de dérivation, (Aµ Bν );κ = (Dκ Aµ )Bν + Aµ (Dκ Bν ) = α α α (Aµ,κ − Γα µκ Aα )Bν + Aµ (Bν,κ − Γνκ Bα ) = (Aµ Bν ),κ − Γµκ (Aα Bν ) − Γνκ (Aµ Bα ), soit finalement α α Tµν;κ = Tµν,κ − Γµκ Tαν − Γνκ Tµα . En généralisant, la dérivée covariante d’un tenseur de rang n fait apparaı̂tre la dérivée ordinaire suivie d’un symbole de Christoffel pour chacun des n indices. En particulier pour un champ scalaire on a Dκ φ = ∂κ φ. Dans le cas présent, φ;µν = Dµ Dν φ = α Dµ φ,ν − Γα νµ φ,α = φ,µν − Γνµ φ,α , donc un seul Christoffel. (112) 150 Mis à jour le 14 Décembre 2012 Le tenseur énergie-impulsion de l’inflaton et les équations de Friedmann associées En présence du champ φ, l’action du champ gravitationnel libre et du champ scalaire s’écrit avec une composante SEH [g µν ] pour la géométrie et Smat [g µν , φ] pour la matière S[g µν , φ] = SEH [g µν ] + Smat [g µν , φ] Z Z √ c4 4 √ =− d x −gR + d4 x −gLmat 16πG où le lagrangien de matière est donné par Lmat = 21 h̄2 ∂µ φ ∂ µ φ − 12 m2 c2 φ2 = 21 h̄2 g µν ∂µ φ ∂ν φ − V (φ) où l’on a généralisé à un potentiel quelconque (113) . La variation δS[g µν , φ] =0 δg µν donne les équations d’Einstein alors que la variation δS[g µν , φ] =0 δφ conduit à l’équation de mouvement de l’inflaton. Par définition (c’est-à-dire pour retrouver Tµν au second membre des équations d’Einstein), la variation de l’action de matière définit le tenseur énergie-impulsion associé, Z Z µν √ √ δ 4 1 −gLmat δg ≡ 2 δSmat = d x µν d4 x −gTµν δg µν , δg d’où l’on déduit Tµν = 2(−g)−1/2 √ δL δ −gLmat = 2 mat − gµν Lmat . µν δg δg µν √ En effectuant le calcul de manière explicite, et en utilisant l’identité δ −g = √ − 21 −ggµν δg µν , on obtient Tµν = 2 δ 1 2 κλ h̄ g ∂ φ ∂ φ − gµν 12 h̄2 g κλ ∂κ φ ∂λ φ + gµν V (φ) κ λ δg µν 2 = h̄2 ∂µ φ ∂ν φ − 21 h̄2 gµν ∂κ φ ∂ κ φ + gµν V (φ) = h̄2 ∂µ φ ∂ν φ − 12 gµν [h̄2 ∂κ φ ∂ κ φ − 2V (φ)] (113) On note que s’agissant d’un champ scalaire, Lmat (φ, Dµ φ) = Lmat (φ, ∂µ φ). Interactions fondamentales et Cosmologie 151 On peut également noter que la définition usuelle Tµν = ∂L φ − gµν L ∂φ,µ ,ν qui découle d’une variation par rapport à φ plutôt que par rapport à la métrique, donne le même résultat (114) . Dans la métrique FRW, où 2 2 2 2 ds = c dt − a (t) dσ 2 2 2 + σ dΩ , 1 − kσ 2 on pose dxµ = (cdt, dσ, dθ, dϕ) et σ = r/a(t), soit g00 = 1, g11 = − a2 , 1 − kσ 2 g22 = −a2 σ 2 , g33 = −a2 σ 2 sin2 θ et g µµ = 1/gµµ . On a également ∂µ = (c−1 ∂t , ∂σ , ∂θ , ∂ϕ ), de sorte que ∂κ φ ∂ κ φ = g κλ ∂κ φ ∂λ φ = g 00 (∂0 φ)2 + g 11 (∂σ φ)2 + g 22 (∂θ φ)2 + g 33 (∂ϕ φ)2 = (∂0 φ)2 − 1 − kσ 2 1 1 (∂σ φ)2 − 2 2 (∂θ φ)2 − 2 2 2 (∂ϕ φ)2 . 2 a a σ a σ sin θ Le tenseur énergie-impulsion devient finalement h h̄2 2 2 1 − kσ 2 (∂ φ) − h̄ (∂σ φ)2 t c2 a2 i 1 1 − h̄2 2 2 (∂θ φ)2 − h̄2 2 2 2 (∂ϕ φ)2 − 2V (φ) . a σ a σ sin θ Tµν = h̄2 ∂µ φ ∂ν φ − 12 gµν Dans le cas d’un problème à symétrie sphérique, les dérivées du champ par rapport à θ et à ϕ n’interviennent pas et cette expression se simplifie pour la partie diagonale en Tµµ = h̄2 ∂µ φ ∂µ φ − 12 gµµ h̄2 h1 (φ̇)2 − c2 i 1 − kσ 2 −2 2 (∂ φ) − 2h̄ V (φ) . σ a2 En rappelant que le tenseur énergie-impulsion admet également la forme hydrodynamique habituelle Tµν = (ρ + p/c2 )vµ vν − pgµν , (114) On note bien le facteur 2 dans ∂L ∂φ,µ = 1 2 h̄ 2φ,µ . 2 152 Mis à jour le 14 Décembre 2012 on peut calculer la densité d’énergie et la pression associées au champ scalaire φ au repos dans le référentiel comobile (vµ = (c, ~0)). h i 1 − kσ 2 2 T00 = ρφ c2 = 12 h̄2 (∂0 φ)2 + + V (φ), (∂ φ) σ a2 T11 = pφ a2 a2 a2 2 2 1 2 1 2 = h̄ (∂ φ) + h̄ (∂ φ) − V (φ). σ 2 2 1 − kσ 2 1 − kσ 2 0 1 − kσ 2 On peut alors écrire les équations de Friedmann en négligeant toute autre forme de matière-énergie que celle associée au champ scalaire φ. On considère en général le cas d’un champ spatialement uniforme, de sorte qu’il ne reste que la dépendance temporelle et le terme d’énergie potentielle V (φ), G00 = 3k 8πG 3ȧ2 + 2 = 4 a2 c2 a c G11 = − 2 1 2 2 h̄ (∂0 φ) 8πG k + 2aä/c2 + ȧ2 /c2 = 4 1 − kσ 2 c + V (φ) , 1 2 2 h̄ 1 a2 a2 (∂0 φ)2 − V (φ) . 2 2 − kσ 1 − kσ Equation de mouvement de l’inflaton L’action de matière dépend évidemment du champ φ de sorte que l’on peut effectuer une variation par rapport à ce champ. En reprenant l’expression de Lmat dans le référentiel comobile et en supposant la symétrie sphérique, on a √ −gLmat = 21 h̄2 √ a3 σ 2 a3 σ 2 1 − kσ 2 2 √ (∂ φ) − (∂0 φ)2 − V (φ) σ a2 1 − kσ 2 1 − kσ 2 de sorte que la variation de Smat [g µν , φ] par rapport à φ conduit à √ ∂ δSmat ∂ √ = ( −gLmat ) − ∂µ ( −gLmat ) = 0 δφ ∂φ ∂(∂µ φ) ou encore, sous une forme plus “symétrique”, √ 1 ∂ ∂ (Lmat ) − √ ∂µ ( −gLmat ) = 0. ∂φ −g ∂(∂µ φ) En effectuant le calcul, on trouve a3 σ 2 dV ∂ √ ( −gLmat ) = − √ , ∂φ 1 − kσ 2 dφ √ ∂ h̄2 σ 2 ( −gLmat ) = − √ (3a2 ȧφ̇ + a3 φ̈), 2 2 ∂(∂0 φ) c 1 − kσ p √ ∂ −∂σ ( −gLmat ) = h̄2 σ 2 1 − kσ 2 a(∂σ φ)2 ∂(∂σ φ) p + h̄2 ∂σ (σ 2 1 − kσ 2 )a∂σ φ, −∂0 Interactions fondamentales et Cosmologie 153 d’où l’équation de Lagrange 3h̄2 h̄2 1 H φ̇ + φ̈ − h̄2 (1 − kσ 2 ) 2 ∂σ2 φ = 0 2 2 c c a V ′ (φ) + que l’on simplifie dans le cas d’un champ φ spatialement uniforme (∂σ φ = 0), 3h̄2 h̄2 H φ̇ + φ̈ = 0. c2 c2 V ′ (φ) + Cette équation peut aussi se retrouver à partir des expressions de ρφ et de pφ injectées dans l’équation de continuité, ρ̇φ c2 + 3(ρφ c2 + pφ ) ȧ =0 a en prenant garde au terme V̇ (φ) = V ′ (φ)φ̇. De ce fait, elle n’est pas une équation indépendante des deux premières. La phase de de Sitter Les équations de Friedmann et de Raychaudhuri, et l’équation de mouvement de l’inflaton dans le cas d’un champ scalaire réel uniforme s’écrivent donc H2 + kc2 8πG h̄2 2 1 = φ̇ + 2 V (φ) , 2 2 2 a 3c 2c kc2 + 2Ḣa2 + 3ȧ2 = − V ′ (φ) + 4πG h̄2 2 φ̇ − V (φ) 2 2 c c 3h̄2 h̄2 H φ̇ + φ̈ = 0 c2 c2 et sont aussi associées à une densité et une pression de la forme ρφ c2 = h̄2 2 φ̇ + V (φ), 2c2 pφ = h̄2 2 φ̇ − V (φ). 2c2 La seconde équation (de Raychaudhuri) n’est généralement pas discutée (les trois équations étant liées, il est plus simple de raisonner sur la première et la troisième). Il s’agit maintenant de contraindre le potentiel pour espérer produire la phase d’inflation. On fait généralement l’approximation du roulement lent qui permet de trouver une limite où l’équation d’état se réduise à wφ = −1, ce qui conduit à une phase de de Sitter : φ̈ ≪ 3H φ̇, et φ̇2 ≪ c2 V (φ). h̄2 154 Mis à jour le 14 Décembre 2012 La seconde condition (énergie cinétique faible devant le potentiel, condition déjà imposée pour que wφ ≃ −1) suppose un potentiel variant très lentement. Une forme possible est celle d’un potentiel en φ4 juste au-dessous de la température de transition, lorsque le terme quadratique est très légèrement négatif. Figure 10.1 L’approximation du roulement lent. Dans les conditions du roulement lent, le potentiel varie très peu et T00 ≃ V (φ) peut être approximé par sa valeur au temps de Planck (nous sommes dans les phases primordiales de l’Univers), T00 ≃ 12 V (φPl. ) ≃ ρPl. c2 = c7 . h̄G2 L’analyse dimensionnelle permet en effet de former à partir des constantes G, h̄ et c, des quantités homogènes respectivement à une masse, MPl. = (h̄c/G)1/2 ≃ 2.2 10−8 kg, à un temps, TPl. = (Gh̄/c5 )1/2 ≃ 5.4 10−44 s et à une longueur, LPl. = (Gh̄/c3 )1/2 ≃ 1.6 10−35 m. La densité lagrangienne ayant pour dimensions celles du −2 c7 potentiel, [L] = ML−1 T−2 , on obtient en effet LPl. ≃ V (φPl. ) ≃ MPl. L−1 Pl. TPl. = h̄G2 . Les dimensions du champ se déduisent de celles du lagrangien et sont données par c2 . [φ] = M−1/2 T−3/2 = G1/2 h̄ 5 4πc L’équation de Friedmann donne dans ces conditions H 2 = 4πG 3c2 V (φPl. ) = 3Gh̄ où l’on a négligé √ le terme en kc2 /a2 en raison de la croissance rapide de a, et il vient −1 H ≃ HPl. = 4π3TPl. . Cela conduit bien à une phase de de Sitter d’expansion exponentielle du facteur d’échelle, car HPl. = const. = (1/a)da/dt admet pour solution a(t) = aPl. exp(HPl. t). Interactions fondamentales et Cosmologie 155 Figure 10.2 Comparaison entre un scenario ordinaire et un scenario avec phase d’inflation. On ajuste les paramètres tf et ti de début et de fin de la phase d’inflation pour 156 Mis à jour le 14 Décembre 2012 rendre compte de la valeur d’homogénéité du CMB observée aujourd’hui. Les conditions du roulement lent permettent l’établissement d’une période d’inflation, mais pour que celle-ci se termine, il faut que le champ évolue vers un puits de potentiel où il puisse acquérir une énergie cinétique de l’ordre de l’énergie potentielle, modifiant l’équation d’état associée qui redevient analogue à celle de la matière ordinaire (permettant à la gravitation de redevenir attractive). L’expansion reprend ainsi une forme en loi de puissance telle que celle que l’on connaı̂t aujourd’hui. Solutions à certains problèmes cosmologiques Le problème de la platitude est automatiquement résolu, car pendant l’inflation, Ω(t) − 1 = a2kH 2 ∼ e−2HPl. t peut avoir été aussi petit qu’on le souhaite. Pour être compatible avec les valeurs observées aujourd’hui, l’inflation doit avoir provoqué une croissance du facteur d’échelle telle que a(tf ) ∼ e100 = 1043 . a(ti ) Cette phase a également produit une dilution extrême qui résoud du même coup le problème des reliques massives. Le problème de l’horizon et celui des grandes structures finalement sont résolus également. La figure ci-dessous illustre la résolution du problème de l’horizon. Figure 10.3 Solution au problème de l’horizon par la phase d’inflation. Les scenarios-type Il existe de nombreux scenarios conduisant à une phase d’inflation. On peut les regrouper essentiellement en trois classes : les scenarios comprenant un champ scalaire couplé à un potentiel tel que ce que nous avons décrit dans ce chapitre, les scenarios à dérivées plus élevées comme les théories f (R) et les modèles de k−inflation dans lesquelles l’énergie cinétique du champ scalaire prend une forme Interactions fondamentales et Cosmologie 157 non traditionnelle (les p−théories). Les deux dernières classes conduisent de manière effective à un champ scalaire couplé à la gravitation et soumis à un potentiel. Le cas des théories f (R) est bien connu. La théorie d’Einstein est la plus simple des théories métriques de Rla gravitation. L’action du champ gravitationnel √ libre se réduit à celle d’Hilbert, d4 x −gR. C’est la seule théorie qui conduise dans l’espace-temps à 4d à des équations du mouvement du second ordre. Toute modification de cette action génère des dérivées d’ordre plus élevé, ce qui entraı̂ne qu’en plus du graviton de spin 2, la théorie contient génériquement un degré de liberté supplémentaire, un champ de spin nul, c’est-à-dire un champ scalaire. Considérons le cas de l’action Z √ 1 S = 2 d4 x −gf (R). Les équations de mouvement du champ libre deviennent ′ f ′ (R)Rµν − 12 gµν f (R) + gµν [f ′ (R)],α ,α − [f (R)];µν = 0. Si l’on applique une transformation conforme (dilatation locale) gµν −→ g̃µν = F gµν , le tenseur de Ricci se transforme également et l’on obtient les équations d’Einstein R̃µν − 12 R̃g̃µν = T̃µν avec le tenseur T̃µν associé à un champ scalaire effectif φ(x) = ln F (R) (avec F (R) = f ′ (R)) soumis à un potentiel V (φ) = (f (R) − Rf ′ (R))/[f ′ (R)]2 . Une théorie de la gravitation ayant des dérivées plus élevées que 2 est conformément équivalente à une théorie d’Einstein couplée à un champ scalaire. Les p−théories sont des théories du type Born-Infeld. S’il existe un champ décrit par l’action Z √ S = d4 x −g p(X, φ) avec X = 12 ∂µ φ ∂ µ φ où le lagrangien p joue le rôle de pression effective et où ρc2 = 2X(∂p/∂X) − p, vµ = (2X)−1 ∂µ φ dans Tµν . En jouant sur la forme de p, on peut obtenir une phase d’inflation. Ce qu’il importe de conclure dans ce chapitre, c’est qu’il existe une grande variété - ici limitée aux champs scalaires - de candidats à l’inflation, mais qui ont en commun de conduire à un même scenario générique. En l’absence de moyens de vérification observationnelle, il importe peu de savoir quel candidat a le plus de chances d’être réalisé dans notre univers. 158 Mis à jour le 14 Décembre 2012 Cosmologie 159 11 Cosmologies alternatives Motivations Le modèle cosmologique standard souffre d’un grand nombre de défauts, communément appelés les problèmes cosmologiques, comme le problème de la constante cosmologique, de la matière noire, de l’horizon, des reliques, etc. La résolution de ces problèmes passe par des théories ingénieuses, mais hautement spéculatives comme l’inflation, par l’espoir que des campagnes d’observations futures mettront en évidence de nouvelles formes de matière comme les WIMPS ou d’énergie comme la quintessence, ou pourquoi pas, par une remise en question des fondements comme la gravitation. On se propose d’ébaucher quelques pistes dans ce court chapitre polémique ! Parmi les alternatives éventuelles, il y a essentiellement deux classes de modifications : les théories alternatives de la gravitation dont il sera davantage question dans ce chapitre, ou les dynamiques modifiées par rapport au schéma communément admis (MOND pour MOdified Newtonian Dynamics, etc) (115) . Si l’on se penche sur internet, on trouve rapidement des pages proposant des théories de la gravitation alternatives (théorie scalaire de Nordström, théorie scalaire-tensorielle de Brans et Dicke, théorie conforme de Weyl, généralisations à 5 dimensions avec l’approche de Kaluza et Klein, etc). Par exemple sur Wikipedia. (115) Ces dernières sont susceptibles de résoudre l’anomalie observée dans la dépendance avec la distance au centre des vitesses radiales des étoiles dans les bras de galaxies. En effet, si l’on suppose une modification de la loi fondamentale de la dynamique faisant apparaı̂tre une accélération ~ = m~af (|~a|/a0 ) avec f (x) → x dans une limite convenable, il en résulte caractéristique a0 , F 2 2 GM/r = a /a0 = v 4 /a0 r 2 , soit v 4 = GM a0 ce qui permettrait d’expliquer le plateau observé dans les courbes de vitesse. Tout le problème consiste ensuite à donner à a0 la valeur requise, puis à explorer les autres conséquences de cette modification en souhaitant qu’elles ne contredisent pas des succès antérieurs. 160 Mis à jour le 14 Décembre 2012 Figure 11.1 Théories de la gravitation sur Wikipedia. On se propose de discuter plus en détail de ces théories relativistes de la gravitation qui offrent une alternative à la relativité générale. Les ingrédients du modèle cosmologique standard Passons rapidement en revue les éléments essentiels au modèle cosmologique standard, avant de proposer des formulations alternatives. Un tel modèle suppose - de travailler à très grande échelle, typiquement 1024 − 1026 m, - une théorie de la gravitation, c’est-à-dire essentiellement une géométrie dans les théories métriques, soit un objet tel que Gµν pour la relativité générale, - des données (sinon des hypothèses) sur le contenu matériel et énergétique de l’Univers, Tµν , - des hypothèses de symétrie qui contraignent gµν de manière à permettre d’exprimer à la fois Gµν et Tµν . Cosmologie 161 Le modèle cosmologique standard est fondé sur le principe cosmologique qui restreint la métrique à celle proposée par Friedmann, Robertson et Walker, soit avec xµ = (ct, r, θ, ϕ), dσ 2 2 2 ds2 = c2 dt2 − a2 (t) , + σ dΩ 1 − kσ 2 avec σ = r/a(t) la coordonnée comobile et a(t) le facteur d’échelle de l’Univers, k = 0, ±1 sa courbure. La théorie de la gravitation appliquée dans ce modèle est celle d’Einstein, appelée aussi relativité générale, soit 1 Gµν = Rµν − gµν Rαα 2 où le tenseur de Ricci Rµν comprend des dérivées premières et secondes de gµν . Enfin, pour ce qui concerne le contenu matériel de l’Univers, il s’agit d’un “fluide cosmique” Tµν = (ρ + p/c2 )vµ vν − pgµν avec diverses composantes obéissant à des équations d’état de la forme pw = wρc2 . Pour rendre le modèle compatible avec les mesures, on distingue essentiellement trois composantes, la matière froide pM = 0, le rayonnement pR = 31 ρc2 et la constante cosmologique pΛ = −ρΛ c2 . Avec l’ensemble de ces “ingrédients”, la dynamique de l’Univers, régie par les équations d’Einstein, 8πG 1 Rµν − gµν Rαα = 4 Tµν , 2 c conduit aux équations de Friedmann 1 ȧ2 kc2 1 4 + − Λc2 = πGρ, 2 2 2a 2a 6 3 ä ȧ2 kc2 8πG 2 + 2 + 2 − Λc2 = − 2 p. a a a c Ce qui valide l’utilisation de la relativité générale (GTR) comme théorie de la gravitation dans l’esprit du modèle cosmologique standard, c’est le schéma suivant : Tableau 11.1 L’“esprit” du modèle cosmologique standard. Théorie Gravité newtonienne ~∇2 φ(~ r) = ρ(~ r) ⇑ GTR Gµν = κTµν Solution −→ −→ Potentiel newtonien φ(~ r ) = − const. |~ r| ⇑ Métrique de Schwarzschild gµν φ = solution newtonienne + corrections 162 Mis à jour le 14 Décembre 2012 dans lequel les corrections au comportement newtonien sont faibles dans le domaine où la gravité newtonienne était efficace et sont confirmées par l’expérience (les “trois tests classiques” dans le système solaire). Ces corrections en revanche n’ont aucune raison d’être faibles dans les domaines nouvellement accessibles, tant qu’elles ne se heurtent pas à des réultats d’expérience. On effectue ensuite un inventaire des composants essentiels de l’Univers sur la base des observations accessibles, pour répertorier les diverses formes de matièreénergie. Les mesures les plus significatives dans le plan ΩΛ − ΩM conduisent à une proportion très importante de formes de matière-énergie (dite sombre) qui sont encore très mal connues à l’heure actuelle, mais dont la présence est indispensable dans le cadre du modèle cosmologique standard pour expliquer les paramètres “cinématiques” (constante de Hubble, paramètre de décélération, . . . ) observés. On arrive ainsi aux données récapitulées dans le chapitre précédent et présentées dans la figure suivante : Figure 11.2 Composition essentielle de l’Univers dans le plan ΩΛ − ΩM . Notons que les cosmologistes ont envisagé bien d’autres formes d’énergie. Mentionnons à côté du rayonnement (w = 1/3), de la matière (w = 0) et de la constante cosmologique (w = −1), des formes plus exotiques comme l’énergie ultralégère (ultralight, w > 1/3), les cordes cosmiques (cosmic strings, w = −1/3), les parois de domaines (domain walls, w = −2/3) ou l’énergie fantôme (phatom energy, w < −1) (116) . Théories alternatives de la gravitation (116) R.J. Nemiroff and B. Patla, Adventures in Friedmann cosmology: A detailed expansion of the cosmological Friedmann equations, Am. J. Phys. 76 265 (2008). Cosmologie 163 ⊲ Extensions “métriques” de la relativité générale. Il existe des extensions de la relativité générale qui entrent dans le cadre évoqué ici avec le tableau précédent. Rappelons que la relativité générale est fondée sur l’action d’Einstein-Hilbert (en l’absence de matière-énergie), SEH = − Z √ d4 x −g Rαα , de sorte que par variation de l’action on obtient δSEH = 0 entraı̂ne δg µν 1 Gµν ≡ Rµν − gµν Rαα = 0. 2 La relativité générale, basée sur l’action SEH , est la plus simple des théories métriques de la gravitation. De nombreuses généralisations en ont été proposées, telles que - théories f (R) S=− S=− Z Z d4 x(−g)1/2 (Rαα )2 , d4 x(−g)1/2 Rαβ Rαβ , Sf (R) = − Z d4 x(−g)1/2 f (Rαα ), - théories incluant davantage de champs, comme la théorie scalaire-tenseur de Brans et Dicke Z SBS = − d4 x(−g)1/2 (φRαα − wφ−1 φ;µ )φ;µ ), - théories incluant davantage de dimensions, comme la théorie de Kaluza et Klein ds2 = gM N dxM dxN = dw2 + gµν dxµ dxν . Toutes ces théories admettent la relativité générale comme limite. ⊲ Schéma d’un modèle cosmologique au-delà du modèle cosmologique standard. Pour envisager des théories alternatives en toute généralité, il est bon d’étendre le schéma proposé. En effet, ce schéma est trop restrictif car il est parfaitement possible qu’une théorie ne redonne jamais la théorie newtonienne (ou par extension la relativité générale) dans aucune limite, sans toutefois être exclue si les solutions de la nouvelle théorie sont susceptibles de redonner à la limite non relativiste la solution newtonienne, ou dans le contexte relativiste, la solution einsteinienne avec éventuellement des corrections nouvelles, à condition que celles-ci soient négligeables à l’échelle du système solaire où la gravitation d’Einstein a passé les tests observationnels avec succès. Le tableau initial doit donc être remplacé par un schéma analogue avec une contrainte au niveau des solutions uniquement. 164 Mis à jour le 14 Décembre 2012 Tableau 11.2 Les contraintes pour des théories alternatives de la gravitation. Théorie Solution Gravité newtonienne ~∇2 φ(~ r) = ρ(~ r) −→ Gravitation relativiste alternative Wµν = κTµν −→ Potentiel newtonien φ(~ r) = − const. |~ r| ⇑ Métrique généralisée gµν φ = solution newtonienne + corrections GTR + autres corrections Ici, Wµν est un nouvel objet à construire. Le fait que l’on retrouve les corrections de relativité générale à la limite faiblement relativiste garantit que les trois tests classiques soient satisfaits si les nouvelles corrections sont négligeables à l’échelle du système solaire. A des échelles plus importantes en revanche, on peut espérer que ces corrections puissent jouer un rôle déterminant et construire ainsi une nouvelle cosmologie ⊲ Exemples dans un contexte classique. La gravité newtonienne est régie par exemple par l’équation de Poisson, ~ 2 φ(~r) = ρ(~r). ∇ Dans le cas d’une distribution de masse à symétrie sphérique, limitée par une taille caractéristique R, le potentiel newtonien à l’extérieur de la distribution de masse s’en déduit : Z 1 R ′ ′2 ′ dr r ρ(r ) φr>R (~r) = − r 0 =− const. . r On pourrait très bien imaginer une théorie basée sur une équation locale différente, par exemple ~ 4 φ(~r) = µ(~r). ∇ Dans cette équation, µ(~r) est une quantité reliée à la densité de masse et définie de sorte que φ(~r) soit toujours le potentiel gravitationnel. Cette équation ne peut pas redonner l’équation de Poisson traditionelle, mais ses solutions dans le cas de la symétrie sphérique, de la forme 1 φr>R (~r) = − r 2 Z R 0 1 dr r µ(r ) − 6r ′ ′2 C = −C1 × r − 2 r ′ Z R 4 dr ′ r ′ µ(r ′ ) 0 admettent le potentiel newtonien comme limite à courte distance. Le premier terme, qui varie linéairement avec la distance, est susceptible de donner lieu à une nouvelle physique à grande distance. C’est le même type de démarche que l’on peut envisager dans le contexte des théories métriques et l’exemple de la théorie de Weyl fait l’objet du paragraphe suivant. Cosmologie 165 Modification de la géométrie, la théorie conforme de Weyl ⊲ L’action de Weyl. (117) Weyl a envisagé une généralisation de la relativité générale, éventuellement susceptible de décrire également l’électromagnétisme, en introduisant au-delà des changements arbitraires de coordonnées, des transformations “de jauge” locales : les transformations conformes, ou dilatations locales, gµν (x) → e2α(x) gµν (x), Aµ (x) → Aµ (x) − e∂µ α(x). L’action SEH n’étant pas invariante par ces transformations, Weyl a construit un tenseur qui reste inchangé, Cλµνκ , et une action invariante de Lorentz, Cλµνκ C λµνκ et invariante conforme, Z 1 1 α 2 4 1/2 λµνκ µν SW = − d x(−g) Rλµνκ R − 2Rµν R + (R α ) 4 3 conduisant aux équations du mouvement λµνκ W µν ≡ 2C;λ;κ − C λµνκ Rλκ = T µν . ⊲ Solution possible au problème des bras de galaxies. En l’absence de matière-énergie, Tµν = 0, et l’équation du mouvement Wµν = 0 se réduit à Rµν = 0, de sorte que l’on retrouve la solution de Schwarzschild, et par conséquent les prévisions habituelles de la relativité générale en ce qui concerne les trois tests classiques. La solution de Schwarzschild est donc bien une solution de la théorie conforme de Weyl dans une certaine limite, bien qu’il soit impossible de retrouver Gµν à partir de Wµν dans cette limite. La limite non relativiste donne en effet un intervalle ds2 = B(r)c2 dt2 − avec dr 2 + r 2 dΩ2 , B(r) ~ 4 B(~r) = ρ(~r) ∇ de sorte qu’à l’exterieur d’une distribution de masse sphérique B(r > R) = g00 = − 1 2β + γr. =1− g11 r Le potentiel gravitationnel croı̂t à grande distance, c’est-à-dire typiquement dans les régions dans lesquelles la matière sombre est habituellement introduite (les halos galactiques), voire aux distances auxquelles la constante cosmologique joue son rôle répulsif ! Les anomalies observées dans les courbes de vitesse de rotation des étoiles lontaines dans les bras des galaxies peuvent être modélisées en utilisant la gravitation conforme sans avoir recours à l’introduction de halos galactiques constitués de matière sombre. (117) P. Mannheim, astro-ph/0505266 166 Mis à jour le 14 Décembre 2012 Figure 11.3 L’anomalie des vitesses de rotation des étoiles dans les bras de galaxies. La contribution en tirets est celle de la gravittaion ordinaire, celle en pointillé (croissante) est due au terme supplémentaire dans la garvitation de Weyl. Aucune des deux contributions ne nécessite d’introduire de forme de matière autre que celle qui est visible. Cosmologie 167 ⊲ Cosmologie conforme. Supposons un modèle simple dans lequel l’Univers est composé d’une espèce non massive de fermions ψ(x) couplée de manière covariante à la gravitation, iψ̄γ µ (x)∂µ ψ → iψ̄γ µ (x)[∂µ + Γµ (x)]ψ et d’un champ scalaire de Higgs φ(x) couplé au champ de fermions ∼ hφψ̄ψ et également couplé minimalement à la gravitation, 1 ∂µ φ∂ µ φ +2m φ2 + λφ4 → φ;µ φ;µ − Rαα φ2 + λφ4 . 6 Au total, l’action prend la forme SW + SM 1 =− 4 Z d4 x(−g)−1/2 Cλµνκ (x)C λµνκ (x) 1 + φ;µ φ;µ − Rαα φ2 + λφ4 6 + iψ̄γ µ (x)[∂µ + Γµ (x)]ψ − hφψ̄ψ Dans le cas de la métrique de FRW, on montre que Cλµνκ = 0 et en introduisant le tenseur énergie-impulsion de la matière (fermionique ici) les équations du mouvement de la cosmologie conforme deviennent 1 1 Tµν = (ρ + p/c2 )vµ vν + pgµν − φ20 (Rµν − gµν R) − gµν λφ40 = 0. 6 2 Le coefficient 16 φ20 joue le rôle d’une constante de gravitation univeselle effective, gouvernée par le boson de Higgs, Geff = − 3c4 . 4πφ20 Cette constante de gravitation négative pourrait éviter l’introduction de matière noire à l’échelle cosmologique, comme la solution approchée appliquée aux bras de galaxies a déjà permis d’en faire l’économie. Le terme en φ40 joue le rôle de constante cosmologique Λ = λφ40 , et peut rendre compte pour sa part de l’accélération de l’expansion cosmologique. 168 Mis à jour le 14 Décembre 2012 Figure 11.4 Comparaison entre la comsologie standard et la cosmologie conforme pour l’affinement des données issues des SNIa. On voit à partir de ces exemples simplifiés comment la théorie de Weyl de la gravitation est susceptible d’apporter une vision différente de l’Univers, sans être obligé d’introduire des formes exotiques et non observées de matière-énergie. Il resterait cependant à vérifier que cette théorie est capable de rendre compte des faits observés sans multiplier les paramètres. C’est une question qui n’est pas tranchée à l’heure actuelle. Cosmologie 169 12 Vers la cosmologie quantique Le problème de l’origine de l’Univers est partiellement résolu moyennant l’hypothèse d’une naissance par effet tunnel. On élabore pour cela une approche quantique de la cosmologie. Formulation lagrangienne et hamiltonienne des équations de Friedmann Il s’agit de déterminer les équations de Friedmann à partir d’une formulation variationnelle, soit d’un lagrangien, puis de construire l’hamiltonien et l’impulsion associée. C’est une présentation simplifiée de l’approche de Wheeler-DeWitt. Partons des équations de Friedmann, 2 ȧ 8πG kc2 Λc2 − ρ+ 2 − = 0, a 3 a 3 2 ä 1 ȧ Λc2 4πGp kc2 + + = 0. + 2 − a 2 a 2a 2 c2 En injectant la première dans la seconde, on reformule la seconde équation comme Λc2 ä 4πGp + (ρ + 3p/c2 ) − = 0. a 3 2 La formulation de Wheeler-DeWitt est facilement appliquée en l’absence de matière et pour un Univers fermé (k = +1), soit dans ce cas 2 ȧ Λc2 kc2 = 0, + 2 − a a 3 ä Λc2 − = 0. a 2 170 Mis à jour le 14 Décembre 2012 Construisons un lagrangien dont la légitimité vient de ce qu’il permet de retrouver les équations de Friedmann comme équations du mouvement, " # 2 ȧ Λc2 kc2 3 L=a − 2 + ≡ L(a, ȧ). a a 3 On en déduit le moment conjugué au facteur d’échelle, p= ∂L = 2aȧ ∂ ȧ en notant que ∂L = ȧ2 − kc2 + Λc2 a2 , ∂a l’équation d’Euler-Lagrange donne l’équation du mouvement suivante 0 = ṗ − ∂L ∂a = 2ȧ2 + 2aä − ȧ2 + kc2 − Λc2 a2 , soit finalement l’une des équations de Friedmann, ä 1 + a 2 2 ȧ Λc2 kc2 = 0. + 2 − a 2a 2 On peut maintenant construire l’hamiltonien associé (qu’on note H pour ne pas confondre avec la constante de Hubble), H = pȧ − L ! 2 2 2 ȧ Λc kc = a3 + 2 − a a 3 ≡ 0. Il est identiquement nul en raison de la première équation de Friedmann. Exprimé en fonction de p, l’hamiltonien devient Λc2 a3 p2 + kc2 a − 4a 3 1 1 2 2 2 4 2 2 = p + 2kc a − Λc a 2a 2 3 H= = 0. Il ne faut pas confondre l’hamiltonien et l’énergie totale, proportionnelle à −k. La signification de H ne me semble d’ailleurs pas bien claire, mais par le biais de la Cosmologie 171 quantification canonique, cela conduit à chercher des fonctions propres d’énergie nulle. Quantification canonique des équations de Friedmann et équation de Wheeler-DeWitt On applique ensuite le principe de correspondance ∂ ∂t ∂ p → −ih̄ . ∂a H → ih̄ pour obtenir l’équation de Wheeler-DeWitt, h̄2 ∂ 2 ψ(a) 2 2 4 2 2 − + 2kc a − Λc a ψ(a) = 0, 2 ∂a2 3 soit une équation de Schrödinger pour un potentiel de la forme 2 2 4 2 2 V (a) = 2kc a − Λc a 3 qui présente une barrière à l’origine au travers de laquelle doit “transiter” la fonction d’onde pour parvenir à une zone classique de facteur d’échelle fini. Figure 12.1 Passage par effet tunnel à travers une barrière de potentiel (emprunté à D. Atkatz, Am. J. Phys. 62, 619 (1994). Cette approche permet d’éviter que l’Univers ne soit créé par une singularité au moment du Big Bang. Il apparaı̂t par effet tunnel avec un facteur d’échelle non nul à partir duquel l’expansion peut se développer. 172 Mis à jour le 14 Décembre 2012 Cosmologie Bibliographie 173 174 Mis à jour le 14 Décembre 2012 175 Eléments de bibliographie Incontournables... L.D. Landau et E. Lifshitz, Théorie des champs, 3ème édition, Editions MIR, Moscou 1970. Texte de référence, la relativité restreinte y est présentée dans les chapitres 1 à 4 et 8 (pour le rayonnement des charges accélérées), la relativité générale dans les chapitres 10 à 12. Edward W. Kolb et Michael S. Turner , The early universe, Addison-Wesley, Redwood City, 1990. C’est le texte de référence par excellence en cosmologie. John A. Peacock, Cosmological Physics, Cambridge University Press, 1999. Plus récent que le précédent c’est aussi un classique. I.R. Kenyon, General relativity, Oxford University Press, New York 1990. Ouvrage très accessible sur la relativité générale. Mérite vraiment qu’on s’y attarde (à conserver sur sa table de nuit !). M.V. Berry, Principles of cosmology and gravitation, Institute of Physics Publishing, Bristol 1989. Passionnant ouvrage d’introduction à la relativité générale et à la cosmologie. n ouvrage très intéressant. W. Pauli, Theory of relativity, Dover, New York 1958. C’est un texte classique tout d’abord écrit à la demande de Sommerfeld par Wolfgang Pauli alors âgé de 21 ans, puis à peine repris et complété en 1955, à l’occasion du cinquantenaire des premiers articles d’Einstein sur la relativité. C’est devenu un texte de référence considéré comme très complet. A noter qu’il emploie d’abord la métrique de Minkowski avant d’introduire la distinction entre les tenseurs contravariants et covariants comme dans les premières éditions de Landau et Lifshitz. P.J.E. Peebles, Principles of Physical Cosmology Princeton University Press, Princeton 1993. S. Weinberg, Gravitation and Cosmology, Wiley, New-York 1972. Parmi les textes qui font autorité en matière de relativité générale, c’est probablement le plus célèbre, . . . C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, Freeman, San Francisco 1973. . . . avec celui-ci qui est une mine d’informations. Pour prolonger la réflexion. . . E. Harrisson, Cosmology, 2nd edition, Cambridge University Press, Cambridge 2000. Un ouvrage passionnant sur la cosmologie, de l’antiquité aux théories actuelles. Très accessible, la relativité y joue un rôle en de multiples endroits. 176 Bibliographie M. Longair, Theoretical concepts in physics, Cambridge University Press, Cambridge 2003. Auteur qui revendique et assume l’aspect théorique de la physique. P. Peter et J.P. Uzan, Cosmologie primordiale, Belin, Paris 2005. Ouvrage récent en français, remarquable et très complet, notamment en matière de données issues de mesures. Ce livre est incontestablement appelé à devenir un classique ! P.A.M. Dirac, General theory of relativity, Princeton University Press, Princeton 1996. Ouvrage d’une concision étonnante sur la relativité générale. Présentation très formelle. J.V. Narlikar, An introduction to Cosmology, Cambridge University Press, Cambridge 2002. S. Weinberg, Cosmology, Oxford University Press, 2008. L. Ryder, Introduction to General Relativity, Cambridge University Press, Cambridge 2009. Du Ryder ! V. Mukhanov, Physical foundations of Cosmology, Cambridge University Press, Cambridge 2005. M.P. Hobson; G. Efstathiou and A.N. Lasenby, General Relativity, an introduction for physicits, Cambridge University Press, Cambridge 2006. A.K. Raychaudhuri, S. Banerji and A. Banerjee, General Relativity, Astrophysics, and Cosmology Springer-Verlag, New-York 1992. Des ouvrages accessibles sur la relativité, la gravitation, la cosmologie. . . M. Lachièze-Rey, Initiation à la cosmologie, Masson, Paris 1992. Ouvrage très accessible (et en français !). Très intéressant, avec quelques prises de positions parfois assez critiques vis à vis de la communauté, malheureusement pas mal de redondances. J. Rich, Fundamentals of cosmology, Springer, Berlin 2001. La cosmologie moderne. Certaines parties sont accessibles assez facilement. A. Einstein, Œuvres choisies, Vol. 2 et 3, Seuil, CNRS Éditions, Paris 1993. Représente une somme ! Contient de nombreux textes d’Einstein et correspondances traduits en français et commentés. G.F.R. Ellis and R.M. Williams, Flat and curved space-times, 2nd edition, Oxford University Press, Oxford 2000. Dans le même esprit que Harrisson. Très agréable à parcourir. W. Rindler, Relativity, Special, general and cosmological, Oxford University Press, Oxford 2001. A. Guth et P. Steinhardt, l’Univers inflationniste in La Nouvelle Physique, ed. par P. Davies, Sciences Flammarion, Paris 1993. Bel ouvrage de vulgarisation sur les grands domaines de la physique. M. Rowan-Robinson, Cosmology, Oxford University Press, 4ème édition, Oxford 2004. Ouvrage parfaitement accessible et très à jour. 177 A. Liddle, An introduction to modern cosmology, John Wiley and Sons, Chichester 2003. Texte assez court, très facile à lire, en chapitres courts et agréablement structuré. Absolument recommendable ! T.P. Chen, Relativity, Gravitation, and Cosmology: A Basic Introduction, Oxford University Press, Oxford 2004. Encore un très bon texte récent. A. Friedmann, G. Lemaı̂tre, Essais de cosmologie, édité par J.P. Luminet, Seuil, Paris 1997. Présentation (et traduction si nécessaire) des textes fondateurs de Friedmann et de Lemaı̂tre sur la cosmologie. Des ouvrages et articles sur la théorie des champs. . . D.J. Gross, Gauge Theory-Past, Present, and Future? Chinese Journal of Physics 30 955 (1992) L.H. Ryder, Quantum field theory, Cambridge University Press, Cambridge 1985. Texte pédagogique célèbre, assez court. C. Quigg, Gauge theory of the strong, weak, and electromagnetic interactions, Westwiew Press, 1997. Des qualités comparables au Ryder. S. Weinberg, The quantum theory of fields, Vol. I and II, Cambridge University Press, Cambridge 1996. Une somme, du Weinberg! T.-P. Cheng and L.-F. Li, Gauge theory of elementary particle physics, Oxford University Press, Oxford 1984. B. Felsager, Geometry, particles and fields, Odense University Press, Gylling 1981. M. E. Peskin and D. V. Schroeder, An Introduction to Quantum Field Theory, (ABP) 1995. Devenu un classique ! Des articles pédagogiques sur des sujets ponctuels R.J. Adler, B. Casey and O.C. Jacob, Vacuum catastrophe: an elementary exposition of the cosmological constant problem, Am. J. Phys. 63, 620 (1995). D. Atkatz, Quantum cosmology for pedestrians Am. J. Phys. 62, 619 (1994). Ph. Brax, The cosmological constant problem, Contemp. Phys. 45, 227 (2004). Exposé à jour sur les problèmes suscités par la valeur de la constante cosmologique et la matière noire. C. Callan, R.H. Dicke and P.J.E. Peebles, Cosmology and newtonian mechanics, Am. J. Phys. 33, 105 (1965). C.F. Chyba, Kaluza-Klein unified field theory and apparent four-dimensional spacetime, Am. J. Phys. 53, 863 (1985). V. Faraoni, A new solution for inflation, Am. J. Phys. 69, 372 (2001). Une présentation simplifiée de la théorie de l’inflation, où un champ scalaire conduit à des effets analogues à la constante cosmologique et produit une expansion exponentielle de l’Univers. V. Faraoni, Solving for the dynamics of the universe, Am. J. Phys. 67, 732 (1999). 178 Bibliographie O. Gron, A new standard model of the universe, Eur. J. Phys. 23, 135 (2002). Une présentation assez détaillée de la dynamique du modèle de FriedmannLemaı̂tre. A. Harvey, Cosmological models, Am. J. Phys. 61, 901 (1993). A. Harvey and E. Schucking, Einstein’s mistake and the cosmological constant, Am. J. Phys. 68, 723 (2000). Le titre est explicite. Très intéressant. J.W. Norbury, From Newton’s laws to the Wheeler-DeWitt equation, Eur. J. Phys. 19, 143 (1998). Présentation détaillée de la cosmologie newtonienne, jusqu’à une introduction à la gravité quantique avec l’équation de Wheeler-DeWitt. P. Pesic and S. P. Boughn, The Weyl-Cartan theorem and the naturalness of general relativity, Eur. J. Phys. 24, 261 (2003). Le théorème de Weyl-Cartan (démontré indépendamment à la même période par ces deux auteurs) stipule que le scalaire de Ricci est le seul invariant relativiste construit à partir du tenseur métrique, de ses dérivées premières et qui dépende linéairement de ses dérivées secondes. Cela entraı̂ne que la théorie d’Einstein est la seule construite de cette manière à partir du tenseur métrique. W. Rindler, General relativity before special relativity: an unconventional overview of relativity theory, Am. J. Phys. 62, 887 (1994). B. Stefanski and D. Bedford, Vacuum gravity, Am. J. Phys. 62, 638 (1994). A.J. Schwarz and N.A. Doughty, Kaluza-Klein unification and the Fierz-Pauli weak field limit Am. J. Phys. 60, 150 (1992). N. Straumann, The mystery of the cosmic vacuum energy density and the accelerated expansion of the Universe, Eur. J. Phys. 20, 419 (1999). Présentation historique du rôle de la constante cosmologique (et des hésitations qu’elle a suscitées) et des problèmes que pose sa valeur actuelle extrêmement faible. Cours en ligne M. Le Bellac, Relativité générale pour débutants, http://cel.ccsd.cnrs.fr/cours/cel-33/cel-33.pdf Nick Kaiser, Notes de cours d’astrophysique, http://www.ifa.hawaii.edu/~kaiser/lectures/content.html Ned Wright, Astronomy 275 lecture notes, http://www.physics.ucla.edu/class/05S/275 WRIGHT/notes/index.html T. F. Jordan, Cosmology calculations almost without general relativity astro-ph/0309756 Mark Trodden, Sean M. Carroll, TASI Lectures: Introduction to Cosmology, astro-ph/0401547 Juan Garcia-Bellido, Cosmology and Astrophysics, astro-ph/0502139 Juan Garcia-Bellido, Astrophysics and Cosmology, hep-ph/0004188 Júlio César Fabris, Introduction à la cosmologie, gr-qc/0412017