Université Paris-Sud - Espace des équipes scientifiques
Transcription
Université Paris-Sud - Espace des équipes scientifiques
Université Paris-Sud L3 Physique et Applications S6 : Jan-Juin 2007 PhysA335. Initiation à la physique des solides Levitation d’un aimant au-dessus d’un supraconducteur Anuradha Jagannathan Laboratoire de Physique des Solides, Bât. 510, Université Paris-Sud, 91405 Orsay, France Table des matières Table des matières 2 Introduction 4 1 Propriétés du gaz d’électrons dans un solide 1.1 Le gaz d’électrons et la conduction électrique dans un métal . . . 1.1.1 Le modèle de Drude de la conductivité électrique . . . . . 1.1.2 D’autres prédictions du modèle classique . . . . . . . . . . 1.1.3 Problèmes du modèle classique . . . . . . . . . . . . . . . 1.2 Le gaz de fermions libres . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Le gaz d’électrons à T = 0 . . . . . . . . . . . . . . . . . 1.2.2 Le gaz d’électrons à température finie . . . . . . . . . . . 1.2.3 Les boı̂tes, fils et puits quantiques . . . . . . . . . . . . . 1.3 L’environnement cristallin et l’émergence des bandes interdites . 1.3.1 La théorie des électrons presque libres . . . . . . . . . . . 1.3.2 Conducteurs, isolants et semiconducteurs. . . . . . . . . . 1.3.3 Résultats en d=2 et 3 . . . . . . . . . . . . . . . . . . . . 1.4 Transitions de phase induites par des interactions . . . . . . . . . 1.4.1 interaction électron-électron. Le magnétisme itiniérant. La de Mott. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 interaction électron-phonon. La supraconductivité. . . . . 1.4.3 Effets du désordre et/ou apériodicité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . transition . . . . . . . . . . . . . . . . . . 2 Propriétés thermiques et acoustiques 2.1 Modèle classique de vibrations . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Chaı̂ne périodique de N atomes identiques . . . . . . . . . . . . . . 2.1.2 Le mouvement des atomes en fonction de k. Périodicité de ω. . . . 2.1.3 Les vibrations dans les cristaux de dimension 2 et 3 . . . . . . . . 2.1.4 Modes optiques. Chaı̂ne à deux constantes de couplage. . . . . . . 2.2 Le passage vers une description quantique. Les phonons. . . . . . . . . . . 2.2.1 Température T 6= 0. La distribution de Planck . . . . . . . . . . . 2.3 Propriétés thermiques des cristaux. Modèle de Debye. . . . . . . . . . . . 2.3.1 Comparaison des chaleurs spécifiques des électrons et des phonons 2.4 Quand l’approximation harmonique devient insuffisante . . . . . . . . . . 2.5 Collisions entre phonons et d’autres particules . . . . . . . . . . . . . . . . 2.5.1 Collisions avec des neutrons . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . 6 7 7 9 11 11 11 13 14 16 16 21 22 22 22 24 25 26 27 27 29 30 32 34 35 35 38 39 39 39 3 2.6 2.5.2 Collisions avec des photons . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Collisions avec des électrons . . . . . . . . . . . . . . . . . . . . . . . Le gaz de phonons. Le second son . . . . . . . . . . . . . . . . . . . . . . . . 3 Magnétisme et supraconductivité. 3.1 Description de composés magnétiques . . . . . . . . . . . . . . . . . . . . 3.1.1 L’aimantation et la susceptibilité magnétique. . . . . . . . . . . . . 3.1.2 Symétries et brisure de symétrie . . . . . . . . . . . . . . . . . . . 3.1.3 Le paramagnétisme. . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.4 Les ferromagnétiques. . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.5 Descriptions phénoménologiques des ferromagnétiques . . . . . . . 3.2 La supraconductivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les conséquences d’une résistance nulle . . . . . . . . . . . . . . . 3.2.2 La théorie de BCS . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Propriétés sous champs électriques et magnétiques de l’état supra . . . . . . . . . . 40 40 41 42 42 44 44 45 47 50 52 53 54 56 Introduction Lorsqu’on regarde le tableau périodique des éléments, on constate l’extrême diversité de comportements des éléments - on y trouve des solides, liquides et gaz, dont, parmi les solides, des métaux, des isolants, des ferromagnétiques et des supraconducteurs, pour ne citer que quelques possibilités. Lorsqu’on considère les composés formés à partir de ces éléments, on découvre de nouvelles propriétés insolites. Les deux ou trois décennies précédantes ont vu un foisonnement de nouvelles technologies (et de prix Nobel !) suivant la découverte de nouveaux matériaux. Dans ce cours nous allons découvrir quelques modèles théoriques permettant d’expliquer des propriétés physiques des solides telles les conductibilités électrique ou thermique, les chaleurs spécifiques, leurs propriétés magnétiques. Nous verrons ce que sont les métaux, semimétaux et les semiconducteurs, ainsi que quelques propriétés interessantes des supraconducteurs. Nous verrons que la mécanique classique permet de comprendre déjà beaucoup de propriétés , mais que, lorsqu’on baisse la température et la taille des objets étudiés, il devient indispensable de recourir à une description quantique. Dans ce cours nous ne parlerons que des matériaux cristallins c’est-à-dire ayant une structure périodique dans l’espace. La physique des milieux amorphes ou apériodiques (tels les quasicristaux) est plus complexe et ne sera pas abordée, hormis quelques remarques qualitatives. Chapitre I Dans ce chapitre nous considérerons quelques propriétés importantes liées au gaz d’électrons présent dans les matériaux tels que les métaux et les semiconducteurs, qui ont des électrons libres. Nous commencerons par un modèle classique pour la conduction électrique. Il sera nécessaire, vu les limitations de ce modèle, de passer ensuite à la ”bonne” description, qui utilise la mécanique quantique. En conséquence, on rappellera les définitions de base pour un gaz de fermions. Ensuite, nous étudierons le comportement du gaz d’électrons dans le milieu périodique formé par l’ensemble de noyaux atomiques. Le théorème de Bloch, fondamental dans la théorie quantique des solides, sera expliqué, et ses conséquences seront examinées. Enfin, on discutera quelques aspects négligés dans ce genre de traitement, notamment (et de façon qualitative) l’effet des interactions répulsives entre électrons. Bien que d’importance modérée dans beaucoup de solides, les interactions peuvent avoir des effets dramatiques dans des systèmes de basse dimension ou de taille réduite (tels qu’une boı̂te quantique) - nous en parlerons brièvement. 4 5 Chapitre II Dans ce chapitre nous discuterons des propriétés associées à l’ensemble des noyaux atomiques. Les noyaux vibrent autour de leurs positions d’équilibre, créant des ondes (des ”phonons” dans le langage quantique). Les propriétés thermiques d’un cristal simple seront présentées, ainsi que les modèles de Einstein, et de Debye. Chapitre III Dans ce chapitre nous considèrons des solides magnétiques et des solides qui deviennent supraconducteurs. Nous essaierons de donner un aperçu des modèles qui ont été introduits pour expliquer des propriétés utilisées dans les technologies modernes. Calculs avec Mathematica Les séances de “travaux pratiques” devront permettre de visualiser et de comprendre les formules présentées en cours. Ceux qui n’ont pas utilisé ce logiciel pourront acquerir les notions de base assez rapidement, dès la première séance des deux séances prévues. Bibliographie – Introduction à la physique de l’état solide – La matière à l’état solide – Physique des solides C. Kittel (Dunod) A. Guinier, R. Jullien (Hachette) N. W. Ashcroft, N. D. Mermin (EDP) Chapitre 1 Propriétés du gaz d’électrons dans un solide Lorsque des atomes se rapprochent et forment un solide, les électrons des couches extérieures peuvent se détacher des noyaux et circuler librement dans tout l’intérieur du cristal (on parle alors de la délocalisation des électrons). Ce gaz d’électrons contribue, par exemple, à l’énergie de cohésion du solide, lorsque l’ensemble noyaux plus électrons délocalisés a une énergie plus basse que celle de l’ensemble d’atomes neutres. Le gaz d’électrons peut donner naissance à un courant électrique lorsqu’il y a un déplacement de l’ensemble des électrons en présence d’un champ électrique extérieur. La conductibilité électrique dépendra non seulement de la densité volumique de ces électrons de conduction mais aussi d’autres facteurs que l’on discutera dans la première section. On peut aussi étudier la propagation d’une onde électromagnétique dans un solide. La présence du gaz d’électrons modifie les propriétés de transmission et réflection d’une telle onde selon sa longueur d’onde (ce qui explique, en particulier, l’aspect visuel des métaux). Le gaz d’électrons contribue également à la chaleur spécifique du solide, et à la conductibilité thermique. La théorie classique du gaz d’électrons de la fin du 19ème siècle a donné quelques résultats en accord avec les expériences mais d’autres résultats en désaccord sérieux avec celles-ci. Les modèles classiques ont été donc assez rapidement abandonnés au profit d’un modèle quantique avec l’arrivée à la même époque de la mécanique quantique. Il est néanmoins utile de commencer par une description classique, pour mettre les idées en place. Ensuite nous introduirons la description quantique quand cela devient nécessaire. La section I commence par un rappel des propriétés d’un gaz de particules libres. Ici, on néglige l’interaction de répulsion coulombienne entre les électrons et aussi les intéractions coulombiennes entre les électrons et les noyaux, (en imaginant que ces derniers sont remplacés par un fond positif continu). Ensuite (la section II) on considère les effets nouveaux dûs à l’interaction entre les électrons et le réseau de noyaux. On distinguera entre les cas de métal, isolant et semiconducteur. Enfin, dans la section III nous allons très brièvement décrire des transitions de phase et nouveaux états engendrés par diverses interactions : les interactions coulombiennes entre les électrons, l’interaction électrons-phonons, et l’effet du désordre. Une grande diversité de nouveaux états de la matière apparaı̂t, parmi lesquels les supraconducteurs, le supersolide, diverses phases magnétiques, piézoélectriques, etc. Q. Quelle est la densité d’électrons de conduction, n (c’est à dire le nombre d’électrons de conduction dans un mole du métal/volume d’un mole) dans le cuivre ? La configuration électronique d’un atome de cuivre (Z = 29) est 1s2 , 2s2 , 2p6 , 3s2 , 3p6 , 3d10 , 4s1 , la masse 6 7 molaire de Cu est M = 63.5 et la masse volumique de Cu est 9 g/cm3 . Quelle est la densité volumique des ions positifs ? La densité volumique de la charge totale ? 1.1 Le gaz d’électrons et la conduction électrique dans un métal Dans cette section nous allons présenter un modèle de conduction électrique dans un ~ On considère un gaz de N charges ponctuelles métal soumi à un champ électrique constant E. q, qui se déplacent indépendamment les unes des autres dans un volume V . Elles sont parfaitement réfléchies par les parois et les collisions entr’elles sont supposées élastiques. En l’absence d’un champ électrique extérieur la valeur moyenne des vitesses sera nulle. Lorsque ~ sur chacune des l’on applique un champ, il y aura une force électrostatique F~el = q E charges. En l’absence de forces qui s’opposent à ce mouvement il y aurait une accélération constante et une vitesse moyenne infinie ! En réalité, on le sait, il y aura des collisions entre les charges, et avec d’autres centres de diffusion à l’intérieur du cristal qui serviront à limiter cette vitesse. En régime permanent, grace à ces collisions, on s’attend à ce que la vitesse moyenne soit constante en fonction du temps. Etablissons tout d’abord une relation simple entre le courant I, la concentration n de charges ponctuelles q et la vitesse des porteurs, v . On considère un fil de métal de section S (voir la figure). Dans un intervalle de temps ∆t, chacune des charges parcourt une distance v∆t. La quantité de charge transportée est donc ∆Q = qnvS∆t. Le courant I = ∆Q/∆t et on en déduit la densité de courant, j = I/S j= ∆Q = qnv S∆t (1.1) Nb. Notons que courant est toujours dans le sens du champ électrique, quelque soit le signe des porteurs : on ne peut pas distinguer entre le cas de charges positives q > 0 ayant des vitesses dans un sens donné, du cas de q < 0 ayant des vitesses dans le sens opposé. E S q v∆t Fig. 1.1 – Conduction électrique dans un métal 1.1.1 Le modèle de Drude de la conductivité électrique On considère un ensemble de charges q ponctuelles ayant une masse m, et une concentration de charges n = N/V où N est le nombre total de charges et V est le volume. Les charges se meuvent dans le milieu avec une vitesse constante, sauf pour des réflections des parois, ou lorsqu’elles rencontrent des centres de diffusion, distribués avec une certaine 8 densité à l’intérieur du volume. La valeur typique de la vitesse des charges, vtyp , peut être estimée à l’aide du théorème d’équipartition d’énergie (où l’énergie cinétique moyenne 2 des particules 12 mvtyp = 32 kB T , soit vtyp ∼ 107 cm/s à T = 300K). Le cas le plus simple consiste à considérer des centres de diffusion qui diffusent les charges avec des collisions élastiques (sans changement d’énergie). On fait l’hypothèse d’un temps de relaxation, τ , qui représente un temps moyen entre collisions. La figure montre une trajectoire aléatoire d’une charge ponctuelle qui subit une succession de collisions. Fig. 1.2 – Trajectoire d’une particule diffusée par des centres de diffusion En champ nul, la vitesse moyenne de l’ensemble des particules à un instant du temps donné h~v (t)i sera évidemment nulle (voir Fig.1.2). Lorsque E est différent de zero, il y aura ~ parallèle aux lignes du champ. Après un temps t mesuré à une force constante F~ = q E partir de la dernière collision, la vitesse instantanée d’une charge s’écrit ~vi + ∆~vi (t), où ~vi est la vitesse juste après la dernière collision. En faisant la moyenne sur l’ensemble des particules, et en utilisant le fait que h~vi i = 0, tandis que h∆vi i = F hti/m = F τ /m on a ~ /m ≡ ~vd (la vitesse de dérive). h~vi i = q Eτ vd E Fig. 1.3 – Mouvement des électrons dans un métal soumi à un champ électrique montrant la vitesse de dérive (drift velocity) Nous avons ainsi trouvé qu’en régime permanent, la vitesse moyenne des électrons ~vd est proportionnelle au champ appliqué, comme l’illustre la fig.1.3. Nous voulons établir une expression pour la densité du courant électrique j et calculer la conductivité électrique σ, définie par j = σE (1.2) En utilisant les relations déjà écrites pour la densité de courant j, la vitesse moyenne, on 2 trouve aisément que σ = nem τ (la charge d’un électron étant e = −1, 6 × 10−19 C). L’inverse 9 de la conductivité est appelé la resistivité, ρ, ρ= m ne2 τ (1.3) On peut voir que la loi d’Ohm ∆V = IR est bien vérifiée dans le métal de la manière suivante : on considère un barreau de section S et de longueur L dans la direction du champ extérieur E. On a alors une différence de potentiel ∆V = EL entre les deux extrémities du barreau, pour un courant I = jS où j = σE. On trouve ∆V = RI où la résistance du barreau R = ∆V /I = ρL/S. Q. Au vu du tableau ci-dessous, quel matériau pensez vous serait un meilleur conducteur d’électricité pour un temps de diffusion τ comparable : le cuivre ou l’aluminium ? Comment expliquer le fait que la resistivité du Cu est plus petite que celle d’Al (dernière colonne) ? métal Na Be Cu Al n (cm3 ) 2.65 × 1022 24.2 × 1022 8.45 × 1022 18.06 × 1022 ρ(273K)(µΩ/cm) 4.2 2.8 1.56 2.45 Tableau 1. Quelques métaux et leurs densités d’électrons de conduction 1.1.2 D’autres prédictions du modèle classique Dépendence de ρ en fonction de T La formule en 1.3 nous aide à comprendre pourquoi la résistivité peut changer avec la température. Cette variation est surtout due aux changements du temps caractéristique τ (en supposant que n est peu dépendant de T - on traitera le cas des semiconducteurs, où la variation de n est importante un peu plus loin dans ce chapitre.) Lorsque la température monte, les électrons sont de plus en plus diffusés par les atomes dont les vibrations deviennent plus importantes ; ils sont aussi plus diffusés par les autres électrons par l’intermédiaire des interactions coulombiennes. On peut distinguer deux types de contributions à la résistance totale : ρ(T ) = ρ(0) + δρ(T ). La première, ρ(T = 0), appelée la résistance résiduelle, est inversement proportionnelle à τel , le temps de parcours moyen dû aux collisions élastiques, quantité qui dépend de la concentration d’impuretés gelées dans le matériau. La deuxième contribution vient des collisions inélastiques mentionnées ci-dessus, elle est inversement proportionnelle à τin qui diminuera en fonction de T . L’effet Hall Il a déjà été remarqué qu’il est impossible de déterminer le signe des porteurs de charge dans un conducteur à partir d’une mesure de I en fonction de la différence de potentiel ∆V . Un dispositif qui permet de distinguer entre les deux possibilités (q positive ou négative) a été conçu par E. Hall. Il s’agit de soumettre un barreau de métal à un champ électrique ~ constant (de manière à créer un courant I le long de l’axe du barreau), et un champ E ~ On peut montrer qu’en régime permagnétique constant dans une direction transverse B. manent, il se crée un champ électrique EH dans la direction perpendiculaire aux champs E 10 et B. Le modèle classique avec l’introduction d’un temps de relaxation à la Drude permet d’établir ce champ (nous ne le démontrons pas ici) EH = jB/nq (1.4) Cette équation montre que le signe de EH dépend de celui des porteurs, ce qui est permet, dans les semiconducteurs de distinguer si la conduction de courant est fait par les électrons (q < 0) ou des trous (q > 0). Nous en parlerons plus dans la discussion, plus loin, sur les semiconducteurs. L’effet Hall est souvent utilisé dans des applications, pour déterminer, par exemple, l’intensité du champ magnétique. B q E EH Fig. 1.4 – Dispositif de Hall montrant une charge q dans des champs magnétiques et électriques et le champ EH résultant Conduction thermique Un des plus grands succès du modèle de Drude a été d’expliquer les résultats expérimentaux montrant une proportionnalité entre T σ(T ) et la conductivité thermique κel (T ). Cette dernière exprime l’efficacité des électrons à transmettre de la chaleur lorsque l’on soumet un métal à un gradient de température. La proportionnalité vient du fait que ce sont les mêmes particules qui sont porteuses de courant électrique et courant thermique. Propriétés optiques Avec le modèle classique, on peut traiter le problème de la transmission des ondes électromagnétiques dans un milieu métallique. La transmitivité et la réflectivité du métal dépendent de la fréquence de l’onde par l’intermédiaire d’une fonction appelée la constante diélectrique, ²(ω). Le modèle de Drude prédit qu’il y aura un pic d’absorption des ondes (pic de Drude) lorsque la fréquence tend vers 0. Oscillations de plasma Imaginons que l’on déplace le gaz d’électrons tout entier par une distance x par rapport au réseau d’atomes que l’on peut décrire par un fond positif continu. On crée ainsi un champ électrique E = nex/²0 dans l’intérieur du solide, et une force de rappel sur chaque 11 électron de F = eE. On a alors l’équation de mouvement d2 x/dt2 = −ωp2 x, où ωp2 = ne2 /²0 , et les électrons participent tous à un mouvement collectif harmonique. Ce sont les oscillations de plasma du gaz d’électrons. Dans un métal, ce type d’oscillations peut être provoqué par un champ électromagnétique incident avec la bonne fréquence. En générale, les métaux réfléchissent plutôt bien des ondes EM incidentes, comme on peut constater pour des surfaces métalliques bien polies - à cause de l’écrantage des champs électromagnétiques par les charges mobiles. Cependant, à la fréquence ωp les électrons ne peuvent plus assurer l’écrantage du champ incident, et le métal devient alors transparent ! Le sodium par exemple, devient transparent aux ondes EM‘pour une longueur d’onde de λ = 2100A en assez bonne accord avec celle trouvée à l’aide de notre formule de ωp . 1.1.3 Problèmes du modèle classique – On peut calculer le temps de relaxation τ à partir de la valeur expérimentale de la résistivité. Dans le cas du cuivre à la température de l’azote liquide (T = 77K), ρ ≈ 0.2µΩcm. On en tire un temps caractéristique τ de l’ordre de 10−8 s, et il résulte un l de l’ordre de quelques centaines de milliers d’Angströms. Si les atomes diffusaient les électrons comme on pourrait s’y attendre, le libre parcours moyen l serait de l’ordre de la distance interatomique, soit quelques Angströms. Le libre parcours moyen trouvé ci-dessus étant beaucoup plus grand, on peut en conclure que les atomes ne sont pas “vus” par les électrons. Plus exactement, les électrons ne sont pas diffusés par les noyaux tant que la disposition dans l’espace de ces derniers reste parfaitement périodique. Par contre, les mesures de résistivité montrent que les électrons sont diffusés par des défauts – des défauts de la structure (dislocations, etc), ou des défauts chimiques dûs à la présence d’impuretés dans le métal. Donc le premier problème est celui d’expliquer le rôle joué par les atomes. – Le problème de la chaleur spécifique des électrons. Les expériences montrent que cV (T ) est très faible à la température ambiante. Elle n’approche la valeur classique de 32 nkB qu’à des températures extrêmement élevées. Cette observation nécessite que l’on passe à un traitement quantique du gaz d’électrons. 1.2 1.2.1 Le gaz de fermions libres Le gaz d’électrons à T = 0 On considère toujours des électrons libres – on négligera les interactions entre les électrons, ~2 ~ 2 et l’interaction des électrons et le réseau de noyaux. L’hamiltonien est H0 = − 2m ∇ où m est la masse de l’électron. Les propriétés thermodynamiques d’un gaz de N ’électrons sont calculés avec les méthodes usuelles de la physique statistique. Nous donnerons ici un rappel des notions de base. Vecteur d’onde k. Un électron libre dans un volume V est décrit par une fonction d’onde solution de l’équation de Schrödinger Hψ = Eψ; √ ~ ψk (~x) = eik.~x / V (1.5) √ les solutions de ψ étant des ondes planes. Prenant l’exemple de d = 1, on a ψk (x) = eikx / L pour un gaz occupant un intervalle de longueur L. Il est souvent commode de prendre des 12 conditions aux limites périodiques : ψ(x + L) = ψ(x). On trouve alors que kL = 2πn où n = ..., −1, 0, 1, 2, ... est un entier. La généralisation à plusieurs dimensions est claire : chaque composante aura une des valeurs discrètes données par ki = 2πni Li (1.6) où i = x, y, .. et Li la longueur du système dans chacune des d directions. Lorsque l’on considère la limite L → ∞, le vecteur d’onde donné par l’expression ci-dessus devient une variable continue. L’énergie (cinétique) dépend de ~k de façon habituelle : ~2 k 2 E(~k) = 2m (1.7) où m est la masse d’un électron, k = |~k|. L’énergie et le vecteur d’onde de Fermi EF et kF . A T = 0 le gaz de N électrons est dans son état fondamental ( l’état de plus basse énergie). Cet état est constitué à partir des ondes planes solutions de l’éq. 1.5 Rappelons que deux fermions ne peuvent posséder la même valeur de ~k que si leurs spins sont opposés, d’après le principe de Pauli. L’énergie totale de l’état fondamental est donc calculée en plaçant une paire d’électrons de spins opposés dans chaque niveau (on rappelle que les niveaux dépendent de d nombres quantiques en dimension d selon l’éq. 2). On commence par l’état de plus basse énergie, jusqu’à ce que l’on arrive à l’énergie EF , le dernier niveau occupé. kF est la norme du vecteur d’onde correspondant. SF , ou la surface de Fermi, est la surface d’une sphère de rayon kF , qui sépare les états occupés et ceux inoccupés à T = 0. Le nombre de valeurs de ~k à l’intérieur de la surface de Fermi est N/2. La densité d’états. V ρ(~k) donne le nombre d’états quantiques dans une région de volume infinitésimal d~k autour d’un point dans l’espace ~k (Il faut multiplier celle-ci par 2 pour prendre en compte les deux états de spin). En une dimension, la distance entre deux valeurs permises de k est ∆k = 2π/L, d’où le nombre d’états dans un intervalle de longueur dk est L dk = ≡ Lρ(k)dk ∆k 2π (1.8) La fonction ρ(k) = 1/2π est la densité d’états en 1 dimension. Dans le cas d’un gaz d’électrons en dimension d occupant un volume V = Ld on a de façon analogue V 3 V ρ(~k)d3 k = (2π) d d k. Dans la limite thermodynamique, toute somme sur les états quantiques peut s’écrire sous forme d’une intégrale Z Z X ... = V d~kρ(~k)... = V dEρ(E)... (1.9) etats où nous avons introduit la densité d’états en fonction de l’énergie ρ(E) dans la deuxième égalité, en effectuant un changement de variables. Pour d = 1 on trouve, par exemple r 1 2m ρ(E) = 2ρ(k)/(dE/dk) = (1.10) 2π~ E (où le facteur 2 dans la première égalité tient compte du fait que les états de k et −k sont dégénérés). 13 Q. Montrer qu’en d = 3 la densité d’états en fonction de l’énergie est donnée par √ 2m3 √ ρ(E) = E 2π 2 ~3 (1.11) Quelques relations pour la surface de Fermi en d=3. Pour trouver kF on calcule d’abord le volume de la sphère représentant les états occupés, Ω = 4πkF3 /3. Le nombre total d’états occupés, N est alors obtenu en multipliant Ω par la densité d’états et un facteur de 2 pour le spin. On trouve ainsi le vecteur d’onde de Fermi, EF et la densité d’états au niveau de Fermi : kF = 2π 3N 1/3 ( ) = (3nπ 2 )1/3 L 8π ~2 EF = (3nπ 2 )2/3 2m 3n ρ(EF ) = 4EF (1.12) (1.13) (1.14) Q. Calculer EF pour le Cu. Donner la valeur de la température de Fermi, TF = EF /kB . En unités de TF que vaut une température ambiante de 300K ? Q. Calculer la vitesse vF d’un électron à la surface de Fermi ( donc un des plus rapides à T = 0) dans le cuivre (vF = ~kF /m). Comparer avec celle prédite par une théorie classique. 1.2.2 Le gaz d’électrons à température finie On suppose une concentration moyenne d’électrons n = N/V fixe. Les électrons peuvent occuper tous les états d’énergie, avec une probabilité donnée par la fonction de Fermi-Dirac fF D (E) = 1 exp(E−µ)/kB T +1 (1.15) où µ(T ), le potentiel chimique, est calculé à partir de l’intégrale qui donne le nombre total d’électrons N, Z X ~ N =2 fF D (E(k)) = 2 dEV ρ(E)fF D (E) (1.16) Dans la deuxième équation nous avons changé de variable et pris la limite thermodynamique (remplacement la somme par une intégrale), et avons multiplié par 2 pour le spin. Forme de la fonction fF D A T = 0 µ = EF , la fonction Fermi-Dirac ne prend que deux valeurs, 1 et 0 en-dessous et au-dessus de EF respectivement. Quand la température augmente, pour T << µ la fonction n’est modifiée qu’au voisinage de µ, où la discontinuité est progressivement lissée et élargie. Le potentiel chimique varie très peu en fonction de T pour des températures usuelles : i h π 2 kB T 2 nous n’allons pas le démontrer ici, mais un calcul approché donne µ = EF 1 − 12 ( EF ) + ... pour un gaz d’électrons libres en d = 3. On peut vérifier qu’il y a un changement de quelque fractions d’un pourcent à 300K. 14 fFD HEL T>0 1 2kB T 0.5 µ E Fig. 1.5 – La forme de fF D pour une température T > 0 Energie interne et chaleur spécifique 2 interne est donnée par une somme sur les énergies de tous les électrons, U = PL’énergie E(~k)fF D (E(~k)) (incluant le facteur 2 pour le spin). Ecrit sous forme d’intégrale, on a Z u = U/V = 2 dEρ(E)fF D (E)E (1.17) ≈ u(0) + π 2 (kB T )2 4 EF où la deuxième ligne vient d’un calcul approché valable à basse T . La chaleur spécifique est donc µ 2¶µ ¶ π kB T ∂u = nkB (1.18) cv (T ) = ∂T 2 EF Comparée à la valeur classique de 23 nkB , cv (T ) est de l’ordre de cent fois plus petite. L’explication de ce fait est que seul un nombre restreint d’électrons est effectivement excité dans les états de plus haute énergie à la température ambiante. Comme nous avons remarqué, la fonction fF D est peu modifiée en fonction de T , les seuls changements ayant lieu dans une gamme d’énergies de largeur kB T autour du niveau de Fermi. Dans une mesure expérimentale de la chaleur spécifique, on obtient la somme de toutes les contributions, qui peuvent être dues aux électrons, des vibrations du réseau (phonons), aux fluctuations magnétiques, supraconductrices et ainsi de suite. La contribution la plus important à température ambiante est celle des phonons. Le figure montre la chaleur spécifique totale, où l’on voit le comportement en T 3 à haute T due aux vibrations (chapitre suivant) et le comportement linéaire en T due aux électrons à basse T . 1.2.3 Les boı̂tes, fils et puits quantiques La miniaturisation des composants électriques est importante pour les technologies nouvelles, et elle est également très intéressante de point de vue purement scientifique. On peut esprérer bientot stocker des bits d’informations dans des boı̂tes quantiques (littéralement 15 Fig. 1.6 – Chaleur spécifique en fonction de T (du site “Hyperphysics”) des boı̂tes à stocker et à retirer des électrons un-à-un). Celles-ci peuvent être fabriquées avec des formes et des dimensions prédeterminées, de façon à avoir un spectre d’énergies discrètes précisément connu, comme dans l’illustration ci-dessous. Fig. 1.7 – Niveaux d’énergie dans une boı̂te quantique (fig. M.Rüfenacht) Les puits quantiques sont des couches minces hébergeant un gaz d’électrons bidimensionnel, qui sont utiles pour une grande variété d’applications (des couches minces magnétiques, notamment, servent dans la fabrication d’une nouvelle génération de mémoires RAM). On peut fabriquer des de tels puits en empilant des couches successives de matériaux différents tels l’arseniure de gallium (GaAs) et l’arseniure d’aluminium (AlAs). L’énergie potentielle étant plus basse dans le GaAs, les électrons resteront dans ces couches-là, prise en sandwich par deux couches de AlAs (voir la figure). Les fils quantiques sont obtenus lorsque l’on les électrons dans deux des directions, en laissant le mouvement libre dans la troisième dimensions. Q. Quelle est la forme de la densité d’états à d = 2 ? Décrire qualitativement la forme de la densité d’états d’un puits quantique, avec un potentiel V (z) qui est ∞ partout sauf entre z = 0 et z = a où V = 0. 16 Fig. 1.8 – puits quantiques fabriqués avec Ga-Al-As (fig. M.Rüfenacht) 1.3 1.3.1 L’environnement cristallin et l’émergence des bandes interdites La théorie des électrons presque libres Dans cette section, nous allons considérer en un peu de détail un électron dans un cristal unidimensionnel. Les généralisations aux dimensions deux et trois seront indiqués à la fin. L’équation de Schrödinger est Hψ(x) = Eψ(x) (1.19) où ψ est la fonction d’onde et E est l’énergie à un électron. Le potentiel étant périodique, V (x + a) = V (x), on peut le développer en série de Fourier V (x) = ∞ X n=−∞ e ingx Vn ; 1 Vn = a Z a dxe−ingx V (x) (1.20) 0 où g = 2π/a. On ne dispose pas de solution exacte de cette équation, même pour des cas particuliers simples. On dispose, toutefois, d’un théorême concernant les solutions ψ de l’éq.1.19. Le théorème de Bloch affirme qu’une fonction d’onde solution de (1.19) aura la forme d’une onde plane multipliée par une fonction périodique u : ψ(x) = uk (x)eikx (1.21) uk (x + a) = uk (x). Pour x0 = na, en utilisant la périodicité de u, l’éq.1.21 donne 0 ψ(x + x0 ) = eikx ψ(x) (1.22) ce qui exprime le fait que les amplitudes de la fonction d’onde en x et en x0 sont les mêmes à un facteur de phase près – une conséquence de l’invariance par translation du cristal. Démonstration du théorême de Bloch : on considère les opérateurs de translations discrètes Tn . H est invariant par translation, donc les Tn commutent avec H. Choississons une base ψ commune de sorte que Hψ = Eψ et Tm ψ = c(m)ψ où E et c sont des nombres. En considérant deux opérations successives, on a Tn Tm = Tn Tm = Tn+m (les translations commutent et deux translations successives peuvent être remplacées par une seule). Cette dernière relation implique que c(m) peut être exprimé sous la forme eim×cste , d’où l’éq.1.22. 17 Quantification des valeurs de k . On suppose que le réseau est composé de N sites, avec une distance entre sites a, et avec des conditions aux limites périodiques. On a donc ψ(x + L) = ψ(x) où L = N a. On en déduit qu’il existe N valeurs distinctes de k, que l’on peut choisir à être dans un intervalle symétrique autour de l’origine, kn = 2π n, a n=− N N −1 , ..., 0, ..., 2 2 (1.23) Dans la limite L → ∞, ces valeurs de k deviennent continues. On appelle la première zone de Brillouin (PZB) l’intervalle [−π/a, π/a]. Le théorême de Bloch implique que l’énergie de l’électron dans un cristal sera une fonction périodique de k, En (k + g) = En (k) (où n est l’indice de bande). Il suffit, donc, de chercher les solutions de l’éq. de Schrödinger dans la première zone de Brillouin. Solution pour V = 0. Le cristal virtuel Considérons un électron qui se propage dans un réseau mais où les interactions avec les noyaux sont négligeables, de sorte que V (x) = 0 (d’où le “virtuel”). Les solutions de l’équation de Schrödinger sont les ondes planes déjà vues, ψK (x) ∝ eiKx . Celles-ci peuvent se réecrire ψn,k (x) = ei(ng+k)x , car on peut exprimer tout vecteur d’onde K sous la forme ng + k où π/a < k < π/a (on parle alors de la valeur “réduite” de K). On trouve ainsi des énergies qui dépendent de k et d’un indice n : ²n (k) = ~2 (ng + k)2 2m (1.24) Ces “bandes d’énergie” sont illustrés dans la figure (il ne s’agit, pour l’instant, qu’une façon inhabituelle de représenter les solutions déjà connues pour un électron libre). Lorsque le potentiel V 6= 0, nous allons voir que ces bandes d’énergie sont peu modifiées à l’intérieur de la PZB, mais qu’il se produit des phénomènes intéressants aux bords, c.a.d. près de ±π/a. Avant d’aborder les calculs voici un argument qualitatif permettant de comprendre ces situations particulières. La non-propagation de certaines ondes planes dans un milieu périodique Pour avoir une idée qualitative de la propagation des électrons dans un cristal il est intéressant de prendre un exemple simple. Considérons une onde incidente venant de −∞ sur une barrière de potentiel, V (x) = V pour 0 < x < d, où V est supposé petit en comparaison avec l’énergie cinétique de l’onde incidente. Une partie de l’onde sera réfléchie, et une partie transmise, les amplitudes de réflection/transmission étant dépendant de V , et d. On considère maintenant l’effet d’enchaı̂ner plusieurs barrières, avec une distance de répétition a. Une onde incidente eikx sera partiellement réfléchie par chacune des barrières. Si l’on considère l’amplitude de l’onde renvoyée vers −∞, elle sera donnée par une somme de termes e−ikx+iM φ , où φ = 2ka est la différence de phase associée à une distance supplémentaire parcourue de 2a. Quand k est un multiple de π/a, φ sera un multiple de 2π, et toutes les réflections arriveront en phase - l’amplitude totale de réflection sera importante (ce qui implique que l’amplitude de transmission de cette onde sera faible). A l’intérieur de la région périodique, à cause des réflections multiples, il y aura une onde stationnaire pour ces valeurs particulières de k, avec, comme on le verra ci-dessous, l’apparition de bandes interdites ou “gaps”. 18 n=-3 n=3 n=-2 n=2 n=-1 n=1 n=0 -0.5 0 0.5 Fig. 1.9 – La relation de dispersion du cristal virtuel dans la première zone de Brillouin (la figure indique k en unités de g) La solution en théorie de perturbation On considère un potentiel périodique simple de forme sinusoı̈dale V (x) = V1 (eigx +e−igx ) ( c.a.d. on ne garde que les premiers termes du développement de Fourier de l’éq.1.20). Quand V1 est petit devant l’énergie cinétique de l’électron, on peut obtenir des solutions de la fonction d’onde ψ(x) et de l’énergie En (k) sous forme d’un développement en puissances de V1 . Nous nous contenterons de citer les résultats du calcul perturbatif |V1 |2 |V1 |2 + + .. ²n (k) − ²n (k + g) ²n (k) − ²n (k − g) V1 V−1 |ψi = |ki + |k + gi + |k − gi + .. ²n (k) − ²n (k + g) ²n (k) − ²n (k − g) En (k) = ²n (k) + (1.25) le ket |ki représentant l’onde plane de vecteur d’onde k, et nous n’avons pas écrit les termes d’ordre plus élevés. Ces équations confirment que les termes de correction seront petites si |²n (k) − ²n (k ± g)| >> |V1 |. On est ainsi amené à conclure que, pour la plupart des électrons dans le gaz de Fermi, les énergies et les fonctions d’onde sont peu affectées par la présence du réseau de noyaux. Les solutions aux bords de la PZB Consid érons d’abord l’énergie E en fonction de k dans la branche d’énergie la plus basse, n = 0. Il suffit de considérer k positif, car le spectre étant symétrique autour de k = 0. Lorsque k augmente, et approche le bord de la PZB, les énergies ²0 (k) et ²0 (k − g) sont très proches. Les éqs.1.25 ne sont plus utiles, et il faut recourir à la théorie de perturbation des états dégénérés. Pour δ petit, et k = g/2 − δ on va chercher une solution de l’éq.1.19 de la 19 forme |ψi = c1 |ki + c2 |k − gi. En multipliant l’équation H|ψi = E|ψi par hk| et par hk − g| on obtient deux équations ²0 (k)c1 + V1 c2 = Ec1 (1.26) ²0 (k − g)c2 + V−1 c1 = Ec2 (1.27) Pour qu’il y ait une solution nontriviale des coefficients ci , il faut que le déterminant de la matrice correspondante soit nul, ce qui donne µ ¶ ²0 (k) V1 det =0 (1.28) V−1 ²0 (k − g) On trouve aisément les deux solutions de l’équation quadratique : E= ²0 (k) + ²0 (k − g) 1 p ± (²0 (k) − ²0 (k − g))2 + 4|V1 |2 2 2 (1.29) ce qui montre (voir la figure) que l’énergie s’écarte sensiblement de sa valeur ²0 (k) dans ce cas. Quand k = g/2, on obtient après simplification, lim E = ²0 (g/2) ± |V1 | δ→0 (1.30) √ Pour cette valeur de k = g/2 il est facile de vérifier que les coefficients c1 = ±c2 = 1/ 2 et les solutions sont donc des ondes stationnaires, ayant des énergies correspondantes ²(g/2)±|V1 |. Il apparaı̂t ainsi une “bande interdite” (ou gap, Eg ) de largeur 2|V1 |. C’est l’intervalle d’énergie entre le haut de la bande n = 0 et le bas des bandes n = ±1, où il n y a pas de solution de l’éq.1.19. Généralisation aux potentiels plus compliqués. On peut prendre en compte les autres coefficients Vn dans la série de Fourier de la même façon. Chaque fois que deux bandes se rencontrent, il y aura formation d’une onde stationnaire, et on verra alors apparaı̂tre des gaps de largeur 2|Vn | (voir la figure). Dans la figure on présente les courbes d’énergie en fonction de k. L’écart entre la courbe parabolique d’un électron libre (ligne hachurée de la figure) et la nouvelle courbe n’est visible que près des valeurs k = 0, ± g2 . Les figures montrent pour ce cas unidimensionnel le diagramme des énergies en fonction de k représentées dans la première zone de Brillouin. Q. Que vaut k au bord de la PZB dans un cristal de a = 1Å ? S’il y a un électron de conduction par atome, que vaut kF ? Conclusion quand à la fonction d’onde au niveau de Fermi. Vitesse de groupe. Masse effective. L’impulsion totale, p, de l’électron n’est plus une quantité conservée à l’intérieur du cristal. Les fonctions d’onde ψ(x) solution de l’éq.1.19 correspondent à des pacquets d’onde, d’une valeur moyenne de k donnée. La “vitesse de groupe” et la masse effective sont définies à partir des relations suivantes : ~v(k) = ∂E/∂k ~2 = ∂ 2 E/∂k 2 mef f (k) (1.31) 20 Fig. 1.10 – Première zone de Brillouin avec quatre bandes dont deux remplies avec des électrons Il est facile de vérifier que ces relations ci-dessus donnent les valeurs attendues de la vitesse (v = ~k/m) et la masse m habituelles dans le cas d’un électron libre. La vitesse moyenne et la masse effective d’un électron deviennent des fonctions de k pour un électron dans un cristal, et c’est aux bords de bande que se produisent les effets les plus surprenants. La vitesse de groupe, proportionnelle à la pente de la courbe de dispersion, s’annule non seulement à k = 0 mais aussi à k = ±π/a. La masse effective mef f sera elle aussi fortement modifiée pour certaines valeurs de k. Développant l’expression de l’énergie En (k) (l’éq.1.30) autour de k = k0 , on a 1 mef f (k) = ~−2 ∂ 2 En (k)/∂k 2 = (1.32) g 1 1 ²n ( 2 ) ± m m 2|V1 | Il s’ensuit que la masse effective peut devenir très grande, approchant l’infini aux bords de la PZB, traduisant le fait qu’une onde stationnaire ne transporte pas d’énergie. g 2|V1 | mef f ( ) = − g m 2 ²( 2 ) (1.33) Conduction d’un courant électrique Sous l’effet d’un champ électrique uniforme E, on peut montrer que la quantité de mouvement ~k varie selon l’équation ~dk = −eE dt (1.34) ayant la solution k(t) = k(0)−eEt/~. Cependant, un électron ne peut changer sa valeur de k que si le nouvel état est vacant. Ceci est possible si tous les électrons changent simultanément 21 leurs états dans le même sens ! La quantité du mouvement du gaz entier est ainsi changée. L’énergie et la vitesse de chacun des électrons sont, eux, des fonctions périodiques de k, en l’absence de transitions entre bandes (ce qui coûterait une énergie égale à la largeur de la bande interdite). Il résulte que le mouvement d’un électron donné sera une fonction oscillante du temps ! Ces “oscillations de Bloch” n’ont été expérimentalement mesurées que très récemment, car il faut des échantillons de très grande pureté. 1.3.2 Conducteurs, isolants et semiconducteurs. Nous avons vu que l’application d’un champ électrique conduit à un changement de k de chaque électron, ce qui est possible si tous les électrons changent leur k en même temps. La quantité de mouvement totale K du gaz deviendra alors non-nulle et il y aura un courant électrique. Ce n’est plus le cas lorsqu’une bande est entièrement remplie - tous les états k disponible sont alors occupés, et le champ électrique ne donnera pas lieu à un déplacement global dans l’espace k de l’ensemble des électrons. Il n y pas de courant électrique et on a affaire à un isolant de bande. Dans quelles conditions une bande est-elle est complètement remplie ? Pour un cristal de N noyaux, il y a N valeurs de k permises. Multipliant par 2 pour le spin on a nombre d’électrons que l’on peut caser dans chacune des bandes, 2N . Quand le nombre total d’électrons est inférieur à 2N, la bande sera partiellement remplie, et il s’agit d’un conducteur. Ce sera le cas pour des atomes monovalents, où chaque atome libère un électron de conduction. Si, par contre, chaque atome contribue exactement 2 électrons, la bande n = 0 sera complètement remplie, et on aura un isolant. Les semiconducteurs sont des matériaux où le gap Eg , est relativement petit. La différence entre le semiconducteur intrinsèque et un isolant est (pour simplifier) uniquement quantitative : par exemple, le diamant, avec son Eg = 7eV est un isolant, tandis que le silicium pur avec Eg = 1.12eV , et le germanium, avec Eg = 0.7eV sont des semiconducteurs. Ces derniers sont des isolants à T = 0, à cause de leurs bandes pleines. En augmentant la température, de plus en plus d’électrons sont excités dans la bande de conduction. En le faisant, ils laissent des états vacants ou “trous” dans la bande de valence. La conduction du courant est assuré en partie par les électrons dans la bande conduction, et en partie par les trous de la bande de valence ! La conductivité σ dépend de la concentration des porteurs de charge négative (n) ou de charge positive (p) de courant électrique. Dans un tel semiconducteur, donc, la σ augmentera en fonction de T . Dans le Si, à T = 300K, n = p = 1.5 × 1010 cm−3 . Calculons le nombre Nc d’électrons dans la bande de conduction pour notre système unidimensionnel. On l’obtient en calculant la somme sur tous les états (de la bande de conduction) des probabilités qu’un état d’énergie E soit occupé. Cela donne Z 1 (1.35) Nc = L dkρk (²(k)−µ)/k B T −1 exp pzB Z Emax 1 = L dEρ(E) (²(E)−µ)/k B T −1 exp Emin où µ est le potentiel chimique. 22 1.3.3 Résultats en d=2 et 3 Un réseau est caractérisé par ses translations élémentaires, que l’on désigne par ~ai (i = 1, .., d). A chaque réseau correspond un réseau réciproque qui, lui, est engendré à partir des ~ i , que l’on peut déterminer à partir des relations vecteurs A ~ i .~aj = 2πδij A (1.36) La première zone de Brillouin est une cellule élémentaire du réseau réciproque, au centré située à ~k = 0. ~ i et construire la pzB du réseau rectangulaire pour lequel ~a1 = lu~x , Q. Préciser les vecteurs A ~a2 = 3lu~y . L’hamiltonien d’un électron dans un tel cristal est H = H0 + V (~x) où V (~x) reflètera la périodicité du réseau, V (~x + ~ai ) = V (~x). Le théorême de Bloch s’écrit ~ ψ~k (~x) = u~k (~x)eik.~x (1.37) Pour de conditions aux limites périodiques, on trouve autant de valeurs discrètes de ~k dans la pzB qu’il y a de sites atomiques, soit N . La théorie de perturbation permet, comme pour d = 1, de calculer les fonctions d’onde ~ est un des composantes ψ~k (~x) et les énergies propres E(~k), en série de puissances de VG~ , où G du développement de Fourier de V . Les modifications sont petites pour la plupart des vecteurs ~k, mais deviennent importantes près d’une des faces de la zone de Brillouin, où l’on obtient des ondes stationnaires dans la direction perpendiculaire à la face. Les énergies E(~k) seront fortement modifiées à ces valeurs de ~k, comme dans l’exemple unidimensionnel. La vitesse de groupe dépendra,en générale, de la direction de propagation, étant donnée par ~ ~k) ~v = ~−1 ∇E( (1.38) puisque les composantes x, y ou z du gradient de E peuvent être différents. La masse effective est un tenseur, donnée par une généralisation simple de l’équation 1.32. Nouveaux effets présents en dimensions supérieures à 1 Dans notre modèle unidimensionnel simple, les gaps sont toujours directs, quelque soit la forme du potentiel V (x), c.a.d. le minimum de En (k) se trouve juste au-dessus du maximum de En−1 (k). Ce n’est plus nécessairement vrai en d > 1, et on peut avoir une situation de “gap indirect” où le maximum de la bande de valence et le minimum de la bande de conduction ne sont pas situés au même endroit (illustré dans la figure). On peut même avoir des situations où Emin de la bande de conduction est en-dessous de Emax de la bande de valence. Dans ces cas, à T = 0K, les électrons occuperont les états de plus basse énergie dans la bande de conduction, et la bande de valence ne sera que partiellement remplie. On emploie le terme “semi-métal”” pour ces matériaux. 1.4 1.4.1 Transitions de phase induites par des interactions interaction électron-électron. Le magnétisme itiniérant. La transition de Mott. Un des sujets de recherche actuel concerne les effets de l’interaction coulombienne entre les électrons, qui a été négligée dans le traitement élementaire de la section précédente. En 23 Fig. 1.11 – i) bande pleine (isolant ou semiconducteur),ii) deux bandes partiellement remplie (semi-métal),iii) bande partiellement remplie (métal) effet, on ne peut plus traiter les particules une par une, car elles seront toutes couplées par ces interaction s. Il n’existe pas de méthode générale pour ce problème à N corps, mais il existe des techniques approximatives. Dans un certain nombre de cas simples, on peut introduire des termes correctifs dans l’hamiltonien pour prendre en compte ces interaction s de façon approximative. On peut utiliser la théorie des perturbations, des théories de champ moyen, la méthode du groupe de renormalisation, etc. Ces méthodes marchent souvent assez bien à d = 3, moins bien en d = 2. Pour d = 1, dans les fils quantiques, il faut recourir à des modèles beaucoup plus sophistiqués pour décrire la physique des électrons en interaction . Dans cette section, nous allons découvrir quelques phénomènes physiques intéressants dûs à l’interaction coulombienne, avec des explications qualitatives. Le ferromagnétisme intinérant Une analyse simple permet de voir que l’interaction répulsive entre électrons favorise un alignement de leurs spins dans un état ferromagnétique. Rappelons que en l’absence de ces interaction s, l’état fondamental du gaz d’électrons correspond à une valeur totale de spin nulle : car les états de spin ± 21 sont occupés de manière identique. Les électrons sont libres de parcourir tout le volume disponible, et de ce fait, deux électrons se retrouveront de temps en temps dans la même région de l’espace. Ce genre de rencontre devient défavorable au fur et à mesure que l’on “branche” l’interaction coulombienne entre les électrons, qui commencent à se demander comment ils peuvent faire pour s’éviter. Une solution est suggerée par le principe de Pauli : avoir la même direction de spin car dans la valse des électrons, deux électrons de spins parallèles s’évitent automatiquement. Mais si l’on retournait tous les spins, cela coûterait trop d’énergie - il faut aller deux fois plus loin dans l’espace des k (et augmenter sensiblement l’énergie de Fermi) pour caser tous les électrons. Un compromis est alors trouvé par le système. Un modèle d’interactions simple a été introduit par Hubbard, qui a remplacé l’interaction habituelle entre deux électrons séparés d’une distance r, 24 e2 /(4π²0 r2 ), par une forme schématique : U si les électrons sont très proches, et 0 sinon. On peut montrer alors qu’à partir d’une certaine valeur critique Uc , le gaz d’électrons choisit un état avec une majorité de spins parallèles, de sorte que le moment magnétique total n’est plus nul. Il s’agit d’une transition de phase d’un état paramagnétique, c.a.d. ayant M = 0 en l’absence d’un champ magnétique extérieur, à un état ferromagnétique (transition de Stoner). Le mot “itinérant” signifie que les électrons restent délocalisés dans le nouvel état, contrairement à ce qui se passe dans la transition de Mott décrite ci-dessous. L’isolant de Mott Le ferromagnétisme itinérant n’est pas la seule solution au problème de minimisation de rencontres entre électrons. Une deuxième possibilité est de localiser les électrons, et créer un réseau d’électrons (cristal de Wigner). Il y a un prix à payer en énergie, car un électron délocalisé a une énergie plus basse qu’un électron contraint de rester à un endroit précis. Toutefois, chaque électron tente de minimiser son énergie en s’arrangeant d’avoir des voisins de spin antiparallèles, de façon à pouvoir faire des sauts locaux. Cela donne un état antiferromagnétique, et bien sur, le système est un isolant. 1.4.2 interaction électron-phonon. La supraconductivité. La théorie de Bardeen, Schrieffer et Cooper proposée dans une série d’articles a permis d’expliquer un phénomène découvert dès 1911 lorsque Kamerlingh-Onnes à trouvé que la résistance de mercure devenait nulle à 4.2K (voir la figure). BCS ont eu le prix Nobel en 1972. Dans cette théorie, la supraconductivité est possible grâce à la formation de paires d’électrons. Les électrons près du niveau de Fermi se regroupent deux par deux, chaque électron de vecteur d’onde ~k s’appariant avec celui de spin opposé de l’état −~k, de manière à former une entité de spin total S = 0. Ces paires, appelées des paires de Cooper, sont des bosons, c’est à dire des particules quantiques de nature fondamentalement différentes des électrons. Les phonons jouent un rôle primordial dans la formation de paires, pour toute une classe de supraconducteurs, appelés des supraconducteurs conventionnels (en contraste avec le supraconducteurs à “haute température critique” découverts en 1986). Un phonon, comme nous allons découvrir en un peu plus de détail dans le chapitre 2, est un mode de vibration des noyaux. Cooper a montré que pour certains cas, les vibrations du réseau peuvent créer une faible attraction entre paires d’électrons. Le potentiel attractif entre paires d’électrons dépend de l’importance de l’interaction électron-phonon. Dans le modèle simplifié de BCS, on introduit un paramètre V qui représente le couplage, et les calculs donneront une température de transition Tc entre la phase “normal” et la phase “supra” en fonction de V . Un des tests de la théorie BCS est de faire des expériences pour voir si Tc varie de façon attendue lorsque le paramètre V change - ce que l’on peut faire dans la pratique en substituant des atomes par des isotopes. La figure montre la dépendance de Tc dans le mercure en fonction de la masse de l’isotope. Contrairement aux fermions, les bosons ont tendance à se rapprocher, et à une température suffisamment basse, il peut se produire une condensation de bosons. C’est ce qui se passe pour les paires de Cooper à la température critique, Tc . Le condensat possède des propriétés nouvelles qui découlent du fait qu’il est un objet quantique macroscopique. L’état supraconducteur est décrit par une fonction d’onde Ψ(~x) que l’on peut factoriser en une amplitude |Ψ(~x)| et un facteur de phase eiΛ . La phase Λ est une propriété de l’ensemble 25 de paires de Cooper, et elle est conservée (on parle alors de cohérence macroscopique). On peut ensuite déduire les propriétés telles que la résistance nulle, et la possibilité d’avoir un courant perpétuel. 1.4.3 Effets du désordre et/ou apériodicité. Jusqu’ici nous avons considéré que l’ordre périodique était parfait. En d’autres termes, la longueur de cohérence ξ de la structure est infinie, où ξ correspond à la distance à partir de laquelle, on ne peut plus écrire avec précision les positions des atomes. Dans la pratique on déduit ξ −1 des clichés de diffraction des rayons-X du cristal - plus les pics de diffusion sont hauts et fins, plus ξ est grande. Pour un cristal de bonne qualité, ξ peut être très grande à basse température (de l’ordre du cm, ce qui correspond à un alignement parfait de quelques millions d’atomes). Par contre, dans un cristal de mauvaise qualité, ou un alliage, où les atomes occupent des sites dans un ordre aléatoire, ξ sera petite. De façon générale il est clair que tous les matériaux sont plus ou moins désordonnés. La théorie des systèmes désordonnés est plus beaucoup plus récente que celle de la section II, et tous les résultats ne sont pas complètement compris. Toutefois, il y a un consensus sur le fait que les états de Bloch d’un cristal parfait disparaissent lorsque le désordre dépasse une valeur critique. Les états à un électron dans un milieu très désordonné sont localisés. Anderson a présenté un modèle simple d’un métal désordonné où l’on peut démontrer qu’il y aura une transition intéressante en d > 2 – la transition métal-isolant – quand le désordre augmente. Le conducteur, avec les états étendus devient subitement un isolant, avec des états localisés. Pour d = 1 les états sont toujours localisés (dès que l’on a un désordre aussi petit qu’il soit) tandis que le cas de d = 2 est un cas limite. Les analyses sont encore plus compliquées lorsque l’on cherche à inclure les interaction s entre électrons. L’étude expérimentales de cette transition et les calculs théoriques continuent d’être des sujets actifs de recherche. Les quasicristaux sont un exemple de système où l’on n’a pas de périodicité, mais où la longueur de cohérence reste très élevée. On peut, en effet, prédire avec certitude la position des atomes, selon des régles plus compliquées que celles d’un cristal. La figure montre un exemple de structure quasipériodique. Il n’existe pas pour le moment de modèle théorique pour ces matériaux. Il est cependant clair qu’ils ne seront pas des bons conducteurs et que les fonctions d’onde des électrons ne seront pas des paquets d’onde de la forme de Bloch, mais seront-ils des isolants, ou des semiconducteurs, ou encore autre chose d’intermédiaire ? La réponse devra venir des calculs avec des techniques nouvelles adaptées à ce cas. Chapitre 2 Propriétés thermiques et acoustiques Du point de vue macroscopique, la distinction entre un solide et un liquide n’est pas toujours évidente. On sait qu’un solide est rigide, et garde sa forme, tandis qu’un liquide coule, et s’adapte à la forme de son conteneur. Mais il y a des situations où l’on a du mal à distinguer le solide du liquide : comment définir, par exemple, la température de gel entre la phase liquide et la phase solide dans un verre ? Nous ne rentrerons pas dans des discussions sur ces systèmes-là, et nous nous restreindrons aux solides cristallins, où les positions moyennes des atomes sont fixes et déterminées par des règles simples. Dans ce chapitre nous allons examiner des propriétés résultant des mouvements des atomes autour de leur position moyenne. L’ordre périodique n’est, en effet, jamais strictement respecté car les atomes ne sont pas immobiles, et peuvent se déplacer de leurs positions d’équilibre à une température finie, par suite des fluctuations thermiques. Même à T = 0 ‘a cause du principe d’incertitude de Heisenberg, on ne peut pas considérer que les atomes soient localisés aux positions fixes - il reste toujours des fluctuations d’origine quantique (appelées “zero point motion” en anglais). Un solide restera un solide tant que l’amplitude de ces mouvements reste bornée, et la transition solide-liquide aura lieu quand ce n’est plus le cas. Une façon de caractériser cette propriété de rigidité du solide est en termes de ses constantes élastiques. Celles-ci expriment la force exercée par un solide lorsque l’on tente de le déformer. En supposant un régime linéaire, un solide comprimé se comportera comme un ressort dont la force de rappel est égale à une constante de raideur multiplié par le changement de longueur. Le solide a aussi une résistance aux forces de cisaillement (comme celles exercées sur la gomme lorsqu’on l’utilise pour effacer). La constante élastique décrivant la réponse du solide à une force de cisaillement devient nulle à la transition solide-liquide : dans un liquide les atomes ne subissent plus une force de rappel élastique. Dans ce chapitre, nous verrons que ces propriétés élastiques du solide permettent la propagation des ondes dans le cristal. On verra qu’il est possible de propager des ondes longitudinales et des ondes tranverses dans un solide (tandis dans les liquides et des gaz dans lesquels il ne peut pas y avoir des ondes transverses). On verra comment le son, qui est une onde longitudinale, peut se propager dans un solide à une vitesse beaucoup plus élevée que dans les liquides et gaz (voir le tableau ci-dessous). Les vibrations atomiques, ou “phonons”, jouent un rôle important pour les propriétés thermiques des solides. Dans ce chapitre, quelques notions de base seront introduites en considérant un modèle simple de vibrations atomiques dans une chaı̂ne d’atomes. La théorie 26 27 classique sera présentée, et ensuite sa version quantique. La généralisation à trois dimensions sera rapidement expliquée. Quelques applications physiques de ce modèle seront ensuite présentées. La dernière section donne une liste non-exhaustive d’interactions possibles entre les phonons et d’autres excitations élementaires dans le solide. milieu (25◦ C) air eau glycerol Cu Fe C (diamant) caoutchouc c (ms−1 ) 343 1493 1904 3560 5130 12000 1600 Tableau 1. Quelques valeurs de la vitesse du son dans des milieux divers : gaz, liquides et solides 2.1 Modèle classique de vibrations Fig. 2.1 – Onde longitudinale se propageant dans un barreau solide. La figure ci-dessus montre un barreau solide dans lequel se propage une onde longitudinale de compression et dilatation. On peut exciter des ondes de ce type en tapant avec un marteau sur une des extrémités du barreau. Comme nous allons voir dans cette section, la vitesse de propagation d’une telle onde dépend des constantes élastiques du matériau. Nous commencerons la discussion par un modèle unidimensionnel simple qui permet d’étudier la propagation des ondes dans un milieu cristallin. 2.1.1 Chaı̂ne périodique de N atomes identiques On considère donc une chaı̂ne d’atomes avec, au repos , une distance entre atomes a. A l’équilibre, les positions des atomes sont donc données par na (n = 0, 1, ..., N − 1). C’est la configuration qui minimise l’énergie potentielle totale des atomes. Lorsque la température T > 0, les atomes peuvent se déplacer, au prix d’une augmentation de leur énergie potentielle. On cherche à établir l’équation du mouvement des atomes. Considérons d’abord une paire d’atomes proches voisins. Nous appelons un et un+1 les déplacements du nième atome 28 et de son voisin par rapport à leurs positions d’équilibre. La distance entre les deux est changée de un+1 − un . En supposant que l’énergie potentielle a une forme de puits harmonique (ce qui est généralement le cas pour des déplacements très petits), on peut en déduire une force de rappel F = K(un+1 − un ). La “constante de raideur” K, qui est la dérivée seconde de l’énergie potentielle, a une valeur plus ou moins importante selon la composition chimique, la structure du composé, etc. Fig. 2.2 – Chaı̂ne d’atomes identiques de masse m L’équation de mouvement du nième atome sera (en tenant compte des mouvements de ses deux voisins) : m d2 ui dt2 = −K[(ui − ui−1 ) + (ui − ui+1 )] (2.1) = K[ui+1 + ui−1 − 2ui ] où m est la masse d’un atome. L’équation 2.2 est une version discrète de l’équation des ondes ( d’Alembert : ∂ 2 u/∂t2 = c2 ∂ 2 u/∂x2 ). On peut donc écrire des solutions de la forme un (t) = A Re ei(kna−ωk t) = A cos(kna − ωk t) (2.2) (Re : partie réelle), où A est l’amplitude de l’onde, k le vecteur d’onde (k = 2π/λ, où λ est la longueur d’onde, et ωk est la pulsation de l’onde. Les valeurs de k permises sont déterminées à partir des conditions aux limites. Pour une chaı̂ne de longueur L = N a répétée de façon périodique, on doit avoir un+N = un , ce qui donne kn = 2nπ , n = 0, ±1, ...., L (2.3) Etant donné la périodicité de la solution 2.2, il y a exactement N solutions distinctes possibles, c’est-à-dire, autant de valeurs distinctes de kn que d’atomes. Noter aussi que lorsque N → ∞, k devient une variable continue dans l’intervalle [− πa , πa ) - la “première zone de Brillouin”. On peut déterminer la valeur de ωk en substituant la forme 2.2 dans l’éq.2.2, et l’on trouve r K ω(k) = (2 − 2 cos(kn a)) (2.4) m r 1 K =2 | sin( kn a)| m 2 29 La courbe de ω en fonction k (la relation de dispersion) est montrée dans la Fig.2.3. Pour k petit, on peut approcher la courbe par une droite, et alors on a ω ≈ ck, comme pour les ondes sonores habituelles. Il s’agit ici, en effet, d’une onde acoustique de même type que celle qui se propage dans l’air. La vitesse du son, qui a une valeur d’environ 343 m/s dans l’air, est ici donnée par la relation r K c=a (2.5) m La vitesse c est beaucoup plus élevée dans le solide, car les forces de rappel entre les atomes sont beaucoup plus importantes que celles entre les molécules de l’atmosphère (penser aux ondes sur une corde tendue, et à leur vitesse en fonction de la force de tension). Pour des valeurs de k plus grandes, il faut utiliser l’expression complète de ω(k) de l’éq.2.5. Lorsque la fréquence est, comme ici, une fonction nonlinéaire de k, la vitesse c des ondes dépend de k. On parle alors de la vitesse de phase, vph = ω/k et la vitesse de groupe, vg (k) = dω/dk. La pente de la courbe ω(k) n’est autre que la vitesse de groupe, et celle-ci décroı̂t progressivement lorsque k augmente, devenant nulle au bord de la zone de Brillouin. C’est l’analogue de ce qui se passe avec les électrons près du bord de la zone de Brillouin. Fig. 2.3 – Relation de dispersion pour la chaı̂ne d’atomes Q1 : On peut “faire chanter” un long barreau d’acier en l’attachant à son milieu, et en frottant avec un tissu. Le son émis peut être capté avec un microphone. Sachant que la vitesse du son dans l’acier est c = 0.59cm/µs, et pour une longueur d’onde dans le mode fondamental de 2L où L = 0.75m, quelle est la valeur de la fréquence correspondante ? Refaites le calcul pour un barreau de fer de la même longueur et pour lequel c = 0.48cm/µs. Est-ce que l’on pourrait entendre la différence entre les deux matériaux ? 2.1.2 Le mouvement des atomes en fonction de k. Périodicité de ω. Il est important de souligner que le vecteur d’onde n’est défini, dans le cristal, qu’au vecteur g = 2π/a près. Il est facile de vérifier que les déplacements des atomes dues à une onde de vecteur d’onde k et celle de k + g sont identiques. L’énergie de ces deux ondes est bien sur la même - autrement dit, ω(k) est une fonction périodique dans l’espace des k. ~ (Ce résultat est également vrai pour des systèmes de dimension d > 1, avec des vecteurs G du réseau réciproque à la place de g. Nous parlerons ainsi plus loin des processus appellés 30 des collisions “umklapp”, où l’onde ~k échange une quantité de mouvement avec le réseau et ~ devient l’onde finale ~k + G). Pour les longueurs d’onde très grandes (k petit), il y aura une lente variation des déplacements un et peu de variation entre proches voisins. La distance entre voisins est très proche de la valeur a. Dans la limite k → 0 les “ressorts” entre atomes ne sont pas déformés, ce qui explique le fait que la fréquence ω tend vers 0 dans cette limite. Dans l’autre limite de k = π/a, la longueur d’onde est 2a, et chaque atome est en opposition de phase avec ses proches voisins. Ceci veut dire que les ressorts sont alternativement comprimés et étendus tout le long de la chaı̂ne d’atomes. Un tel mouvement q coûte évidemment beaucoup plus d’énergie, et la fréquence prend sa valeur maximale, 2 K m . De plus, il y a un mélangé des ondes de vecteur d’onde k = πa avec l’onde de k − g = − πa , d’où la formation d’onde stationnaire comme pour les électrons du chapitre 1. 2.1.3 Les vibrations dans les cristaux de dimension 2 et 3 On peut étendre les idées précédentes aux réseaux de plusieurs dimensions, même si le modèle devient assez complexe pour d = 3. Pour résumer les résultats principaux : on trouve, comme dans le modèle unidimensionnel, dN modes différentes de la vibration atomique. Chaque mode est décrit par un vecteur d’onde ~k, avec une fréquence ω(~k) correspondante. Ces fréquences seront des fonctions des constantes élastiques du matériau (voir la section suivante). Valeurs distinctes de k A une dimension, rappelons que les valeurs de k pour une chaı̂ne périodique de N atomes sont espacées de δk = N2πa et k ∈ [− πa , πa ]. Dans le cas d’un réseau carré (d=2) ou réseau cubique (d=3), de façon analogue, les vecteurs d’ondes ont des valeurs discrètes espacées de N2πa selon chaque direction, où a est la distance entre proches voisins. Si l’on appelle WB le volume qui correspond à la première zone de Brillouin, ~k ∈ WB (2.6) Pour le cas d=3 WB est un cube de coté 2π/a. Il n’est pas difficile de voir que le nombre de valeurs distinctes de ~k est, comme à une dimension, égal au nombre d’atomes X 1=N (2.7) ~k Dans la limite N → ∞, on peut remplacer la somme par une intégrale Z X =V dd kρ(~k) ~k (2.8) WB où V = Ld est le volume du cristal et la densité d’états ρ(~k) = (1/2π)d a été introduite dans Ch.1. Plusieurs valeurs de ω pour chaque valeur de ~k Pour d = 3 (et pour un cristal ayant un atome par maille), il y aura trois modes de vibrations pour chaque valeur de ~k. On peut les écrire ωµ (~k), µ = 1, .., 3. Pour une direction de propagation le long d’un des axes du cube, par exemple, on a trois polarisations possibles de l’onde : une longitudinale (tous les atomes se déplacent parallèle à la direction de propagation) et deux tranverses (c.a.d. des mouvements sont dans le plan perpendiculaire à la direction de propagation). Au totale, on a donc bien 3N modes comme indiqué précédemment. 31 Comportement de ω pour k petit Pour des grandes longueurs d’onde (|~k| petit), il y aura 3 ondes acoustiques de polarisations différentes, et ayant des vitesses différentes. Dans le cas le plus simple d’un cristal cubique, et lorsque l’onde se propage selon un des axes de symétrie, on peut écrire des relations linéaires approchées suivantes ωl (~k) = cl k; ωt (~k) = ct k (2.9) où k est la valeur absolue du vecteur d’onde, et l et t indique la direction de polarisation de l’onde. (Nb. Il y a un mode l de vitesse cl et deux modes t, de la même vitesse, ct ). Quelques valeurs des vitesses correspondantes sont données dans le tableau. métal Al acier ρ(g/cm3 ) 2.7 7.9 cl (m/s) 6420 5790 ct (m/s) 3040 3100 Tableau 2. Exemples des vitesses acoustiques dans des métaux Expression des vitesses du son en fonction des constantes élastiques La théorie de vibrations harmoniques dans un cristal à trois dimensions ne sera pas abordée en détail ici, nous nous contenterons de présenter quelques idées simples. La complexité des mouvements peut s’exprimer du simple fait qu’il faut un grand nombre de constantes élastiques pour caractériser les forces de rappel dans un cristal dans trois dimensions : jusqu’à 21 constantes différentes au lieu d’une seule en d = 1 ! Pour un cristal cubique, toutefois, les symétries permettent de réduire ce nombre à seulement 3, appelées C11 , C12 et C44 . La première, C11 (aussi appelée module de Young), donne la déformation du solide lorsqu’il est comprimé. Elle peut être obtenue dans une expérience où l’on comprime un barreau solide en appliquant une force de compression uniaxiale, à partir de la relation P = C11 ∆L L (2.10) où P est la pression, L la longueur initiale et ∆L le retrécissement. Il doit être évident que C11 est l’analogue de la quantité K introduite pour la chaı̂ne d’atomes. C44 décrit par exemple la déformation suite à un cisaillement du solide. C12 décrit le changement de longueur dans une direction perpendiculaire à l’axe de compression. Le solide se distingue ainsi du liquide ou du gaz qui, eux, sont caractérisés par une compressibilité (la résistance du fluide à un changement de volume). On considère le cas d’une direction de propagation le long d’une des axes du cristal cubique. La vitesse de l’onde “longitudinale” cl est donnée par s C11 cl = (2.11) ρ q où ρ est la masse volumique. La vitesse des deux ondes tranverses est donnée par ct = Cρ44 . Dans la plupart des matériaux, en supposant des forces centrales, la constante C11 aura la valeur la plus grande de toutes les constantes élastiques et une des conséquences en est que vl est typiquement environ deux fois plus grande que vt . Notons qu’il n y a pas d’équivalent de l’onde transverse dans un fluide. Q2 : Les valeurs des constantes élastiques pour trois cristaux cubiques sont données dans le tableau ci-dessous (les unités des C sont en 107 N cm−2 ) 32 métal Na Cu C11 0.07 1.68 C12 0.06 1.21 C44 0.045 0.75 Tableau 2. Deux métaux et leurs constantes élastiques Pour lequel des deux métaux dans le tableau la propagation d’une onde de compression sera-t-elle la plus rapide ? On donne ρN a = 0.97g/cm3 , ρCu = 8.96g/cm3 . Q3 : On mesure c = 0.589cm/µs dans un barreau d’acier et c = 0.480cm/µs dans un barreau de fer. Leurs masses volumiques sont proches. Lequel des deux matériaux choisiriez-vous pour construire un pont ? (raisonner à partir du modèle qui vient d’être présenté) 2.1.4 Modes optiques. Chaı̂ne à deux constantes de couplage. Fig. 2.4 – Une chaı̂ne avec deux atomes par maille Les solides ne sont pas tous, évidemment, constitués d’une seule espèce d’atomes comme nous l’avons supposé dans notre modèle de vibrations. Un composé tel que N aCl (sel de table) a une structure de deux atomes par maille élementaire, chaque atome de N a est accompagné de son voisin Cl situé à une distance a/2, par exemple. On verra que cette fois, les mouvements atomiques rendent possible des nouveaux phénomènes comme l’émission de photons, et de la lumière (d’où le nom de phonon optique). Lorsqu’il y a deux (ou plusieurs) atomes par maille, comme dans la chaı̂ne dans la fig.2.4, on a la possibilité d’avoir, en plus de l’onde acoustique décrite ci-dessus, des modes de vibration appelés “optiques”. Pour comprendre mieux de quoi il s’agit, prenons un modèle simple d’un cristal à une dimension composé de deux types d’atomes. On prend une chaı̂ne de 2N atomes, dont N de type “A” et N de type “B”. Le pas du réseau, a, est donné par la distance entre deux atomes “A”. On peut avoir une situation où les forces de rappel sont différentes, et alternent entre deux valeurs K1 et K2 (ce qui peut se produire lorsque les distances entre l’atome A et ses voisins de gauche et de droite ne sont pas identiques). Dans ce cas on a une série d’équations couplées, comme pour la chaı̂ne simple : on note xi le déplacement de la position d’équilibre d’un atome A, et yi celui de 33 l’atome B à sa droite, et l’on a d2 xi dt2 d 2 yi m 2 dt m = −[K1 (xi − yi−1 ) + K2 (xi − yi )] (2.12) = −[K2 (yi − xi ) + K1 (yi − xi+1 )] (2.13) On cherche des solutions ondes planes de la forme ( partie réelle implicite) xn (t) = αei(kna−ωt) (2.14) i(kna−ωt) (2.15) yn (t) = βe Substituant dans l’éq.2.13, on trouve deux équations que l’on peut mettre sous la forme µ ¶µ ¶ mω 2 − (K1 + K2 ) K1 + K2 eika α =0 (2.16) β K1 + K2 e−ika mω 2 − (K1 + K2 ) Pourqu’il y ait des solutions non-triviales de cette équation, il faut que le déterminant de la matrice soit nul. On a ainsi le résultat suivant pour les fréquences ω, p K12 + K22 + 2K1 K2 cos(ka) K1 + K2 ω± (k) = ± (2.17) m m Il est facile de vérifier que, pour petit k, ω− ≈ ck où c est la vitesse du son. C’est la fréquence associée au mode dit acoustique car c’est l’équivalent de l’onde sonore dans le solide. La deuxième solution ω+ reste élevée même lorsque k → 0 (voir la figure). Quelles sont les vibrations atomiques correspondantes ? La solution complète de l’éq.2.16 pour k = 0 donne aussi α = ±β pour les amplitudes de l’onde sur les atomes A et B. Dans le cas de l’onde acoustique, les deux atomes dans chaque maille ont un mouvement en phase. Cela ne coûte évidemment rien en ce qui concerne l’énergie potentielle du ressort entre les deux atomes, d’où une fréquence nulle pour ce genre de vibration. Dans le cas de l’onde “optique”, au contraire, les phases sont en opposition, et la fréquence ω+ est la moyenne géométrique des deux constantes de couplage. Tout au long de la chaı̂ne, des paires d’atomes effectuent exactement le même mouvement. Lorsque A et B sont des noyaux de charges opposées, la paire de charges oscillant en opposition de phase agit comme un dipole électrique, qui est un capteur/émetteur d’ondes électromagnétiques à la manière d’une antenne miniature. Dans certains matériaux, ω+ correspond à une fréquence des ondes visibles (ou plutôt infrarouges), d’où le nom de ce mode de vibration. 34 Fig. 2.5 – Relation de dispersion pour la chaı̂ne de deux atomes par maille 2.2 Le passage vers une description quantique. Les phonons. A T > 0, le mouvement des atomes est le résultant des différents modes de vibration qui sont excités, correspondant à des longueurs d’onde et fréquences différentes, Dans la théorie harmonique, valable à basse température, ces ondes se propagent indépendamment les unes des autres. Dans ce cas, on peut retrouver les équations du mouvement de l’éq.2.2 à partir de hamiltoniens de N oscillateurs harmoniques indépendants. La chaleur spécifique par atome d’un tel ensemble d’oscillateurs classiques est indépendente de la température, cV (T ) = 3kB (loi de Dulong-Petit). Or, les mesures expérimentales montrent que la chaleur spécifique croı̂t en fonction de T (voir figure). Einstein et Debye ont contribué à la résolution de ce problème en considérant des modèles quantiques du mouvement des atomes. La description quantique de chacun de ces oscillateurs est un problème bien connu dans les cours de mécanique quantique, et nous allons supposer que les notions de base vous sont déjà familières. Rappelons donc que dans le modèle quantique d’un oscillateur à une dimension de fréquence ω l’énergie prend des valeurs discrètes, ~ω(n + 12 ). n = 0, 1, ... est le nombre quantique qui sert à repérer les états propres du système |ni. On peut généraliser ce résultat au cas d’un grand nombre d’oscillateurs. Dans le calcul quantique pour la chaı̂ne d’atomes, l’énergie totale sera la somme des énergies de N oscillateurs harmoniques, et H= X 1 ~ωk (nk + ) 2 (2.18) où nk est la valeur moyenne du nombre quantique du mode k, nk = 0, 1, 2, .... L’état fondamental correspond à nk = 0 pour tous les modes. On voit que l’énergie de cet état n’est pas nulle - c’est une conséquence, comme nous avons déjà remarqué, du principe d’incertitude de Heisenberg, selon lequel on ne peut pas trouver un atome dans un état où x et p 35 s’annulent simultanément. En conséquence, les atomes n’arretent jamais de bouger même à température nulle. 2.2.1 Température T 6= 0. La distribution de Planck Quand la température est très basse, seuls les états de ~ωk petite seront excités, comme on verra ci-dessous. Au fur et à mesure que T augmente, le nombre de phonons excités, nk , dans chaque mode augmentera, et des modes d’énergie de plus en plus grande seront présents. On peut calculer la valeur moyenne thermique de nk en utilisant des méthodes bien connues de la physique statistique. Notons que les phonons sont des bosons, et que leur nombre n’est pas conservé. La nombre moyen de phonons de vecteur d’onde k est donnée comme pour les photons, par la fonction de distribution de Planck (on passe à une notation continue pour k), hn(k)i = 1 . e~βω(k) − 1 (2.19) Quand la température est très basse, et ~βω(k) >> 1, il y aura peu de phonons de fréquence ω(k) excités dans le cristal, car hn(k)i ≈ e−~βω(k) << 1 (2.20) Quand la température est très grande devant l’énergie des phonons, de sorte que ~βω(k) << 1 on excite au contraire beaucoup de phonons hn(k)i ≈ 1 >> 1 ~βω(k) (2.21) Enfin, notons une proportionnalité entre l’énergie et le nombre pour des températures élevées, lorsque hn(k)i est grand, 1 E(k, T ) = ~ω(k)(hn(k)i + ) ≈ ~ω(k)hn(k)i 2 (2.22) Dans l’image classique, l’énergie d’un oscillateur est proportionnelle à l’amplitude carrée du mouvement. On s’attend à ce que l’amplitude carrée des mouvements atomiques soit proportionnelle à n(k) et qu’elle va donc croı̂tre en fonction de T. Toutefois, à haute température, il ne faut pas prendre notre modèle trop au sérieux - il n’est applicable que pour des mouvements petits devant la séparation entre atomes. Quand la température est très élevée, ces mouvements deviennent de plus en plus importants, jusqu’à ce que le cristal fonde. Q4. D’où vient, d’après vous, le nom de “phonon” pour parler des modes de vibration du réseau ? (Dans la physique, celle du solide en particulière, on une prolifération d’objets quantiques de noms exotiques : on y rencontre des plasmons, des polarons, des rotons, des spinons, excitons,....) 2.3 Propriétés thermiques des cristaux. Modèle de Debye. Dans cette section, nous allons présenter le modèle de Debye (1936) pour la chaleur spécifique des cristaux. Nous avons vu que, dans le cadre d’un modèle simple de forces 36 de rappel linéaires, les atomes peuvent se déplacer de façon collective, dans des modes de vibration indépendants, chacun caractérisé par une valeur du vecteur d’onde ~k, un indice de polarisation µ = 1, 3 et la fréquence ωµ (~k). Dans la théorie quantique, l’hamiltonien est la somme sur tous les hamiltoniens de ces oscillateurs harmoniques indépendants H= XX µ ~k 1 ~ωµ (~k)(n̂µ (~k) + ) 2 (2.23) Le nombre moyen de phonons d’un mode (~k, µ) donné est donné par la distribution de Planck nµ (~k) = 1 eβ~ωµ (~k) − 1 (2.24) (où β = 1/kB T ) L’énergie interne est la valeur moyenne thermique de H, hHi = XX µ ~k 1 ~ωµ (~k)h(n̂µ (~k) + )i 2 (2.25) = E(T ) + E0 et la chaleur spécifique est cV (T ) = N −1 ∂E/∂T . Le modèle de Debye dans sa version la plus simple consiste à simplifier encore ces expressions en posant ωµ (~k) = ĉk (0 < k < kD ) (2.26) où ĉ est la vitesse du son “moyenne” pour toutes les directions de l’espace (la définition précise ne nous concernera pas ici), et où l’on a pris des vecteurs d’onde à l’intérieur d’une sphère de rayon kD au lieu de les prendre dans la première zone de Brillouin. Le rayon de la sphère est déterminé en demandant que la sphère ait le même volume que la première zone de Brillouin. Cela donne pour le cristal cubique simple 4π 3 2π kD = ( )3 3 a 2 1/3 kD = (6π ) a (2.27) On s’attend à ce que les approximations faites ci-dessus marchent bien, d’une part, quand T est très basse, car alors seuls les phonons de basses énergies seront présents, pour lesquels 1) la relation de dispersion est effectivement linéaire, et 2) le changement de la région d’intégration n’a aucune incidence. A l’autre extrême, à des valeurs de T très élevées le modèle de Debye donnera les bons rśultats car alors la chaleur spécifique devient indépendante de T quelque soit la relation de dispersion, du moment où l’on a conservé le nombre totale de modes (3N ). Entre les deux limites, on peut effectivement constater des déviations des prédictions du modèle de Debye. Dans le modèle, on a la fréquence maximale caractéristique du solide, appellée fréquence de Debye, ωD = ĉkD . On définit également une température de Debye TD = ~ωD /kB . Ces quantitiés varient selon la substance considérée. Quelques valeurs de TD sont données dans le tableau, ainsi que les températures de fusion Tm (on peut constater une corrélation entre ces deux : plus TD est grande, plus la température de fusion est élevée). 37 Q5 : Calculer le vecteur d’onde de Debye, la fréquence maximale ωD , et la température de Debye TD pour un cristal cubique simple ayant a = 2.5A, et dans lequel la vitesse de son est ĉ = 5000m/s. Comparer avec la valeur de TF pour ce cristal en supposant que chaque atome libère un électron. Q6 : Comparer les expressions de kD et kF pour un cristal cubique simple contenant N atomes de valence Z dans un volume V . Pour Z = 1 est-ce que les deux vecteurs d’onde ont des valeurs proches ? métal Li Na Al C (dia.) TD 700 K 150 K 394 K 1860 K Tm 453 K 371 K 933 K 4300 K Tableau 4. Quelques valeurs typiques de TD et la température de fusion Tm Propriétés thermiques à des températures très élevées Lorsque T >> TD , il n’est pas nécessaire de recourir à l’approximation de Debye, car le nombre de photons est ≈ kB T /~ω pour tous les modes, et l’éq.2.26 devient E(T ) = 3 X ~k kB T = 3N kB T ~ω(~k) × ~ω(~k) (2.28) La chaleur spécifique est donc cV (T ) = 3kB , comme pour un gaz classique (résultat de Dulong et Petit). Températures très basses Revenant à l’expression de l’énergie interne, on a E(T ) = 3 V =3 (2π)3 Z X ~ Zk ~ω(~k) 1 eβ~ω − 1 (2.29) 1 dΩ~ck β~ck e −1 Z 3 3V c k = dk β~ck 2 2π e −1 3V c 1 I ∝ T4 = 2π 2 (β~c)4 k 2 dk où l’on a d’abord substitué la somme par une intégrale sur le rayon k et l’angle solide Ω et dans la dernière ligne, on a éffectué un changement de variables en termes d’une nouvelle variable sans dimensions x = ~βck. L’intégrale I, Z xD x3 I= dx x (2.30) e −1 0 sera donc aussi sans dimension, et doit être calculée numériquement pour une valeur de température donnée. Toutefois, pour de basses valeurs de T , la limite supérieure, xD = 38 β~ckD → ∞, et I approche rapidement sa valeur asymptotique de π 4 /15. La chaleur spécifique est cV (T ) = 1 ∂U 12π 4 T 3 = ( ) kB N ∂T 15 TD (2.31) On a le comportement de CV en T 3 dû aux vibrations du solide auquel on a déjà fait allusion dans le chapitre 1. La chaleur spécifique, puisque dépendant du rapport TTD sera évidemment faible pour des températures petites devant TD . La théorie de Debye a ainsi pu expliquer les observations expérimentales qui montraient un écart important par rapport à la seule théorie qui était alors disponible, celle de Dulong et Petit. A partir des données comme celles montrées dans la courbe de cV (T ), on peut extraire la valeur de la température de Debye. C’est ce qui a été fait dans le tableau ci-dessous, où l’on donne donne quelques valeurs représentatives. Q7. Compléter les calculs qui donnent l’expression finale de la chaleur spécifique l’éq.2.31, partant de la définition de E(T ) (dans l’éq.2.28) et de TD . Les figures montrent la chaleur spécifique mesurée dans plusieurs matériaux, le cuivre, l’aluminium et le diamant. On voit ( à gauche) que lorsque l’on porte cV en fonction de T , les courbes sont toutes différentes, ce que l’on comprend facilement vu les différences de valeur de TD de ces substances. La théorie de Debye prédit, par contre, que l’on trouvera une seule courbe si l’on trace cV en fonction de la variable T /TD . On voit que c’est effectivement le cas dans la figure de droite. Fig. 2.6 – La chaleur spécifique de trois matériaux en fonction de T (gauche) ; en fonction de T /TD (droite) 2.3.1 Comparaison des chaleurs spécifiques des électrons et des phonons Pour une grande gamme de températures autour de la température ambiante, la chaleur spécifique due aux électrons est une fonction linéaire de T , tandis que celle des phonons dépend de T 3 . Pour voir laquelle des deux est plus importante, on peut considérer leur rapport ph cel V (T )/cV (T ) = TD3 5 24π 2 TF T 2 (2.32) où TF , la température de Fermi est typiquement dix fois plus que TD . On constate que le rapport est grand, c.a.d. les électrons contribueront plus à la chaleur spécifique que les 39 phonons, si la température T << T0 , tandis que pour T >> T0 , l’inverse est vrai. La q 3 température T0 ≈ 5TD /(24π 2 TF ) est généralement très basse, ce qui veut dire que c’est les phonons qui sont responsables de la chaleur spécifique des matériaux à température ambiante. Q8. Trouver la température T0 en dessous de laquelle la contribution des électrons à la chaleur spécifique devient plus importante que celle des phonons dans le cuivre. 2.4 Quand l’approximation harmonique devient insuffisante Nous avons mentionné le fait que, lorsque T augmente, l’amplitude des vibrations augmente. A partir d’une certaine température, l’approximation harmonique ne sera plus bonne, et les forces de rappel seront, en général, nonlinéaires en fonction des déplacements. Il faut alors prendre en compte des interactions anharmoniques entre atomes. Lorsque ces interactions sont petites, on peut considérer que les modes restent proches des phonons que nous avons déjà décrits. Cependant, les phonons ne sont plus indépendants les uns des autres, et il y a des collisions entre phonons (intéractions phonon-phonon), qui ont pour effet de détruire le phonon au bout d’un temps τ caractéristique. Ces interactions dues aux termes anharmoniques sont d’ailleurs essentielles pour comprendre pourquoi la conductivité thermique des matériaux n’est pas infinie. En effet, si les phonons n’étaient jamais diffusés, la conductivité thermique serait infinie (penser au modèle de conductivité électrique pour les électrons qui ne sont jamais diffusés). Dans la pratique, la chaleur est transportée plus ou moins bien selon la probabilité de diffusion des phonons par les autres phonons. Il faut aussi tenir compte les processus de diffusion des phonons par ~ (se rappeler que ~k le réseau lui-même - le fait qu’un vecteur d’onde ~k peut devenir ~k + K est défini à un vecteur d’onde du réseau réciproque près) où K est un multiple de 2π/a. 2.5 2.5.1 Collisions entre phonons et d’autres particules Collisions avec des neutrons Le neutron est utilisé très couramment dans les études de phonons. On bombarde le cristal avec un faisceau de neutrons, dont les impulsions sont bien définies, et l’on trie les neutrons sortant du cristal en fonction de leurs énergies et de leurs impulsions finales. Un neutron d’impulsion p~ peut absorber ou émettre un phonon de vecteur d’onde ~k. Utilisant les principes de conservation de quantité de mouvement et de l’énergie, on peut écrire l’impulsion et l’énergie du neutron après la collision ~ p~0 = p~ ± ~(~k + K) ²0 = ² ± ~ω(~k) (2.33) où l’on a pris en compte la possibilité que le réseau puisse contribuer une l’impulsion ~K ~ K) = ω(~k)). On peut trier les neutrons sortant (sans que cela coûte une énergie, car ω(k + par leurs impulsions et leurs énergies, et ainsi remonter à des informations utiles sur les phonons. Lorsque l’on ne connaı̂t pas la structure du réseau, la diffusion des neutrons est utilisé dans la détermination de la structure – on considère uniquement des collisions ~ avec élastiques où le neutron garde son énergie mais échange une quantité de mouvement ~K 40 ~ du réseau le réseau. En mesurant les impulsions p~ et p~0 , on peut remonter aux vecteurs K réciproque. Une fois ces vecteurs connus, il est souvent facile d’en déduire la structure. Q9. Que se passe-t-il quand un neutron “absorbe” un phonon - pouvez vous décrire qualitativement l’état du cristal avant et après une telle collision ? Quelle est l’énergie en eV et la longueur d’onde de de Broglie λ = h/p d’un neutron de vitesse 2000m/s ? (mn = 1.67 × 10−27 kg) 2.5.2 Collisions avec des photons Les collisions entre phonons et photons sont régies par les mêmes principes de conservation d’énergie et d’impulsion que ceux énoncés ci-dessus. Il y a toutefois une différence majeure entre les photons et les neutrons. Celle-ci provient de la grande différence des vitesses de propagation du photon et du phonon. En conséquence, pour un photon de lumière, son vecteur d’onde est proche de zero, comparé aux valeurs de k possibles des phonons. Donc, pour un photon incident avec impulsion ~~q et sortant après absorption d’un phonon, avec une impulsion finale ~q~0 et sachant que ~ ~q~0 = ~~q ± ~(~k + K) (2.34) on voit que K est obligatoirement égal à zero (pas de échange d’impulsion avec le réseau) et que le phonon impliqué dans la collision aura une valeur de k proche de zero. On ne “verra” ainsi que des phonons de très basse fréquence par la diffusion de la lumière. Dans des expériences de diffusion de la lumière, on envoie un faisceau de lumière de fréquence initiale connue, et on enregistre l’intensité de la lumière sortant en fonction de la fréquence finale. Ce spectre de Brillouin montrera deux pics de part et d’autre du pic central, qui correspondent aux photons après absorption/emission d’un phonon. 2.5.3 Collisions avec des électrons Les phonons et les électrons, habitent le même espace – l’intérieur du solide – et les effets des uns sur les autres sont diverses et variés. Le plus spectaculaire est l’état supraconducteur, que l’on discutera plus tard (chapitre 3). Les deux particules ne sont pas sur un pied d’égalité car un électron a une énergie beaucoup plus élevée qu’un phonon, pour des vecteurs d’onde comparables. Toutefois, les phonons jouent un rôle important dans les propriétés électroniques des solides. (Les semiconducteurs sont des matériaux où les interactions entre électrons, photons et phonons peuvent donner lieu à des propriétés optiques, thermiques et électriques diverses, très utiles dans une variété d’applications technologiques. Nous n’aurons pas le temps dans ce cours d’en parler plus.) Parlons d’une des conséquences les plus évidentes de l’interaction entre phonons et électrons. Il s’agit de la baisse de la conductivité électrique à cause de la diffusion des électrons par les phonons, ce qui nous ramène à la discussion entamée dans le premier chapitre sur ce sujet (le modèle de Drude). Le libre parcours moyen l est fortement diminué lorsque l’électron subit des diffusions multiples avec les phonons. Le temps de relaxation τ (T ), qui est proportionnel au libre parcours moyen, diminue quand la température augmente à cause de l’augmentation du nombre de phonons. Le résultat en est que la conductivité électrique σ(T ) décroı̂t en fonction de T dans la plupart des métaux. Rappelons que l’aluminium a une conductivité plus faible que celle du cuivre malgré un nombre plus élevé 41 d’électrons de conduction. On peut maintenant donner une explication de ce fait en notant qu’à une température donnée, il est plus facile d’exciter des phonons dans l’Al à cause du fait que les atomes sont plus légers que ceux du Cu. 2.6 Le gaz de phonons. Le second son On termine ce chapitre avec un exemple de phénomène purement quantique associé à l’existence des phonons. C’est la possibilité de créer des vibrations appelées “second son” dans certains cristaux. Imaginons que le cristal est un conteneur d’un gaz de particules, les phonons. Ces phonons ont une durée de vie finie (du fait des collisions avec le réseau et avec les autres phonons) mais assez long pour que l’on puisse faire des observations expérimentales. En analogie avec un gaz de molécules, la théorie montre qu’une onde de compression/raréfaction pourrait s’établir dans le gaz de phonons sous certaines conditions. Ces conditions sont réunies dans le He3 solide. Une onde de compression/raréfaction dans un gaz de phonons correspond à des oscillations d’énergie interne dans l’espace et dans le temps. Si une telle onde était excitée, il y aurait une oscillation de la température locale en fonction du temps. L’existence du second son a été démontré dans des expériences où l’on a réussi à faire propager un pulse de chaleur avec une vitesse constante à travers un cristal de helium solide. Cette propagation n’est possible que dans une gamme très réduite de T , en contraste avec le mode habituel de propagation diffusif de la chaleur. He3 . Chapitre 3 Magnétisme et supraconductivité. Nous allons clore ce cours d’initiation aux modèles de la physique du solide avec une discussion de quelques transitions de phase de la matière. On commence par les matériaux tels le fer qui a donné son nom à toute une classe de matériaux appelés des ferromagnétiques. Dans ce matériau, on a une transition de phase lorsque l’on baisse la température, d’un état où les spins des atomes de Fe sont désordonnés, à un nouvel état où les spins sont alignés selon une certaine direction. Nous allons parler très rapidement d’une transition de phase qui a lieu dans beaucoup des métaux lorsque l’on baisse la température et le solide devient supraconducteur. C’est le phénomène découvert par Kamerlingh Onnes en 1911, lorsqu’il a constaté que la résistance d’un échantillon de mercure tombait brutalement à zero en dessous d’une certaine température. 3.1 Description de composés magnétiques Dans les matériaux magnétiques que nous allons considérer ici, le magnétisme provient du moment magnétique total des électrons dans des orbitales d ou f partiellement remplies. Dans la figure, qui montre quatre différentes types de structures magnétiques dans un cristal, on a représenté les moments magnétiques des atomes par des petites flêches. En effet, contrairement aux électrons des orbitales p ou s, qui se libèrent (en ce qui concerne les couches extérieures) de leurs atomes parents et se promène librement dans tout le volume disponible, les électrons d et f sont moins mobiles. Ils contribuent donc de façon importante au moment magnétique effectif de l’atome (ou ion). Avant d’en venir aux atomes, toutefois, nous allons rapidement mentionner le rôle joué par les électrons de conduction. Ils contribuent, eux aussi, quoique plus modestement que les atomes que nous allons considérer, aux propriétés magnétiques. Propriétés sous champ du gaz d’électrons de conduction Avant d’en venir aux atomes, on doit souligner que les propriétés magnétiques d’un métal seront en partie aussi dues aux électrons de conduction. Rappelons que l’électron est une particule de spin 12 , une propriété que nous n’avons pas, jusqu’ici, eu l’occasion de considérer (hormis le facteur “2” dans les formules de la densité d’états électronique !) Lorsqu’un champ extérieur B est appliqué, les électrons seront polarisés, et on aura une petite contribution à l’aimantation M qui vient du fait qu’il y aura plus de spins parallèles au champ que antiparallèles. On dit que c’est un comportement paramagnétique : M et 42 43 Fig. 3.1 – Quatre organisations possibles de moments magnétiques dans l’espace : sans ordre (paramagnétique), alignés (ferromagnétique) ou antialignés (deux derniers cas) H sont parallèles. Il y a un deuxième effet, à cause de la loi de Lenz – les électrons de conduction vont tenter d’écranter le flux magnétique à l’intérieur du métal. Cela implique qu’ils tentent de réduire autant que possible l’induction B = µ0 (H + M ) (µ0 = 4π × 10−7 NA−2 ). Pour donner une image classique, ils se tournent autour des lignes du champ, formant des petites boucles de courant et créant une M négative. On dit que c’est un comportement diamagnétique. Cependant, ces effets dûs au gaz d’électrons sont négligeables devant le magnétisme des atomes que nous allons maintenant considérer. Le moment magnétique associé aux atomes Venons en maintenant aux atomes ayant une couche atomique extérieure d ou f qui est remplie partiellement. Pour déterminer l’état électronique dans ces cas, on fait appel aux règles de Hund. Nous rappelons la règle concernant la valeur de spin totale S lorsqu’une orbitale comprend plusieurs électrons : l’état de plus basse énergie correspond à la valeur la plus grande de S. (Les autres régles permettent de classer les niveaux selon la valeur du moment cinétique orbital total L, et du moment cinétique total J). Les valeurs de S,L et J prédites par les règles de Hund sont bien vérifiées dans les ions des terres rares, mais doivent être modifiées dans le cas des métaux de transition. Sans entrer plus en détail, nous nous contentons de donner dans le tableau les valeurs de L, S et J pour quelques ions : Fe et Cu (des métaux de transition), et Gd et Dy (des terres rares). Le moment magnétique de l’ atome µ ~ sera de magnitude µ = gµB J µB = e~ = 9.27 × 10−24 J/T 2m (3.1) où µB (le magneton de Bohr) est une constante et g (le facteur de Landé) dépend de L,S et J. g vaut 2 pour J = 12 (voir la définition ci-dessous). p Q1. On définit une quantité p (nombre effectif de magneton) par la relation p = g J(J + 1) où g = 23 + 12 S(S+1)−L(L+1) . Calculer, à l’aide du tableau 1 les valeurs de p des ions de Fe3+ ,Gd3+ et J(J+1) Cu2+ . Comparer aux valeurs obtenues experimentalement qui sont 5.9 (fer), 8 (gadolinium) et 1.9 (cuivre). 3+ Fe Cu2+ Mn4+ Gd3+ Dy 3+ configuration 3d5 3d9 3d3 4f 7 4f 9 S 5 2 1 2 3 2 7 2 5 2 L 0 2 3 0 5 J 5 2 5 2 3 2 7 2 15 2 44 Tableau 1. Les valeurs de L, S et J d’un ion isolé de quelques métaux de transition et terres rares 3.1.1 L’aimantation et la susceptibilité magnétique. L’aimantation M d’un ensemble de N atomes s’exprime en termes des valeurs moyennes de chacun des moments magnétiques, ~ = M N X h~ µi i (3.2) i=1 On parle d’aimantation spontanée lorsque M 6= 0 même en l’absence d’un champ extérieur. ~ on a l’induction Lorsque l’on soumet le solide à un champ magnétique H, ~ = µ0 (H ~ +M ~ ) ≈ µ0 H ~ B (3.3) où l’on a supposé que M est négligeable devant H. En présence du champ, chaque moment magnétique a une énergie potentielle ~ Ep = −µ0 (µ~i .H) (3.4) ~ sont parallèles. Enfin, on définit la susceptibilité magnétique, qui sera minimisée lorsque µ ~ et H χ, χ(T ) = V −1 lim ∂M/∂H H→0 (3.5) où V est le volume. χ mesure la facilité avec laquelle les atomes se rangent parallèles au champ extérieur. (Nb. Dans l’équation nous avons supposé que l’aimantation est alignée avec le champ ; la fonction χ est appelée la suscéptibilité longitudinale). Q2. Y a t-il une force d’attraction lorsqu’on approche un aimant près d’un matériau paramagnétique ? d’un matériau diamagnétique ? 3.1.2 Symétries et brisure de symétrie Pour les systèmes magnétiques isotropes que nous allons considérer dans les sections suivantes, les para- et les ferromagnétiques, quand la température est très élevée, et en l’absence d’un champ extérieur H, les moments magnétiques élémentaires n’ont pas de préférence pour une orientation plutôt qu’une autre. Ils changent rapidement de direction, avec une valeur moyenne de µ ~ nulle. Cet état complètement désordonnée possède la symétrie d’invariance de l’hamiltonien sous des rotations globales de tous les spins. C’est une autre façon de dire qu’il n y a pas de direction préférée dans ces systèmes. Lorsque l’on soumet le système à un champ magnétique, l’hamiltonien n’est plus invariant sous rotations, car il y a une direction privilégiée dans l’espace. Il apparait alors une aimantation induite, car les atomes favoriseront l’alignement parallèle au champ, pour minimiser leur énergie potentielle. On parle d’une brisure de symétrie “spontanée” lorsqu’il y a une aimantation M même en l’absence de champ magnétique extérieur. C’est ce qui arrive dans les ferromagnétiques, comme nous allons le voir plus loin. D’abord, dans la section suivante, nous allons parler du cas le plus simple, celui des composés paramagnétiques. 45 3.1.3 Le paramagnétisme. Nous considérons d’abord l’analyse d’un modèle simple où il n’y a pas d’interactions entre les ions portant des moments magnétiques, qui agissent, donc, independamment les uns des autres. C’est une situation à peu près réalisée dans certains composés à la base de terres rares. Dans les atomes magnétiques de ces composés, la couche d’électrons f étant très proche du noyau, les électrons sont relativement bien protégés des perturbations dues aux atomes voisins. La seule interaction d’importance est celle avec le champ magnétique extérieur. On considère un ensemble de moments µ ~ i , i = 1, ..., N , soumis à un champ ~ Nous allons calculer l’aimantation M ~ ainsi que la susceptibilité magnétique. extérieur H. Dans ce problème, il se trouve que la direction de l’aimantation est toujours celle du champ, et nous allons en conséquence omettre les signes vectoriels, en supposant que tout se passe dans la direction fixée par le champ extérieur. On s’attend à ce que l’aimantation dépende du champ H et de la température T , les deux agissant en sens contraire : le premier veut aligner les moments selon une direction commune, et l’autre favorise l’individualisme et donc le désordre. Le calcul suivant pour des spins quantiques a été fait par L. Brillouin en 1927. La fonction de partition d’un spin donné est Z(T, H) = J X e−β²j (3.6) j=−J où l’énergie potentielle, qui dépend du nombre quantique j = −J, ...., J vaut, d’après l’éq.3.4 ²j = −µ0 (gµB )jH (3.7) Il y a (2J + 1) termes dans l’expression de Z, qui sont autant de termes d’une série géométrique Z(T, H) = ex (1 + ex/J + ..... + e−2Jx/J ) = ex e−x e−x/J − 1 − e−x/J = (3.8) sinh( 2J+1 2J x) 1 sinh( 2J x) où x = µ0 (gµB )βH. La valeur moyenne du moment magnétique est hµi ≡ m(T, H) = gµB hmJ i, m(T, H) = 1 ∂ ln Z βµ0 ∂H (3.9) 1 1 1 ) coth((1 + )x) − coth(x/2J) 2J 2J 2J = gµB JBJ (x) = gµB J((1 + où l’on a introduit la fonction BJ (la fonction de Brillouin). Il est aisé de vérifier le comportement de BJ pour x très petit : (x << 1) BJ (x) ≈ J +1 x − ()x3 3J (3.10) tandis que pour x >> 1 BJ (x) ≈ 1 − e−x/J . L’aimantation par spin m(T, H) est linéaire quand x est petit, et elle sature à sa valeur maximale de gµB J quand ce rapport est grand. L’aimantation totale M est N M (T, H) = m(T, H) (3.11) V 46 Fig. 3.2 – La fonction de Brillouin pour différentes valeurs de J La figure 3.2 montre les courbes de BJ (et donc l’aimantation) en fonction de x ∝ H/T pour des valeurs de J différentes. On voit que dans la limite de H/T petit (c.a.d. à haute température), l’aimantation est faible, et que dans la limite x grand (température basse) elle approche sa valeur maximale de N gµB J/V . La figure montre aussi que l’aimantation augmente plus lentement vers sa valeur asymptotique quand J est grand que lorsque J est petit. Ceci traduit le fait que les fluctuations de spin sont plus grandes quand le spin est grand. On note également que M = 0 quand le champ H = 0. Passons maintenant à la susceptibilité magnétique. Pour une valeur de H petite, en utilisant l’éq.3.10 on a χ(T ) = limH→0 = C T N M = µ0 (gµB )2 J(J + 1)/(3kB T ) H V (3.12) Cette équation, appelée loi de Curie, donne une relation simple de χ en fonction de la température. χ(T ) diminue quand la température augmente, traduisant le fait qu’il faut un champ magnétique de plus en plus grand pour aligner les atomes.La loi de Curie a été vérifiée dans des expériences sur les terres rares. La constante de Curie, C, peut être extraite des données expérimentales. Elle fournit des renseignements sur la magnitude de S des ions magnétiques, que l’on peut ensuite comparer avec la valeur prédite par les règles de Hund. L’accord est bon pour la plupart des terres rares. Pour les métaux de transition, on obtient un accord avec les expériences si l’on pose J = S, ce qui revient à dire qu’il n y a aucune contribution orbitale à la valeur du moment magnétique total de ces atomes-là. (Vous avez sans doute remarqué le désaccord flagrant entre les valeurs de p théorique et expérimentale dans le cas du cuivre dans la Q1 !) La justification de ce procédé se trouve dans le fait que pour les métaux de transition, les atomes sont soumis à une forte anisotropie due au champ cristallin des atomes voisins. Pour simplifier, on peut dire que les électrons effectueront un mouvement de précession et en conséquence, la valeur moyenne de L sera nulle. Q3. Montrer que pour le cas S = 1 2 la fonction de partition est Z = 2 cosh(x) et l’aimantation d’un 47 spin est proportionnelle à B 21 (x) = tanh(x). 3.1.4 Les ferromagnétiques. Dans les métaux de transition, les électrons de la couche 3d subissent l’influence des atomes voisins, et il est nécessaire de prendre en compte les interactions entre le spin d’un atome avec ceux autour. Il est bien sur assez difficile d’écrire exactement la forme de ces interactions, mais il existe une forme simple introduite par Heisenberg qui exprime le fait que, grosso modo, l’énergie d’un état où deux spins voisins sont parallèles est plus basse que celle de l’état où ils sont antiparallèles. On peut écrire un hamiltonien qui ne dépend que ~1 et S ~2 des deux atomes ayant la propriété d’invariance des deux degrés de liberté, les spins S sous une rotation globale des spins, qui exprime ce fait : ~1 .S ~2 −J S (3.13) Pour une constante de couplage J > 0 (ne pas confondre avec le symbole J de la section précédente !) on a bien une énergie plus basse de l’état de spins parallèles. Pour un système de N spins, on écrit l’hamiltonien de Heisenberg ferromagnétique, X ~i .S ~j S (3.14) H = −J hi,ji (3.15) où le symbole hi, ji indique que la double somme n’inclut que des termes où i et j sont proches voisins. Bien que simple, cet hamiltonien n’a pas été résolu exactement au-delà d’une dimension ! Beaucoup d’efforts ont été consacrés à l’étude des propriétés thermodynamiques de l’hamiltonien de Heisenberg, dès les années 30. On comprend toutefois assez bien ses propriétés essentielles, tant sur le plan qualitatif que quantitatif, grace aux méthodes analytiques tr`’es poussées combinées avec des méthodes numériques. Nous allons ici résumer quelques résultats connus. Concernant la transition de phase dans le modèle de Heisenberg – A T = 0, quelque soit la dimension de l’espace, l’invariance par rotations sera brisée, et tous les moments seront alignés en parallèle selon une direction particulière. Cela vient du fait que l’énergie libre F = E − T S est minimisée quand E est minimale. L’énergie de cet état est E0 = − 12 zN JS 2 où z est la coordinance et N le nombre de spins. A l’autre extrème de T → ∞ l’énergie libre sera minimisée lorsque l’entropie est maximale, ce qui implique un état totalement désordonné. La question est de savoir ce qui se passe entre ces deux limites. – En une et deux dimensions, l’aimantation M (T ) = 0 pour T > 0. Il n y a donc jamais de transition avec une Tc finie. L’impossibilité d’avoir un tel état est énoncée dans un théorème (celui de Mermin, Wagner et Hohenberg) qui s’applique à tout hamiltonien ayant une symétrie continue. – En d > 2 il y a une transition de phase entre l’état de M = 0 (la phase paramagnétique) et la phase ferromagnétique, de M 6= 0 à une température critique Tc qui dépend du réseau et de la dimension. Lorsque l’on baisse la température en dessous de Tc , l’aimantation démarre de zero à Tc , et augmente jusqu’à atteindre son maximum à T = 0. A la transition, il y une divergence de la susceptibilité magnétique et 48 de la chaleur spécifique, et d’autres singularités des grandeurs thermodynamiques. Ce modèle a été le sujet de beaucoup d’études théoriques, surtout danss les années 60 et 70, et diverses méthodes analytiques sophistiquées ont été développées pour calculer toutes les propriétés interessantes du modèle de Heisenberg. – Plus la dimension d est grande, moins sont importantes les fluctuations de spin. Dans la limite formelle de d → ∞, les différentes méthodes convergent souvent à un résultat exact. C’est une limite où la technique du champ moyen de la section suivante donne la bonne solution. Méthode du champ moyen. Weiss a considéré une version simplifiée de l’hamiltonien de l’éq.3.15 où, au lieu de laisser les deux spins fluctuer au gré des excitations thermiques, il a considéré les fluctuations des spins placés dans un champ effectif crée par les z voisins autour (“le champ moléculaire de ~i donné, on a Weiss”). En considérant l’hamiltonien d’un spin S Hspin,i = −J z X ~i .S ~j S (3.16) j=1 qui montre que le site central subit un champ effectif fluctuant de tous ses voisins. Si nous ~j par sa valeur moyenne (la même pour tous les sites), m = gµB hS ~j i, remplaçons chacun des S ~i .Hef f où le champ effectif Hef f sur le site 1 (et sur tous l’hamiltonien prend la forme −µ0 S les sites, l’invariance translationnelle oblige) est µ0 Hef f = zJm (gµB )2 (3.17) où z est le nombre de proches voisins du site i. Nous avons auparavant résolu l’hamiltonien d’un spin couplé au champ extérieur. On a donc une formule reliant la valeur moyenne du ~j au champ externe, l’éq.3.10. On a spin S m = gµB SBS (x); où x = (gµB )βµ0 Hef f = zJm gµB kB T (3.18) L’argument de la fonction de Brillouin contient m, et l’éq.3.18 est donc une relation d’autocohérence. Nous voulons déterminer la valeur de m(T ) à une température T donnée. Comme l’équation n’a pas de solution m analytique simple, nous allons recourir à une solution graphique de l’éq.3.18. Les solutions de m sont données par les intersections de la droite, m = m avec la courbe gµB SBS (x(m)). Cette dernière est une courbe convexe, ayant sa pente maximale à l’origine, (cf. la figure 3.2). Quand cette pente, qui dépend de la température, est inférieure à 1, il n y a qu’une solution, m = 0. Quand la pente est supérieure à 1, la bonne solution correspond à m 6= 0. (On peut vérifier que la suscéptibilité est négative pour la solution m = 0, qui est donc une solution instable). Nous avons bien une situation où l’aimantation totale M = N m/V est nulle pour T > Tc et non-nulle en dessous de Tc . La température critique est ainsi donnée par la condition kB Tc = S(S + 1) zJ 3S Q4. Obtenir l’expression de Tc de l’éq.3.19) en utilisant l’éq.3.10. Quelques remarques concernant ce résultat de la méthode du champ moyen : (3.19) 49 Fig. 3.3 – Champ moyen : l’aimantation m/m(T = 0) en fonction de T /Tc 1. Tc n’est jamais nulle, et ne dépend pas de la dimension excepté à travers la coordinence z. Cette méthode n’est visiblement pas adaptée aux systèmes en d = 1 et 2. 2. Pour T << Tc la variable x ∝ m/T devient très grande et la fonction de Brillouin approche sa valeur asymptotique. L’éq.3.18 nous dit que m atteint donc sa valeur maximale gµB S quand T → 0. 3. Tc augmente avec le nombre de proches voisins z, ce qui est logique (le champ local sur un site donné sera plus grand pour une coordinence plus élevée). On peut donc s’attendre, par exemple, à ce que le système reste ferromagnétique jusqu’à une température plus élevée dans un réseau carré (z = 4) que pour un réseau “nid d’abéille” (z = 3) (voir les figures). 4. Tc augmente avec le couplage J, ce qui est logique. Il faut fournir plus d’énergie pour “casser” des liaisons ferromagnétiques dans le cas où J est grand. Dans le cas des métaux de transition on s’attend à ce que J soit plus grand que dans le cas des terres rares (pour la raison évoquée dans la section sur le paramagnétisme). 5. Tc augmente avec le spin S. C’est un résultat également attendu, vu le fait que la méthode du champ moyen ne prend pas compte des fluctuations, une grande valeur du moment magnétique implique une grande valeur du champ local. Le tableau ci-dessous donne quelques exemples de Tc (à éventuellement comparer avec les prédictions de l’éq.3.19 !) métal Fe Ni Gd Dy S 5 2 1 7 2 9 2 Tc (K) 1043 627 293 85 M0 (gauss) 1752 510 1980 3000 Tableau 2. Tc et M0 (l’aimantation à T = 0) dans quelques métaux 50 Q5. Exprimer, avec la méthode du champ moyen, la fonction de partition et l’aimantation pour le cas particulier de S = 12 . Obtenir, en développant autour de Tc , et en résolvant l’équation quadratique ainsi obtenue, l’aimantation m(T ) en dessous de Tc . Montrer que celle-ci suit une loi de puissance en t = |T − Tc |/Tc . Fig. 3.4 – Photographie avec une microscope polarisante montrant l’intérieur d’une plaque de ferrite, indiquant les domaines (voir texte) 3.1.5 Descriptions phénoménologiques des ferromagnétiques Fig. 3.5 – Images IRM de l’intérieur du cerveau Les domaines de Weiss Le fer est l’exemple le plus connu de la classe de ferromagnétiques, et avec le cobalt et le nickel, est à la base de beaucoup de alliages utilisées dans la fabrication d’instruments. Pourtant, contrairement à tout ce que nous avons dit ci-dessus, l’aimantation spontanée observée dans un échantillon d’une de ces alliages est souvent nulle ou presque nulle en champ extérieur nul à température ambiente. Sachant que Tc est quelques centaines de K, Weiss a proposé une résolution de cet apparent paradoxe en proposant que les spins s’organisent dans une multitude de domaines, chacun préférant une direction différente des autres, de telle sorte que l’aimantation totale soit nulle. Ces domaines ont depuis été mis en évidence et sont de tailles allant de 10−7 à 10−7 m selon le matériau et le traitement qu’il a subi. La formation de domaines est due à l’interaction magnétique dipolaire entre chaque paire des moment magnétiques. L’énergie de cette interaction dépend de l’orientation relative des 51 deux moments, ainsi que de leur position relative, ~r : µi .~ µj ) 3(~ µi .~r)(~ µj .~r)) µ0 (~ [ − ] (3.20) 3 5 4π r r On peut vérifier que cette énergie favorise l’alignement antiparallèle dans certaines directions. Quoique très faible, comparée à l’énergie typique du couplage de Heisenberg entre spins proches voisins, cette énergie dipolaire devient importante à cause du grand nombre de paires impliquées. C’est pour cette raison que le système trouve qu’il est plus favorable de s’organiser en petits ensembles de spins alignés entr’eux à courte échelle mais désordonnés sur une échelle plus grande – expliquant ainsi l’existence des domaines. ²= Fig. 3.6 – Un cycle d’hystérésis Lorsque l’on applique un petit champ extérieur H, les domaines se réoriente, et les domaines de spins parallèles au champ augmentent en taille pendant que ceux qui sotn alignés retrécissent, le résultat de tout ceci étant une augmentation de M qui peut être assez conséquente. Ainsi, grace à cette structure en domaines, on peut trouver des valeurs de pérméabilité µ très élevées où l’on définit B = µ0 (H + M ) = µ0 (1 + χ)H ≡ µH (3.21) On peut multiplier le champ effectif à l’intérieur d’une bobine en utilisant un entrefer constitué d’un matériaux à µ élevée. Les deux bobines d’un transformateur sont couplées à travers le flux magnétique, dans l’entrefer, d’où l’interêt d’utiliser ces matériaux dans les transformateurs. Dans le même esprit, l’electroaimant schématisé par le circuit de la figure 3.7, utilise un entrefer qui sert à canaliser et intensifier le flux magnétique φ. Le fer a une pérméabilité µ ≈ 200µ0 . Pour des applications nécessitant des champs intenses (telles l’IRM : imagerie par résonance magnétique), on dispose aussi d’alliages de Fe, Co et Ni telles le permalloy (µ/µ0 ∼ 8000) ou le mu-métal (µ/µ0 ∼ 20, 000). Cycle d’hystérésis. Champ coercitif. Aimantation rémanente. Quand le champ appliqué, H, est assez fort, on constate que les changements de M en fonction de H ne sont pas reversibles. La figure montre les valeurs de M pour un cycle 52 Fig. 3.7 – Circuit d’un electroaimant qui crée une force de collage entre les deux composantes. (symboles : l : longueurs, S : surfaces, µ : perméabilités, n :nombre de tours dans la bobine, I : courant, φ : flux magnétique dans l’entrefer) complète où l’on augmente le champ de 0 jusqu’à une valeur maximum positive, ensuite jusqu’à une valeur maximum négative, et enfin vers sa valeur initiale nulle. On constate que le matériau garde une aimantation Mr (aimantation rémanente) positive ou négative en champ nul selon l’histoire récente de l’échantillon. Pour faire descendre M à 0 ; il faut appliquer un champ Hc (champ coercitif) dans la direction opposée à l’aimantation. Le rapport Mr /Mmax doit être grand pour les matériaux utilisés dans la fabrication des aimants permanents. 3.2 La supraconductivité Fig. 3.8 – Le lévitation d’un aimant au-dessus d’un supraconducteur En 1911, Kamerlingh Onnes a découvert la supraconductivité dans le mercure lorsqu’il a l’a refroidi en dessous de la température d’hélium liquide. Vers 4.1K, il a constaté que la résistivité chutait abruptement à zéro. D’autres métaux ont été refroidis , et dans beaucoup de cas, le même phénomène se produit à une température critique, Tc (voir le tableau) typiquement de quelques Kelvins. La chasse aux supraconducteurs était ouverte, et l’on 53 a découvert une grande variété de composés supraconducteurs à une température assez basse. La plus grande série de découvertes récentes a eu lieu autour des années 85-86, où les records de Tc ont été successivement battus. Des membres d’une nouvelle famille de supraconducteurs céramiques ( !) – les supras “haute-Tc – ont été successivement révélés aux physiciens guettant chaque publication. Revenant aux supraconducteurs conventionnels, l’explication théorique de la transition métal normal-supraconducteur s’est fait attendre jusqu’à l’année 1957, où Bardeen,Schrieffer et Cooper (BCS) ont proposé leur modèle de la supraconductivité. Nous allons d’abord on donnera une brève description de quelques-uns des phénomènes nouveaux intéressants, avant de présenter un aperçu de la théorie de BCS. 3.2.1 Les conséquences d’une résistance nulle Revenons un instant au modèle de Drude (Ch. 1)et ce qu’il prédit dans le cas où il n y aurait plus de collisions et le libre parcours moyen l deviendrait infini. La conductivité, quantité proportionnelle à l σ= ne2 l mvF (3.22) tendrait vers l’infinie, et la résistivité serait nulle. Dans cette limite, rien n’empecherait le courant d’augmenter sans limite lorsque l’on appliquait un champ électrique. De même, il est évident qu’une fois un courant établi, dans l’absence de processus de relaxation, ce courant ne diminuerait jamais. D’où la possibilité de faire circuler un courant électrique permanent dans une boucle supraconductrices – les expériences ont été faites où l’on voit que le courant circule sans s’affaiblir durant plusieurs années ! Fig. 3.9 – L’expulsion du flux magnétique de l’intérieur d’un supraconducteur Considérons un tel métal dans un champ magnétique qui augmente subitement de zéro à une valeur H. La loi de Lenz nous dit qu’il y aura des courants surfaciques qui tenteront d’annuler l’induction B = µ0 (H +M ) à l’intérieur du solide. Si l’on fait l’expérience inverse : annuler subitement un champ magnétique déjà présent dans le métal, la loi de Lenz prédit qu’il y aura de nouveau des courants qui annuleront le changement, c.a.d. qui créeront une induction non-nulle à l’intérieur du solide. Un supraconducteur ne ressemble pas à un tel conducteur parfait. Quelque soit le sens du changement de H, l’induction B à l’intérieur d’un supraconducteur sera toujours nulle ! 54 Une expérience classique consiste à refroidir un supraconducteur sur lequel l’on a posé un aimant. Dans son état normal, le matériau laisse pénétrer des lignes de B, et l’aimant reste en contact avec la surface. En dessous de Tc , le supraconducteur crée des boucles de courant à sa surface, qui annule le champ de l’aimant, et le résultat est une force de répulsion entre la surface et l’aimant. Si l’aimant est suffisamment léger, il lévitera audessus du supraconducteur (voir la photo). Ce phénomène d’expulsion du flux magnétique porte le nom d’effet Meissner. Fig. 3.10 – Les courants surfaciques donnant lieu à la lévitation d’un aimant au-dessus d’un supraconducteur 3.2.2 La théorie de BCS A l’origine de cette théorie est l’observation de Cooper sur la possibilité de former des états liés de deux électrons sous certaines conditions : – Il faut d’abord une intéraction effective attractive, V > 0 entre les deux. Cette hypothèse n’est pas aussi déraisonnable qu’il n y paraı̂t, car on savait déjà que l’intéractions entre les électrons et le réseau peut donner lieu à une attraction faible. Une image souvent présentée en guise d’explication a été donnée à fin du chapitre 1. On y voit une déformation du réseau due au passage un électron – cette déformation attire ensuite un autre électron, engendrant ainsi une intéraction effective attractive entre les deux. Des calculs plus détaillés montrent que cette image traduit à peu près ce qui se passe. Il faut toutefois que les deux électrons aient une énergie proche de l’énergie de Fermi, et l’intéraction V provient surtout des phonons de fréquence proches de ωD . – Une telle paire est stabilisée même lorsque V est très petite (ce qui est le cas) à cause de tous les autres électrons dans la mer de Fermi. C’est un problème à N corps, les (N-2) autres électrons sont importants car ils limitent l’espace de phase de la paire que l’on considère. BCS ont généralisé cette idée en postulant que tous les électrons forment des paires, et l’ensemble étant stable, et ayant une énergie plus basse que l’énergie de l’état fondamental sans l’appariement. La fonction d’onde qu’ils proposérent a la forme Ψ(~r1 , ~r2 , ..., ~rN ) = Aφ(~r1 − ~r2 )φ(~r3 − ~r4 )....φ(~rN −1 − ~rN ) (3.23) 55 Fig. 3.11 – Les états qui participent à la formation des paires de Cooper (région d’épaisseur ∆ autour du niveau de Fermi où φ(~ri − ~rj ) est la fonction d’onde d’une paire d’électrons dans un état singulet (ayant leurs spins opposés). De plus, φ correspond à un état qui est invariant par translation (donc construit à partir des états de ~ki = −~kj . L’opérateur A effectue antisymétrisation du produit des φ (c’est l’opération d’effectuer une somme de toutes les permutations 2 par 2 des électrons avec le signe − pour chaque permutation). On voit que Ψ est une combinaison complexe des fonctions d’ondes des paires, toutes imbriquées et participant de façon collective au transport de courant. Il coûte une énergie minimum ∆(T ) pour casser une paire et rendre leur indépendance aux deux électrons. Cette énergie, appellé le “gap” du supraconducteur a une valeur maximale ∆(0) à T = 0, et s’annule à Tc . La théorie BCS donne le gap à T = 0 en termes des paramètres du modèle V (le potentiel attractif) et ω (la fréquence du phonon médiateur de cette interaction) : ∆(0) = 2hωe−1/ρ(EF )V (3.24) où ρ(EF )V est la densité d’états du gaz d’électrons au niveau de Fermi du métal. La théorie prédit une relation similaire pour la température critique, de sorte que le rapport ∆(0)/kB Tc devient indépendant de tous les paramètres, et vaut ∆(0) = 1.74 kB T c (3.25) Cette relation entre les deux quantités a été testée et confirmée avec une assez bonne précision (compte tenu de la simplicité du modèle) dans des expériences. On peut estimer la “taille” d’une de ces paires en utilisant le principe d’incertitude : ∆x∆p ∼ ~. Sachant que l’énergie des électrons de la paire est distribuée dans une peau d’épaisseur ∆ autour de l’énergie de Fermi, on peut déduire l’incertitude de p dE = ∆ = p dp ≈ vF dp m (3.26) d’où le rayon de la paire ξ ∼ ∆x, ξ= ~vF ∼ 103 A ∆ (3.27) pour des valeurs de vF d’environ 108 cm/s et ∆ ∼ kB Tc d’environ 10−4 eV . On voit bien que la distance entre partenaires est très grande, et qu’il n’est donc pas possible de considérer 56 la paire comme une particule composite même pour une échelle de distance grande devant la distance interélectrons typique. Pres de Tc , on peut montrer que le gap s’annule comme la racine de la température réduite r Tc − T ∆(T ) = cste (3.28) Tc exactement comme l’aimantation, dans la théorie du champ moyen d’un ferromagnétique (l’approximation faite est la même). 3.2.3 Propriétés sous champs électriques et magnétiques de l’état supra Une explication des phénomènes caractéristiques des supraconducteurs peut maintenant être donnée, à la lumière de la solution de BCS. Sous l’influence d’un champ électrique appliqué pendant une durée de temps finie, les paires de Cooper acquiereront une quantité de mouvement identique pour toutes les paires. Au cours de leurs mouvements, il n y aura pas, contrairement au cas des électrons normaux, les paires ne peuvent pas être diffusées dans de nouveaux états et ainsi changer leur quantité de mouvement car tous les états disponibles sont déjà occupés. Le courant passe donc sans atténuation dans un supraconducteur, en ce qui concerne la conduction par les paires de Cooper. L’expulsion du champ magnétique est un peu plus compliqué à expliquer. Un argument possible consiste à écrire l’hamiltonien d’une des paires – on prend la forme conventionnelle ~: pour une particule de charge −2e et de masse 2m soumi à un potentiel vecteur A H= 1 ~ 2 + V (~r) (~ p − 2eA) 4m (3.29) ~ ×A ~ = B. ~ La fonction d’onde de la paire φ est représentée sous la forme où ∇ φ(~r) = |φ|eiθ(~r) (3.30) où l’on a explicitement écrit la module, que l’on suppose constante, et la phase, qui, elle, ~ La densité du courant électrique due à cette fonction est ~j(~r) = dépend du champ A. −2e ~ où les valeurs moyennes sont calculées dans l’état φ. L’élément de −2eh~v i = 2m h~ p − 2eAi, matrice de p~ est calculé à partir de l’équation iθ(~ r) ~ ~ r)φ(~r) p~φ(~r) = (−i~∇)|φ|e ≈ ~∇θ(~ (3.31) On trouve ainsi le courant, qui contient deux termes, 2 ~ r) − 2eA)|φ| ~ ~j(~r) = −e (~∇θ(~ m (3.32) Comme la densité de courant ~j(~r) est nul, la circulation de celle-ci autour d’un circuit fermé entièrement contenue à l’intérieur du supraconducteur sera nulle aussi, c’est-à-dire I I ~ r) − 2eA).d ~ ~l ~j.d~l = 0 = (~∇θ(~ (3.33) 57 On en tire, en utilisant l’identité que R Z ~ ~l = A.d R ~ B.dS et la définition du flux magnétique ΦB 2e ΦB ~ = 0 ~ r).d~l = ∇θ(~ (3.34) la deuxième égalité venant du fait que θ(~r) est une fonction analytique dans la région considérée. Nous avons ainsi montré que le fait de pouvoir exprimer la fonction d’onde en termes d’une phase bien définie dans l’état supraconducteur donne, comme un des résultats, l’effet Meissner.