Université Paris-Sud - Espace des équipes scientifiques

Transcription

Université Paris-Sud - Espace des équipes scientifiques
Université Paris-Sud
L3 Physique et Applications
S6 : Jan-Juin 2007
PhysA335. Initiation à la physique des solides
Levitation d’un aimant au-dessus d’un supraconducteur
Anuradha Jagannathan
Laboratoire de Physique des Solides,
Bât. 510, Université Paris-Sud,
91405 Orsay, France
Table des matières
Table des matières
2
Introduction
4
1 Propriétés du gaz d’électrons dans un solide
1.1 Le gaz d’électrons et la conduction électrique dans un métal . . .
1.1.1 Le modèle de Drude de la conductivité électrique . . . . .
1.1.2 D’autres prédictions du modèle classique . . . . . . . . . .
1.1.3 Problèmes du modèle classique . . . . . . . . . . . . . . .
1.2 Le gaz de fermions libres . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Le gaz d’électrons à T = 0 . . . . . . . . . . . . . . . . .
1.2.2 Le gaz d’électrons à température finie . . . . . . . . . . .
1.2.3 Les boı̂tes, fils et puits quantiques . . . . . . . . . . . . .
1.3 L’environnement cristallin et l’émergence des bandes interdites .
1.3.1 La théorie des électrons presque libres . . . . . . . . . . .
1.3.2 Conducteurs, isolants et semiconducteurs. . . . . . . . . .
1.3.3 Résultats en d=2 et 3 . . . . . . . . . . . . . . . . . . . .
1.4 Transitions de phase induites par des interactions . . . . . . . . .
1.4.1 interaction électron-électron. Le magnétisme itiniérant. La
de Mott. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 interaction électron-phonon. La supraconductivité. . . . .
1.4.3 Effets du désordre et/ou apériodicité. . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
transition
. . . . . .
. . . . . .
. . . . . .
2 Propriétés thermiques et acoustiques
2.1 Modèle classique de vibrations . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Chaı̂ne périodique de N atomes identiques . . . . . . . . . . . . . .
2.1.2 Le mouvement des atomes en fonction de k. Périodicité de ω. . . .
2.1.3 Les vibrations dans les cristaux de dimension 2 et 3 . . . . . . . .
2.1.4 Modes optiques. Chaı̂ne à deux constantes de couplage. . . . . . .
2.2 Le passage vers une description quantique. Les phonons. . . . . . . . . . .
2.2.1 Température T 6= 0. La distribution de Planck . . . . . . . . . . .
2.3 Propriétés thermiques des cristaux. Modèle de Debye. . . . . . . . . . . .
2.3.1 Comparaison des chaleurs spécifiques des électrons et des phonons
2.4 Quand l’approximation harmonique devient insuffisante . . . . . . . . . .
2.5 Collisions entre phonons et d’autres particules . . . . . . . . . . . . . . . .
2.5.1 Collisions avec des neutrons . . . . . . . . . . . . . . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
6
7
7
9
11
11
11
13
14
16
16
21
22
22
22
24
25
26
27
27
29
30
32
34
35
35
38
39
39
39
3
2.6
2.5.2 Collisions avec des photons . . . . . . . . . . . . . . . . . . . . . . .
2.5.3 Collisions avec des électrons . . . . . . . . . . . . . . . . . . . . . . .
Le gaz de phonons. Le second son . . . . . . . . . . . . . . . . . . . . . . . .
3 Magnétisme et supraconductivité.
3.1 Description de composés magnétiques . . . . . . . . . . . . . . . . . . . .
3.1.1 L’aimantation et la susceptibilité magnétique. . . . . . . . . . . . .
3.1.2 Symétries et brisure de symétrie . . . . . . . . . . . . . . . . . . .
3.1.3 Le paramagnétisme. . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.4 Les ferromagnétiques. . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.5 Descriptions phénoménologiques des ferromagnétiques . . . . . . .
3.2 La supraconductivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Les conséquences d’une résistance nulle . . . . . . . . . . . . . . .
3.2.2 La théorie de BCS . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Propriétés sous champs électriques et magnétiques de l’état supra
.
.
.
.
.
.
.
.
.
.
40
40
41
42
42
44
44
45
47
50
52
53
54
56
Introduction
Lorsqu’on regarde le tableau périodique des éléments, on constate l’extrême diversité de
comportements des éléments - on y trouve des solides, liquides et gaz, dont, parmi les solides,
des métaux, des isolants, des ferromagnétiques et des supraconducteurs, pour ne citer que
quelques possibilités. Lorsqu’on considère les composés formés à partir de ces éléments,
on découvre de nouvelles propriétés insolites. Les deux ou trois décennies précédantes ont
vu un foisonnement de nouvelles technologies (et de prix Nobel !) suivant la découverte de
nouveaux matériaux.
Dans ce cours nous allons découvrir quelques modèles théoriques permettant d’expliquer des propriétés physiques des solides telles les conductibilités électrique ou thermique,
les chaleurs spécifiques, leurs propriétés magnétiques. Nous verrons ce que sont les métaux,
semimétaux et les semiconducteurs, ainsi que quelques propriétés interessantes des supraconducteurs. Nous verrons que la mécanique classique permet de comprendre déjà beaucoup
de propriétés , mais que, lorsqu’on baisse la température et la taille des objets étudiés, il
devient indispensable de recourir à une description quantique. Dans ce cours nous ne parlerons que des matériaux cristallins c’est-à-dire ayant une structure périodique dans l’espace.
La physique des milieux amorphes ou apériodiques (tels les quasicristaux) est plus complexe
et ne sera pas abordée, hormis quelques remarques qualitatives.
Chapitre I
Dans ce chapitre nous considérerons quelques propriétés importantes liées au gaz d’électrons
présent dans les matériaux tels que les métaux et les semiconducteurs, qui ont des électrons
libres.
Nous commencerons par un modèle classique pour la conduction électrique. Il sera
nécessaire, vu les limitations de ce modèle, de passer ensuite à la ”bonne” description,
qui utilise la mécanique quantique. En conséquence, on rappellera les définitions de base
pour un gaz de fermions. Ensuite, nous étudierons le comportement du gaz d’électrons dans
le milieu périodique formé par l’ensemble de noyaux atomiques. Le théorème de Bloch, fondamental dans la théorie quantique des solides, sera expliqué, et ses conséquences seront
examinées. Enfin, on discutera quelques aspects négligés dans ce genre de traitement, notamment (et de façon qualitative) l’effet des interactions répulsives entre électrons. Bien que
d’importance modérée dans beaucoup de solides, les interactions peuvent avoir des effets
dramatiques dans des systèmes de basse dimension ou de taille réduite (tels qu’une boı̂te
quantique) - nous en parlerons brièvement.
4
5
Chapitre II
Dans ce chapitre nous discuterons des propriétés associées à l’ensemble des noyaux atomiques. Les noyaux vibrent autour de leurs positions d’équilibre, créant des ondes (des
”phonons” dans le langage quantique). Les propriétés thermiques d’un cristal simple seront
présentées, ainsi que les modèles de Einstein, et de Debye.
Chapitre III
Dans ce chapitre nous considèrons des solides magnétiques et des solides qui deviennent
supraconducteurs. Nous essaierons de donner un aperçu des modèles qui ont été introduits
pour expliquer des propriétés utilisées dans les technologies modernes.
Calculs avec Mathematica
Les séances de “travaux pratiques” devront permettre de visualiser et de comprendre les
formules présentées en cours. Ceux qui n’ont pas utilisé ce logiciel pourront acquerir les
notions de base assez rapidement, dès la première séance des deux séances prévues.
Bibliographie
– Introduction à la physique de l’état solide
– La matière à l’état solide
– Physique des solides
C. Kittel (Dunod)
A. Guinier, R. Jullien (Hachette)
N. W. Ashcroft, N. D. Mermin (EDP)
Chapitre 1
Propriétés du gaz d’électrons dans
un solide
Lorsque des atomes se rapprochent et forment un solide, les électrons des couches
extérieures peuvent se détacher des noyaux et circuler librement dans tout l’intérieur du
cristal (on parle alors de la délocalisation des électrons). Ce gaz d’électrons contribue,
par exemple, à l’énergie de cohésion du solide, lorsque l’ensemble noyaux plus électrons
délocalisés a une énergie plus basse que celle de l’ensemble d’atomes neutres. Le gaz d’électrons
peut donner naissance à un courant électrique lorsqu’il y a un déplacement de l’ensemble des
électrons en présence d’un champ électrique extérieur. La conductibilité électrique dépendra
non seulement de la densité volumique de ces électrons de conduction mais aussi d’autres
facteurs que l’on discutera dans la première section. On peut aussi étudier la propagation
d’une onde électromagnétique dans un solide. La présence du gaz d’électrons modifie les
propriétés de transmission et réflection d’une telle onde selon sa longueur d’onde (ce qui
explique, en particulier, l’aspect visuel des métaux). Le gaz d’électrons contribue également
à la chaleur spécifique du solide, et à la conductibilité thermique.
La théorie classique du gaz d’électrons de la fin du 19ème siècle a donné quelques
résultats en accord avec les expériences mais d’autres résultats en désaccord sérieux avec
celles-ci. Les modèles classiques ont été donc assez rapidement abandonnés au profit d’un
modèle quantique avec l’arrivée à la même époque de la mécanique quantique. Il est néanmoins
utile de commencer par une description classique, pour mettre les idées en place. Ensuite
nous introduirons la description quantique quand cela devient nécessaire.
La section I commence par un rappel des propriétés d’un gaz de particules libres. Ici, on
néglige l’interaction de répulsion coulombienne entre les électrons et aussi les intéractions
coulombiennes entre les électrons et les noyaux, (en imaginant que ces derniers sont remplacés par un fond positif continu). Ensuite (la section II) on considère les effets nouveaux
dûs à l’interaction entre les électrons et le réseau de noyaux. On distinguera entre les cas
de métal, isolant et semiconducteur. Enfin, dans la section III nous allons très brièvement
décrire des transitions de phase et nouveaux états engendrés par diverses interactions : les
interactions coulombiennes entre les électrons, l’interaction électrons-phonons, et l’effet du
désordre. Une grande diversité de nouveaux états de la matière apparaı̂t, parmi lesquels les
supraconducteurs, le supersolide, diverses phases magnétiques, piézoélectriques, etc.
Q. Quelle est la densité d’électrons de conduction, n (c’est à dire le nombre d’électrons
de conduction dans un mole du métal/volume d’un mole) dans le cuivre ? La configuration
électronique d’un atome de cuivre (Z = 29) est 1s2 , 2s2 , 2p6 , 3s2 , 3p6 , 3d10 , 4s1 , la masse
6
7
molaire de Cu est M = 63.5 et la masse volumique de Cu est 9 g/cm3 . Quelle est la densité
volumique des ions positifs ? La densité volumique de la charge totale ?
1.1
Le gaz d’électrons et la conduction électrique dans un
métal
Dans cette section nous allons présenter un modèle de conduction électrique dans un
~ On considère un gaz de N charges ponctuelles
métal soumi à un champ électrique constant E.
q, qui se déplacent indépendamment les unes des autres dans un volume V . Elles sont
parfaitement réfléchies par les parois et les collisions entr’elles sont supposées élastiques. En
l’absence d’un champ électrique extérieur la valeur moyenne des vitesses sera nulle. Lorsque
~ sur chacune des
l’on applique un champ, il y aura une force électrostatique F~el = q E
charges. En l’absence de forces qui s’opposent à ce mouvement il y aurait une accélération
constante et une vitesse moyenne infinie ! En réalité, on le sait, il y aura des collisions entre
les charges, et avec d’autres centres de diffusion à l’intérieur du cristal qui serviront à limiter
cette vitesse. En régime permanent, grace à ces collisions, on s’attend à ce que la vitesse
moyenne soit constante en fonction du temps.
Etablissons tout d’abord une relation simple entre le courant I, la concentration n de
charges ponctuelles q et la vitesse des porteurs, v . On considère un fil de métal de section S
(voir la figure). Dans un intervalle de temps ∆t, chacune des charges parcourt une distance
v∆t. La quantité de charge transportée est donc ∆Q = qnvS∆t. Le courant I = ∆Q/∆t et
on en déduit la densité de courant, j = I/S
j=
∆Q
= qnv
S∆t
(1.1)
Nb. Notons que courant est toujours dans le sens du champ électrique, quelque soit le signe
des porteurs : on ne peut pas distinguer entre le cas de charges positives q > 0 ayant des
vitesses dans un sens donné, du cas de q < 0 ayant des vitesses dans le sens opposé.
E
S
q
v∆t
Fig. 1.1 – Conduction électrique dans un métal
1.1.1
Le modèle de Drude de la conductivité électrique
On considère un ensemble de charges q ponctuelles ayant une masse m, et une concentration de charges n = N/V où N est le nombre total de charges et V est le volume.
Les charges se meuvent dans le milieu avec une vitesse constante, sauf pour des réflections
des parois, ou lorsqu’elles rencontrent des centres de diffusion, distribués avec une certaine
8
densité à l’intérieur du volume. La valeur typique de la vitesse des charges, vtyp , peut
être estimée à l’aide du théorème d’équipartition d’énergie (où l’énergie cinétique moyenne
2
des particules 12 mvtyp
= 32 kB T , soit vtyp ∼ 107 cm/s à T = 300K). Le cas le plus simple
consiste à considérer des centres de diffusion qui diffusent les charges avec des collisions
élastiques (sans changement d’énergie). On fait l’hypothèse d’un temps de relaxation, τ , qui
représente un temps moyen entre collisions. La figure montre une trajectoire aléatoire d’une
charge ponctuelle qui subit une succession de collisions.
Fig. 1.2 – Trajectoire d’une particule diffusée par des centres de diffusion
En champ nul, la vitesse moyenne de l’ensemble des particules à un instant du temps
donné h~v (t)i sera évidemment nulle (voir Fig.1.2). Lorsque E est différent de zero, il y aura
~ parallèle aux lignes du champ. Après un temps t mesuré à
une force constante F~ = q E
partir de la dernière collision, la vitesse instantanée d’une charge s’écrit ~vi + ∆~vi (t), où
~vi est la vitesse juste après la dernière collision. En faisant la moyenne sur l’ensemble des
particules, et en utilisant le fait que h~vi i = 0, tandis que h∆vi i = F hti/m = F τ /m on a
~ /m ≡ ~vd (la vitesse de dérive).
h~vi i = q Eτ
vd
E
Fig. 1.3 – Mouvement des électrons dans un métal soumi à un champ électrique montrant
la vitesse de dérive (drift velocity)
Nous avons ainsi trouvé qu’en régime permanent, la vitesse moyenne des électrons ~vd
est proportionnelle au champ appliqué, comme l’illustre la fig.1.3. Nous voulons établir une
expression pour la densité du courant électrique j et calculer la conductivité électrique σ,
définie par
j = σE
(1.2)
En utilisant les relations déjà écrites pour la densité de courant j, la vitesse moyenne, on
2
trouve aisément que σ = nem τ (la charge d’un électron étant e = −1, 6 × 10−19 C). L’inverse
9
de la conductivité est appelé la resistivité, ρ,
ρ=
m
ne2 τ
(1.3)
On peut voir que la loi d’Ohm ∆V = IR est bien vérifiée dans le métal de la manière
suivante : on considère un barreau de section S et de longueur L dans la direction du champ
extérieur E. On a alors une différence de potentiel ∆V = EL entre les deux extrémities
du barreau, pour un courant I = jS où j = σE. On trouve ∆V = RI où la résistance du
barreau R = ∆V /I = ρL/S.
Q. Au vu du tableau ci-dessous, quel matériau pensez vous serait un meilleur conducteur
d’électricité pour un temps de diffusion τ comparable : le cuivre ou l’aluminium ? Comment
expliquer le fait que la resistivité du Cu est plus petite que celle d’Al (dernière colonne) ?
métal
Na
Be
Cu
Al
n (cm3 )
2.65 × 1022
24.2 × 1022
8.45 × 1022
18.06 × 1022
ρ(273K)(µΩ/cm)
4.2
2.8
1.56
2.45
Tableau 1. Quelques métaux et leurs densités d’électrons de conduction
1.1.2
D’autres prédictions du modèle classique
Dépendence de ρ en fonction de T
La formule en 1.3 nous aide à comprendre pourquoi la résistivité peut changer avec la
température. Cette variation est surtout due aux changements du temps caractéristique τ
(en supposant que n est peu dépendant de T - on traitera le cas des semiconducteurs, où
la variation de n est importante un peu plus loin dans ce chapitre.) Lorsque la température
monte, les électrons sont de plus en plus diffusés par les atomes dont les vibrations deviennent plus importantes ; ils sont aussi plus diffusés par les autres électrons par l’intermédiaire des interactions coulombiennes. On peut distinguer deux types de contributions à la résistance totale : ρ(T ) = ρ(0) + δρ(T ). La première, ρ(T = 0), appelée la
résistance résiduelle, est inversement proportionnelle à τel , le temps de parcours moyen dû
aux collisions élastiques, quantité qui dépend de la concentration d’impuretés gelées dans le
matériau. La deuxième contribution vient des collisions inélastiques mentionnées ci-dessus,
elle est inversement proportionnelle à τin qui diminuera en fonction de T .
L’effet Hall
Il a déjà été remarqué qu’il est impossible de déterminer le signe des porteurs de charge
dans un conducteur à partir d’une mesure de I en fonction de la différence de potentiel ∆V .
Un dispositif qui permet de distinguer entre les deux possibilités (q positive ou négative)
a été conçu par E. Hall. Il s’agit de soumettre un barreau de métal à un champ électrique
~ constant (de manière à créer un courant I le long de l’axe du barreau), et un champ
E
~ On peut montrer qu’en régime permagnétique constant dans une direction transverse B.
manent, il se crée un champ électrique EH dans la direction perpendiculaire aux champs E
10
et B. Le modèle classique avec l’introduction d’un temps de relaxation à la Drude permet
d’établir ce champ (nous ne le démontrons pas ici)
EH = jB/nq
(1.4)
Cette équation montre que le signe de EH dépend de celui des porteurs, ce qui est
permet, dans les semiconducteurs de distinguer si la conduction de courant est fait par les
électrons (q < 0) ou des trous (q > 0). Nous en parlerons plus dans la discussion, plus
loin, sur les semiconducteurs. L’effet Hall est souvent utilisé dans des applications, pour
déterminer, par exemple, l’intensité du champ magnétique.
B
q
E
EH
Fig. 1.4 – Dispositif de Hall montrant une charge q dans des champs magnétiques et
électriques et le champ EH résultant
Conduction thermique
Un des plus grands succès du modèle de Drude a été d’expliquer les résultats expérimentaux
montrant une proportionnalité entre T σ(T ) et la conductivité thermique κel (T ). Cette
dernière exprime l’efficacité des électrons à transmettre de la chaleur lorsque l’on soumet
un métal à un gradient de température. La proportionnalité vient du fait que ce sont les
mêmes particules qui sont porteuses de courant électrique et courant thermique.
Propriétés optiques
Avec le modèle classique, on peut traiter le problème de la transmission des ondes
électromagnétiques dans un milieu métallique. La transmitivité et la réflectivité du métal
dépendent de la fréquence de l’onde par l’intermédiaire d’une fonction appelée la constante
diélectrique, ²(ω). Le modèle de Drude prédit qu’il y aura un pic d’absorption des ondes
(pic de Drude) lorsque la fréquence tend vers 0.
Oscillations de plasma
Imaginons que l’on déplace le gaz d’électrons tout entier par une distance x par rapport
au réseau d’atomes que l’on peut décrire par un fond positif continu. On crée ainsi un
champ électrique E = nex/²0 dans l’intérieur du solide, et une force de rappel sur chaque
11
électron de F = eE. On a alors l’équation de mouvement d2 x/dt2 = −ωp2 x, où ωp2 =
ne2 /²0 , et les électrons participent tous à un mouvement collectif harmonique. Ce sont les
oscillations de plasma du gaz d’électrons. Dans un métal, ce type d’oscillations peut être
provoqué par un champ électromagnétique incident avec la bonne fréquence. En générale,
les métaux réfléchissent plutôt bien des ondes EM incidentes, comme on peut constater pour
des surfaces métalliques bien polies - à cause de l’écrantage des champs électromagnétiques
par les charges mobiles. Cependant, à la fréquence ωp les électrons ne peuvent plus assurer
l’écrantage du champ incident, et le métal devient alors transparent ! Le sodium par exemple,
devient transparent aux ondes EM‘pour une longueur d’onde de λ = 2100A en assez bonne
accord avec celle trouvée à l’aide de notre formule de ωp .
1.1.3
Problèmes du modèle classique
– On peut calculer le temps de relaxation τ à partir de la valeur expérimentale de la
résistivité. Dans le cas du cuivre à la température de l’azote liquide (T = 77K),
ρ ≈ 0.2µΩcm. On en tire un temps caractéristique τ de l’ordre de 10−8 s, et il résulte
un l de l’ordre de quelques centaines de milliers d’Angströms.
Si les atomes diffusaient les électrons comme on pourrait s’y attendre, le libre parcours
moyen l serait de l’ordre de la distance interatomique, soit quelques Angströms. Le
libre parcours moyen trouvé ci-dessus étant beaucoup plus grand, on peut en conclure
que les atomes ne sont pas “vus” par les électrons. Plus exactement, les électrons ne
sont pas diffusés par les noyaux tant que la disposition dans l’espace de ces derniers
reste parfaitement périodique. Par contre, les mesures de résistivité montrent que les
électrons sont diffusés par des défauts – des défauts de la structure (dislocations, etc),
ou des défauts chimiques dûs à la présence d’impuretés dans le métal. Donc le premier
problème est celui d’expliquer le rôle joué par les atomes.
– Le problème de la chaleur spécifique des électrons. Les expériences montrent que cV (T )
est très faible à la température ambiante. Elle n’approche la valeur classique de 32 nkB
qu’à des températures extrêmement élevées. Cette observation nécessite que l’on passe
à un traitement quantique du gaz d’électrons.
1.2
1.2.1
Le gaz de fermions libres
Le gaz d’électrons à T = 0
On considère toujours des électrons libres – on négligera les interactions entre les électrons,
~2 ~ 2
et l’interaction des électrons et le réseau de noyaux. L’hamiltonien est H0 = − 2m
∇ où m
est la masse de l’électron. Les propriétés thermodynamiques d’un gaz de N ’électrons sont
calculés avec les méthodes usuelles de la physique statistique. Nous donnerons ici un rappel
des notions de base.
Vecteur d’onde k. Un électron libre dans un volume V est décrit par une fonction d’onde
solution de l’équation de Schrödinger
Hψ = Eψ;
√
~
ψk (~x) = eik.~x / V
(1.5)
√
les solutions de ψ étant des ondes planes. Prenant l’exemple de d = 1, on a ψk (x) = eikx / L
pour un gaz occupant un intervalle de longueur L. Il est souvent commode de prendre des
12
conditions aux limites périodiques : ψ(x + L) = ψ(x). On trouve alors que kL = 2πn
où n = ..., −1, 0, 1, 2, ... est un entier. La généralisation à plusieurs dimensions est claire :
chaque composante aura une des valeurs discrètes données par
ki =
2πni
Li
(1.6)
où i = x, y, .. et Li la longueur du système dans chacune des d directions. Lorsque l’on
considère la limite L → ∞, le vecteur d’onde donné par l’expression ci-dessus devient une
variable continue. L’énergie (cinétique) dépend de ~k de façon habituelle :
~2 k 2
E(~k) =
2m
(1.7)
où m est la masse d’un électron, k = |~k|.
L’énergie et le vecteur d’onde de Fermi EF et kF . A T = 0 le gaz de N électrons est
dans son état fondamental ( l’état de plus basse énergie). Cet état est constitué à partir des
ondes planes solutions de l’éq. 1.5 Rappelons que deux fermions ne peuvent posséder la même
valeur de ~k que si leurs spins sont opposés, d’après le principe de Pauli. L’énergie totale
de l’état fondamental est donc calculée en plaçant une paire d’électrons de spins opposés
dans chaque niveau (on rappelle que les niveaux dépendent de d nombres quantiques en
dimension d selon l’éq. 2). On commence par l’état de plus basse énergie, jusqu’à ce que
l’on arrive à l’énergie EF , le dernier niveau occupé. kF est la norme du vecteur d’onde
correspondant. SF , ou la surface de Fermi, est la surface d’une sphère de rayon kF , qui
sépare les états occupés et ceux inoccupés à T = 0. Le nombre de valeurs de ~k à l’intérieur
de la surface de Fermi est N/2.
La densité d’états. V ρ(~k) donne le nombre d’états quantiques dans une région de volume
infinitésimal d~k autour d’un point dans l’espace ~k (Il faut multiplier celle-ci par 2 pour
prendre en compte les deux états de spin).
En une dimension, la distance entre deux valeurs permises de k est ∆k = 2π/L, d’où le
nombre d’états dans un intervalle de longueur dk est
L
dk
=
≡ Lρ(k)dk
∆k
2π
(1.8)
La fonction ρ(k) = 1/2π est la densité d’états en 1 dimension. Dans le cas d’un
gaz d’électrons en dimension d occupant un volume V = Ld on a de façon analogue
V
3
V ρ(~k)d3 k = (2π)
d d k. Dans la limite thermodynamique, toute somme sur les états quantiques peut s’écrire sous forme d’une intégrale
Z
Z
X
... = V
d~kρ(~k)... = V
dEρ(E)...
(1.9)
etats
où nous avons introduit la densité d’états en fonction de l’énergie ρ(E) dans la deuxième
égalité, en effectuant un changement de variables. Pour d = 1 on trouve, par exemple
r
1
2m
ρ(E) = 2ρ(k)/(dE/dk) =
(1.10)
2π~
E
(où le facteur 2 dans la première égalité tient compte du fait que les états de k et −k sont
dégénérés).
13
Q. Montrer qu’en d = 3 la densité d’états en fonction de l’énergie est donnée par
√
2m3 √
ρ(E) =
E
2π 2 ~3
(1.11)
Quelques relations pour la surface de Fermi en d=3.
Pour trouver kF on calcule d’abord le volume de la sphère représentant les états occupés,
Ω = 4πkF3 /3. Le nombre total d’états occupés, N est alors obtenu en multipliant Ω par la
densité d’états et un facteur de 2 pour le spin. On trouve ainsi le vecteur d’onde de Fermi,
EF et la densité d’états au niveau de Fermi :
kF =
2π 3N 1/3
(
) = (3nπ 2 )1/3
L 8π
~2
EF =
(3nπ 2 )2/3
2m
3n
ρ(EF ) =
4EF
(1.12)
(1.13)
(1.14)
Q. Calculer EF pour le Cu. Donner la valeur de la température de Fermi, TF = EF /kB .
En unités de TF que vaut une température ambiante de 300K ?
Q. Calculer la vitesse vF d’un électron à la surface de Fermi ( donc un des plus rapides à
T = 0) dans le cuivre (vF = ~kF /m). Comparer avec celle prédite par une théorie classique.
1.2.2
Le gaz d’électrons à température finie
On suppose une concentration moyenne d’électrons n = N/V fixe. Les électrons peuvent
occuper tous les états d’énergie, avec une probabilité donnée par la fonction de Fermi-Dirac
fF D (E) =
1
exp(E−µ)/kB T
+1
(1.15)
où µ(T ), le potentiel chimique, est calculé à partir de l’intégrale qui donne le nombre total
d’électrons N,
Z
X
~
N =2
fF D (E(k)) = 2 dEV ρ(E)fF D (E)
(1.16)
Dans la deuxième équation nous avons changé de variable et pris la limite thermodynamique
(remplacement la somme par une intégrale), et avons multiplié par 2 pour le spin.
Forme de la fonction fF D
A T = 0 µ = EF , la fonction Fermi-Dirac ne prend que deux valeurs, 1 et 0 en-dessous et
au-dessus de EF respectivement. Quand la température augmente, pour T << µ la fonction
n’est modifiée qu’au voisinage de µ, où la discontinuité est progressivement lissée et élargie.
Le potentiel chimique varie très peu en fonction de T pour des températures
usuelles : i
h
π 2 kB T 2
nous n’allons pas le démontrer ici, mais un calcul approché donne µ = EF 1 − 12 ( EF ) + ...
pour un gaz d’électrons libres en d = 3. On peut vérifier qu’il y a un changement de quelque
fractions d’un pourcent à 300K.
14
fFD HEL
T>0
1
2kB T
0.5
µ
E
Fig. 1.5 – La forme de fF D pour une température T > 0
Energie interne et chaleur spécifique
2
interne est donnée par une somme sur les énergies de tous les électrons, U =
PL’énergie
E(~k)fF D (E(~k)) (incluant le facteur 2 pour le spin). Ecrit sous forme d’intégrale, on a
Z
u = U/V = 2 dEρ(E)fF D (E)E
(1.17)
≈ u(0) +
π 2 (kB T )2
4 EF
où la deuxième ligne vient d’un calcul approché valable à basse T . La chaleur spécifique est
donc
µ 2¶µ
¶
π
kB T
∂u
= nkB
(1.18)
cv (T ) =
∂T
2
EF
Comparée à la valeur classique de 23 nkB , cv (T ) est de l’ordre de cent fois plus petite.
L’explication de ce fait est que seul un nombre restreint d’électrons est effectivement
excité dans les états de plus haute énergie à la température ambiante. Comme nous avons
remarqué, la fonction fF D est peu modifiée en fonction de T , les seuls changements ayant
lieu dans une gamme d’énergies de largeur kB T autour du niveau de Fermi.
Dans une mesure expérimentale de la chaleur spécifique, on obtient la somme de toutes
les contributions, qui peuvent être dues aux électrons, des vibrations du réseau (phonons),
aux fluctuations magnétiques, supraconductrices et ainsi de suite. La contribution la plus important à température ambiante est celle des phonons. Le figure montre la chaleur spécifique
totale, où l’on voit le comportement en T 3 à haute T due aux vibrations (chapitre suivant)
et le comportement linéaire en T due aux électrons à basse T .
1.2.3
Les boı̂tes, fils et puits quantiques
La miniaturisation des composants électriques est importante pour les technologies nouvelles, et elle est également très intéressante de point de vue purement scientifique. On peut
esprérer bientot stocker des bits d’informations dans des boı̂tes quantiques (littéralement
15
Fig. 1.6 – Chaleur spécifique en fonction de T (du site “Hyperphysics”)
des boı̂tes à stocker et à retirer des électrons un-à-un). Celles-ci peuvent être fabriquées
avec des formes et des dimensions prédeterminées, de façon à avoir un spectre d’énergies
discrètes précisément connu, comme dans l’illustration ci-dessous.
Fig. 1.7 – Niveaux d’énergie dans une boı̂te quantique (fig. M.Rüfenacht)
Les puits quantiques sont des couches minces hébergeant un gaz d’électrons bidimensionnel, qui sont utiles pour une grande variété d’applications (des couches minces magnétiques,
notamment, servent dans la fabrication d’une nouvelle génération de mémoires RAM). On
peut fabriquer des de tels puits en empilant des couches successives de matériaux différents
tels l’arseniure de gallium (GaAs) et l’arseniure d’aluminium (AlAs). L’énergie potentielle
étant plus basse dans le GaAs, les électrons resteront dans ces couches-là, prise en sandwich par deux couches de AlAs (voir la figure). Les fils quantiques sont obtenus lorsque
l’on les électrons dans deux des directions, en laissant le mouvement libre dans la troisième
dimensions.
Q. Quelle est la forme de la densité d’états à d = 2 ? Décrire qualitativement la forme
de la densité d’états d’un puits quantique, avec un potentiel V (z) qui est ∞ partout sauf
entre z = 0 et z = a où V = 0.
16
Fig. 1.8 – puits quantiques fabriqués avec Ga-Al-As (fig. M.Rüfenacht)
1.3
1.3.1
L’environnement cristallin et l’émergence des bandes interdites
La théorie des électrons presque libres
Dans cette section, nous allons considérer en un peu de détail un électron dans un cristal
unidimensionnel. Les généralisations aux dimensions deux et trois seront indiqués à la fin.
L’équation de Schrödinger est
Hψ(x) = Eψ(x)
(1.19)
où ψ est la fonction d’onde et E est l’énergie à un électron. Le potentiel étant périodique,
V (x + a) = V (x), on peut le développer en série de Fourier
V (x) =
∞
X
n=−∞
e
ingx
Vn ;
1
Vn =
a
Z
a
dxe−ingx V (x)
(1.20)
0
où g = 2π/a.
On ne dispose pas de solution exacte de cette équation, même pour des cas particuliers
simples. On dispose, toutefois, d’un théorême concernant les solutions ψ de l’éq.1.19. Le
théorème de Bloch affirme qu’une fonction d’onde solution de (1.19) aura la forme d’une
onde plane multipliée par une fonction périodique u :
ψ(x) = uk (x)eikx
(1.21)
uk (x + a) = uk (x). Pour x0 = na, en utilisant la périodicité de u, l’éq.1.21 donne
0
ψ(x + x0 ) = eikx ψ(x)
(1.22)
ce qui exprime le fait que les amplitudes de la fonction d’onde en x et en x0 sont les mêmes
à un facteur de phase près – une conséquence de l’invariance par translation du cristal.
Démonstration du théorême de Bloch : on considère les opérateurs de translations
discrètes Tn . H est invariant par translation, donc les Tn commutent avec H. Choississons une base ψ commune de sorte que Hψ = Eψ et Tm ψ = c(m)ψ où E et c sont des
nombres. En considérant deux opérations successives, on a Tn Tm = Tn Tm = Tn+m (les
translations commutent et deux translations successives peuvent être remplacées par une
seule). Cette dernière relation implique que c(m) peut être exprimé sous la forme eim×cste ,
d’où l’éq.1.22.
17
Quantification des valeurs de k
. On suppose que le réseau est composé de N sites, avec une distance entre sites a, et
avec des conditions aux limites périodiques. On a donc ψ(x + L) = ψ(x) où L = N a. On en
déduit qu’il existe N valeurs distinctes de k, que l’on peut choisir à être dans un intervalle
symétrique autour de l’origine,
kn =
2π
n,
a
n=−
N
N −1
, ..., 0, ...,
2
2
(1.23)
Dans la limite L → ∞, ces valeurs de k deviennent continues. On appelle la première zone
de Brillouin (PZB) l’intervalle [−π/a, π/a]. Le théorême de Bloch implique que l’énergie de
l’électron dans un cristal sera une fonction périodique de k, En (k + g) = En (k) (où n est
l’indice de bande). Il suffit, donc, de chercher les solutions de l’éq. de Schrödinger dans la
première zone de Brillouin.
Solution pour V = 0. Le cristal virtuel
Considérons un électron qui se propage dans un réseau mais où les interactions avec
les noyaux sont négligeables, de sorte que V (x) = 0 (d’où le “virtuel”). Les solutions de
l’équation de Schrödinger sont les ondes planes déjà vues, ψK (x) ∝ eiKx . Celles-ci peuvent
se réecrire ψn,k (x) = ei(ng+k)x , car on peut exprimer tout vecteur d’onde K sous la forme
ng + k où π/a < k < π/a (on parle alors de la valeur “réduite” de K). On trouve ainsi des
énergies qui dépendent de k et d’un indice n :
²n (k) =
~2
(ng + k)2
2m
(1.24)
Ces “bandes d’énergie” sont illustrés dans la figure (il ne s’agit, pour l’instant, qu’une façon
inhabituelle de représenter les solutions déjà connues pour un électron libre).
Lorsque le potentiel V 6= 0, nous allons voir que ces bandes d’énergie sont peu modifiées à
l’intérieur de la PZB, mais qu’il se produit des phénomènes intéressants aux bords, c.a.d. près
de ±π/a. Avant d’aborder les calculs voici un argument qualitatif permettant de comprendre
ces situations particulières.
La non-propagation de certaines ondes planes dans un milieu périodique
Pour avoir une idée qualitative de la propagation des électrons dans un cristal il est
intéressant de prendre un exemple simple. Considérons une onde incidente venant de −∞
sur une barrière de potentiel, V (x) = V pour 0 < x < d, où V est supposé petit en comparaison avec l’énergie cinétique de l’onde incidente. Une partie de l’onde sera réfléchie, et une
partie transmise, les amplitudes de réflection/transmission étant dépendant de V , et d. On
considère maintenant l’effet d’enchaı̂ner plusieurs barrières, avec une distance de répétition
a. Une onde incidente eikx sera partiellement réfléchie par chacune des barrières. Si l’on
considère l’amplitude de l’onde renvoyée vers −∞, elle sera donnée par une somme de termes
e−ikx+iM φ , où φ = 2ka est la différence de phase associée à une distance supplémentaire
parcourue de 2a. Quand k est un multiple de π/a, φ sera un multiple de 2π, et toutes les
réflections arriveront en phase - l’amplitude totale de réflection sera importante (ce qui implique que l’amplitude de transmission de cette onde sera faible). A l’intérieur de la région
périodique, à cause des réflections multiples, il y aura une onde stationnaire pour ces valeurs
particulières de k, avec, comme on le verra ci-dessous, l’apparition de bandes interdites ou
“gaps”.
18
n=-3
n=3
n=-2
n=2
n=-1
n=1
n=0
-0.5
0
0.5
Fig. 1.9 – La relation de dispersion du cristal virtuel dans la première zone de Brillouin (la
figure indique k en unités de g)
La solution en théorie de perturbation
On considère un potentiel périodique simple de forme sinusoı̈dale V (x) = V1 (eigx +e−igx )
( c.a.d. on ne garde que les premiers termes du développement de Fourier de l’éq.1.20).
Quand V1 est petit devant l’énergie cinétique de l’électron, on peut obtenir des solutions de la fonction d’onde ψ(x) et de l’énergie En (k) sous forme d’un développement en
puissances de V1 . Nous nous contenterons de citer les résultats du calcul perturbatif
|V1 |2
|V1 |2
+
+ ..
²n (k) − ²n (k + g) ²n (k) − ²n (k − g)
V1
V−1
|ψi = |ki +
|k + gi +
|k − gi + ..
²n (k) − ²n (k + g)
²n (k) − ²n (k − g)
En (k) = ²n (k) +
(1.25)
le ket |ki représentant l’onde plane de vecteur d’onde k, et nous n’avons pas écrit les termes
d’ordre plus élevés. Ces équations confirment que les termes de correction seront petites si
|²n (k) − ²n (k ± g)| >> |V1 |.
On est ainsi amené à conclure que, pour la plupart des électrons dans le gaz de Fermi,
les énergies et les fonctions d’onde sont peu affectées par la présence du réseau de noyaux.
Les solutions aux bords de la PZB
Consid érons d’abord l’énergie E en fonction de k dans la branche d’énergie la plus basse,
n = 0. Il suffit de considérer k positif, car le spectre étant symétrique autour de k = 0.
Lorsque k augmente, et approche le bord de la PZB, les énergies ²0 (k) et ²0 (k − g) sont très
proches. Les éqs.1.25 ne sont plus utiles, et il faut recourir à la théorie de perturbation des
états dégénérés. Pour δ petit, et k = g/2 − δ on va chercher une solution de l’éq.1.19 de la
19
forme |ψi = c1 |ki + c2 |k − gi. En multipliant l’équation H|ψi = E|ψi par hk| et par hk − g|
on obtient deux équations
²0 (k)c1 + V1 c2 = Ec1
(1.26)
²0 (k − g)c2 + V−1 c1 = Ec2
(1.27)
Pour qu’il y ait une solution nontriviale des coefficients ci , il faut que le déterminant de la
matrice correspondante soit nul, ce qui donne
µ
¶
²0 (k)
V1
det
=0
(1.28)
V−1 ²0 (k − g)
On trouve aisément les deux solutions de l’équation quadratique :
E=
²0 (k) + ²0 (k − g) 1 p
±
(²0 (k) − ²0 (k − g))2 + 4|V1 |2
2
2
(1.29)
ce qui montre (voir la figure) que l’énergie s’écarte sensiblement de sa valeur ²0 (k) dans ce
cas. Quand k = g/2, on obtient après simplification,
lim E = ²0 (g/2) ± |V1 |
δ→0
(1.30)
√
Pour cette valeur de k = g/2 il est facile de vérifier que les coefficients c1 = ±c2 = 1/ 2 et les
solutions sont donc des ondes stationnaires, ayant des énergies correspondantes ²(g/2)±|V1 |.
Il apparaı̂t ainsi une “bande interdite” (ou gap, Eg ) de largeur 2|V1 |. C’est l’intervalle
d’énergie entre le haut de la bande n = 0 et le bas des bandes n = ±1, où il n y a pas de
solution de l’éq.1.19.
Généralisation aux potentiels plus compliqués. On peut prendre en compte les autres coefficients Vn dans la série de Fourier de la même façon. Chaque fois que deux bandes se
rencontrent, il y aura formation d’une onde stationnaire, et on verra alors apparaı̂tre des
gaps de largeur 2|Vn | (voir la figure). Dans la figure on présente les courbes d’énergie en
fonction de k. L’écart entre la courbe parabolique d’un électron libre (ligne hachurée de la figure) et la nouvelle courbe n’est visible que près des valeurs k = 0, ± g2 . Les figures montrent
pour ce cas unidimensionnel le diagramme des énergies en fonction de k représentées dans
la première zone de Brillouin.
Q. Que vaut k au bord de la PZB dans un cristal de a = 1Å ? S’il y a un électron de
conduction par atome, que vaut kF ? Conclusion quand à la fonction d’onde au niveau de
Fermi.
Vitesse de groupe. Masse effective.
L’impulsion totale, p, de l’électron n’est plus une quantité conservée à l’intérieur du
cristal. Les fonctions d’onde ψ(x) solution de l’éq.1.19 correspondent à des pacquets d’onde,
d’une valeur moyenne de k donnée. La “vitesse de groupe” et la masse effective sont définies
à partir des relations suivantes :
~v(k) = ∂E/∂k
~2
= ∂ 2 E/∂k 2
mef f (k)
(1.31)
20
Fig. 1.10 – Première zone de Brillouin avec quatre bandes dont deux remplies avec des
électrons
Il est facile de vérifier que ces relations ci-dessus donnent les valeurs attendues de la
vitesse (v = ~k/m) et la masse m habituelles dans le cas d’un électron libre. La vitesse
moyenne et la masse effective d’un électron deviennent des fonctions de k pour un électron
dans un cristal, et c’est aux bords de bande que se produisent les effets les plus surprenants.
La vitesse de groupe, proportionnelle à la pente de la courbe de dispersion, s’annule non
seulement à k = 0 mais aussi à k = ±π/a.
La masse effective mef f sera elle aussi fortement modifiée pour certaines valeurs de k.
Développant l’expression de l’énergie En (k) (l’éq.1.30) autour de k = k0 , on a
1
mef f (k)
= ~−2 ∂ 2 En (k)/∂k 2
=
(1.32)
g
1
1 ²n ( 2 )
±
m m 2|V1 |
Il s’ensuit que la masse effective peut devenir très grande, approchant l’infini aux bords de
la PZB, traduisant le fait qu’une onde stationnaire ne transporte pas d’énergie.
g
2|V1 |
mef f ( ) = − g m
2
²( 2 )
(1.33)
Conduction d’un courant électrique
Sous l’effet d’un champ électrique uniforme E, on peut montrer que la quantité de
mouvement ~k varie selon l’équation
~dk
= −eE
dt
(1.34)
ayant la solution k(t) = k(0)−eEt/~. Cependant, un électron ne peut changer sa valeur de k
que si le nouvel état est vacant. Ceci est possible si tous les électrons changent simultanément
21
leurs états dans le même sens ! La quantité du mouvement du gaz entier est ainsi changée.
L’énergie et la vitesse de chacun des électrons sont, eux, des fonctions périodiques de k,
en l’absence de transitions entre bandes (ce qui coûterait une énergie égale à la largeur
de la bande interdite). Il résulte que le mouvement d’un électron donné sera une fonction
oscillante du temps ! Ces “oscillations de Bloch” n’ont été expérimentalement mesurées que
très récemment, car il faut des échantillons de très grande pureté.
1.3.2
Conducteurs, isolants et semiconducteurs.
Nous avons vu que l’application d’un champ électrique conduit à un changement de k de
chaque électron, ce qui est possible si tous les électrons changent leur k en même temps. La
quantité de mouvement totale K du gaz deviendra alors non-nulle et il y aura un courant
électrique. Ce n’est plus le cas lorsqu’une bande est entièrement remplie - tous les états k
disponible sont alors occupés, et le champ électrique ne donnera pas lieu à un déplacement
global dans l’espace k de l’ensemble des électrons. Il n y pas de courant électrique et on a
affaire à un isolant de bande.
Dans quelles conditions une bande est-elle est complètement remplie ? Pour un cristal de N noyaux, il y a N valeurs de k permises. Multipliant par 2 pour le spin on a
nombre d’électrons que l’on peut caser dans chacune des bandes, 2N . Quand le nombre
total d’électrons est inférieur à 2N, la bande sera partiellement remplie, et il s’agit d’un
conducteur. Ce sera le cas pour des atomes monovalents, où chaque atome libère un
électron de conduction. Si, par contre, chaque atome contribue exactement 2 électrons, la
bande n = 0 sera complètement remplie, et on aura un isolant.
Les semiconducteurs sont des matériaux où le gap Eg , est relativement petit. La
différence entre le semiconducteur intrinsèque et un isolant est (pour simplifier) uniquement
quantitative : par exemple, le diamant, avec son Eg = 7eV est un isolant, tandis que le
silicium pur avec Eg = 1.12eV , et le germanium, avec Eg = 0.7eV sont des semiconducteurs.
Ces derniers sont des isolants à T = 0, à cause de leurs bandes pleines. En augmentant la
température, de plus en plus d’électrons sont excités dans la bande de conduction. En le
faisant, ils laissent des états vacants ou “trous” dans la bande de valence. La conduction
du courant est assuré en partie par les électrons dans la bande conduction, et en partie
par les trous de la bande de valence ! La conductivité σ dépend de la concentration des
porteurs de charge négative (n) ou de charge positive (p) de courant électrique. Dans un
tel semiconducteur, donc, la σ augmentera en fonction de T . Dans le Si, à T = 300K,
n = p = 1.5 × 1010 cm−3 .
Calculons le nombre Nc d’électrons dans la bande de conduction pour notre système
unidimensionnel. On l’obtient en calculant la somme sur tous les états (de la bande de
conduction) des probabilités qu’un état d’énergie E soit occupé. Cela donne
Z
1
(1.35)
Nc = L
dkρk
(²(k)−µ)/k
B T −1
exp
pzB
Z Emax
1
= L
dEρ(E)
(²(E)−µ)/k
B T −1
exp
Emin
où µ est le potentiel chimique.
22
1.3.3
Résultats en d=2 et 3
Un réseau est caractérisé par ses translations élémentaires, que l’on désigne par ~ai (i =
1, .., d). A chaque réseau correspond un réseau réciproque qui, lui, est engendré à partir des
~ i , que l’on peut déterminer à partir des relations
vecteurs A
~ i .~aj = 2πδij
A
(1.36)
La première zone de Brillouin est une cellule élémentaire du réseau réciproque, au centré
située à ~k = 0.
~ i et construire la pzB du réseau rectangulaire pour lequel ~a1 = lu~x ,
Q. Préciser les vecteurs A
~a2 = 3lu~y .
L’hamiltonien d’un électron dans un tel cristal est H = H0 + V (~x) où V (~x) reflètera la
périodicité du réseau, V (~x + ~ai ) = V (~x).
Le théorême de Bloch s’écrit
~
ψ~k (~x) = u~k (~x)eik.~x
(1.37)
Pour de conditions aux limites périodiques, on trouve autant de valeurs discrètes de ~k dans
la pzB qu’il y a de sites atomiques, soit N .
La théorie de perturbation permet, comme pour d = 1, de calculer les fonctions d’onde
~ est un des composantes
ψ~k (~x) et les énergies propres E(~k), en série de puissances de VG~ , où G
du développement de Fourier de V . Les modifications sont petites pour la plupart des
vecteurs ~k, mais deviennent importantes près d’une des faces de la zone de Brillouin, où
l’on obtient des ondes stationnaires dans la direction perpendiculaire à la face. Les énergies
E(~k) seront fortement modifiées à ces valeurs de ~k, comme dans l’exemple unidimensionnel.
La vitesse de groupe dépendra,en générale, de la direction de propagation, étant donnée
par
~ ~k)
~v = ~−1 ∇E(
(1.38)
puisque les composantes x, y ou z du gradient de E peuvent être différents. La masse effective
est un tenseur, donnée par une généralisation simple de l’équation 1.32.
Nouveaux effets présents en dimensions supérieures à 1
Dans notre modèle unidimensionnel simple, les gaps sont toujours directs, quelque soit la
forme du potentiel V (x), c.a.d. le minimum de En (k) se trouve juste au-dessus du maximum
de En−1 (k). Ce n’est plus nécessairement vrai en d > 1, et on peut avoir une situation de
“gap indirect” où le maximum de la bande de valence et le minimum de la bande de
conduction ne sont pas situés au même endroit (illustré dans la figure). On peut même
avoir des situations où Emin de la bande de conduction est en-dessous de Emax de la bande
de valence. Dans ces cas, à T = 0K, les électrons occuperont les états de plus basse énergie
dans la bande de conduction, et la bande de valence ne sera que partiellement remplie. On
emploie le terme “semi-métal”” pour ces matériaux.
1.4
1.4.1
Transitions de phase induites par des interactions
interaction électron-électron. Le magnétisme itiniérant. La transition de Mott.
Un des sujets de recherche actuel concerne les effets de l’interaction coulombienne entre
les électrons, qui a été négligée dans le traitement élementaire de la section précédente. En
23
Fig. 1.11 – i) bande pleine (isolant ou semiconducteur),ii) deux bandes partiellement remplie
(semi-métal),iii) bande partiellement remplie (métal)
effet, on ne peut plus traiter les particules une par une, car elles seront toutes couplées par
ces interaction s. Il n’existe pas de méthode générale pour ce problème à N corps, mais
il existe des techniques approximatives. Dans un certain nombre de cas simples, on peut
introduire des termes correctifs dans l’hamiltonien pour prendre en compte ces interaction s
de façon approximative. On peut utiliser la théorie des perturbations, des théories de champ
moyen, la méthode du groupe de renormalisation, etc. Ces méthodes marchent souvent assez
bien à d = 3, moins bien en d = 2. Pour d = 1, dans les fils quantiques, il faut recourir à des
modèles beaucoup plus sophistiqués pour décrire la physique des électrons en interaction .
Dans cette section, nous allons découvrir quelques phénomènes physiques intéressants dûs
à l’interaction coulombienne, avec des explications qualitatives.
Le ferromagnétisme intinérant
Une analyse simple permet de voir que l’interaction répulsive entre électrons favorise un
alignement de leurs spins dans un état ferromagnétique. Rappelons que en l’absence de ces
interaction s, l’état fondamental du gaz d’électrons correspond à une valeur totale de spin
nulle : car les états de spin ± 21 sont occupés de manière identique. Les électrons sont libres
de parcourir tout le volume disponible, et de ce fait, deux électrons se retrouveront de temps
en temps dans la même région de l’espace. Ce genre de rencontre devient défavorable au
fur et à mesure que l’on “branche” l’interaction coulombienne entre les électrons, qui commencent à se demander comment ils peuvent faire pour s’éviter. Une solution est suggerée
par le principe de Pauli : avoir la même direction de spin car dans la valse des électrons,
deux électrons de spins parallèles s’évitent automatiquement. Mais si l’on retournait tous
les spins, cela coûterait trop d’énergie - il faut aller deux fois plus loin dans l’espace des k
(et augmenter sensiblement l’énergie de Fermi) pour caser tous les électrons. Un compromis
est alors trouvé par le système. Un modèle d’interactions simple a été introduit par Hubbard, qui a remplacé l’interaction habituelle entre deux électrons séparés d’une distance r,
24
e2 /(4π²0 r2 ), par une forme schématique : U si les électrons sont très proches, et 0 sinon. On
peut montrer alors qu’à partir d’une certaine valeur critique Uc , le gaz d’électrons choisit un
état avec une majorité de spins parallèles, de sorte que le moment magnétique total n’est
plus nul. Il s’agit d’une transition de phase d’un état paramagnétique, c.a.d. ayant M = 0
en l’absence d’un champ magnétique extérieur, à un état ferromagnétique (transition de
Stoner). Le mot “itinérant” signifie que les électrons restent délocalisés dans le nouvel état,
contrairement à ce qui se passe dans la transition de Mott décrite ci-dessous.
L’isolant de Mott
Le ferromagnétisme itinérant n’est pas la seule solution au problème de minimisation
de rencontres entre électrons. Une deuxième possibilité est de localiser les électrons, et
créer un réseau d’électrons (cristal de Wigner). Il y a un prix à payer en énergie, car un
électron délocalisé a une énergie plus basse qu’un électron contraint de rester à un endroit
précis. Toutefois, chaque électron tente de minimiser son énergie en s’arrangeant d’avoir des
voisins de spin antiparallèles, de façon à pouvoir faire des sauts locaux. Cela donne un état
antiferromagnétique, et bien sur, le système est un isolant.
1.4.2
interaction électron-phonon. La supraconductivité.
La théorie de Bardeen, Schrieffer et Cooper proposée dans une série d’articles a permis
d’expliquer un phénomène découvert dès 1911 lorsque Kamerlingh-Onnes à trouvé que la
résistance de mercure devenait nulle à 4.2K (voir la figure). BCS ont eu le prix Nobel en
1972. Dans cette théorie, la supraconductivité est possible grâce à la formation de paires
d’électrons. Les électrons près du niveau de Fermi se regroupent deux par deux, chaque
électron de vecteur d’onde ~k s’appariant avec celui de spin opposé de l’état −~k, de manière
à former une entité de spin total S = 0. Ces paires, appelées des paires de Cooper, sont des
bosons, c’est à dire des particules quantiques de nature fondamentalement différentes des
électrons.
Les phonons jouent un rôle primordial dans la formation de paires, pour toute une classe
de supraconducteurs, appelés des supraconducteurs conventionnels (en contraste avec le supraconducteurs à “haute température critique” découverts en 1986). Un phonon, comme
nous allons découvrir en un peu plus de détail dans le chapitre 2, est un mode de vibration
des noyaux. Cooper a montré que pour certains cas, les vibrations du réseau peuvent créer
une faible attraction entre paires d’électrons. Le potentiel attractif entre paires d’électrons
dépend de l’importance de l’interaction électron-phonon. Dans le modèle simplifié de BCS,
on introduit un paramètre V qui représente le couplage, et les calculs donneront une
température de transition Tc entre la phase “normal” et la phase “supra” en fonction de V .
Un des tests de la théorie BCS est de faire des expériences pour voir si Tc varie de façon
attendue lorsque le paramètre V change - ce que l’on peut faire dans la pratique en substituant des atomes par des isotopes. La figure montre la dépendance de Tc dans le mercure
en fonction de la masse de l’isotope.
Contrairement aux fermions, les bosons ont tendance à se rapprocher, et à une température
suffisamment basse, il peut se produire une condensation de bosons. C’est ce qui se passe
pour les paires de Cooper à la température critique, Tc . Le condensat possède des propriétés nouvelles qui découlent du fait qu’il est un objet quantique macroscopique. L’état
supraconducteur est décrit par une fonction d’onde Ψ(~x) que l’on peut factoriser en une
amplitude |Ψ(~x)| et un facteur de phase eiΛ . La phase Λ est une propriété de l’ensemble
25
de paires de Cooper, et elle est conservée (on parle alors de cohérence macroscopique). On
peut ensuite déduire les propriétés telles que la résistance nulle, et la possibilité d’avoir un
courant perpétuel.
1.4.3
Effets du désordre et/ou apériodicité.
Jusqu’ici nous avons considéré que l’ordre périodique était parfait. En d’autres termes,
la longueur de cohérence ξ de la structure est infinie, où ξ correspond à la distance à partir
de laquelle, on ne peut plus écrire avec précision les positions des atomes. Dans la pratique
on déduit ξ −1 des clichés de diffraction des rayons-X du cristal - plus les pics de diffusion
sont hauts et fins, plus ξ est grande. Pour un cristal de bonne qualité, ξ peut être très
grande à basse température (de l’ordre du cm, ce qui correspond à un alignement parfait de
quelques millions d’atomes). Par contre, dans un cristal de mauvaise qualité, ou un alliage,
où les atomes occupent des sites dans un ordre aléatoire, ξ sera petite. De façon générale
il est clair que tous les matériaux sont plus ou moins désordonnés. La théorie des systèmes
désordonnés est plus beaucoup plus récente que celle de la section II, et tous les résultats
ne sont pas complètement compris. Toutefois, il y a un consensus sur le fait que les états
de Bloch d’un cristal parfait disparaissent lorsque le désordre dépasse une valeur critique.
Les états à un électron dans un milieu très désordonné sont localisés. Anderson a présenté
un modèle simple d’un métal désordonné où l’on peut démontrer qu’il y aura une transition intéressante en d > 2 – la transition métal-isolant – quand le désordre augmente. Le
conducteur, avec les états étendus devient subitement un isolant, avec des états localisés.
Pour d = 1 les états sont toujours localisés (dès que l’on a un désordre aussi petit qu’il
soit) tandis que le cas de d = 2 est un cas limite. Les analyses sont encore plus compliquées
lorsque l’on cherche à inclure les interaction s entre électrons. L’étude expérimentales de
cette transition et les calculs théoriques continuent d’être des sujets actifs de recherche.
Les quasicristaux sont un exemple de système où l’on n’a pas de périodicité, mais où la
longueur de cohérence reste très élevée. On peut, en effet, prédire avec certitude la position
des atomes, selon des régles plus compliquées que celles d’un cristal. La figure montre un
exemple de structure quasipériodique. Il n’existe pas pour le moment de modèle théorique
pour ces matériaux. Il est cependant clair qu’ils ne seront pas des bons conducteurs et que
les fonctions d’onde des électrons ne seront pas des paquets d’onde de la forme de Bloch,
mais seront-ils des isolants, ou des semiconducteurs, ou encore autre chose d’intermédiaire ?
La réponse devra venir des calculs avec des techniques nouvelles adaptées à ce cas.
Chapitre 2
Propriétés thermiques et
acoustiques
Du point de vue macroscopique, la distinction entre un solide et un liquide n’est pas
toujours évidente. On sait qu’un solide est rigide, et garde sa forme, tandis qu’un liquide
coule, et s’adapte à la forme de son conteneur. Mais il y a des situations où l’on a du
mal à distinguer le solide du liquide : comment définir, par exemple, la température de
gel entre la phase liquide et la phase solide dans un verre ? Nous ne rentrerons pas dans
des discussions sur ces systèmes-là, et nous nous restreindrons aux solides cristallins, où les
positions moyennes des atomes sont fixes et déterminées par des règles simples. Dans ce
chapitre nous allons examiner des propriétés résultant des mouvements des atomes autour
de leur position moyenne. L’ordre périodique n’est, en effet, jamais strictement respecté car
les atomes ne sont pas immobiles, et peuvent se déplacer de leurs positions d’équilibre à une
température finie, par suite des fluctuations thermiques. Même à T = 0 ‘a cause du principe
d’incertitude de Heisenberg, on ne peut pas considérer que les atomes soient localisés aux
positions fixes - il reste toujours des fluctuations d’origine quantique (appelées “zero point
motion” en anglais). Un solide restera un solide tant que l’amplitude de ces mouvements
reste bornée, et la transition solide-liquide aura lieu quand ce n’est plus le cas.
Une façon de caractériser cette propriété de rigidité du solide est en termes de ses
constantes élastiques. Celles-ci expriment la force exercée par un solide lorsque l’on tente
de le déformer. En supposant un régime linéaire, un solide comprimé se comportera comme
un ressort dont la force de rappel est égale à une constante de raideur multiplié par le
changement de longueur. Le solide a aussi une résistance aux forces de cisaillement (comme
celles exercées sur la gomme lorsqu’on l’utilise pour effacer). La constante élastique décrivant
la réponse du solide à une force de cisaillement devient nulle à la transition solide-liquide :
dans un liquide les atomes ne subissent plus une force de rappel élastique. Dans ce chapitre,
nous verrons que ces propriétés élastiques du solide permettent la propagation des ondes
dans le cristal. On verra qu’il est possible de propager des ondes longitudinales et des ondes
tranverses dans un solide (tandis dans les liquides et des gaz dans lesquels il ne peut pas y
avoir des ondes transverses). On verra comment le son, qui est une onde longitudinale, peut
se propager dans un solide à une vitesse beaucoup plus élevée que dans les liquides et gaz
(voir le tableau ci-dessous).
Les vibrations atomiques, ou “phonons”, jouent un rôle important pour les propriétés
thermiques des solides. Dans ce chapitre, quelques notions de base seront introduites en
considérant un modèle simple de vibrations atomiques dans une chaı̂ne d’atomes. La théorie
26
27
classique sera présentée, et ensuite sa version quantique. La généralisation à trois dimensions
sera rapidement expliquée. Quelques applications physiques de ce modèle seront ensuite
présentées. La dernière section donne une liste non-exhaustive d’interactions possibles entre
les phonons et d’autres excitations élementaires dans le solide.
milieu (25◦ C)
air
eau
glycerol
Cu
Fe
C (diamant)
caoutchouc
c (ms−1 )
343
1493
1904
3560
5130
12000
1600
Tableau 1. Quelques valeurs de la vitesse du son dans des milieux divers : gaz, liquides et solides
2.1
Modèle classique de vibrations
Fig. 2.1 – Onde longitudinale se propageant dans un barreau solide.
La figure ci-dessus montre un barreau solide dans lequel se propage une onde longitudinale de compression et dilatation. On peut exciter des ondes de ce type en tapant avec un
marteau sur une des extrémités du barreau. Comme nous allons voir dans cette section, la
vitesse de propagation d’une telle onde dépend des constantes élastiques du matériau. Nous
commencerons la discussion par un modèle unidimensionnel simple qui permet d’étudier la
propagation des ondes dans un milieu cristallin.
2.1.1
Chaı̂ne périodique de N atomes identiques
On considère donc une chaı̂ne d’atomes avec, au repos , une distance entre atomes a. A
l’équilibre, les positions des atomes sont donc données par na (n = 0, 1, ..., N − 1). C’est la
configuration qui minimise l’énergie potentielle totale des atomes. Lorsque la température
T > 0, les atomes peuvent se déplacer, au prix d’une augmentation de leur énergie potentielle. On cherche à établir l’équation du mouvement des atomes. Considérons d’abord une
paire d’atomes proches voisins. Nous appelons un et un+1 les déplacements du nième atome
28
et de son voisin par rapport à leurs positions d’équilibre. La distance entre les deux est
changée de un+1 − un . En supposant que l’énergie potentielle a une forme de puits harmonique (ce qui est généralement le cas pour des déplacements très petits), on peut en déduire
une force de rappel F = K(un+1 − un ). La “constante de raideur” K, qui est la dérivée
seconde de l’énergie potentielle, a une valeur plus ou moins importante selon la composition
chimique, la structure du composé, etc.
Fig. 2.2 – Chaı̂ne d’atomes identiques de masse m
L’équation de mouvement du nième atome sera (en tenant compte des mouvements de
ses deux voisins) :
m
d2 ui
dt2
= −K[(ui − ui−1 ) + (ui − ui+1 )]
(2.1)
= K[ui+1 + ui−1 − 2ui ]
où m est la masse d’un atome. L’équation 2.2 est une version discrète de l’équation des
ondes ( d’Alembert : ∂ 2 u/∂t2 = c2 ∂ 2 u/∂x2 ). On peut donc écrire des solutions de la forme
un (t) = A Re
ei(kna−ωk t) = A cos(kna − ωk t)
(2.2)
(Re : partie réelle), où A est l’amplitude de l’onde, k le vecteur d’onde (k = 2π/λ, où λ est la
longueur d’onde, et ωk est la pulsation de l’onde. Les valeurs de k permises sont déterminées
à partir des conditions aux limites. Pour une chaı̂ne de longueur L = N a répétée de façon
périodique, on doit avoir un+N = un , ce qui donne
kn =
2nπ
, n = 0, ±1, ....,
L
(2.3)
Etant donné la périodicité de la solution 2.2, il y a exactement N solutions distinctes
possibles, c’est-à-dire, autant de valeurs distinctes de kn que d’atomes. Noter aussi que
lorsque N → ∞, k devient une variable continue dans l’intervalle [− πa , πa ) - la “première
zone de Brillouin”.
On peut déterminer la valeur de ωk en substituant la forme 2.2 dans l’éq.2.2, et l’on
trouve
r
K
ω(k) =
(2 − 2 cos(kn a))
(2.4)
m
r
1
K
=2
| sin( kn a)|
m
2
29
La courbe de ω en fonction k (la relation de dispersion) est montrée dans la Fig.2.3. Pour
k petit, on peut approcher la courbe par une droite, et alors on a ω ≈ ck, comme pour les
ondes sonores habituelles. Il s’agit ici, en effet, d’une onde acoustique de même type que
celle qui se propage dans l’air. La vitesse du son, qui a une valeur d’environ 343 m/s dans
l’air, est ici donnée par la relation
r
K
c=a
(2.5)
m
La vitesse c est beaucoup plus élevée dans le solide, car les forces de rappel entre les atomes
sont beaucoup plus importantes que celles entre les molécules de l’atmosphère (penser aux
ondes sur une corde tendue, et à leur vitesse en fonction de la force de tension).
Pour des valeurs de k plus grandes, il faut utiliser l’expression complète de ω(k) de l’éq.2.5.
Lorsque la fréquence est, comme ici, une fonction nonlinéaire de k, la vitesse c des ondes
dépend de k. On parle alors de la vitesse de phase, vph = ω/k et la vitesse de groupe,
vg (k) = dω/dk. La pente de la courbe ω(k) n’est autre que la vitesse de groupe, et celle-ci
décroı̂t progressivement lorsque k augmente, devenant nulle au bord de la zone de Brillouin.
C’est l’analogue de ce qui se passe avec les électrons près du bord de la zone de Brillouin.
Fig. 2.3 – Relation de dispersion pour la chaı̂ne d’atomes
Q1 : On peut “faire chanter” un long barreau d’acier en l’attachant à son milieu, et en frottant avec
un tissu. Le son émis peut être capté avec un microphone. Sachant que la vitesse du son dans l’acier
est c = 0.59cm/µs, et pour une longueur d’onde dans le mode fondamental de 2L où L = 0.75m,
quelle est la valeur de la fréquence correspondante ? Refaites le calcul pour un barreau de fer de la
même longueur et pour lequel c = 0.48cm/µs. Est-ce que l’on pourrait entendre la différence entre
les deux matériaux ?
2.1.2
Le mouvement des atomes en fonction de k. Périodicité de ω.
Il est important de souligner que le vecteur d’onde n’est défini, dans le cristal, qu’au
vecteur g = 2π/a près. Il est facile de vérifier que les déplacements des atomes dues à une
onde de vecteur d’onde k et celle de k + g sont identiques. L’énergie de ces deux ondes est
bien sur la même - autrement dit, ω(k) est une fonction périodique dans l’espace des k.
~
(Ce résultat est également vrai pour des systèmes de dimension d > 1, avec des vecteurs G
du réseau réciproque à la place de g. Nous parlerons ainsi plus loin des processus appellés
30
des collisions “umklapp”, où l’onde ~k échange une quantité de mouvement avec le réseau et
~
devient l’onde finale ~k + G).
Pour les longueurs d’onde très grandes (k petit), il y aura une lente variation des
déplacements un et peu de variation entre proches voisins. La distance entre voisins est
très proche de la valeur a. Dans la limite k → 0 les “ressorts” entre atomes ne sont pas
déformés, ce qui explique le fait que la fréquence ω tend vers 0 dans cette limite.
Dans l’autre limite de k = π/a, la longueur d’onde est 2a, et chaque atome est en
opposition de phase avec ses proches voisins. Ceci veut dire que les ressorts sont alternativement comprimés et étendus tout le long de la chaı̂ne d’atomes. Un tel mouvement
q coûte
évidemment beaucoup plus d’énergie, et la fréquence prend sa valeur maximale, 2 K
m . De
plus, il y a un mélangé des ondes de vecteur d’onde k = πa avec l’onde de k − g = − πa , d’où
la formation d’onde stationnaire comme pour les électrons du chapitre 1.
2.1.3
Les vibrations dans les cristaux de dimension 2 et 3
On peut étendre les idées précédentes aux réseaux de plusieurs dimensions, même si le
modèle devient assez complexe pour d = 3. Pour résumer les résultats principaux : on trouve,
comme dans le modèle unidimensionnel, dN modes différentes de la vibration atomique.
Chaque mode est décrit par un vecteur d’onde ~k, avec une fréquence ω(~k) correspondante.
Ces fréquences seront des fonctions des constantes élastiques du matériau (voir la section
suivante).
Valeurs distinctes de k A une dimension, rappelons que les valeurs de k pour une chaı̂ne
périodique de N atomes sont espacées de δk = N2πa et k ∈ [− πa , πa ]. Dans le cas d’un réseau
carré (d=2) ou réseau cubique (d=3), de façon analogue, les vecteurs d’ondes ont des valeurs
discrètes espacées de N2πa selon chaque direction, où a est la distance entre proches voisins.
Si l’on appelle WB le volume qui correspond à la première zone de Brillouin,
~k ∈ WB
(2.6)
Pour le cas d=3 WB est un cube de coté 2π/a. Il n’est pas difficile de voir que le nombre
de valeurs distinctes de ~k est, comme à une dimension, égal au nombre d’atomes
X
1=N
(2.7)
~k
Dans la limite N → ∞, on peut remplacer la somme par une intégrale
Z
X
=V
dd kρ(~k)
~k
(2.8)
WB
où V = Ld est le volume du cristal et la densité d’états ρ(~k) = (1/2π)d a été introduite
dans Ch.1.
Plusieurs valeurs de ω pour chaque valeur de ~k Pour d = 3 (et pour un cristal ayant
un atome par maille), il y aura trois modes de vibrations pour chaque valeur de ~k. On peut
les écrire ωµ (~k), µ = 1, .., 3. Pour une direction de propagation le long d’un des axes du
cube, par exemple, on a trois polarisations possibles de l’onde : une longitudinale (tous les
atomes se déplacent parallèle à la direction de propagation) et deux tranverses (c.a.d. des
mouvements sont dans le plan perpendiculaire à la direction de propagation). Au totale, on
a donc bien 3N modes comme indiqué précédemment.
31
Comportement de ω pour k petit Pour des grandes longueurs d’onde (|~k| petit), il y
aura 3 ondes acoustiques de polarisations différentes, et ayant des vitesses différentes. Dans
le cas le plus simple d’un cristal cubique, et lorsque l’onde se propage selon un des axes de
symétrie, on peut écrire des relations linéaires approchées suivantes
ωl (~k) = cl k;
ωt (~k) = ct k
(2.9)
où k est la valeur absolue du vecteur d’onde, et l et t indique la direction de polarisation de
l’onde. (Nb. Il y a un mode l de vitesse cl et deux modes t, de la même vitesse, ct ). Quelques
valeurs des vitesses correspondantes sont données dans le tableau.
métal
Al
acier
ρ(g/cm3 )
2.7
7.9
cl (m/s)
6420
5790
ct (m/s)
3040
3100
Tableau 2. Exemples des vitesses acoustiques dans des métaux
Expression des vitesses du son en fonction des constantes élastiques La théorie de
vibrations harmoniques dans un cristal à trois dimensions ne sera pas abordée en détail ici,
nous nous contenterons de présenter quelques idées simples. La complexité des mouvements
peut s’exprimer du simple fait qu’il faut un grand nombre de constantes élastiques pour
caractériser les forces de rappel dans un cristal dans trois dimensions : jusqu’à 21 constantes
différentes au lieu d’une seule en d = 1 ! Pour un cristal cubique, toutefois, les symétries
permettent de réduire ce nombre à seulement 3, appelées C11 , C12 et C44 . La première, C11
(aussi appelée module de Young), donne la déformation du solide lorsqu’il est comprimé. Elle
peut être obtenue dans une expérience où l’on comprime un barreau solide en appliquant
une force de compression uniaxiale, à partir de la relation
P = C11
∆L
L
(2.10)
où P est la pression, L la longueur initiale et ∆L le retrécissement. Il doit être évident
que C11 est l’analogue de la quantité K introduite pour la chaı̂ne d’atomes. C44 décrit
par exemple la déformation suite à un cisaillement du solide. C12 décrit le changement de
longueur dans une direction perpendiculaire à l’axe de compression. Le solide se distingue
ainsi du liquide ou du gaz qui, eux, sont caractérisés par une compressibilité (la résistance
du fluide à un changement de volume).
On considère le cas d’une direction de propagation le long d’une des axes du cristal
cubique. La vitesse de l’onde “longitudinale” cl est donnée par
s
C11
cl =
(2.11)
ρ
q
où ρ est la masse volumique. La vitesse des deux ondes tranverses est donnée par ct = Cρ44
. Dans la plupart des matériaux, en supposant des forces centrales, la constante C11 aura la
valeur la plus grande de toutes les constantes élastiques et une des conséquences en est que
vl est typiquement environ deux fois plus grande que vt . Notons qu’il n y a pas d’équivalent
de l’onde transverse dans un fluide.
Q2 : Les valeurs des constantes élastiques pour trois cristaux cubiques sont données dans le tableau
ci-dessous (les unités des C sont en 107 N cm−2 )
32
métal
Na
Cu
C11
0.07
1.68
C12
0.06
1.21
C44
0.045
0.75
Tableau 2. Deux métaux et leurs constantes élastiques
Pour lequel des deux métaux dans le tableau la propagation d’une onde de compression sera-t-elle
la plus rapide ? On donne ρN a = 0.97g/cm3 , ρCu = 8.96g/cm3 .
Q3 : On mesure c = 0.589cm/µs dans un barreau d’acier et c = 0.480cm/µs dans un barreau de fer.
Leurs masses volumiques sont proches. Lequel des deux matériaux choisiriez-vous pour construire
un pont ? (raisonner à partir du modèle qui vient d’être présenté)
2.1.4
Modes optiques. Chaı̂ne à deux constantes de couplage.
Fig. 2.4 – Une chaı̂ne avec deux atomes par maille
Les solides ne sont pas tous, évidemment, constitués d’une seule espèce d’atomes comme
nous l’avons supposé dans notre modèle de vibrations. Un composé tel que N aCl (sel de
table) a une structure de deux atomes par maille élementaire, chaque atome de N a est
accompagné de son voisin Cl situé à une distance a/2, par exemple. On verra que cette fois,
les mouvements atomiques rendent possible des nouveaux phénomènes comme l’émission de
photons, et de la lumière (d’où le nom de phonon optique). Lorsqu’il y a deux (ou plusieurs)
atomes par maille, comme dans la chaı̂ne dans la fig.2.4, on a la possibilité d’avoir, en plus
de l’onde acoustique décrite ci-dessus, des modes de vibration appelés “optiques”. Pour
comprendre mieux de quoi il s’agit, prenons un modèle simple d’un cristal à une dimension
composé de deux types d’atomes.
On prend une chaı̂ne de 2N atomes, dont N de type “A” et N de type “B”. Le pas du
réseau, a, est donné par la distance entre deux atomes “A”. On peut avoir une situation où
les forces de rappel sont différentes, et alternent entre deux valeurs K1 et K2 (ce qui peut
se produire lorsque les distances entre l’atome A et ses voisins de gauche et de droite ne
sont pas identiques). Dans ce cas on a une série d’équations couplées, comme pour la chaı̂ne
simple : on note xi le déplacement de la position d’équilibre d’un atome A, et yi celui de
33
l’atome B à sa droite, et l’on a
d2 xi
dt2
d 2 yi
m 2
dt
m
= −[K1 (xi − yi−1 ) + K2 (xi − yi )]
(2.12)
= −[K2 (yi − xi ) + K1 (yi − xi+1 )]
(2.13)
On cherche des solutions ondes planes de la forme ( partie réelle implicite)
xn (t) = αei(kna−ωt)
(2.14)
i(kna−ωt)
(2.15)
yn (t) = βe
Substituant dans l’éq.2.13, on trouve deux équations que l’on peut mettre sous la forme
µ
¶µ
¶
mω 2 − (K1 + K2 )
K1 + K2 eika
α
=0
(2.16)
β
K1 + K2 e−ika mω 2 − (K1 + K2 )
Pourqu’il y ait des solutions non-triviales de cette équation, il faut que le déterminant de
la matrice soit nul. On a ainsi le résultat suivant pour les fréquences ω,
p
K12 + K22 + 2K1 K2 cos(ka)
K1 + K2
ω± (k) =
±
(2.17)
m
m
Il est facile de vérifier que, pour petit k, ω− ≈ ck où c est la vitesse du son. C’est la fréquence
associée au mode dit acoustique car c’est l’équivalent de l’onde sonore dans le solide. La
deuxième solution ω+ reste élevée même lorsque k → 0 (voir la figure).
Quelles sont les vibrations atomiques correspondantes ? La solution complète de l’éq.2.16
pour k = 0 donne aussi α = ±β pour les amplitudes de l’onde sur les atomes A et B. Dans le
cas de l’onde acoustique, les deux atomes dans chaque maille ont un mouvement en phase.
Cela ne coûte évidemment rien en ce qui concerne l’énergie potentielle du ressort entre les
deux atomes, d’où une fréquence nulle pour ce genre de vibration. Dans le cas de l’onde
“optique”, au contraire, les phases sont en opposition, et la fréquence ω+ est la moyenne
géométrique des deux constantes de couplage. Tout au long de la chaı̂ne, des paires d’atomes
effectuent exactement le même mouvement.
Lorsque A et B sont des noyaux de charges opposées, la paire de charges oscillant en
opposition de phase agit comme un dipole électrique, qui est un capteur/émetteur d’ondes
électromagnétiques à la manière d’une antenne miniature. Dans certains matériaux, ω+
correspond à une fréquence des ondes visibles (ou plutôt infrarouges), d’où le nom de ce
mode de vibration.
34
Fig. 2.5 – Relation de dispersion pour la chaı̂ne de deux atomes par maille
2.2
Le passage vers une description quantique. Les phonons.
A T > 0, le mouvement des atomes est le résultant des différents modes de vibration
qui sont excités, correspondant à des longueurs d’onde et fréquences différentes, Dans la
théorie harmonique, valable à basse température, ces ondes se propagent indépendamment
les unes des autres. Dans ce cas, on peut retrouver les équations du mouvement de l’éq.2.2
à partir de hamiltoniens de N oscillateurs harmoniques indépendants. La chaleur spécifique
par atome d’un tel ensemble d’oscillateurs classiques est indépendente de la température,
cV (T ) = 3kB (loi de Dulong-Petit). Or, les mesures expérimentales montrent que la chaleur
spécifique croı̂t en fonction de T (voir figure). Einstein et Debye ont contribué à la résolution
de ce problème en considérant des modèles quantiques du mouvement des atomes.
La description quantique de chacun de ces oscillateurs est un problème bien connu dans
les cours de mécanique quantique, et nous allons supposer que les notions de base vous
sont déjà familières. Rappelons donc que dans le modèle quantique d’un oscillateur à une
dimension de fréquence ω l’énergie prend des valeurs discrètes, ~ω(n + 12 ). n = 0, 1, ... est le
nombre quantique qui sert à repérer les états propres du système |ni. On peut généraliser
ce résultat au cas d’un grand nombre d’oscillateurs. Dans le calcul quantique pour la chaı̂ne
d’atomes, l’énergie totale sera la somme des énergies de N oscillateurs harmoniques, et
H=
X
1
~ωk (nk + )
2
(2.18)
où nk est la valeur moyenne du nombre quantique du mode k, nk = 0, 1, 2, .... L’état fondamental correspond à nk = 0 pour tous les modes. On voit que l’énergie de cet état n’est
pas nulle - c’est une conséquence, comme nous avons déjà remarqué, du principe d’incertitude de Heisenberg, selon lequel on ne peut pas trouver un atome dans un état où x et p
35
s’annulent simultanément. En conséquence, les atomes n’arretent jamais de bouger même à
température nulle.
2.2.1
Température T 6= 0. La distribution de Planck
Quand la température est très basse, seuls les états de ~ωk petite seront excités, comme
on verra ci-dessous. Au fur et à mesure que T augmente, le nombre de phonons excités,
nk , dans chaque mode augmentera, et des modes d’énergie de plus en plus grande seront
présents.
On peut calculer la valeur moyenne thermique de nk en utilisant des méthodes bien
connues de la physique statistique. Notons que les phonons sont des bosons, et que leur
nombre n’est pas conservé. La nombre moyen de phonons de vecteur d’onde k est donnée
comme pour les photons, par la fonction de distribution de Planck (on passe à une notation
continue pour k),
hn(k)i =
1
.
e~βω(k) − 1
(2.19)
Quand la température est très basse, et ~βω(k) >> 1, il y aura peu de phonons de fréquence
ω(k) excités dans le cristal, car
hn(k)i ≈ e−~βω(k) << 1
(2.20)
Quand la température est très grande devant l’énergie des phonons, de sorte que ~βω(k) <<
1 on excite au contraire beaucoup de phonons
hn(k)i ≈
1
>> 1
~βω(k)
(2.21)
Enfin, notons une proportionnalité entre l’énergie et le nombre pour des températures
élevées, lorsque hn(k)i est grand,
1
E(k, T ) = ~ω(k)(hn(k)i + ) ≈ ~ω(k)hn(k)i
2
(2.22)
Dans l’image classique, l’énergie d’un oscillateur est proportionnelle à l’amplitude carrée
du mouvement. On s’attend à ce que l’amplitude carrée des mouvements atomiques soit
proportionnelle à n(k) et qu’elle va donc croı̂tre en fonction de T. Toutefois, à haute
température, il ne faut pas prendre notre modèle trop au sérieux - il n’est applicable que
pour des mouvements petits devant la séparation entre atomes. Quand la température est
très élevée, ces mouvements deviennent de plus en plus importants, jusqu’à ce que le cristal
fonde.
Q4. D’où vient, d’après vous, le nom de “phonon” pour parler des modes de vibration du réseau ?
(Dans la physique, celle du solide en particulière, on une prolifération d’objets quantiques de noms
exotiques : on y rencontre des plasmons, des polarons, des rotons, des spinons, excitons,....)
2.3
Propriétés thermiques des cristaux. Modèle de Debye.
Dans cette section, nous allons présenter le modèle de Debye (1936) pour la chaleur
spécifique des cristaux. Nous avons vu que, dans le cadre d’un modèle simple de forces
36
de rappel linéaires, les atomes peuvent se déplacer de façon collective, dans des modes de
vibration indépendants, chacun caractérisé par une valeur du vecteur d’onde ~k, un indice
de polarisation µ = 1, 3 et la fréquence ωµ (~k). Dans la théorie quantique, l’hamiltonien est
la somme sur tous les hamiltoniens de ces oscillateurs harmoniques indépendants
H=
XX
µ
~k
1
~ωµ (~k)(n̂µ (~k) + )
2
(2.23)
Le nombre moyen de phonons d’un mode (~k, µ) donné est donné par la distribution de
Planck
nµ (~k) =
1
eβ~ωµ (~k) − 1
(2.24)
(où β = 1/kB T )
L’énergie interne est la valeur moyenne thermique de H,
hHi =
XX
µ
~k
1
~ωµ (~k)h(n̂µ (~k) + )i
2
(2.25)
= E(T ) + E0
et la chaleur spécifique est cV (T ) = N −1 ∂E/∂T .
Le modèle de Debye dans sa version la plus simple consiste à simplifier encore ces
expressions en posant
ωµ (~k) = ĉk
(0 < k < kD )
(2.26)
où ĉ est la vitesse du son “moyenne” pour toutes les directions de l’espace (la définition
précise ne nous concernera pas ici), et où l’on a pris des vecteurs d’onde à l’intérieur d’une
sphère de rayon kD au lieu de les prendre dans la première zone de Brillouin. Le rayon de
la sphère est déterminé en demandant que la sphère ait le même volume que la première
zone de Brillouin. Cela donne pour le cristal cubique simple
4π 3
2π
kD = ( )3
3
a
2 1/3
kD = (6π ) a
(2.27)
On s’attend à ce que les approximations faites ci-dessus marchent bien, d’une part, quand
T est très basse, car alors seuls les phonons de basses énergies seront présents, pour lesquels 1) la relation de dispersion est effectivement linéaire, et 2) le changement de la
région d’intégration n’a aucune incidence. A l’autre extrême, à des valeurs de T très
élevées le modèle de Debye donnera les bons rśultats car alors la chaleur spécifique devient
indépendante de T quelque soit la relation de dispersion, du moment où l’on a conservé le
nombre totale de modes (3N ). Entre les deux limites, on peut effectivement constater des
déviations des prédictions du modèle de Debye.
Dans le modèle, on a la fréquence maximale caractéristique du solide, appellée fréquence
de Debye, ωD = ĉkD . On définit également une température de Debye TD = ~ωD /kB . Ces
quantitiés varient selon la substance considérée. Quelques valeurs de TD sont données dans
le tableau, ainsi que les températures de fusion Tm (on peut constater une corrélation entre
ces deux : plus TD est grande, plus la température de fusion est élevée).
37
Q5 : Calculer le vecteur d’onde de Debye, la fréquence maximale ωD , et la température de Debye
TD pour un cristal cubique simple ayant a = 2.5A, et dans lequel la vitesse de son est ĉ = 5000m/s.
Comparer avec la valeur de TF pour ce cristal en supposant que chaque atome libère un électron.
Q6 : Comparer les expressions de kD et kF pour un cristal cubique simple contenant N atomes
de valence Z dans un volume V . Pour Z = 1 est-ce que les deux vecteurs d’onde ont des valeurs
proches ?
métal
Li
Na
Al
C (dia.)
TD
700 K
150 K
394 K
1860 K
Tm
453 K
371 K
933 K
4300 K
Tableau 4. Quelques valeurs typiques de TD et la température de fusion Tm
Propriétés thermiques à des températures très élevées
Lorsque T >> TD , il n’est pas nécessaire de recourir à l’approximation de Debye, car le
nombre de photons est ≈ kB T /~ω pour tous les modes, et l’éq.2.26 devient
E(T ) = 3
X
~k
kB T
= 3N kB T
~ω(~k) ×
~ω(~k)
(2.28)
La chaleur spécifique est donc cV (T ) = 3kB , comme pour un gaz classique (résultat de
Dulong et Petit).
Températures très basses
Revenant à l’expression de l’énergie interne, on a
E(T ) = 3
V
=3
(2π)3
Z
X
~
Zk
~ω(~k)
1
eβ~ω − 1
(2.29)
1
dΩ~ck β~ck
e
−1
Z
3
3V c
k
=
dk β~ck
2
2π
e
−1
3V c 1
I ∝ T4
=
2π 2 (β~c)4
k 2 dk
où l’on a d’abord substitué la somme par une intégrale sur le rayon k et l’angle solide Ω et
dans la dernière ligne, on a éffectué un changement de variables en termes d’une nouvelle
variable sans dimensions x = ~βck. L’intégrale I,
Z xD
x3
I=
dx x
(2.30)
e −1
0
sera donc aussi sans dimension, et doit être calculée numériquement pour une valeur de
température donnée. Toutefois, pour de basses valeurs de T , la limite supérieure, xD =
38
β~ckD → ∞, et I approche rapidement sa valeur asymptotique de π 4 /15. La chaleur
spécifique est
cV (T ) =
1 ∂U
12π 4 T 3
=
(
) kB
N ∂T
15 TD
(2.31)
On a le comportement de CV en T 3 dû aux vibrations du solide auquel on a déjà fait
allusion dans le chapitre 1. La chaleur spécifique, puisque dépendant du rapport TTD sera
évidemment faible pour des températures petites devant TD . La théorie de Debye a ainsi pu
expliquer les observations expérimentales qui montraient un écart important par rapport
à la seule théorie qui était alors disponible, celle de Dulong et Petit. A partir des données
comme celles montrées dans la courbe de cV (T ), on peut extraire la valeur de la température
de Debye. C’est ce qui a été fait dans le tableau ci-dessous, où l’on donne donne quelques
valeurs représentatives.
Q7. Compléter les calculs qui donnent l’expression finale de la chaleur spécifique l’éq.2.31, partant
de la définition de E(T ) (dans l’éq.2.28) et de TD .
Les figures montrent la chaleur spécifique mesurée dans plusieurs matériaux, le cuivre,
l’aluminium et le diamant. On voit ( à gauche) que lorsque l’on porte cV en fonction de
T , les courbes sont toutes différentes, ce que l’on comprend facilement vu les différences de
valeur de TD de ces substances. La théorie de Debye prédit, par contre, que l’on trouvera une
seule courbe si l’on trace cV en fonction de la variable T /TD . On voit que c’est effectivement
le cas dans la figure de droite.
Fig. 2.6 – La chaleur spécifique de trois matériaux en fonction de T (gauche) ; en fonction
de T /TD (droite)
2.3.1
Comparaison des chaleurs spécifiques des électrons et des phonons
Pour une grande gamme de températures autour de la température ambiante, la chaleur
spécifique due aux électrons est une fonction linéaire de T , tandis que celle des phonons
dépend de T 3 . Pour voir laquelle des deux est plus importante, on peut considérer leur
rapport
ph
cel
V (T )/cV (T ) =
TD3
5
24π 2 TF T 2
(2.32)
où TF , la température de Fermi est typiquement dix fois plus que TD . On constate que
le rapport est grand, c.a.d. les électrons contribueront plus à la chaleur spécifique que les
39
phonons, si la température
T << T0 , tandis que pour T >> T0 , l’inverse est vrai. La
q
3
température T0 ≈ 5TD /(24π 2 TF ) est généralement très basse, ce qui veut dire que c’est
les phonons qui sont responsables de la chaleur spécifique des matériaux à température
ambiante.
Q8. Trouver la température T0 en dessous de laquelle la contribution des électrons à la chaleur
spécifique devient plus importante que celle des phonons dans le cuivre.
2.4
Quand l’approximation harmonique devient insuffisante
Nous avons mentionné le fait que, lorsque T augmente, l’amplitude des vibrations augmente. A partir d’une certaine température, l’approximation harmonique ne sera plus bonne,
et les forces de rappel seront, en général, nonlinéaires en fonction des déplacements. Il faut
alors prendre en compte des interactions anharmoniques entre atomes. Lorsque ces interactions sont petites, on peut considérer que les modes restent proches des phonons que nous
avons déjà décrits. Cependant, les phonons ne sont plus indépendants les uns des autres,
et il y a des collisions entre phonons (intéractions phonon-phonon), qui ont pour effet de
détruire le phonon au bout d’un temps τ caractéristique.
Ces interactions dues aux termes anharmoniques sont d’ailleurs essentielles pour comprendre pourquoi la conductivité thermique des matériaux n’est pas infinie. En effet, si les
phonons n’étaient jamais diffusés, la conductivité thermique serait infinie (penser au modèle
de conductivité électrique pour les électrons qui ne sont jamais diffusés). Dans la pratique,
la chaleur est transportée plus ou moins bien selon la probabilité de diffusion des phonons
par les autres phonons. Il faut aussi tenir compte les processus de diffusion des phonons par
~ (se rappeler que ~k
le réseau lui-même - le fait qu’un vecteur d’onde ~k peut devenir ~k + K
est défini à un vecteur d’onde du réseau réciproque près) où K est un multiple de 2π/a.
2.5
2.5.1
Collisions entre phonons et d’autres particules
Collisions avec des neutrons
Le neutron est utilisé très couramment dans les études de phonons. On bombarde le
cristal avec un faisceau de neutrons, dont les impulsions sont bien définies, et l’on trie les
neutrons sortant du cristal en fonction de leurs énergies et de leurs impulsions finales. Un
neutron d’impulsion p~ peut absorber ou émettre un phonon de vecteur d’onde ~k. Utilisant
les principes de conservation de quantité de mouvement et de l’énergie, on peut écrire
l’impulsion et l’énergie du neutron après la collision
~
p~0 = p~ ± ~(~k + K)
²0 = ² ± ~ω(~k)
(2.33)
où l’on a pris en compte la possibilité que le réseau puisse contribuer une l’impulsion ~K
~ K) = ω(~k)). On peut trier les neutrons sortant
(sans que cela coûte une énergie, car ω(k +
par leurs impulsions et leurs énergies, et ainsi remonter à des informations utiles sur les
phonons. Lorsque l’on ne connaı̂t pas la structure du réseau, la diffusion des neutrons
est utilisé dans la détermination de la structure – on considère uniquement des collisions
~ avec
élastiques où le neutron garde son énergie mais échange une quantité de mouvement ~K
40
~ du réseau
le réseau. En mesurant les impulsions p~ et p~0 , on peut remonter aux vecteurs K
réciproque. Une fois ces vecteurs connus, il est souvent facile d’en déduire la structure.
Q9. Que se passe-t-il quand un neutron “absorbe” un phonon - pouvez vous décrire qualitativement
l’état du cristal avant et après une telle collision ? Quelle est l’énergie en eV et la longueur d’onde
de de Broglie λ = h/p d’un neutron de vitesse 2000m/s ? (mn = 1.67 × 10−27 kg)
2.5.2
Collisions avec des photons
Les collisions entre phonons et photons sont régies par les mêmes principes de conservation d’énergie et d’impulsion que ceux énoncés ci-dessus. Il y a toutefois une différence
majeure entre les photons et les neutrons. Celle-ci provient de la grande différence des vitesses de propagation du photon et du phonon. En conséquence, pour un photon de lumière,
son vecteur d’onde est proche de zero, comparé aux valeurs de k possibles des phonons. Donc,
pour un photon incident avec impulsion ~~q et sortant après absorption d’un phonon, avec
une impulsion finale ~q~0 et sachant que
~
~q~0 = ~~q ± ~(~k + K)
(2.34)
on voit que K est obligatoirement égal à zero (pas de échange d’impulsion avec le réseau) et
que le phonon impliqué dans la collision aura une valeur de k proche de zero. On ne “verra”
ainsi que des phonons de très basse fréquence par la diffusion de la lumière.
Dans des expériences de diffusion de la lumière, on envoie un faisceau de lumière de
fréquence initiale connue, et on enregistre l’intensité de la lumière sortant en fonction de
la fréquence finale. Ce spectre de Brillouin montrera deux pics de part et d’autre du pic
central, qui correspondent aux photons après absorption/emission d’un phonon.
2.5.3
Collisions avec des électrons
Les phonons et les électrons, habitent le même espace – l’intérieur du solide – et les effets
des uns sur les autres sont diverses et variés. Le plus spectaculaire est l’état supraconducteur,
que l’on discutera plus tard (chapitre 3). Les deux particules ne sont pas sur un pied
d’égalité car un électron a une énergie beaucoup plus élevée qu’un phonon, pour des vecteurs
d’onde comparables. Toutefois, les phonons jouent un rôle important dans les propriétés
électroniques des solides.
(Les semiconducteurs sont des matériaux où les interactions entre électrons, photons et
phonons peuvent donner lieu à des propriétés optiques, thermiques et électriques diverses,
très utiles dans une variété d’applications technologiques. Nous n’aurons pas le temps dans
ce cours d’en parler plus.)
Parlons d’une des conséquences les plus évidentes de l’interaction entre phonons et
électrons. Il s’agit de la baisse de la conductivité électrique à cause de la diffusion des
électrons par les phonons, ce qui nous ramène à la discussion entamée dans le premier chapitre sur ce sujet (le modèle de Drude). Le libre parcours moyen l est fortement diminué
lorsque l’électron subit des diffusions multiples avec les phonons. Le temps de relaxation
τ (T ), qui est proportionnel au libre parcours moyen, diminue quand la température augmente à cause de l’augmentation du nombre de phonons. Le résultat en est que la conductivité électrique σ(T ) décroı̂t en fonction de T dans la plupart des métaux. Rappelons que
l’aluminium a une conductivité plus faible que celle du cuivre malgré un nombre plus élevé
41
d’électrons de conduction. On peut maintenant donner une explication de ce fait en notant
qu’à une température donnée, il est plus facile d’exciter des phonons dans l’Al à cause du
fait que les atomes sont plus légers que ceux du Cu.
2.6
Le gaz de phonons. Le second son
On termine ce chapitre avec un exemple de phénomène purement quantique associé à
l’existence des phonons. C’est la possibilité de créer des vibrations appelées “second son”
dans certains cristaux. Imaginons que le cristal est un conteneur d’un gaz de particules,
les phonons. Ces phonons ont une durée de vie finie (du fait des collisions avec le réseau
et avec les autres phonons) mais assez long pour que l’on puisse faire des observations
expérimentales. En analogie avec un gaz de molécules, la théorie montre qu’une onde de
compression/raréfaction pourrait s’établir dans le gaz de phonons sous certaines conditions.
Ces conditions sont réunies dans le He3 solide.
Une onde de compression/raréfaction dans un gaz de phonons correspond à des oscillations d’énergie interne dans l’espace et dans le temps. Si une telle onde était excitée, il
y aurait une oscillation de la température locale en fonction du temps. L’existence du second son a été démontré dans des expériences où l’on a réussi à faire propager un pulse de
chaleur avec une vitesse constante à travers un cristal de helium solide. Cette propagation
n’est possible que dans une gamme très réduite de T , en contraste avec le mode habituel de
propagation diffusif de la chaleur. He3 .
Chapitre 3
Magnétisme et supraconductivité.
Nous allons clore ce cours d’initiation aux modèles de la physique du solide avec une
discussion de quelques transitions de phase de la matière. On commence par les matériaux
tels le fer qui a donné son nom à toute une classe de matériaux appelés des ferromagnétiques.
Dans ce matériau, on a une transition de phase lorsque l’on baisse la température, d’un état
où les spins des atomes de Fe sont désordonnés, à un nouvel état où les spins sont alignés
selon une certaine direction. Nous allons parler très rapidement d’une transition de phase
qui a lieu dans beaucoup des métaux lorsque l’on baisse la température et le solide devient
supraconducteur. C’est le phénomène découvert par Kamerlingh Onnes en 1911, lorsqu’il
a constaté que la résistance d’un échantillon de mercure tombait brutalement à zero en
dessous d’une certaine température.
3.1
Description de composés magnétiques
Dans les matériaux magnétiques que nous allons considérer ici, le magnétisme provient
du moment magnétique total des électrons dans des orbitales d ou f partiellement remplies. Dans la figure, qui montre quatre différentes types de structures magnétiques dans
un cristal, on a représenté les moments magnétiques des atomes par des petites flêches. En
effet, contrairement aux électrons des orbitales p ou s, qui se libèrent (en ce qui concerne les
couches extérieures) de leurs atomes parents et se promène librement dans tout le volume
disponible, les électrons d et f sont moins mobiles. Ils contribuent donc de façon importante
au moment magnétique effectif de l’atome (ou ion). Avant d’en venir aux atomes, toutefois,
nous allons rapidement mentionner le rôle joué par les électrons de conduction. Ils contribuent, eux aussi, quoique plus modestement que les atomes que nous allons considérer, aux
propriétés magnétiques.
Propriétés sous champ du gaz d’électrons de conduction
Avant d’en venir aux atomes, on doit souligner que les propriétés magnétiques d’un
métal seront en partie aussi dues aux électrons de conduction. Rappelons que l’électron
est une particule de spin 12 , une propriété que nous n’avons pas, jusqu’ici, eu l’occasion
de considérer (hormis le facteur “2” dans les formules de la densité d’états électronique !)
Lorsqu’un champ extérieur B est appliqué, les électrons seront polarisés, et on aura une
petite contribution à l’aimantation M qui vient du fait qu’il y aura plus de spins parallèles
au champ que antiparallèles. On dit que c’est un comportement paramagnétique : M et
42
43
Fig. 3.1 – Quatre organisations possibles de moments magnétiques dans l’espace : sans
ordre (paramagnétique), alignés (ferromagnétique) ou antialignés (deux derniers cas)
H sont parallèles. Il y a un deuxième effet, à cause de la loi de Lenz – les électrons de
conduction vont tenter d’écranter le flux magnétique à l’intérieur du métal. Cela implique
qu’ils tentent de réduire autant que possible l’induction B = µ0 (H + M ) (µ0 = 4π × 10−7
NA−2 ). Pour donner une image classique, ils se tournent autour des lignes du champ, formant
des petites boucles de courant et créant une M négative. On dit que c’est un comportement
diamagnétique. Cependant, ces effets dûs au gaz d’électrons sont négligeables devant le
magnétisme des atomes que nous allons maintenant considérer.
Le moment magnétique associé aux atomes
Venons en maintenant aux atomes ayant une couche atomique extérieure d ou f qui est
remplie partiellement. Pour déterminer l’état électronique dans ces cas, on fait appel aux
règles de Hund. Nous rappelons la règle concernant la valeur de spin totale S lorsqu’une
orbitale comprend plusieurs électrons : l’état de plus basse énergie correspond à la valeur
la plus grande de S. (Les autres régles permettent de classer les niveaux selon la valeur du
moment cinétique orbital total L, et du moment cinétique total J). Les valeurs de S,L et
J prédites par les règles de Hund sont bien vérifiées dans les ions des terres rares, mais
doivent être modifiées dans le cas des métaux de transition. Sans entrer plus en détail, nous
nous contentons de donner dans le tableau les valeurs de L, S et J pour quelques ions : Fe
et Cu (des métaux de transition), et Gd et Dy (des terres rares). Le moment magnétique
de l’ atome µ
~ sera de magnitude
µ = gµB J
µB =
e~
= 9.27 × 10−24 J/T
2m
(3.1)
où µB (le magneton de Bohr) est une constante et g (le facteur de Landé) dépend de L,S
et J. g vaut 2 pour J = 12 (voir la définition ci-dessous).
p
Q1. On définit une quantité p (nombre effectif de magneton) par la relation p = g J(J + 1) où
g = 23 + 12 S(S+1)−L(L+1)
. Calculer, à l’aide du tableau 1 les valeurs de p des ions de Fe3+ ,Gd3+ et
J(J+1)
Cu2+ . Comparer aux valeurs obtenues experimentalement qui sont 5.9 (fer), 8 (gadolinium) et 1.9
(cuivre).
3+
Fe
Cu2+
Mn4+
Gd3+
Dy 3+
configuration
3d5
3d9
3d3
4f 7
4f 9
S
5
2
1
2
3
2
7
2
5
2
L
0
2
3
0
5
J
5
2
5
2
3
2
7
2
15
2
44
Tableau 1. Les valeurs de L, S et J d’un ion isolé de quelques métaux de transition et terres rares
3.1.1
L’aimantation et la susceptibilité magnétique.
L’aimantation M d’un ensemble de N atomes s’exprime en termes des valeurs moyennes
de chacun des moments magnétiques,
~ =
M
N
X
h~
µi i
(3.2)
i=1
On parle d’aimantation spontanée lorsque M 6= 0 même en l’absence d’un champ extérieur.
~ on a l’induction
Lorsque l’on soumet le solide à un champ magnétique H,
~ = µ0 (H
~ +M
~ ) ≈ µ0 H
~
B
(3.3)
où l’on a supposé que M est négligeable devant H. En présence du champ, chaque moment
magnétique a une énergie potentielle
~
Ep = −µ0 (µ~i .H)
(3.4)
~ sont parallèles. Enfin, on définit la susceptibilité magnétique,
qui sera minimisée lorsque µ
~ et H
χ,
χ(T ) = V −1 lim ∂M/∂H
H→0
(3.5)
où V est le volume. χ mesure la facilité avec laquelle les atomes se rangent parallèles au
champ extérieur. (Nb. Dans l’équation nous avons supposé que l’aimantation est alignée
avec le champ ; la fonction χ est appelée la suscéptibilité longitudinale).
Q2. Y a t-il une force d’attraction lorsqu’on approche un aimant près d’un matériau paramagnétique ?
d’un matériau diamagnétique ?
3.1.2
Symétries et brisure de symétrie
Pour les systèmes magnétiques isotropes que nous allons considérer dans les sections
suivantes, les para- et les ferromagnétiques, quand la température est très élevée, et en
l’absence d’un champ extérieur H, les moments magnétiques élémentaires n’ont pas de
préférence pour une orientation plutôt qu’une autre. Ils changent rapidement de direction,
avec une valeur moyenne de µ
~ nulle. Cet état complètement désordonnée possède la symétrie
d’invariance de l’hamiltonien sous des rotations globales de tous les spins. C’est une autre
façon de dire qu’il n y a pas de direction préférée dans ces systèmes. Lorsque l’on soumet le
système à un champ magnétique, l’hamiltonien n’est plus invariant sous rotations, car il y
a une direction privilégiée dans l’espace. Il apparait alors une aimantation induite, car les
atomes favoriseront l’alignement parallèle au champ, pour minimiser leur énergie potentielle.
On parle d’une brisure de symétrie “spontanée” lorsqu’il y a une aimantation M même
en l’absence de champ magnétique extérieur. C’est ce qui arrive dans les ferromagnétiques,
comme nous allons le voir plus loin. D’abord, dans la section suivante, nous allons parler
du cas le plus simple, celui des composés paramagnétiques.
45
3.1.3
Le paramagnétisme.
Nous considérons d’abord l’analyse d’un modèle simple où il n’y a pas d’interactions
entre les ions portant des moments magnétiques, qui agissent, donc, independamment les
uns des autres. C’est une situation à peu près réalisée dans certains composés à la base de
terres rares. Dans les atomes magnétiques de ces composés, la couche d’électrons f étant
très proche du noyau, les électrons sont relativement bien protégés des perturbations dues
aux atomes voisins. La seule interaction d’importance est celle avec le champ magnétique
extérieur. On considère un ensemble de moments µ
~ i , i = 1, ..., N , soumis à un champ
~ Nous allons calculer l’aimantation M
~ ainsi que la susceptibilité magnétique.
extérieur H.
Dans ce problème, il se trouve que la direction de l’aimantation est toujours celle du champ,
et nous allons en conséquence omettre les signes vectoriels, en supposant que tout se passe
dans la direction fixée par le champ extérieur. On s’attend à ce que l’aimantation dépende
du champ H et de la température T , les deux agissant en sens contraire : le premier veut
aligner les moments selon une direction commune, et l’autre favorise l’individualisme et
donc le désordre. Le calcul suivant pour des spins quantiques a été fait par L. Brillouin en
1927.
La fonction de partition d’un spin donné est
Z(T, H) =
J
X
e−β²j
(3.6)
j=−J
où l’énergie potentielle, qui dépend du nombre quantique j = −J, ...., J vaut, d’après l’éq.3.4
²j = −µ0 (gµB )jH
(3.7)
Il y a (2J + 1) termes dans l’expression de Z, qui sont autant de termes d’une série
géométrique
Z(T, H) = ex (1 + ex/J + ..... + e−2Jx/J )
=
ex
e−x e−x/J
−
1 − e−x/J
=
(3.8)
sinh( 2J+1
2J x)
1
sinh( 2J
x)
où x = µ0 (gµB )βH. La valeur moyenne du moment magnétique est hµi ≡ m(T, H) =
gµB hmJ i,
m(T, H) =
1 ∂ ln Z
βµ0 ∂H
(3.9)
1
1
1
) coth((1 +
)x) −
coth(x/2J)
2J
2J
2J
= gµB JBJ (x)
= gµB J((1 +
où l’on a introduit la fonction BJ (la fonction de Brillouin). Il est aisé de vérifier le comportement de BJ pour x très petit :
(x << 1)
BJ (x) ≈
J +1
x − ()x3
3J
(3.10)
tandis que pour x >> 1 BJ (x) ≈ 1 − e−x/J . L’aimantation par spin m(T, H) est linéaire
quand x est petit, et elle sature à sa valeur maximale de gµB J quand ce rapport est grand.
L’aimantation totale M est
N
M (T, H) = m(T, H)
(3.11)
V
46
Fig. 3.2 – La fonction de Brillouin pour différentes valeurs de J
La figure 3.2 montre les courbes de BJ (et donc l’aimantation) en fonction de x ∝ H/T
pour des valeurs de J différentes. On voit que dans la limite de H/T petit (c.a.d. à haute
température), l’aimantation est faible, et que dans la limite x grand (température basse)
elle approche sa valeur maximale de N gµB J/V . La figure montre aussi que l’aimantation
augmente plus lentement vers sa valeur asymptotique quand J est grand que lorsque J est
petit. Ceci traduit le fait que les fluctuations de spin sont plus grandes quand le spin est
grand. On note également que M = 0 quand le champ H = 0.
Passons maintenant à la susceptibilité magnétique. Pour une valeur de H petite, en
utilisant l’éq.3.10 on a
χ(T ) = limH→0
=
C
T
N
M
= µ0 (gµB )2 J(J + 1)/(3kB T )
H
V
(3.12)
Cette équation, appelée loi de Curie, donne une relation simple de χ en fonction de la
température. χ(T ) diminue quand la température augmente, traduisant le fait qu’il faut
un champ magnétique de plus en plus grand pour aligner les atomes.La loi de Curie a été
vérifiée dans des expériences sur les terres rares.
La constante de Curie, C, peut être extraite des données expérimentales. Elle fournit des
renseignements sur la magnitude de S des ions magnétiques, que l’on peut ensuite comparer
avec la valeur prédite par les règles de Hund. L’accord est bon pour la plupart des terres
rares. Pour les métaux de transition, on obtient un accord avec les expériences si l’on pose
J = S, ce qui revient à dire qu’il n y a aucune contribution orbitale à la valeur du moment
magnétique total de ces atomes-là. (Vous avez sans doute remarqué le désaccord flagrant
entre les valeurs de p théorique et expérimentale dans le cas du cuivre dans la Q1 !) La
justification de ce procédé se trouve dans le fait que pour les métaux de transition, les
atomes sont soumis à une forte anisotropie due au champ cristallin des atomes voisins. Pour
simplifier, on peut dire que les électrons effectueront un mouvement de précession et en
conséquence, la valeur moyenne de L sera nulle.
Q3. Montrer que pour le cas S =
1
2
la fonction de partition est Z = 2 cosh(x) et l’aimantation d’un
47
spin est proportionnelle à B 21 (x) = tanh(x).
3.1.4
Les ferromagnétiques.
Dans les métaux de transition, les électrons de la couche 3d subissent l’influence des
atomes voisins, et il est nécessaire de prendre en compte les interactions entre le spin d’un
atome avec ceux autour. Il est bien sur assez difficile d’écrire exactement la forme de ces
interactions, mais il existe une forme simple introduite par Heisenberg qui exprime le fait
que, grosso modo, l’énergie d’un état où deux spins voisins sont parallèles est plus basse que
celle de l’état où ils sont antiparallèles. On peut écrire un hamiltonien qui ne dépend que
~1 et S
~2 des deux atomes ayant la propriété d’invariance
des deux degrés de liberté, les spins S
sous une rotation globale des spins, qui exprime ce fait :
~1 .S
~2
−J S
(3.13)
Pour une constante de couplage J > 0 (ne pas confondre avec le symbole J de la section
précédente !) on a bien une énergie plus basse de l’état de spins parallèles. Pour un système
de N spins, on écrit l’hamiltonien de Heisenberg ferromagnétique,
X
~i .S
~j
S
(3.14)
H = −J
hi,ji
(3.15)
où le symbole hi, ji indique que la double somme n’inclut que des termes où i et j sont
proches voisins.
Bien que simple, cet hamiltonien n’a pas été résolu exactement au-delà d’une dimension !
Beaucoup d’efforts ont été consacrés à l’étude des propriétés thermodynamiques de l’hamiltonien de Heisenberg, dès les années 30. On comprend toutefois assez bien ses propriétés
essentielles, tant sur le plan qualitatif que quantitatif, grace aux méthodes analytiques
tr`’es poussées combinées avec des méthodes numériques. Nous allons ici résumer quelques
résultats connus.
Concernant la transition de phase dans le modèle de Heisenberg
– A T = 0, quelque soit la dimension de l’espace, l’invariance par rotations sera brisée,
et tous les moments seront alignés en parallèle selon une direction particulière. Cela
vient du fait que l’énergie libre F = E − T S est minimisée quand E est minimale.
L’énergie de cet état est E0 = − 12 zN JS 2 où z est la coordinance et N le nombre de
spins. A l’autre extrème de T → ∞ l’énergie libre sera minimisée lorsque l’entropie est
maximale, ce qui implique un état totalement désordonné. La question est de savoir
ce qui se passe entre ces deux limites.
– En une et deux dimensions, l’aimantation M (T ) = 0 pour T > 0. Il n y a donc jamais
de transition avec une Tc finie. L’impossibilité d’avoir un tel état est énoncée dans un
théorème (celui de Mermin, Wagner et Hohenberg) qui s’applique à tout hamiltonien
ayant une symétrie continue.
– En d > 2 il y a une transition de phase entre l’état de M = 0 (la phase paramagnétique) et la phase ferromagnétique, de M 6= 0 à une température critique Tc
qui dépend du réseau et de la dimension. Lorsque l’on baisse la température en dessous
de Tc , l’aimantation démarre de zero à Tc , et augmente jusqu’à atteindre son maximum à T = 0. A la transition, il y une divergence de la susceptibilité magnétique et
48
de la chaleur spécifique, et d’autres singularités des grandeurs thermodynamiques. Ce
modèle a été le sujet de beaucoup d’études théoriques, surtout danss les années 60 et
70, et diverses méthodes analytiques sophistiquées ont été développées pour calculer
toutes les propriétés interessantes du modèle de Heisenberg.
– Plus la dimension d est grande, moins sont importantes les fluctuations de spin. Dans
la limite formelle de d → ∞, les différentes méthodes convergent souvent à un résultat
exact. C’est une limite où la technique du champ moyen de la section suivante donne
la bonne solution.
Méthode du champ moyen.
Weiss a considéré une version simplifiée de l’hamiltonien de l’éq.3.15 où, au lieu de laisser
les deux spins fluctuer au gré des excitations thermiques, il a considéré les fluctuations des
spins placés dans un champ effectif crée par les z voisins autour (“le champ moléculaire de
~i donné, on a
Weiss”). En considérant l’hamiltonien d’un spin S
Hspin,i = −J
z
X
~i .S
~j
S
(3.16)
j=1
qui montre que le site central subit un champ effectif fluctuant de tous ses voisins. Si nous
~j par sa valeur moyenne (la même pour tous les sites), m = gµB hS
~j i,
remplaçons chacun des S
~i .Hef f où le champ effectif Hef f sur le site 1 (et sur tous
l’hamiltonien prend la forme −µ0 S
les sites, l’invariance translationnelle oblige) est
µ0 Hef f =
zJm
(gµB )2
(3.17)
où z est le nombre de proches voisins du site i. Nous avons auparavant résolu l’hamiltonien
d’un spin couplé au champ extérieur. On a donc une formule reliant la valeur moyenne du
~j au champ externe, l’éq.3.10. On a
spin S
m = gµB SBS (x);
où
x = (gµB )βµ0 Hef f =
zJm
gµB kB T
(3.18)
L’argument de la fonction de Brillouin contient m, et l’éq.3.18 est donc une relation d’autocohérence. Nous voulons déterminer la valeur de m(T ) à une température T donnée. Comme
l’équation n’a pas de solution m analytique simple, nous allons recourir à une solution graphique de l’éq.3.18. Les solutions de m sont données par les intersections de la droite, m = m
avec la courbe gµB SBS (x(m)). Cette dernière est une courbe convexe, ayant sa pente maximale à l’origine, (cf. la figure 3.2). Quand cette pente, qui dépend de la température, est
inférieure à 1, il n y a qu’une solution, m = 0. Quand la pente est supérieure à 1, la bonne
solution correspond à m 6= 0. (On peut vérifier que la suscéptibilité est négative pour la
solution m = 0, qui est donc une solution instable).
Nous avons bien une situation où l’aimantation totale M = N m/V est nulle pour T > Tc
et non-nulle en dessous de Tc . La température critique est ainsi donnée par la condition
kB Tc =
S(S + 1)
zJ
3S
Q4. Obtenir l’expression de Tc de l’éq.3.19) en utilisant l’éq.3.10.
Quelques remarques concernant ce résultat de la méthode du champ moyen :
(3.19)
49
Fig. 3.3 – Champ moyen : l’aimantation m/m(T = 0) en fonction de T /Tc
1. Tc n’est jamais nulle, et ne dépend pas de la dimension excepté à travers la coordinence
z. Cette méthode n’est visiblement pas adaptée aux systèmes en d = 1 et 2.
2. Pour T << Tc la variable x ∝ m/T devient très grande et la fonction de Brillouin
approche sa valeur asymptotique. L’éq.3.18 nous dit que m atteint donc sa valeur
maximale gµB S quand T → 0.
3. Tc augmente avec le nombre de proches voisins z, ce qui est logique (le champ local sur un site donné sera plus grand pour une coordinence plus élevée). On peut
donc s’attendre, par exemple, à ce que le système reste ferromagnétique jusqu’à
une température plus élevée dans un réseau carré (z = 4) que pour un réseau “nid
d’abéille” (z = 3) (voir les figures).
4. Tc augmente avec le couplage J, ce qui est logique. Il faut fournir plus d’énergie pour
“casser” des liaisons ferromagnétiques dans le cas où J est grand. Dans le cas des
métaux de transition on s’attend à ce que J soit plus grand que dans le cas des terres
rares (pour la raison évoquée dans la section sur le paramagnétisme).
5. Tc augmente avec le spin S. C’est un résultat également attendu, vu le fait que la
méthode du champ moyen ne prend pas compte des fluctuations, une grande valeur
du moment magnétique implique une grande valeur du champ local.
Le tableau ci-dessous donne quelques exemples de Tc (à éventuellement comparer avec
les prédictions de l’éq.3.19 !)
métal
Fe
Ni
Gd
Dy
S
5
2
1
7
2
9
2
Tc (K)
1043
627
293
85
M0 (gauss)
1752
510
1980
3000
Tableau 2. Tc et M0 (l’aimantation à T = 0) dans quelques métaux
50
Q5. Exprimer, avec la méthode du champ moyen, la fonction de partition et l’aimantation pour le
cas particulier de S = 12 . Obtenir, en développant autour de Tc , et en résolvant l’équation quadratique
ainsi obtenue, l’aimantation m(T ) en dessous de Tc . Montrer que celle-ci suit une loi de puissance
en t = |T − Tc |/Tc .
Fig. 3.4 – Photographie avec une microscope polarisante montrant l’intérieur d’une plaque
de ferrite, indiquant les domaines (voir texte)
3.1.5
Descriptions phénoménologiques des ferromagnétiques
Fig. 3.5 – Images IRM de l’intérieur du cerveau
Les domaines de Weiss
Le fer est l’exemple le plus connu de la classe de ferromagnétiques, et avec le cobalt et
le nickel, est à la base de beaucoup de alliages utilisées dans la fabrication d’instruments.
Pourtant, contrairement à tout ce que nous avons dit ci-dessus, l’aimantation spontanée
observée dans un échantillon d’une de ces alliages est souvent nulle ou presque nulle en
champ extérieur nul à température ambiente. Sachant que Tc est quelques centaines de
K, Weiss a proposé une résolution de cet apparent paradoxe en proposant que les spins
s’organisent dans une multitude de domaines, chacun préférant une direction différente des
autres, de telle sorte que l’aimantation totale soit nulle. Ces domaines ont depuis été mis en
évidence et sont de tailles allant de 10−7 à 10−7 m selon le matériau et le traitement qu’il a
subi.
La formation de domaines est due à l’interaction magnétique dipolaire entre chaque paire
des moment magnétiques. L’énergie de cette interaction dépend de l’orientation relative des
51
deux moments, ainsi que de leur position relative, ~r :
µi .~
µj ) 3(~
µi .~r)(~
µj .~r))
µ0 (~
[
−
]
(3.20)
3
5
4π
r
r
On peut vérifier que cette énergie favorise l’alignement antiparallèle dans certaines directions. Quoique très faible, comparée à l’énergie typique du couplage de Heisenberg entre
spins proches voisins, cette énergie dipolaire devient importante à cause du grand nombre
de paires impliquées. C’est pour cette raison que le système trouve qu’il est plus favorable de
s’organiser en petits ensembles de spins alignés entr’eux à courte échelle mais désordonnés
sur une échelle plus grande – expliquant ainsi l’existence des domaines.
²=
Fig. 3.6 – Un cycle d’hystérésis
Lorsque l’on applique un petit champ extérieur H, les domaines se réoriente, et les
domaines de spins parallèles au champ augmentent en taille pendant que ceux qui sotn
alignés retrécissent, le résultat de tout ceci étant une augmentation de M qui peut être
assez conséquente. Ainsi, grace à cette structure en domaines, on peut trouver des valeurs
de pérméabilité µ très élevées où l’on définit
B = µ0 (H + M ) = µ0 (1 + χ)H ≡ µH
(3.21)
On peut multiplier le champ effectif à l’intérieur d’une bobine en utilisant un entrefer
constitué d’un matériaux à µ élevée. Les deux bobines d’un transformateur sont couplées
à travers le flux magnétique, dans l’entrefer, d’où l’interêt d’utiliser ces matériaux dans
les transformateurs. Dans le même esprit, l’electroaimant schématisé par le circuit de la
figure 3.7, utilise un entrefer qui sert à canaliser et intensifier le flux magnétique φ. Le fer a
une pérméabilité µ ≈ 200µ0 . Pour des applications nécessitant des champs intenses (telles
l’IRM : imagerie par résonance magnétique), on dispose aussi d’alliages de Fe, Co et Ni
telles le permalloy (µ/µ0 ∼ 8000) ou le mu-métal (µ/µ0 ∼ 20, 000).
Cycle d’hystérésis. Champ coercitif. Aimantation rémanente.
Quand le champ appliqué, H, est assez fort, on constate que les changements de M en
fonction de H ne sont pas reversibles. La figure montre les valeurs de M pour un cycle
52
Fig. 3.7 – Circuit d’un electroaimant qui crée une force de collage entre les deux composantes. (symboles : l : longueurs, S : surfaces, µ : perméabilités, n :nombre de tours dans la
bobine, I : courant, φ : flux magnétique dans l’entrefer)
complète où l’on augmente le champ de 0 jusqu’à une valeur maximum positive, ensuite
jusqu’à une valeur maximum négative, et enfin vers sa valeur initiale nulle. On constate
que le matériau garde une aimantation Mr (aimantation rémanente) positive ou négative
en champ nul selon l’histoire récente de l’échantillon. Pour faire descendre M à 0 ; il faut
appliquer un champ Hc (champ coercitif) dans la direction opposée à l’aimantation. Le
rapport Mr /Mmax doit être grand pour les matériaux utilisés dans la fabrication des aimants
permanents.
3.2
La supraconductivité
Fig. 3.8 – Le lévitation d’un aimant au-dessus d’un supraconducteur
En 1911, Kamerlingh Onnes a découvert la supraconductivité dans le mercure lorsqu’il
a l’a refroidi en dessous de la température d’hélium liquide. Vers 4.1K, il a constaté que la
résistivité chutait abruptement à zéro. D’autres métaux ont été refroidis , et dans beaucoup
de cas, le même phénomène se produit à une température critique, Tc (voir le tableau)
typiquement de quelques Kelvins. La chasse aux supraconducteurs était ouverte, et l’on
53
a découvert une grande variété de composés supraconducteurs à une température assez
basse. La plus grande série de découvertes récentes a eu lieu autour des années 85-86, où
les records de Tc ont été successivement battus. Des membres d’une nouvelle famille de
supraconducteurs céramiques ( !) – les supras “haute-Tc – ont été successivement révélés aux
physiciens guettant chaque publication. Revenant aux supraconducteurs conventionnels,
l’explication théorique de la transition métal normal-supraconducteur s’est fait attendre
jusqu’à l’année 1957, où Bardeen,Schrieffer et Cooper (BCS) ont proposé leur modèle de la
supraconductivité. Nous allons d’abord on donnera une brève description de quelques-uns
des phénomènes nouveaux intéressants, avant de présenter un aperçu de la théorie de BCS.
3.2.1
Les conséquences d’une résistance nulle
Revenons un instant au modèle de Drude (Ch. 1)et ce qu’il prédit dans le cas où il n
y aurait plus de collisions et le libre parcours moyen l deviendrait infini. La conductivité,
quantité proportionnelle à l
σ=
ne2 l
mvF
(3.22)
tendrait vers l’infinie, et la résistivité serait nulle. Dans cette limite, rien n’empecherait
le courant d’augmenter sans limite lorsque l’on appliquait un champ électrique. De même,
il est évident qu’une fois un courant établi, dans l’absence de processus de relaxation, ce
courant ne diminuerait jamais. D’où la possibilité de faire circuler un courant électrique
permanent dans une boucle supraconductrices – les expériences ont été faites où l’on voit
que le courant circule sans s’affaiblir durant plusieurs années !
Fig. 3.9 – L’expulsion du flux magnétique de l’intérieur d’un supraconducteur
Considérons un tel métal dans un champ magnétique qui augmente subitement de zéro
à une valeur H. La loi de Lenz nous dit qu’il y aura des courants surfaciques qui tenteront
d’annuler l’induction B = µ0 (H +M ) à l’intérieur du solide. Si l’on fait l’expérience inverse :
annuler subitement un champ magnétique déjà présent dans le métal, la loi de Lenz prédit
qu’il y aura de nouveau des courants qui annuleront le changement, c.a.d. qui créeront une
induction non-nulle à l’intérieur du solide.
Un supraconducteur ne ressemble pas à un tel conducteur parfait. Quelque soit le sens
du changement de H, l’induction B à l’intérieur d’un supraconducteur sera toujours nulle !
54
Une expérience classique consiste à refroidir un supraconducteur sur lequel l’on a posé un
aimant. Dans son état normal, le matériau laisse pénétrer des lignes de B, et l’aimant
reste en contact avec la surface. En dessous de Tc , le supraconducteur crée des boucles
de courant à sa surface, qui annule le champ de l’aimant, et le résultat est une force de
répulsion entre la surface et l’aimant. Si l’aimant est suffisamment léger, il lévitera audessus du supraconducteur (voir la photo). Ce phénomène d’expulsion du flux magnétique
porte le nom d’effet Meissner.
Fig. 3.10 – Les courants surfaciques donnant lieu à la lévitation d’un aimant au-dessus d’un
supraconducteur
3.2.2
La théorie de BCS
A l’origine de cette théorie est l’observation de Cooper sur la possibilité de former des
états liés de deux électrons sous certaines conditions :
– Il faut d’abord une intéraction effective attractive, V > 0 entre les deux. Cette
hypothèse n’est pas aussi déraisonnable qu’il n y paraı̂t, car on savait déjà que
l’intéractions entre les électrons et le réseau peut donner lieu à une attraction faible.
Une image souvent présentée en guise d’explication a été donnée à fin du chapitre 1.
On y voit une déformation du réseau due au passage un électron – cette déformation
attire ensuite un autre électron, engendrant ainsi une intéraction effective attractive
entre les deux. Des calculs plus détaillés montrent que cette image traduit à peu
près ce qui se passe. Il faut toutefois que les deux électrons aient une énergie proche
de l’énergie de Fermi, et l’intéraction V provient surtout des phonons de fréquence
proches de ωD .
– Une telle paire est stabilisée même lorsque V est très petite (ce qui est le cas) à cause
de tous les autres électrons dans la mer de Fermi. C’est un problème à N corps, les
(N-2) autres électrons sont importants car ils limitent l’espace de phase de la paire
que l’on considère.
BCS ont généralisé cette idée en postulant que tous les électrons forment des paires, et
l’ensemble étant stable, et ayant une énergie plus basse que l’énergie de l’état fondamental
sans l’appariement. La fonction d’onde qu’ils proposérent a la forme
Ψ(~r1 , ~r2 , ..., ~rN ) = Aφ(~r1 − ~r2 )φ(~r3 − ~r4 )....φ(~rN −1 − ~rN )
(3.23)
55
Fig. 3.11 – Les états qui participent à la formation des paires de Cooper (région d’épaisseur
∆ autour du niveau de Fermi
où φ(~ri − ~rj ) est la fonction d’onde d’une paire d’électrons dans un état singulet (ayant
leurs spins opposés). De plus, φ correspond à un état qui est invariant par translation
(donc construit à partir des états de ~ki = −~kj . L’opérateur A effectue antisymétrisation
du produit des φ (c’est l’opération d’effectuer une somme de toutes les permutations 2
par 2 des électrons avec le signe − pour chaque permutation). On voit que Ψ est une
combinaison complexe des fonctions d’ondes des paires, toutes imbriquées et participant de
façon collective au transport de courant. Il coûte une énergie minimum ∆(T ) pour casser
une paire et rendre leur indépendance aux deux électrons. Cette énergie, appellé le “gap”
du supraconducteur a une valeur maximale ∆(0) à T = 0, et s’annule à Tc . La théorie BCS
donne le gap à T = 0 en termes des paramètres du modèle V (le potentiel attractif) et ω (la
fréquence du phonon médiateur de cette interaction) :
∆(0) = 2hωe−1/ρ(EF )V
(3.24)
où ρ(EF )V est la densité d’états du gaz d’électrons au niveau de Fermi du métal. La théorie
prédit une relation similaire pour la température critique, de sorte que le rapport ∆(0)/kB Tc
devient indépendant de tous les paramètres, et vaut
∆(0)
= 1.74
kB T c
(3.25)
Cette relation entre les deux quantités a été testée et confirmée avec une assez bonne
précision (compte tenu de la simplicité du modèle) dans des expériences.
On peut estimer la “taille” d’une de ces paires en utilisant le principe d’incertitude :
∆x∆p ∼ ~. Sachant que l’énergie des électrons de la paire est distribuée dans une peau
d’épaisseur ∆ autour de l’énergie de Fermi, on peut déduire l’incertitude de p
dE = ∆ =
p
dp ≈ vF dp
m
(3.26)
d’où le rayon de la paire ξ ∼ ∆x,
ξ=
~vF
∼ 103 A
∆
(3.27)
pour des valeurs de vF d’environ 108 cm/s et ∆ ∼ kB Tc d’environ 10−4 eV . On voit bien que
la distance entre partenaires est très grande, et qu’il n’est donc pas possible de considérer
56
la paire comme une particule composite même pour une échelle de distance grande devant
la distance interélectrons typique.
Pres de Tc , on peut montrer que le gap s’annule comme la racine de la température
réduite
r
Tc − T
∆(T ) = cste
(3.28)
Tc
exactement comme l’aimantation, dans la théorie du champ moyen d’un ferromagnétique
(l’approximation faite est la même).
3.2.3
Propriétés sous champs électriques et magnétiques de l’état supra
Une explication des phénomènes caractéristiques des supraconducteurs peut maintenant
être donnée, à la lumière de la solution de BCS. Sous l’influence d’un champ électrique
appliqué pendant une durée de temps finie, les paires de Cooper acquiereront une quantité
de mouvement identique pour toutes les paires. Au cours de leurs mouvements, il n y aura
pas, contrairement au cas des électrons normaux, les paires ne peuvent pas être diffusées dans
de nouveaux états et ainsi changer leur quantité de mouvement car tous les états disponibles
sont déjà occupés. Le courant passe donc sans atténuation dans un supraconducteur, en ce
qui concerne la conduction par les paires de Cooper.
L’expulsion du champ magnétique est un peu plus compliqué à expliquer. Un argument
possible consiste à écrire l’hamiltonien d’une des paires – on prend la forme conventionnelle
~:
pour une particule de charge −2e et de masse 2m soumi à un potentiel vecteur A
H=
1
~ 2 + V (~r)
(~
p − 2eA)
4m
(3.29)
~ ×A
~ = B.
~ La fonction d’onde de la paire φ est représentée sous la forme
où ∇
φ(~r) = |φ|eiθ(~r)
(3.30)
où l’on a explicitement écrit la module, que l’on suppose constante, et la phase, qui, elle,
~ La densité du courant électrique due à cette fonction est ~j(~r) =
dépend du champ A.
−2e
~ où les valeurs moyennes sont calculées dans l’état φ. L’élément de
−2eh~v i = 2m h~
p − 2eAi,
matrice de p~ est calculé à partir de l’équation
iθ(~
r)
~
~ r)φ(~r)
p~φ(~r) = (−i~∇)|φ|e
≈ ~∇θ(~
(3.31)
On trouve ainsi le courant, qui contient deux termes,
2
~ r) − 2eA)|φ|
~
~j(~r) = −e (~∇θ(~
m
(3.32)
Comme la densité de courant ~j(~r) est nul, la circulation de celle-ci autour d’un circuit fermé
entièrement contenue à l’intérieur du supraconducteur sera nulle aussi, c’est-à-dire
I
I
~ r) − 2eA).d
~ ~l
~j.d~l = 0 = (~∇θ(~
(3.33)
57
On en tire, en utilisant l’identité
que
R
Z
~ ~l =
A.d
R
~
B.dS
et la définition du flux magnétique ΦB
2e
ΦB
~
= 0
~ r).d~l =
∇θ(~
(3.34)
la deuxième égalité venant du fait que θ(~r) est une fonction analytique dans la région
considérée. Nous avons ainsi montré que le fait de pouvoir exprimer la fonction d’onde en
termes d’une phase bien définie dans l’état supraconducteur donne, comme un des résultats,
l’effet Meissner.