Université Paris-Sud - Espace des équipes scientifiques

Transcription

Université Paris-Sud
L3 Physique et Applications
S6 : Jan-Juin 2007
PhysA335. Initiation à la physique des solides
Levitation d’un aimant au-dessus d’un supraconducteur
Anuradha Jagannathan
Laboratoire de Physique des Solides,
Bât. 510, Université Paris-Sud,
91405 Orsay, France
Table des matières
Table des matières
2
Introduction
4
1 Propriétés du gaz d’électrons dans un solide
1.1 Le gaz d’électrons et la conduction électrique dans un métal . . .
1.1.1 Le modèle de Drude de la conductivité électrique . . . . .
1.1.2 D’autres prédictions du modèle classique . . . . . . . . . .
1.1.3 Problèmes du modèle classique . . . . . . . . . . . . . . .
1.2 Le gaz de fermions libres . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Le gaz d’électrons à T = 0 . . . . . . . . . . . . . . . . .
1.2.2 Le gaz d’électrons à température finie . . . . . . . . . . .
1.2.3 Les boı̂tes, fils et puits quantiques . . . . . . . . . . . . .
1.3 L’environnement cristallin et l’émergence des bandes interdites .
1.3.1 La théorie des électrons presque libres . . . . . . . . . . .
1.3.2 Conducteurs, isolants et semiconducteurs. . . . . . . . . .
1.3.3 Résultats en d=2 et 3 . . . . . . . . . . . . . . . . . . . .
1.4 Transitions de phase induites par des interactions . . . . . . . . .
1.4.1 interaction électron-électron. Le magnétisme itiniérant. La
de Mott. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 interaction électron-phonon. La supraconductivité. . . . .
1.4.3 Effets du désordre et/ou apériodicité. . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
transition
. . . . . .
. . . . . .
. . . . . .
2 Propriétés thermiques et acoustiques
2.1 Modèle classique de vibrations . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Chaı̂ne périodique de N atomes identiques . . . . . . . . . . . . . .
2.1.2 Le mouvement des atomes en fonction de k. Périodicité de ω. . . .
2.1.3 Les vibrations dans les cristaux de dimension 2 et 3 . . . . . . . .
2.1.4 Modes optiques. Chaı̂ne à deux constantes de couplage. . . . . . .
2.2 Le passage vers une description quantique. Les phonons. . . . . . . . . . .
2.2.1 Température T 6= 0. La distribution de Planck . . . . . . . . . . .
2.3 Propriétés thermiques des cristaux. Modèle de Debye. . . . . . . . . . . .
2.3.1 Comparaison des chaleurs spécifiques des électrons et des phonons
2.4 Quand l’approximation harmonique devient insuffisante . . . . . . . . . .
2.5 Collisions entre phonons et d’autres particules . . . . . . . . . . . . . . . .
2.5.1 Collisions avec des neutrons . . . . . . . . . . . . . . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
6
7
7
9
11
11
11
13
14
16
16
21
22
22
22
24
25
26
27
27
29
30
32
34
35
35
38
39
39
39
3
2.6
2.5.2 Collisions avec des photons . . . . . . . . . . . . . . . . . . . . . . .
2.5.3 Collisions avec des électrons . . . . . . . . . . . . . . . . . . . . . . .
Le gaz de phonons. Le second son . . . . . . . . . . . . . . . . . . . . . . . .
3 Magnétisme et supraconductivité.
3.1 Description de composés magnétiques . . . . . . . . . . . . . . . . . . . .
3.1.1 L’aimantation et la susceptibilité magnétique. . . . . . . . . . . . .
3.1.2 Symétries et brisure de symétrie . . . . . . . . . . . . . . . . . . .
3.1.3 Le paramagnétisme. . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.4 Les ferromagnétiques. . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.5 Descriptions phénoménologiques des ferromagnétiques . . . . . . .
3.2 La supraconductivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Les conséquences d’une résistance nulle . . . . . . . . . . . . . . .
3.2.2 La théorie de BCS . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Propriétés sous champs électriques et magnétiques de l’état supra
.
.
.
.
.
.
.
.
.
.
40
40
41
42
42
44
44
45
47
50
52
53
54
56
Introduction
Lorsqu’on regarde le tableau périodique des éléments, on constate l’extrême diversité de
comportements des éléments - on y trouve des solides, liquides et gaz, dont, parmi les solides,
des métaux, des isolants, des ferromagnétiques et des supraconducteurs, pour ne citer que
quelques possibilités. Lorsqu’on considère les composés formés à partir de ces éléments,
on découvre de nouvelles propriétés insolites. Les deux ou trois décennies précédantes ont
vu un foisonnement de nouvelles technologies (et de prix Nobel !) suivant la découverte de
nouveaux matériaux.
Dans ce cours nous allons découvrir quelques modèles théoriques permettant d’expliquer des propriétés physiques des solides telles les conductibilités électrique ou thermique,
les chaleurs spécifiques, leurs propriétés magnétiques. Nous verrons ce que sont les métaux,
semimétaux et les semiconducteurs, ainsi que quelques propriétés interessantes des supraconducteurs. Nous verrons que la mécanique classique permet de comprendre déjà beaucoup
de propriétés , mais que, lorsqu’on baisse la température et la taille des objets étudiés, il
devient indispensable de recourir à une description quantique. Dans ce cours nous ne parlerons que des matériaux cristallins c’est-à-dire ayant une structure périodique dans l’espace.
La physique des milieux amorphes ou apériodiques (tels les quasicristaux) est plus complexe
et ne sera pas abordée, hormis quelques remarques qualitatives.
Chapitre I
Dans ce chapitre nous considérerons quelques propriétés importantes liées au gaz d’électrons
présent dans les matériaux tels que les métaux et les semiconducteurs, qui ont des électrons
libres.
Nous commencerons par un modèle classique pour la conduction électrique. Il sera
nécessaire, vu les limitations de ce modèle, de passer ensuite à la ”bonne” description,
qui utilise la mécanique quantique. En conséquence, on rappellera les définitions de base
pour un gaz de fermions. Ensuite, nous étudierons le comportement du gaz d’électrons dans
le milieu périodique formé par l’ensemble de noyaux atomiques. Le théorème de Bloch, fondamental dans la théorie quantique des solides, sera expliqué, et ses conséquences seront
examinées. Enfin, on discutera quelques aspects négligés dans ce genre de traitement, notamment (et de façon qualitative) l’effet des interactions répulsives entre électrons. Bien que
d’importance modérée dans beaucoup de solides, les interactions peuvent avoir des effets
dramatiques dans des systèmes de basse dimension ou de taille réduite (tels qu’une boı̂te
quantique) - nous en parlerons brièvement.
4
5
Chapitre II
Dans ce chapitre nous discuterons des propriétés associées à l’ensemble des noyaux atomiques. Les noyaux vibrent autour de leurs positions d’équilibre, créant des ondes (des
”phonons” dans le langage quantique). Les propriétés thermiques d’un cristal simple seront
présentées, ainsi que les modèles de Einstein, et de Debye.
Chapitre III
Dans ce chapitre nous considèrons des solides magnétiques et des solides qui deviennent
supraconducteurs. Nous essaierons de donner un aperçu des modèles qui ont été introduits
pour expliquer des propriétés utilisées dans les technologies modernes.
Calculs avec Mathematica
Les séances de “travaux pratiques” devront permettre de visualiser et de comprendre les
formules présentées en cours. Ceux qui n’ont pas utilisé ce logiciel pourront acquerir les
notions de base assez rapidement, dès la première séance des deux séances prévues.
Bibliographie
– Introduction à la physique de l’état solide
– La matière à l’état solide
– Physique des solides
C. Kittel (Dunod)
A. Guinier, R. Jullien (Hachette)
N. W. Ashcroft, N. D. Mermin (EDP)
Chapitre 1
Propriétés du gaz d’électrons dans
un solide
Lorsque des atomes se rapprochent et forment un solide, les électrons des couches
extérieures peuvent se détacher des noyaux et circuler librement dans tout l’intérieur du
cristal (on parle alors de la délocalisation des électrons). Ce gaz d’électrons contribue,
par exemple, à l’énergie de cohésion du solide, lorsque l’ensemble noyaux plus électrons
délocalisés a une énergie plus basse que celle de l’ensemble d’atomes neutres. Le gaz d’électrons
peut donner naissance à un courant électrique lorsqu’il y a un déplacement de l’ensemble des
électrons en présence d’un champ électrique extérieur. La conductibilité électrique dépendra
non seulement de la densité volumique de ces électrons de conduction mais aussi d’autres
facteurs que l’on discutera dans la première section. On peut aussi étudier la propagation
d’une onde électromagnétique dans un solide. La présence du gaz d’électrons modifie les
propriétés de transmission et réflection d’une telle onde selon sa longueur d’onde (ce qui
explique, en particulier, l’aspect visuel des métaux). Le gaz d’électrons contribue également
à la chaleur spécifique du solide, et à la conductibilité thermique.
La théorie classique du gaz d’électrons de la fin du 19ème siècle a donné quelques
résultats en accord avec les expériences mais d’autres résultats en désaccord sérieux avec
celles-ci. Les modèles classiques ont été donc assez rapidement abandonnés au profit d’un
modèle quantique avec l’arrivée à la même époque de la mécanique quantique. Il est néanmoins
utile de commencer par une description classique, pour mettre les idées en place. Ensuite
nous introduirons la description quantique quand cela devient nécessaire.
La section I commence par un rappel des propriétés d’un gaz de particules libres. Ici, on
néglige l’interaction de répulsion coulombienne entre les électrons et aussi les intéractions
coulombiennes entre les électrons et les noyaux, (en imaginant que ces derniers sont remplacés par un fond positif continu). Ensuite (la section II) on considère les effets nouveaux
dûs à l’interaction entre les électrons et le réseau de noyaux. On distinguera entre les cas
de métal, isolant et semiconducteur. Enfin, dans la section III nous allons très brièvement
décrire des transitions de phase et nouveaux états engendrés par diverses interactions : les
interactions coulombiennes entre les électrons, l’interaction électrons-phonons, et l’effet du
désordre. Une grande diversité de nouveaux états de la matière apparaı̂t, parmi lesquels les
supraconducteurs, le supersolide, diverses phases magnétiques, piézoélectriques, etc.
Q. Quelle est la densité d’électrons de conduction, n (c’est à dire le nombre d’électrons
de conduction dans un mole du métal/volume d’un mole) dans le cuivre ? La configuration
électronique d’un atome de cuivre (Z = 29) est 1s2 , 2s2 , 2p6 , 3s2 , 3p6 , 3d10 , 4s1 , la masse
6
7
molaire de Cu est M = 63.5 et la masse volumique de Cu est 9 g/cm3 . Quelle est la densité
volumique des ions positifs ? La densité volumique de la charge totale ?
1.1
Le gaz d’électrons et la conduction électrique dans un
métal
Dans cette section nous allons présenter un modèle de conduction électrique dans un
~ On considère un gaz de N charges ponctuelles
métal soumi à un champ électrique constant E.
q, qui se déplacent indépendamment les unes des autres dans un volume V . Elles sont
parfaitement réfléchies par les parois et les collisions entr’elles sont supposées élastiques. En
l’absence d’un champ électrique extérieur la valeur moyenne des vitesses sera nulle. Lorsque
~ sur chacune des
l’on applique un champ, il y aura une force électrostatique F~el = q E
charges. En l’absence de forces qui s’opposent à ce mouvement il y aurait une accélération
constante et une vitesse moyenne infinie ! En réalité, on le sait, il y aura des collisions entre
les charges, et avec d’autres centres de diffusion à l’intérieur du cristal qui serviront à limiter
cette vitesse. En régime permanent, grace à ces collisions, on s’attend à ce que la vitesse
moyenne soit constante en fonction du temps.
Etablissons tout d’abord une relation simple entre le courant I, la concentration n de
charges ponctuelles q et la vitesse des porteurs, v . On considère un fil de métal de section S
(voir la figure). Dans un intervalle de temps ∆t, chacune des charges parcourt une distance
v∆t. La quantité de charge transportée est donc ∆Q = qnvS∆t. Le courant I = ∆Q/∆t et
on en déduit la densité de courant, j = I/S
j=
∆Q
= qnv
S∆t
(1.1)
Nb. Notons que courant est toujours dans le sens du champ électrique, quelque soit le signe
des porteurs : on ne peut pas distinguer entre le cas de charges positives q > 0 ayant des
vitesses dans un sens donné, du cas de q < 0 ayant des vitesses dans le sens opposé.
E
S
q
v∆t
Fig. 1.1 – Conduction électrique dans un métal
1.1.1
Le modèle de Drude de la conductivité électrique
On considère un ensemble de charges q ponctuelles ayant une masse m, et une concentration de charges n = N/V où N est le nombre total de charges et V est le volume.
Les charges se meuvent dans le milieu avec une vitesse constante, sauf pour des réflections
des parois, ou lorsqu’elles rencontrent des centres de diffusion, distribués avec une certaine
8
densité à l’intérieur du volume. La valeur typique de la vitesse des charges, vtyp , peut
être estimée à l’aide du théorème d’équipartition d’énergie (où l’énergie cinétique moyenne
2
des particules 12 mvtyp
= 32 kB T , soit vtyp ∼ 107 cm/s à T = 300K). Le cas le plus simple
consiste à considérer des centres de diffusion qui diffusent les charges avec des collisions
élastiques (sans changement d’énergie). On fait l’hypothèse d’un temps de relaxation, τ , qui
représente un temps moyen entre collisions. La figure montre une trajectoire aléatoire d’une
charge ponctuelle qui subit une succession de collisions.
Fig. 1.2 – Trajectoire d’une particule diffusée par des centres de diffusion
En champ nul, la vitesse moyenne de l’ensemble des particules à un instant du temps
donné h~v (t)i sera évidemment nulle (voir Fig.1.2). Lorsque E est différent de zero, il y aura
~ parallèle aux lignes du champ. Après un temps t mesuré à
une force constante F~ = q E
partir de la dernière collision, la vitesse instantanée d’une charge s’écrit ~vi + ∆~vi (t), où
~vi est la vitesse juste après la dernière collision. En faisant la moyenne sur l’ensemble des
particules, et en utilisant le fait que h~vi i = 0, tandis que h∆vi i = F hti/m = F τ /m on a
~ /m ≡ ~vd (la vitesse de dérive).
h~vi i = q Eτ
vd
E
Fig. 1.3 – Mouvement des électrons dans un métal soumi à un champ électrique montrant
la vitesse de dérive (drift velocity)
Nous avons ainsi trouvé qu’en régime permanent, la vitesse moyenne des électrons ~vd
est proportionnelle au champ appliqué, comme l’illustre la fig.1.3. Nous voulons établir une
expression pour la densité du courant électrique j et calculer la conductivité électrique σ,
définie par
j = σE
(1.2)
En utilisant les relations déjà écrites pour la densité de courant j, la vitesse moyenne, on
2
trouve aisément que σ = nem τ (la charge d’un électron étant e = −1, 6 × 10−19 C). L’inverse
9
de la conductivité est appelé la resistivité, ρ,
ρ=
m
ne2 τ
(1.3)
On peut voir que la loi d’Ohm ∆V = IR est bien vérifiée dans le métal de la manière
suivante : on considère un barreau de section S et de longueur L dans la direction du champ
extérieur E. On a alors une différence de potentiel ∆V = EL entre les deux extrémities
du barreau, pour un courant I = jS où j = σE. On trouve ∆V = RI où la résistance du
barreau R = ∆V /I = ρL/S.
Q. Au vu du tableau ci-dessous, quel matériau pensez vous serait un meilleur conducteur
d’électricité pour un temps de diffusion τ comparable : le cuivre ou l’aluminium ? Comment
expliquer le fait que la resistivité du Cu est plus petite que celle d’Al (dernière colonne) ?
métal
Na
Be
Cu
Al
n (cm3 )
2.65 × 1022
24.2 × 1022
8.45 × 1022
18.06 × 1022
ρ(273K)(µΩ/cm)
4.2
2.8
1.56
2.45
Tableau 1. Quelques métaux et leurs densités d’électrons de conduction
1.1.2
D’autres prédictions du modèle classique
Dépendence de ρ en fonction de T
La formule en 1.3 nous aide à comprendre pourquoi la résistivité peut changer avec la
température. Cette variation est surtout due aux changements du temps caractéristique τ
(en supposant que n est peu dépendant de T - on traitera le cas des semiconducteurs, où
la variation de n est importante un peu plus loin dans ce chapitre.) Lorsque la température
monte, les électrons sont de plus en plus diffusés par les atomes dont les vibrations deviennent plus importantes ; ils sont aussi plus diffusés par les autres électrons par l’intermédiaire des interactions coulombiennes. On peut distinguer deux types de contributions à la résistance totale : ρ(T ) = ρ(0) + δρ(T ). La première, ρ(T = 0), appelée la
résistance résiduelle, est inversement proportionnelle à τel , le temps de parcours moyen dû
aux collisions élastiques, quantité qui dépend de la concentration d’impuretés gelées dans le
matériau. La deuxième contribution vient des collisions inélastiques mentionnées ci-dessus,
elle est inversement proportionnelle à τin qui diminuera en fonction de T .
L’effet Hall
Il a déjà été remarqué qu’il est impossible de déterminer le signe des porteurs de charge
dans un conducteur à partir d’une mesure de I en fonction de la différence de potentiel ∆V .
Un dispositif qui permet de distinguer entre les deux possibilités (q positive ou négative)
a été conçu par E. Hall. Il s’agit de soumettre un barreau de métal à un champ électrique
~ constant (de manière à créer un courant I le long de l’axe du barreau), et un champ
E
~ On peut montrer qu’en régime permagnétique constant dans une direction transverse B.
manent, il se crée un champ électrique EH dans la direction perpendiculaire aux champs E
10
et B. Le modèle classique avec l’introduction d’un temps de relaxation à la Drude permet
d’établir ce champ (nous ne le démontrons pas ici)
EH = jB/nq
(1.4)
Cette équation montre que le signe de EH dépend de celui des porteurs, ce qui est
permet, dans les semiconducteurs de distinguer si la conduction de courant est fait par les
électrons (q < 0) ou des trous (q > 0). Nous en parlerons plus dans la discussion, plus
loin, sur les semiconducteurs. L’effet Hall est souvent utilisé dans des applications, pour
déterminer, par exemple, l’intensité du champ magnétique.
B
q
E
EH
Fig. 1.4 – Dispositif de Hall montrant une charge q dans des champs magnétiques et
électriques et le champ EH résultant
Conduction thermique
Un des plus grands succès du modèle de Drude a été d’expliquer les résultats expérimentaux
montrant une proportionnalité entre T σ(T ) et la conductivité thermique κel (T ). Cette
dernière exprime l’efficacité des électrons à transmettre de la chaleur lorsque l’on soumet
un métal à un gradient de température. La proportionnalité vient du fait que ce sont les
mêmes particules qui sont porteuses de courant électrique et courant thermique.
Propriétés optiques
Avec le modèle classique, on peut traiter le problème de la transmission des ondes
électromagnétiques dans un milieu métallique. La transmitivité et la réflectivité du métal
dépendent de la fréquence de l’onde par l’intermédiaire d’une fonction appelée la constante
diélectrique, ²(ω). Le modèle de Drude prédit qu’il y aura un pic d’absorption des ondes
(pic de Drude) lorsque la fréquence tend vers 0.
Oscillations de plasma
Imaginons que l’on déplace le gaz d’électrons tout entier par une distance x par rapport
au réseau d’atomes que l’on peut décrire par un fond positif continu. On crée ainsi un
champ électrique E = nex/²0 dans l’intérieur du solide, et une force de rappel sur chaque
11
électron de F = eE. On a alors l’équation de mouvement d2 x/dt2 = −ωp2 x, où ωp2 =
ne2 /²0 , et les électrons participent tous à un mouvement collectif harmonique. Ce sont les
oscillations de plasma du gaz d’électrons. Dans un métal, ce type d’oscillations peut être
provoqué par un champ électromagnétique incident avec la bonne fréquence. En générale,
les métaux réfléchissent plutôt bien des ondes EM incidentes, comme on peut constater pour
des surfaces métalliques bien polies - à cause de l’écrantage des champs électromagnétiques
par les charges mobiles. Cependant, à la fréquence ωp les électrons ne peuvent plus assurer
l’écrantage du champ incident, et le métal devient alors transparent ! Le sodium par exemple,
devient transparent aux ondes EM‘pour une longueur d’onde de λ = 2100A en assez bonne
accord avec celle trouvée à l’aide de notre formule de ωp .
1.1.3
Problèmes du modèle classique
– On peut calculer le temps de relaxation τ à partir de la valeur expérimentale de la
résistivité. Dans le cas du cuivre à la température de l’azote liquide (T = 77K),
ρ ≈ 0.2µΩcm. On en tire un temps caractéristique τ de l’ordre de 10−8 s, et il résulte
un l de l’ordre de quelques centaines de milliers d’Angströms.
Si les atomes diffusaient les électrons comme on pourrait s’y attendre, le libre parcours
moyen l serait de l’ordre de la distance interatomique, soit quelques Angströms. Le
libre parcours moyen trouvé ci-dessus étant beaucoup plus grand, on peut en conclure
que les atomes ne sont pas “vus” par les électrons. Plus exactement, les électrons ne
sont pas diffusés par les noyaux tant que la disposition dans l’espace de ces derniers
reste parfaitement périodique. Par contre, les mesures de résistivité montrent que les
électrons sont diffusés par des défauts – des défauts de la structure (dislocations, etc),
ou des défauts chimiques dûs à la présence d’impuretés dans le métal. Donc le premier
problème est celui d’expliquer le rôle joué par les atomes.
– Le problème de la chaleur spécifique des électrons. Les expériences montrent que cV (T )
est très faible à la température ambiante. Elle n’approche la valeur classique de 32 nkB
qu’à des températures extrêmement élevées. Cette observation nécessite que l’on passe
à un traitement quantique du gaz d’électrons.
1.2
1.2.1
Le gaz de fermions libres
Le gaz d’électrons à T = 0
On considère toujours des électrons libres – on négligera les interactions entre les électrons,
~2 ~ 2
et l’interaction des électrons et le réseau de noyaux. L’hamiltonien est H0 = − 2m
∇ où m
est la masse de l’électron. Les propriétés thermodynamiques d’un gaz de N ’électrons sont
calculés avec les méthodes usuelles de la physique statistique. Nous donnerons ici un rappel
des notions de base.
Vecteur d’onde k. Un électron libre dans un volume V est décrit par une fonction d’onde
solution de l’équation de Schrödinger
Hψ = Eψ;
√
~
ψk (~x) = eik.~x / V
(1.5)
√
les solutions de ψ étant des ondes planes. Prenant l’exemple de d = 1, on a ψk (x) = eikx / L
pour un gaz occupant un intervalle de longueur L. Il est souvent commode de prendre des
12
conditions aux limites périodiques : ψ(x + L) = ψ(x). On trouve alors que kL = 2πn
où n = ..., −1, 0, 1, 2, ... est un entier. La généralisation à plusieurs dimensions est claire :
chaque composante aura une des valeurs discrètes données par
ki =
2πni
Li
(1.6)
où i = x, y, .. et Li la longueur du système dans chacune des d directions. Lorsque l’on
considère la limite L → ∞, le vecteur d’onde donné par l’expression ci-dessus devient une
variable continue. L’énergie (cinétique) dépend de ~k de façon habituelle :
~2 k 2
E(~k) =
2m
(1.7)
où m est la masse d’un électron, k = |~k|.
L’énergie et le vecteur d’onde de Fermi EF et kF . A T = 0 le gaz de N électrons est
dans son état fondamental ( l’état de plus basse énergie). Cet état est constitué à partir des
ondes planes solutions de l’éq. 1.5 Rappelons que deux fermions ne peuvent posséder la même
valeur de ~k que si leurs spins sont opposés, d’après le principe de Pauli. L’énergie totale
de l’état fondamental est donc calculée en plaçant une paire d’électrons de spins opposés
dans chaque niveau (on rappelle que les niveaux dépendent de d nombres quantiques en
dimension d selon l’éq. 2). On commence par l’état de plus basse énergie, jusqu’à ce que
l’on arrive à l’énergie EF , le dernier niveau occupé. kF est la norme du vecteur d’onde
correspondant. SF , ou la surface de Fermi, est la surface d’une sphère de rayon kF , qui
sépare les états occupés et ceux inoccupés à T = 0. Le nombre de valeurs de ~k à l’intérieur
de la surface de Fermi est N/2.
La densité d’états. V ρ(~k) donne le nombre d’états quantiques dans une région de volume
infinitésimal d~k autour d’un point dans l’espace ~k (Il faut multiplier celle-ci par 2 pour
prendre en compte les deux états de spin).
En une dimension, la distance entre deux valeurs permises de k est ∆k = 2π/L, d’où le
nombre d’états dans un intervalle de longueur dk est
L
dk
=
≡ Lρ(k)dk
∆k
2π
(1.8)
La fonction ρ(k) = 1/2π est la densité d’états en 1 dimension. Dans le cas d’un
gaz d’électrons en dimension d occupant un volume V = Ld on a de façon analogue
V
3
V ρ(~k)d3 k = (2π)
d d k. Dans la limite thermodynamique, toute somme sur les états quantiques peut s’écrire sous forme d’une intégrale
Z
Z
X
... = V
d~kρ(~k)... = V
dEρ(E)...
(1.9)
etats
où nous avons introduit la densité d’états en fonction de l’énergie ρ(E) dans la deuxième
égalité, en effectuant un changement de variables. Pour d = 1 on trouve, par exemple
r
1
2m
ρ(E) = 2ρ(k)/(dE/dk) =
(1.10)
2π~
E
(où le facteur 2 dans la première égalité tient compte du fait que les états de k et −k sont
dégénérés).
13
Q. Montrer qu’en d = 3 la densité d’états en fonction de l’énergie est donnée par
√
2m3 √
ρ(E) =
E
2π 2 ~3
(1.11)
Quelques relations pour la surface de Fermi en d=3.
Pour trouver kF on calcule d’abord le volume de la sphère représentant les états occupés,
Ω = 4πkF3 /3. Le nombre total d’états occupés, N est alors obtenu en multipliant Ω par la
densité d’états et un facteur de 2 pour le spin. On trouve ainsi le vecteur d’onde de Fermi,
EF et la densité d’états au niveau de Fermi :
kF =
2π 3N 1/3
(
) = (3nπ 2 )1/3
L 8π
~2
EF =
(3nπ 2 )2/3
2m
3n
ρ(EF ) =
4EF
(1.12)
(1.13)
(1.14)
Q. Calculer EF pour le Cu. Donner la valeur de la température de Fermi, TF = EF /kB .
En unités de TF que vaut une température ambiante de 300K ?
Q. Calculer la vitesse vF d’un électron à la surface de Fermi ( donc un des plus rapides à
T = 0) dans le cuivre (vF = ~kF /m). Comparer avec celle prédite par une théorie classique.
1.2.2
Le gaz d’électrons à température finie
On suppose une concentration moyenne d’électrons n = N/V fixe. Les électrons peuvent
occuper tous les états d’énergie, avec une probabilité donnée par la fonction de Fermi-Dirac
fF D (E) =
1
exp(E−µ)/kB T
+1
(1.15)
où µ(T ), le potentiel chimique, est calculé à partir de l’intégrale qui donne le nombre total
d’électrons N,
Z
X
~
N =2
fF D (E(k)) = 2 dEV ρ(E)fF D (E)
(1.16)
Dans la deuxième équation nous avons changé de variable et pris la limite thermodynamique
(remplacement la somme par une intégrale), et avons multiplié par 2 pour le spin.
Forme de la fonction fF D
A T = 0 µ = EF , la fonction Fermi-Dirac ne prend que deux valeurs, 1 et 0 en-dessous et
au-dessus de EF respectivement. Quand la température augmente, pour T << µ la fonction
n’est modifiée qu’au voisinage de µ, où la discontinuité est progressivement lissée et élargie.
Le potentiel chimique varie très peu en fonction de T pour des températures
usuelles : i
h
π 2 kB T 2
nous n’allons pas le démontrer ici, mais un calcul approché donne µ = EF 1 − 12 ( EF ) + ...
pour un gaz d’électrons libres en d = 3. On peut vérifier qu’il y a un changement de quelque
fractions d’un pourcent à 300K.
14
fFD HEL
T>0
1
2kB T
0.5
µ
E
Fig. 1.5 – La forme de fF D pour une température T > 0
Energie interne et chaleur spécifique
2
interne est donnée par une somme sur les énergies de tous les électrons, U =
PL’énergie
E(~k)fF D (E(~k)) (incluant le facteur 2 pour le spin). Ecrit sous forme d’intégrale, on a
Z
u = U/V = 2 dEρ(E)fF D (E)E
(1.17)
≈ u(0) +
π 2 (kB T )2
4 EF
où la deuxième ligne vient d’un calcul approché valable à basse T . La chaleur spécifique est
donc
µ 2¶µ
¶
π
kB T
∂u
= nkB
(1.18)
cv (T ) =
∂T
2
EF
Comparée à la valeur classique de 23 nkB , cv (T ) est de l’ordre de cent fois plus petite.
L’explication de ce fait est que seul un nombre restreint d’électrons est effectivement
excité dans les états de plus haute énergie à la température ambiante. Comme nous avons
remarqué, la fonction fF D est peu modifiée en fonction de T , les seuls changements ayant
lieu dans une gamme d’énergies de largeur kB T autour du niveau de Fermi.
Dans une mesure expérimentale de la chaleur spécifique, on obtient la somme de toutes
les contributions, qui peuvent être dues aux électrons, des vibrations du réseau (phonons),
aux fluctuations magnétiques, supraconductrices et ainsi de suite. La contribution la plus important à température ambiante est celle des phonons. Le figure montre la chaleur spécifique
totale, où l’on voit le comportement en T 3 à haute T due aux vibrations (chapitre suivant)
et le comportement linéaire en T due aux électrons à basse T .
1.2.3
Les boı̂tes, fils et puits quantiques
La miniaturisation des composants électriques est importante pour les technologies nouvelles, et elle est également très intéressante de point de vue purement scientifique. On peut
esprérer bientot stocker des bits d’informations dans des boı̂tes quantiques (littéralement
15
Fig. 1.6 – Chaleur spécifique en fonction de T (du site “Hyperphysics”)
des boı̂tes à stocker et à retirer des électrons un-à-un). Celles-ci peuvent être fabriquées
avec des formes et des dimensions prédeterminées, de façon à avoir un spectre d’énergies
discrètes précisément connu, comme dans l’illustration ci-dessous.
Fig. 1.7 – Niveaux d’énergie dans une boı̂te quantique (fig. M.Rüfenacht)
Les puits quantiques sont des couches minces hébergeant un gaz d’électrons bidimensionnel, qui sont utiles pour une grande variété d’applications (des couches minces magnétiques,
notamment, servent dans la fabrication d’une nouvelle génération de mémoires RAM). On
peut fabriquer des de tels puits en empilant des couches successives de matériaux différents
tels l’arseniure de gallium (GaAs) et l’arseniure d’aluminium (AlAs). L’énergie potentielle
étant plus basse dans le GaAs, les électrons resteront dans ces couches-là, prise en sandwich par deux couches de AlAs (voir la figure). Les fils quantiques sont obtenus lorsque
l’on les électrons dans deux des directions, en laissant le mouvement libre dans la troisième
dimensions.
Q. Quelle est la forme de la densité d’états à d = 2 ? Décrire qualitativement la forme
de la densité d’états d’un puits quantique, avec un potentiel V (z) qui est ∞ partout sauf
entre z = 0 et z = a où V = 0.
16
Fig. 1.8 – puits quantiques fabriqués avec Ga-Al-As (fig. M.Rüfenacht)
1.3
1.3.1
L’environnement cristallin et l’émergence des bandes interdites
La théorie des électrons presque libres
Dans cette section, nous allons considérer en un peu de détail un électron dans un cristal
unidimensionnel. Les généralisations aux dimensions deux et trois seront indiqués à la fin.
L’équation de Schrödinger est
Hψ(x) = Eψ(x)
(1.19)
où ψ est la fonction d’onde et E est l’énergie à un électron. Le potentiel étant périodique,
V (x + a) = V (x), on peut le développer en série de Fourier
V (x) =
∞
X
n=−∞
e
ingx
Vn ;
1
Vn =
a
Z
a
dxe−ingx V (x)
(1.20)
0
où g = 2π/a.
On ne dispose pas de solution exacte de cette équation, même pour des cas particuliers
simples. On dispose, toutefois, d’un théorême concernant les solutions ψ de l’éq.1.19. Le
théorème de Bloch affirme qu’une fonction d’onde solution de (1.19) aura la forme d’une
onde plane multipliée par une fonction périodique u :
ψ(x) = uk (x)eikx
(1.21)
uk (x + a) = uk (x). Pour x0 = na, en utilisant la périodicité de u, l’éq.1.21 donne
0
ψ(x + x0 ) = eikx ψ(x)
(1.22)
ce qui exprime le fait que les amplitudes de la fonction d’onde en x et en x0 sont les mêmes
à un facteur de phase près – une conséquence de l’invariance par translation du cristal.
Démonstration du théorême de Bloch : on considère les opérateurs de translations
discrètes Tn . H est invariant par translation, donc les Tn commutent avec H. Choississons une base ψ commune de sorte que Hψ = Eψ et Tm ψ = c(m)ψ où E et c sont des
nombres. En considérant deux opérations successives, on a Tn Tm = Tn Tm = Tn+m (les
translations commutent et deux translations successives peuvent être remplacées par une
seule). Cette dernière relation implique que c(m) peut être exprimé sous la forme eim×cste ,
d’où l’éq.1.22.
17
Quantification des valeurs de k
. On suppose que le réseau est composé de N sites, avec une distance entre sites a, et
avec des conditions aux limites périodiques. On a donc ψ(x + L) = ψ(x) où L = N a. On en
déduit qu’il existe N valeurs distinctes de k, que l’on peut choisir à être dans un intervalle
symétrique autour de l’origine,
kn =
2π
n,
a
n=−
N
N −1
, ..., 0, ...,
2
2
(1.23)
Dans la limite L → ∞, ces valeurs de k deviennent continues. On appelle la première zone
de Brillouin (PZB) l’intervalle [−π/a, π/a]. Le théorême de Bloch implique que l’énergie de
l’électron dans un cristal sera une fonction périodique de k, En (k + g) = En (k) (où n est
l’indice de bande). Il suffit, donc, de chercher les solutions de l’éq. de Schrödinger dans la
première zone de Brillouin.
Solution pour V = 0. Le cristal virtuel
Considérons un électron qui se propage dans un réseau mais où les interactions avec
les noyaux sont négligeables, de sorte que V (x) = 0 (d’où le “virtuel”). Les solutions de
l’équation de Schrödinger sont les ondes planes déjà vues, ψK (x) ∝ eiKx . Celles-ci peuvent
se réecrire ψn,k (x) = ei(ng+k)x , car on peut exprimer tout vecteur d’onde K sous la forme
ng + k où π/a < k < π/a (on parle alors de la valeur “réduite” de K). On trouve ainsi des
énergies qui dépendent de k et d’un indice n :
²n (k) =
~2
(ng + k)2
2m
(1.24)
Ces “bandes d’énergie” sont illustrés dans la figure (il ne s’agit, pour l’instant, qu’une façon
inhabituelle de représenter les solutions déjà connues pour un électron libre).
Lorsque le potentiel V 6= 0, nous allons voir que ces bandes d’énergie sont peu modifiées à
l’intérieur de la PZB, mais qu’il se produit des phénomènes intéressants aux bords, c.a.d. près
de ±π/a. Avant d’aborder les calculs voici un argument qualitatif permettant de comprendre
ces situations particulières.
La non-propagation de certaines ondes planes dans un milieu périodique
Pour avoir une idée qualitative de la propagation des électrons dans un cristal il est
intéressant de prendre un exemple simple. Considérons une onde incidente venant de −∞
sur une barrière de potentiel, V (x) = V pour 0 < x < d, où V est supposé petit en comparaison avec l’énergie cinétique de l’onde incidente. Une partie de l’onde sera réfléchie, et une
partie transmise, les amplitudes de réflection/transmission étant dépendant de V , et d. On
considère maintenant l’effet d’enchaı̂ner plusieurs barrières, avec une distance de répétition
a. Une onde incidente eikx sera partiellement réfléchie par chacune des barrières. Si l’on
considère l’amplitude de l’onde renvoyée vers −∞, elle sera donnée par une somme de termes
e−ikx+iM φ , où φ = 2ka est la différence de phase associée à une distance supplémentaire
parcourue de 2a. Quand k est un multiple de π/a, φ sera un multiple de 2π, et toutes les
réflections arriveront en phase - l’amplitude totale de réflection sera importante (ce qui implique que l’amplitude de transmission de cette onde sera faible). A l’intérieur de la région
périodique, à cause des réflections multiples, il y aura une onde stationnaire pour ces valeurs
particulières de k, avec, comme on le verra ci-dessous, l’apparition de bandes interdites ou
“gaps”.
18
n=-3
n=3
n=-2
n=2
n=-1
n=1
n=0
-0.5
0
0.5
Fig. 1.9 – La relation de dispersion du cristal virtuel dans la première zone de Brillouin (la
figure indique k en unités de g)
La solution en théorie de perturbation
On considère un potentiel périodique simple de forme sinusoı̈dale V (x) = V1 (eigx +e−igx )
( c.a.d. on ne garde que les premiers termes du développement de Fourier de l’éq.1.20).
Quand V1 est petit devant l’énergie cinétique de l’électron, on peut obtenir des solutions de la fonction d’onde ψ(x) et de l’énergie En (k) sous forme d’un développement en
puissances de V1 . Nous nous contenterons de citer les résultats du calcul perturbatif
|V1 |2
|V1 |2
+
+ ..
²n (k) − ²n (k + g) ²n (k) − ²n (k − g)
V1
V−1
|ψi = |ki +
|k + gi +
|k − gi + ..
²n (k) − ²n (k + g)
²n (k) − ²n (k − g)
En (k) = ²n (k) +
(1.25)
le ket |ki représentant l’onde plane de vecteur d’onde k, et nous n’avons pas écrit les termes
d’ordre plus élevés. Ces équations confirment que les termes de correction seront petites si
|²n (k) − ²n (k ± g)| >> |V1 |.
On est ainsi amené à conclure que, pour la plupart des électrons dans le gaz de Fermi,
les énergies et les fonctions d’onde sont peu affectées par la présence du réseau de noyaux.
Les solutions aux bords de la PZB
Consid érons d’abord l’énergie E en fonction de k dans la branche d’énergie la plus basse,
n = 0. Il suffit de considérer k positif, car le spectre étant symétrique autour de k = 0.
Lorsque k augmente, et approche le bord de la PZB, les énergies ²0 (k) et ²0 (k − g) sont très
proches. Les éqs.1.25 ne sont plus utiles, et il faut recourir à la théorie de perturbation des
états dégénérés. Pour δ petit, et k = g/2 − δ on va chercher une solution de l’éq.1.19 de la
19
forme |ψi = c1 |ki + c2 |k − gi. En multipliant l’équation H|ψi = E|ψi par hk| et par hk − g|
on obtient deux équations
²0 (k)c1 + V1 c2 = Ec1
(1.26)
²0 (k − g)c2 + V−1 c1 = Ec2
(1.27)
Pour qu’il y ait une solution nontriviale des coefficients ci , il faut que le déterminant de la
matrice correspondante soit nul, ce qui donne
µ
¶
²0 (k)
V1
det
=0
(1.28)
V−1 ²0 (k − g)
On trouve aisément les deux solutions de l’équation quadratique :
E=
²0 (k) + ²0 (k − g) 1 p
±
(²0 (k) − ²0 (k − g))2 + 4|V1 |2
2
2
(1.29)
ce qui montre (voir la figure) que l’énergie s’écarte sensiblement de sa valeur ²0 (k) dans ce
cas. Quand k = g/2, on obtient après simplification,
lim E = ²0 (g/2) ± |V1 |
δ→0
(1.30)
√
Pour cette valeur de k = g/2 il est facile de vérifier que les coefficients c1 = ±c2 = 1/ 2 et les
solutions sont donc des ondes stationnaires, ayant des énergies correspondantes ²(g/2)±|V1 |.
Il apparaı̂t ainsi une “bande interdite” (ou gap, Eg ) de largeur 2|V1 |. C’est l’intervalle
d’énergie entre le haut de la bande n = 0 et le bas des bandes n = ±1, où il n y a pas de
solution de l’éq.1.19.
Généralisation aux potentiels plus compliqués. On peut prendre en compte les autres coefficients Vn dans la série de Fourier de la même façon. Chaque fois que deux bandes se
rencontrent, il y aura formation d’une onde stationnaire, et on verra alors apparaı̂tre des
gaps de largeur 2|Vn | (voir la figure). Dans la figure on présente les courbes d’énergie en
fonction de k. L’écart entre la courbe parabolique d’un électron libre (ligne hachurée de la figure) et la nouvelle courbe n’est visible que près des valeurs k = 0, ± g2 . Les figures montrent
pour ce cas unidimensionnel le diagramme des énergies en fonction de k représentées dans
la première zone de Brillouin.
Q. Que vaut k au bord de la PZB dans un cristal de a = 1Å ? S’il y a un électron de
conduction par atome, que vaut kF ? Conclusion quand à la fonction d’onde au niveau de
Fermi.
Vitesse de groupe. Masse effective.
L’impulsion totale, p, de l’électron n’est plus une quantité conservée à l’intérieur du
cristal. Les fonctions d’onde ψ(x) solution de l’éq.1.19 correspondent à des pacquets d’onde,
d’une valeur moyenne de k donnée. La “vitesse de groupe” et la masse effective sont définies
à partir des relations suivantes :
~v(k) = ∂E/∂k
~2
= ∂ 2 E/∂k 2
mef f (k)
(1.31)
20
Fig. 1.10 – Première zone de Brillouin avec quatre bandes dont deux remplies avec des
électrons
Il est facile de vérifier que ces relations ci-dessus donnent les valeurs attendues de la
vitesse (v = ~k/m) et la masse m habituelles dans le cas d’un électron libre. La vitesse
moyenne et la masse effective d’un électron deviennent des fonctions de k pour un électron
dans un cristal, et c’est aux bords de bande que se produisent les effets les plus surprenants.
La vitesse de groupe, proportionnelle à la pente de la courbe de dispersion, s’annule non
seulement à k = 0 mais aussi à k = ±π/a.
La masse effective mef f sera elle aussi fortement modifiée pour certaines valeurs de k.
Développant l’expression de l’énergie En (k) (l’éq.1.30) autour de k = k0 , on a
1
mef f (k)
= ~−2 ∂ 2 En (k)/∂k 2
=
(1.32)
g
1
1 ²n ( 2 )
±
m m 2|V1 |
Il s’ensuit que la masse effective peut devenir très grande, approchant l’infini aux bords de
la PZB, traduisant le fait qu’une onde stationnaire ne transporte pas d’énergie.
g
2|V1 |
mef f ( ) = − g m
2
²( 2 )
(1.33)
Conduction d’un courant électrique
Sous l’effet d’un champ électrique uniforme E, on peut montrer que la quantité de
mouvement ~k varie selon l’équation
~dk
= −eE
dt
(1.34)
ayant la solution k(t) = k(0)−eEt/~. Cependant, un électron ne peut changer sa valeur de k
que si le nouvel état est vacant. Ceci est possible si tous les électrons changent simultanément
21
leurs états dans le même sens ! La quantité du mouvement du gaz entier est ainsi changée.
L’énergie et la vitesse de chacun des électrons sont, eux, des fonctions périodiques de k,
en l’absence de transitions entre bandes (ce qui coûterait une énergie égale à la largeur
de la bande interdite). Il résulte que le mouvement d’un électron donné sera une fonction
oscillante du temps ! Ces “oscillations de Bloch” n’ont été expérimentalement mesurées que
très récemment, car il faut des échantillons de très grande pureté.
1.3.2
Conducteurs, isolants et semiconducteurs.
Nous avons vu que l’application d’un champ électrique conduit à un changement de k de
chaque électron, ce qui est possible si tous les électrons changent leur k en même temps. La
quantité de mouvement totale K du gaz deviendra alors non-nulle et il y aura un courant
électrique. Ce n’est plus le cas lorsqu’une bande est entièrement remplie - tous les états k
disponible sont alors occupés, et le champ électrique ne donnera pas lieu à un déplacement
global dans l’espace k de l’ensemble des électrons. Il n y pas de courant électrique et on a
affaire à un isolant de bande.
Dans quelles conditions une bande est-elle est complètement remplie ? Pour un cristal de N noyaux, il y a N valeurs de k permises. Multipliant par 2 pour le spin on a
nombre d’électrons que l’on peut caser dans chacune des bandes, 2N . Quand le nombre
total d’électrons est inférieur à 2N, la bande sera partiellement remplie, et il s’agit d’un
conducteur. Ce sera le cas pour des atomes monovalents, où chaque atome libère un
électron de conduction. Si, par contre, chaque atome contribue exactement 2 électrons, la
bande n = 0 sera complètement remplie, et on aura un isolant.
Les semiconducteurs sont des matériaux où le gap Eg , est relativement petit. La
différence entre le semiconducteur intrinsèque et un isolant est (pour simplifier) uniquement
quantitative : par exemple, le diamant, avec son Eg = 7eV est un isolant, tandis que le
silicium pur avec Eg = 1.12eV , et le germanium, avec Eg = 0.7eV sont des semiconducteurs.
Ces derniers sont des isolants à T = 0, à cause de leurs bandes pleines. En augmentant la
température, de plus en plus d’électrons sont excités dans la bande de conduction. En le
faisant, ils laissent des états vacants ou “trous” dans la bande de valence. La conduction
du courant est assuré en partie par les électrons dans la bande conduction, et en partie
par les trous de la bande de valence ! La conductivité σ dépend de la concentration des
porteurs de charge négative (n) ou de charge positive (p) de courant électrique. Dans un
tel semiconducteur, donc, la σ augmentera en fonction de T . Dans le Si, à T = 300K,
n = p = 1.5 × 1010 cm−3 .
Calculons le nombre Nc d’électrons dans la bande de conduction pour notre système
unidimensionnel. On l’obtient en calculant la somme sur tous les états (de la bande de
conduction) des probabilités qu’un état d’énergie E soit occupé. Cela donne
Z
1
(1.35)
Nc = L
dkρk
(²(k)−µ)/k
B T −1
exp
pzB
Z Emax
1
= L
dEρ(E)
(²(E)−µ)/k
B T −1
exp
Emin
où µ est le potentiel chimique.
22
1.3.3
Résultats en d=2 et 3
Un réseau est caractérisé par ses translations élémentaires, que l’on désigne par ~ai (i =
1, .., d). A chaque réseau correspond un réseau réciproque qui, lui, est engendré à partir des
~ i , que l’on peut déterminer à partir des relations
vecteurs A
~ i .~aj = 2πδij
A
(1.36)
La première zone de Brillouin est une cellule élémentaire du réseau réciproque, au centré
située à ~k = 0.
~ i et construire la pzB du réseau rectangulaire pour lequel ~a1 = lu~x ,
Q. Préciser les vecteurs A
~a2 = 3lu~y .
L’hamiltonien d’un électron dans un tel cristal est H = H0 + V (~x) où V (~x) reflètera la
périodicité du réseau, V (~x + ~ai ) = V (~x).
Le théorême de Bloch s’écrit
~
ψ~k (~x) = u~k (~x)eik.~x
(1.37)
Pour de conditions aux limites périodiques, on trouve autant de valeurs discrètes de ~k dans
la pzB qu’il y a de sites atomiques, soit N .
La théorie de perturbation permet, comme pour d = 1, de calculer les fonctions d’onde
~ est un des composantes
ψ~k (~x) et les énergies propres E(~k), en série de puissances de VG~ , où G
du développement de Fourier de V . Les modifications sont petites pour la plupart des
vecteurs ~k, mais deviennent importantes près d’une des faces de la zone de Brillouin, où
l’on obtient des ondes stationnaires dans la direction perpendiculaire à la face. Les énergies
E(~k) seront fortement modifiées à ces valeurs de ~k, comme dans l’exemple unidimensionnel.
La vitesse de groupe dépendra,en générale, de la direction de propagation, étant donnée
par
~ ~k)
~v = ~−1 ∇E(
(1.38)
puisque les composantes x, y ou z du gradient de E peuvent être différents. La masse effective
est un tenseur, donnée par une généralisation simple de l’équation 1.32.
Nouveaux effets présents en dimensions supérieures à 1
Dans notre modèle unidimensionnel simple, les gaps sont toujours directs, quelque soit la
forme du potentiel V (x), c.a.d. le minimum de En (k) se trouve juste au-dessus du maximum
de En−1 (k). Ce n’est plus nécessairement vrai en d > 1, et on peut avoir une situation de
“gap indirect” où le maximum de la bande de valence et le minimum de la bande de
conduction ne sont pas situés au même endroit (illustré dans la figure). On peut même
avoir des situations où Emin de la bande de conduction est en-dessous de Emax de la bande
de valence. Dans ces cas, à T = 0K, les électrons occuperont les états de plus basse énergie
dans la bande de conduction, et la bande de valence ne sera que partiellement remplie. On
emploie le terme “semi-métal”” pour ces matériaux.
1.4
1.4.1
Transitions de phase induites par des interactions
interaction électron-électron. Le magnétisme itiniérant. La transition de Mott.
Un des sujets de recherche actuel concerne les effets de l’interaction coulombienne entre
les électrons, qui a été négligée dans le traitement élementaire de la section précédente. En
23
Fig. 1.11 – i) bande pleine (isolant ou semiconducteur),ii) deux bandes partiellement remplie
(semi-métal),iii) bande partiellement remplie (métal)
effet, on ne peut plus traiter les particules une par une, car elles seront toutes couplées par
ces interaction s. Il n’existe pas de méthode générale pour ce problème à N corps, mais
il existe des techniques approximatives. Dans un certain nombre de cas simples, on peut
introduire des termes correctifs dans l’hamiltonien pour prendre en compte ces interaction s
de façon approximative. On peut utiliser la théorie des perturbations, des théories de champ
moyen, la méthode du groupe de renormalisation, etc. Ces méthodes marchent souvent assez
bien à d = 3, moins bien en d = 2. Pour d = 1, dans les fils quantiques, il faut recourir à des
modèles beaucoup plus sophistiqués pour décrire la physique des électrons en interaction .
Dans cette section, nous allons découvrir quelques phénomènes physiques intéressants dûs
à l’interaction coulombienne, avec des explications qualitatives.
Le ferromagnétisme intinérant
Une analyse simple permet de voir que l’interaction répulsive entre électrons favorise un
alignement de leurs spins dans un état ferromagnétique. Rappelons que en l’absence de ces
interaction s, l’état fondamental du gaz d’électrons correspond à une valeur totale de spin
nulle : car les états de spin ± 21 sont occupés de manière identique. Les électrons sont libres
de parcourir tout le volume disponible, et de ce fait, deux électrons se retrouveront de temps
en temps dans la même région de l’espace. Ce genre de rencontre devient défavorable au
fur et à mesure que l’on “branche” l’interaction coulombienne entre les électrons, qui commencent à se demander comment ils peuvent faire pour s’éviter. Une solution est suggerée
par le principe de Pauli : avoir la même direction de spin car dans la valse des électrons,
deux électrons de spins parallèles s’évitent automatiquement. Mais si l’on retournait tous
les spins, cela coûterait trop d’énergie - il faut aller deux fois plus loin dans l’espace des k
(et augmenter sensiblement l’énergie de Fermi) pour caser tous les électrons. Un compromis
est alors trouvé par le système. Un modèle d’interactions simple a été introduit par Hubbard, qui a remplacé l’interaction habituelle entre deux électrons séparés d’une distance r,
24
e2 /(4π²0 r2 ), par une forme schématique : U si les électrons sont très proches, et 0 sinon. On
peut montrer alors qu’à partir d’une certaine valeur critique Uc , le gaz d’électrons choisit un
état avec une majorité de spins parallèles, de sorte que le moment magnétique total n’est
plus nul. Il s’agit d’une transition de phase d’un état paramagnétique, c.a.d. ayant M = 0
en l’absence d’un champ magnétique extérieur, à un état ferromagnétique (transition de
Stoner). Le mot “itinérant” signifie que les électrons restent délocalisés dans le nouvel état,
contrairement à ce qui se passe dans la transition de Mott décrite ci-dessous.
L’isolant de Mott
Le ferromagnétisme itinérant n’est pas la seule solution au problème de minimisation
de rencontres entre électrons. Une deuxième possibilité est de localiser les électrons, et
créer un réseau d’électrons (cristal de Wigner). Il y a un prix à payer en énergie, car un
électron délocalisé a une énergie plus basse qu’un électron contraint de rester à un endroit
précis. Toutefois, chaque électron tente de minimiser son énergie en s’arrangeant d’avoir des
voisins de spin antiparallèles, de façon à pouvoir faire des sauts locaux. Cela donne un état
antiferromagnétique, et bien sur, le système est un isolant.
1.4.2
interaction électron-phonon. La supraconductivité.
La théorie de Bardeen, Schrieffer et Cooper proposée dans une série d’articles a permis
d’expliquer un phénomène découvert dès 1911 lorsque Kamerlingh-Onnes à trouvé que la
résistance de mercure devenait nulle à 4.2K (voir la figure). BCS ont eu le prix Nobel en
1972. Dans cette théorie, la supraconductivité est possible grâce à la formation de paires
d’électrons. Les électrons près du niveau de Fermi se regroupent deux par deux, chaque
électron de vecteur d’onde ~k s’appariant avec celui de spin opposé de l’état −~k, de manière
à former une entité de spin total S = 0. Ces paires, appelées des paires de Cooper, sont des
bosons, c’est à dire des particules quantiques de nature fondamentalement différentes des
électrons.
Les phonons jouent un rôle primordial dans la formation de paires, pour toute une classe
de supraconducteurs, appelés des supraconducteurs conventionnels (en contraste avec le supraconducteurs à “haute température critique” découverts en 1986). Un phonon, comme
nous allons découvrir en un peu plus de détail dans le chapitre 2, est un mode de vibration
des noyaux. Cooper a montré que pour certains cas, les vibrations du réseau peuvent créer
une faible attraction entre paires d’électrons. Le potentiel attractif entre paires d’électrons
dépend de l’importance de l’interaction électron-phonon. Dans le modèle simplifié de BCS,
on introduit un paramètre V qui représente le couplage, et les calculs donneront une
température de transition Tc entre la phase “normal” et la phase “supra” en fonction de V .
Un des tests de la théorie BCS est de faire des expériences pour voir si Tc varie de façon
attendue lorsque le paramètre V change - ce que l’on peut faire dans la pratique en substituant des atomes par des isotopes. La figure montre la dépendance de Tc dans le mercure
en fonction de la masse de l’isotope.
Contrairement aux fermions, les bosons ont tendance à se rapprocher, et à une température
suffisamment basse, il peut se produire une condensation de bosons. C’est ce qui se passe
pour les paires de Cooper à la température critique, Tc . Le condensat possède des propriétés nouvelles qui découlent du fait qu’il est un objet quantique macroscopique. L’état
supraconducteur est décrit par une fonction d’onde Ψ(~x) que l’on peut factoriser en une
amplitude |Ψ(~x)| et un facteur de phase eiΛ . La phase Λ est une propriété de l’ensemble
25
de paires de Cooper, et elle est conservée (on parle alors de cohérence macroscopique). On
peut ensuite déduire les propriétés telles que la résistance nulle, et la possibilité d’avoir un
courant perpétuel.
1.4.3
Effets du désordre et/ou apériodicité.
Jusqu’ici nous avons considéré que l’ordre périodique était parfait. En d’autres termes,
la longueur de cohérence ξ de la structure est infinie, où ξ correspond à la distance à partir
de laquelle, on ne peut plus écrire avec précision les positions des atomes. Dans la pratique
on déduit ξ −1 des clichés de diffraction des rayons-X du cristal - plus les pics de diffusion
sont hauts et fins, plus ξ est grande. Pour un cristal de bonne qualité, ξ peut être très
grande à basse température (de l’ordre du cm, ce qui correspond à un alignement parfait de
quelques millions d’atomes). Par contre, dans un cristal de mauvaise qualité, ou un alliage,
où les atomes occupent des sites dans un ordre aléatoire, ξ sera petite. De façon générale
il est clair que tous les matériaux sont plus ou moins désordonnés. La théorie des systèmes
désordonnés est plus beaucoup plus récente que celle de la section II, et tous les résultats
ne sont pas complètement compris. Toutefois, il y a un consensus sur le fait que les états
de Bloch d’un cristal parfait disparaissent lorsque le désordre dépasse une valeur critique.
Les états à un électron dans un milieu très désordonné sont localisés. Anderson a présenté
un modèle simple d’un métal désordonné où l’on peut démontrer qu’il y aura une transition intéressante en d > 2 – la transition métal-isolant – quand le désordre augmente. Le
conducteur, avec les états étendus devient subitement un isolant, avec des états localisés.
Pour d = 1 les états sont toujours localisés (dès que l’on a un désordre aussi petit qu’il
soit) tandis que le cas de d = 2 est un cas limite. Les analyses sont encore plus compliquées
lorsque l’on cherche à inclure les interaction s entre électrons. L’étude expérimentales de
cette transition et les calculs théoriques continuent d’être des sujets actifs de recherche.
Les quasicristaux sont un exemple de système où l’on n’a pas de périodicité, mais où la
longueur de cohérence reste très élevée. On peut, en effet, prédire avec certitude la position
des atomes, selon des régles plus compliquées que celles d’un cristal. La figure montre un
exemple de structure quasipériodique. Il n’existe pas pour le moment de modèle théorique
pour ces matériaux. Il est cependant clair qu’ils ne seront pas des bons conducteurs et que
les fonctions d’onde des électrons ne seront pas des paquets d’onde de la forme de Bloch,
mais seront-ils des isolants, ou des semiconducteurs, ou encore autre chose d’intermédiaire ?
La réponse devra venir des calculs avec des techniques nouvelles adaptées à ce cas.
Chapitre 2
Propriétés thermiques et
acoustiques
Du point de vue macroscopique, la distinction entre un solide et un liquide n’est pas
toujours évidente. On sait qu’un solide est rigide, et garde sa forme, tandis qu’un liquide
coule, et s’adapte à la forme de son conteneur. Mais il y a des situations où l’on a du
mal à distinguer le solide du liquide : comment définir, par exemple, la température de
gel entre la phase liquide et la phase solide dans un verre ? Nous ne rentrerons pas dans
des discussions sur ces systèmes-là, et nous nous restreindrons aux solides cristallins, où les
positions moyennes des atomes sont fixes et déterminées par des règles simples. Dans ce
chapitre nous allons examiner des propriétés résultant des mouvements des atomes autour
de leur position moyenne. L’ordre périodique n’est, en effet, jamais strictement respecté car
les atomes ne sont pas immobiles, et peuvent se déplacer de leurs positions d’équilibre à une
température finie, par suite des fluctuations thermiques. Même à T = 0 ‘a cause du principe
d’incertitude de Heisenberg, on ne peut pas considérer que les atomes soient localisés aux
positions fixes - il reste toujours des fluctuations d’origine quantique (appelées “zero point
motion” en anglais). Un solide restera un solide tant que l’amplitude de ces mouvements
reste bornée, et la transition solide-liquide aura lieu quand ce n’est plus le cas.
Une façon de caractériser cette propriété de rigidité du solide est en termes de ses
constantes élastiques. Celles-ci expriment la force exercée par un solide lorsque l’on tente
de le déformer. En supposant un régime linéaire, un solide comprimé se comportera comme
un ressort dont la force de rappel est égale à une constante de raideur multiplié par le
changement de longueur. Le solide a aussi une résistance aux forces de cisaillement (comme
celles exercées sur la gomme lorsqu’on l’utilise pour effacer). La constante élastique décrivant
la réponse du solide à une force de cisaillement devient nulle à la transition solide-liquide :
dans un liquide les atomes ne subissent plus une force de rappel élastique. Dans ce chapitre,
nous verrons que ces propriétés élastiques du solide permettent la propagation des ondes
dans le cristal. On verra qu’il est possible de propager des ondes longitudinales et des ondes
tranverses dans un solide (tandis dans les liquides et des gaz dans lesquels il ne peut pas y
avoir des ondes transverses). On verra comment le son, qui est une onde longitudinale, peut
se propager dans un solide à une vitesse beaucoup plus élevée que dans les liquides et gaz
(voir le tableau ci-dessous).
Les vibrations atomiques, ou “phonons”, jouent un rôle important pour les propriétés
thermiques des solides. Dans ce chapitre, quelques notions de base seront introduites en
considérant un modèle simple de vibrations atomiques dans une chaı̂ne d’atomes. La théorie
26
27
classique sera présentée, et ensuite sa version quantique. La généralisation à trois dimensions
sera rapidement expliquée. Quelques applications physiques de ce modèle seront ensuite
présentées. La dernière section donne une liste non-exhaustive d’interactions possibles entre
les phonons et d’autres excitations élementaires dans le solide.
milieu (25◦ C)
air
eau
glycerol
Cu
Fe
C (diamant)
caoutchouc
c (ms−1 )
343
1493
1904
3560
5130
12000
1600
Tableau 1. Quelques valeurs de la vitesse du son dans des milieux divers : gaz, liquides et solides
2.1
Modèle classique de vibrations
Fig. 2.1 – Onde longitudinale se propageant dans un barreau solide.
La figure ci-dessus montre un barreau solide dans lequel se propage une onde longitudinale de compression et dilatation. On peut exciter des ondes de ce type en tapant avec un
marteau sur une des extrémités du barreau. Comme nous allons voir dans cette section, la
vitesse de propagation d’une telle onde dépend des constantes élastiques du matériau. Nous
commencerons la discussion par un modèle unidimensionnel simple qui permet d’étudier la
propagation des ondes dans un milieu cristallin.
2.1.1
Chaı̂ne périodique de N atomes identiques
On considère donc une chaı̂ne d’atomes avec, au repos , une distance entre atomes a. A
l’équilibre, les positions des atomes sont donc données par na (n = 0, 1, ..., N − 1). C’est la
configuration qui minimise l’énergie potentielle totale des atomes. Lorsque la température
T > 0, les atomes peuvent se déplacer, au prix d’une augmentation de leur énergie potentielle. On cherche à établir l’équation du mouvement des atomes. Considérons d’abord une
paire d’atomes proches voisins. Nous appelons un et un+1 les déplacements du nième atome
28
et de son voisin par rapport à leurs positions d’équilibre. La distance entre les deux est
changée de un+1 − un . En supposant que l’énergie potentielle a une forme de puits harmonique (ce qui est généralement le cas pour des déplacements très petits), on peut en déduire
une force de rappel F = K(un+1 − un ). La “constante de raideur” K, qui est la dérivée
seconde de l’énergie potentielle, a une valeur plus ou moins importante selon la composition
chimique, la structure du composé, etc.
Fig. 2.2 – Chaı̂ne d’atomes identiques de masse m
L’équation de mouvement du nième atome sera (en tenant compte des mouvements de
ses deux voisins) :
m
d2 ui
dt2
= −K[(ui − ui−1 ) + (ui − ui+1 )]
(2.1)
= K[ui+1 + ui−1 − 2ui ]
où m est la masse d’un atome. L’équation 2.2 est une version discrète de l’équation des
ondes ( d’Alembert : ∂ 2 u/∂t2 = c2 ∂ 2 u/∂x2 ). On peut donc écrire des solutions de la forme
un (t) = A Re
ei(kna−ωk t) = A cos(kna − ωk t)
(2.2)
(Re : partie réelle), où A est l’amplitude de l’onde, k le vecteur d’onde (k = 2π/λ, où λ est la
longueur d’onde, et ωk est la pulsation de l’onde. Les valeurs de k permises sont déterminées
à partir des conditions aux limites. Pour une chaı̂ne de longueur L = N a répétée de façon
périodique, on doit avoir un+N = un , ce qui donne
kn =
2nπ
, n = 0, ±1, ....,
L
(2.3)
Etant donné la périodicité de la solution 2.2, il y a exactement N solutions distinctes
possibles, c’est-à-dire, autant de valeurs distinctes de kn que d’atomes. Noter aussi que
lorsque N → ∞, k devient une variable continue dans l’intervalle [− πa , πa ) - la “première
zone de Brillouin”.
On peut déterminer la valeur de ωk en substituant la forme 2.2 dans l’éq.2.2, et l’on
trouve
r
K
ω(k) =
(2 − 2 cos(kn a))
(2.4)
m
r
1
K
=2
| sin( kn a)|
m
2
29
La courbe de ω en fonction k (la relation de dispersion) est montrée dans la Fig.2.3. Pour
k petit, on peut approcher la courbe par une droite, et alors on a ω ≈ ck, comme pour les
ondes sonores habituelles. Il s’agit ici, en effet, d’une onde acoustique de même type que
celle qui se propage dans l’air. La vitesse du son, qui a une valeur d’environ 343 m/s dans
l’air, est ici donnée par la relation
r
K
c=a
(2.5)
m
La vitesse c est beaucoup plus élevée dans le solide, car les forces de rappel entre les atomes
sont beaucoup plus importantes que celles entre les molécules de l’atmosphère (penser aux
ondes sur une corde tendue, et à leur vitesse en fonction de la force de tension).
Pour des valeurs de k plus grandes, il faut utiliser l’expression complète de ω(k) de l’éq.2.5.
Lorsque la fréquence est, comme ici, une fonction nonlinéaire de k, la vitesse c des ondes
dépend de k. On parle alors de la vitesse de phase, vph = ω/k et la vitesse de groupe,
vg (k) = dω/dk. La pente de la courbe ω(k) n’est autre que la vitesse de groupe, et celle-ci
décroı̂t progressivement lorsque k augmente, devenant nulle au bord de la zone de Brillouin.
C’est l’analogue de ce qui se passe avec les électrons près du bord de la zone de Brillouin.
Fig. 2.3 – Relation de dispersion pour la chaı̂ne d’atomes
Q1 : On peut “faire chanter” un long barreau d’acier en l’attachant à son milieu, et en frottant avec
un tissu. Le son émis peut être capté avec un microphone. Sachant que la vitesse du son dans l’acier
est c = 0.59cm/µs, et pour une longueur d’onde dans le mode fondamental de 2L où L = 0.75m,
quelle est la valeur de la fréquence correspondante ? Refaites le calcul pour un barreau de fer de la
même longueur et pour lequel c = 0.48cm/µs. Est-ce que l’on pourrait entendre la différence entre
les deux matériaux ?
2.1.2
Le mouvement des atomes en fonction de k. Périodicité de ω.
Il est important de souligner que le vecteur d’onde n’est défini, dans le cristal, qu’au
vecteur g = 2π/a près. Il est facile de vérifier que les déplacements des atomes dues à une
onde de vecteur d’onde k et celle de k + g sont identiques. L’énergie de ces deux ondes est
bien sur la même - autrement dit, ω(k) est une fonction périodique dans l’espace des k.
~
(Ce résultat est également vrai pour des systèmes de dimension d > 1, avec des vecteurs G
du réseau réciproque à la place de g. Nous parlerons ainsi plus loin des processus appellés
30
des collisions “umklapp”, où l’onde ~k échange une quantité de mouvement avec le réseau et
~
devient l’onde finale ~k + G).
Pour les longueurs d’onde très grandes (k petit), il y aura une lente variation des
déplacements un et peu de variation entre proches voisins. La distance entre voisins est
très proche de la valeur a. Dans la limite k → 0 les “ressorts” entre atomes ne sont pas
déformés, ce qui explique le fait que la fréquence ω tend vers 0 dans cette limite.
Dans l’autre limite de k = π/a, la longueur d’onde est 2a, et chaque atome est en
opposition de phase avec ses proches voisins. Ceci veut dire que les ressorts sont alternativement comprimés et étendus tout le long de la chaı̂ne d’atomes. Un tel mouvement
q coûte
évidemment beaucoup plus d’énergie, et la fréquence prend sa valeur maximale, 2 K
m . De
plus, il y a un mélangé des ondes de vecteur d’onde k = πa avec l’onde de k − g = − πa , d’où
la formation d’onde stationnaire comme pour les électrons du chapitre 1.
2.1.3
Les vibrations dans les cristaux de dimension 2 et 3
On peut étendre les idées précédentes aux réseaux de plusieurs dimensions, même si le
modèle devient assez complexe pour d = 3. Pour résumer les résultats principaux : on trouve,
comme dans le modèle unidimensionnel, dN modes différentes de la vibration atomique.
Chaque mode est décrit par un vecteur d’onde ~k, avec une fréquence ω(~k) correspondante.
Ces fréquences seront des fonctions des constantes élastiques du matériau (voir la section
suivante).
Valeurs distinctes de k A une dimension, rappelons que les valeurs de k pour une chaı̂ne
périodique de N atomes sont espacées de δk = N2πa et k ∈ [− πa , πa ]. Dans le cas d’un réseau
carré (d=2) ou réseau cubique (d=3), de façon analogue, les vecteurs d’ondes ont des valeurs
discrètes espacées de N2πa selon chaque direction, où a est la distance entre proches voisins.
Si l’on appelle WB le volume qui correspond à la première zone de Brillouin,
~k ∈ WB
(2.6)
Pour le cas d=3 WB est un cube de coté 2π/a. Il n’est pas difficile de voir que le nombre
de valeurs distinctes de ~k est, comme à une dimension, égal au nombre d’atomes
X
1=N
(2.7)
~k
Dans la limite N → ∞, on peut remplacer la somme par une intégrale
Z
X
=V
dd kρ(~k)
~k
(2.8)
WB
où V = Ld est le volume du cristal et la densité d’états ρ(~k) = (1/2π)d a été introduite
dans Ch.1.
Plusieurs valeurs de ω pour chaque valeur de ~k Pour d = 3 (et pour un cristal ayant
un atome par maille), il y aura trois modes de vibrations pour chaque valeur de ~k. On peut
les écrire ωµ (~k), µ = 1, .., 3. Pour une direction de propagation le long d’un des axes du
cube, par exemple, on a trois polarisations possibles de l’onde : une longitudinale (tous les
atomes se déplacent parallèle à la direction de propagation) et deux tranverses (c.a.d. des
mouvements sont dans le plan perpendiculaire à la direction de propagation). Au totale, on
a donc bien 3N modes comme indiqué précédemment.
31
Comportement de ω pour k petit Pour des grandes longueurs d’onde (|~k| petit), il y
aura 3 ondes acoustiques de polarisations différentes, et ayant des vitesses différentes. Dans
le cas le plus simple d’un cristal cubique, et lorsque l’onde se propage selon un des axes de
symétrie, on peut écrire des relations linéaires approchées suivantes
ωl (~k) = cl k;
ωt (~k) = ct k
(2.9)
où k est la valeur absolue du vecteur d’onde, et l et t indique la direction de polarisation de
l’onde. (Nb. Il y a un mode l de vitesse cl et deux modes t, de la même vitesse, ct ). Quelques
valeurs des vitesses correspondantes sont données dans le tableau.
métal
Al
acier
ρ(g/cm3 )
2.7
7.9
cl (m/s)
6420
5790
ct (m/s)
3040
3100
Tableau 2. Exemples des vitesses acoustiques dans des métaux
Expression des vitesses du son en fonction des constantes élastiques La théorie de
vibrations harmoniques dans un cristal à trois dimensions ne sera pas abordée en détail ici,
nous nous contenterons de présenter quelques idées simples. La complexité des mouvements
peut s’exprimer du simple fait qu’il faut un grand nombre de constantes élastiques pour
caractériser les forces de rappel dans un cristal dans trois dimensions : jusqu’à 21 constantes
différentes au lieu d’une seule en d = 1 ! Pour un cristal cubique, toutefois, les symétries
permettent de réduire ce nombre à seulement 3, appelées C11 , C12 et C44 . La première, C11
(aussi appelée module de Young), donne la déformation du solide lorsqu’il est comprimé. Elle
peut être obtenue dans une expérience où l’on comprime un barreau solide en appliquant
une force de compression uniaxiale, à partir de la relation
P = C11
∆L
L
(2.10)
où P est la pression, L la longueur initiale et ∆L le retrécissement. Il doit être évident
que C11 est l’analogue de la quantité K introduite pour la chaı̂ne d’atomes. C44 décrit
par exemple la déformation suite à un cisaillement du solide. C12 décrit le changement de
longueur dans une direction perpendiculaire à l’axe de compression. Le solide se distingue
ainsi du liquide ou du gaz qui, eux, sont caractérisés par une compressibilité (la résistance
du fluide à un changement de volume).
On considère le cas d’une direction de propagation le long d’une des axes du cristal
cubique. La vitesse de l’onde “longitudinale” cl est donnée par
s
C11
cl =
(2.11)
ρ
q
où ρ est la masse volumique. La vitesse des deux ondes tranverses est donnée par ct = Cρ44
. Dans la plupart des matériaux, en supposant des forces centrales, la constante C11 aura la
valeur la plus grande de toutes les constantes élastiques et une des conséquences en est que
vl est typiquement environ deux fois plus grande que vt . Notons qu’il n y a pas d’équivalent
de l’onde transverse dans un fluide.
Q2 : Les valeurs des constantes élastiques pour trois cristaux cubiques sont données dans le tableau
ci-dessous (les unités des C sont en 107 N cm−2 )
32
métal
Na
Cu
C11
0.07
1.68
C12
0.06
1.21
C44
0.045
0.75
Tableau 2. Deux métaux et leurs constantes élastiques
Pour lequel des deux métaux dans le tableau la propagation d’une onde de compression sera-t-elle
la plus rapide ? On donne ρN a = 0.97g/cm3 , ρCu = 8.96g/cm3 .
Q3 : On mesure c = 0.589cm/µs dans un barreau d’acier et c = 0.480cm/µs dans un barreau de fer.
Leurs masses volumiques sont proches. Lequel des deux matériaux choisiriez-vous pour construire
un pont ? (raisonner à partir du modèle qui vient d’être présenté)
2.1.4
Modes optiques. Chaı̂ne à deux constantes de couplage.
Fig. 2.4 – Une chaı̂ne avec deux atomes par maille
Les solides ne sont pas tous, évidemment, constitués d’une seule espèce d’atomes comme
nous l’avons supposé dans notre modèle de vibrations. Un composé tel que N aCl (sel de
table) a une structure de deux atomes par maille élementaire, chaque atome de N a est
accompagné de son voisin Cl situé à une distance a/2, par exemple. On verra que cette fois,
les mouvements atomiques rendent possible des nouveaux phénomènes comme l’émission de
photons, et de la lumière (d’où le nom de phonon optique). Lorsqu’il y a deux (ou plusieurs)
atomes par maille, comme dans la chaı̂ne dans la fig.2.4, on a la possibilité d’avoir, en plus
de l’onde acoustique décrite ci-dessus, des modes de vibration appelés “optiques”. Pour
comprendre mieux de quoi il s’agit, prenons un modèle simple d’un cristal à une dimension
composé de deux types d’atomes.
On prend une chaı̂ne de 2N atomes, dont N de type “A” et N de type “B”. Le pas du
réseau, a, est donné par la distance entre deux atomes “A”. On peut avoir une situation où
les forces de rappel sont différentes, et alternent entre deux valeurs K1 et K2 (ce qui peut
se produire lorsque les distances entre l’atome A et ses voisins de gauche et de droite ne
sont pas identiques). Dans ce cas on a une série d’équations couplées, comme pour la chaı̂ne
simple : on note xi le déplacement de la position d’équilibre d’un atome A, et yi celui de
33
l’atome B à sa droite, et l’on a
d2 xi
dt2
d 2 yi
m 2
dt
m
= −[K1 (xi − yi−1 ) + K2 (xi − yi )]
(2.12)
= −[K2 (yi − xi ) + K1 (yi − xi+1 )]
(2.13)
On cherche des solutions ondes planes de la forme ( partie réelle implicite)
xn (t) = αei(kna−ωt)
(2.14)
i(kna−ωt)
(2.15)
yn (t) = βe
Substituant dans l’éq.2.13, on trouve deux équations que l’on peut mettre sous la forme
µ
¶µ
¶
mω 2 − (K1 + K2 )
K1 + K2 eika
α
=0
(2.16)
β
K1 + K2 e−ika mω 2 − (K1 + K2 )
Pourqu’il y ait des solutions non-triviales de cette équation, il faut que le déterminant de
la matrice soit nul. On a ainsi le résultat suivant pour les fréquences ω,
p
K12 + K22 + 2K1 K2 cos(ka)
K1 + K2
ω± (k) =
±
(2.17)
m
m
Il est facile de vérifier que, pour petit k, ω− ≈ ck où c est la vitesse du son. C’est la fréquence
associée au mode dit acoustique car c’est l’équivalent de l’onde sonore dans le solide. La
deuxième solution ω+ reste élevée même lorsque k → 0 (voir la figure).
Quelles sont les vibrations atomiques correspondantes ? La solution complète de l’éq.2.16
pour k = 0 donne aussi α = ±β pour les amplitudes de l’onde sur les atomes A et B. Dans le
cas de l’onde acoustique, les deux atomes dans chaque maille ont un mouvement en phase.
Cela ne coûte évidemment rien en ce qui concerne l’énergie potentielle du ressort entre les
deux atomes, d’où une fréquence nulle pour ce genre de vibration. Dans le cas de l’onde
“optique”, au contraire, les phases sont en opposition, et la fréquence ω+ est la moyenne
géométrique des deux constantes de couplage. Tout au long de la chaı̂ne, des paires d’atomes
effectuent exactement le même mouvement.
Lorsque A et B sont des noyaux de charges opposées, la paire de charges oscillant en
opposition de phase agit comme un dipole électrique, qui est un capteur/émetteur d’ondes
électromagnétiques à la manière d’une antenne miniature. Dans certains matériaux, ω+
correspond à une fréquence des ondes visibles (ou plutôt infrarouges), d’où le nom de ce
mode de vibration.
34
Fig. 2.5 – Relation de dispersion pour la chaı̂ne de deux atomes par maille
2.2
Le passage vers une description quantique. Les phonons.
A T > 0, le mouvement des atomes est le résultant des différents modes de vibration
qui sont excités, correspondant à des longueurs d’onde et fréquences différentes, Dans la
théorie harmonique, valable à basse température, ces ondes se propagent indépendamment
les unes des autres. Dans ce cas, on peut retrouver les équations du mouvement de l’éq.2.2
à partir de hamiltoniens de N oscillateurs harmoniques indépendants. La chaleur spécifique
par atome d’un tel ensemble d’oscillateurs classiques est indépendente de la température,
cV (T ) = 3kB (loi de Dulong-Petit). Or, les mesures expérimentales montrent que la chaleur
spécifique croı̂t en fonction de T (voir figure). Einstein et Debye ont contribué à la résolution
de ce problème en considérant des modèles quantiques du mouvement des atomes.
La description quantique de chacun de ces oscillateurs est un problème bien connu dans
les cours de mécanique quantique, et nous allons supposer que les notions de base vous
sont déjà familières. Rappelons donc que dans le modèle quantique d’un oscillateur à une
dimension de fréquence ω l’énergie prend des valeurs discrètes, ~ω(n + 12 ). n = 0, 1, ... est le
nombre quantique qui sert à repérer les états propres du système |ni. On peut généraliser
ce résultat au cas d’un grand nombre d’oscillateurs. Dans le calcul quantique pour la chaı̂ne
d’atomes, l’énergie totale sera la somme des énergies de N oscillateurs harmoniques, et
H=
X
1
~ωk (nk + )
2
(2.18)
où nk est la valeur moyenne du nombre quantique du mode k, nk = 0, 1, 2, .... L’état fondamental correspond à nk = 0 pour tous les modes. On voit que l’énergie de cet état n’est
pas nulle - c’est une conséquence, comme nous avons déjà remarqué, du principe d’incertitude de Heisenberg, selon lequel on ne peut pas trouver un atome dans un état où x et p
35
s’annulent simultanément. En conséquence, les atomes n’arretent jamais de bouger même à
température nulle.
2.2.1
Température T 6= 0. La distribution de Planck
Quand la température est très basse, seuls les états de ~ωk petite seront excités, comme
on verra ci-dessous. Au fur et à mesure que T augmente, le nombre de phonons excités,
nk , dans chaque mode augmentera, et des modes d’énergie de plus en plus grande seront
présents.
On peut calculer la valeur moyenne thermique de nk en utilisant des méthodes bien
connues de la physique statistique. Notons que les phonons sont des bosons, et que leur
nombre n’est pas conservé. La nombre moyen de phonons de vecteur d’onde k est donnée
comme pour les photons, par la fonction de distribution de Planck (on passe à une notation
continue pour k),
hn(k)i =
1
.
e~βω(k) − 1
(2.19)
Quand la température est très basse, et ~βω(k) >> 1, il y aura peu de phonons de fréquence
ω(k) excités dans le cristal, car
hn(k)i ≈ e−~βω(k) << 1
(2.20)
Quand la température est très grande devant l’énergie des phonons, de sorte que ~βω(k) <<
1 on excite au contraire beaucoup de phonons
hn(k)i ≈
1
>> 1
~βω(k)
(2.21)
Enfin, notons une proportionnalité entre l’énergie et le nombre pour des températures
élevées, lorsque hn(k)i est grand,
1
E(k, T ) = ~ω(k)(hn(k)i + ) ≈ ~ω(k)hn(k)i
2
(2.22)
Dans l’image classique, l’énergie d’un oscillateur est proportionnelle à l’amplitude carrée
du mouvement. On s’attend à ce que l’amplitude carrée des mouvements atomiques soit
proportionnelle à n(k) et qu’elle va donc croı̂tre en fonction de T. Toutefois, à haute
température, il ne faut pas prendre notre modèle trop au sérieux - il n’est applicable que
pour des mouvements petits devant la séparation entre atomes. Quand la température est
très élevée, ces mouvements deviennent de plus en plus importants, jusqu’à ce que le cristal
fonde.
Q4. D’où vient, d’après vous, le nom de “phonon” pour parler des modes de vibration du réseau ?
(Dans la physique, celle du solide en particulière, on une prolifération d’objets quantiques de noms
exotiques : on y rencontre des plasmons, des polarons, des rotons, des spinons, excitons,....)
2.3
Propriétés thermiques des cristaux. Modèle de Debye.
Dans cette section, nous allons présenter le modèle de Debye (1936) pour la chaleur
spécifique des cristaux. Nous avons vu que, dans le cadre d’un modèle simple de forces
36
de rappel linéaires, les atomes peuvent se déplacer de façon collective, dans des modes de
vibration indépendants, chacun caractérisé par une valeur du vecteur d’onde ~k, un indice
de polarisation µ = 1, 3 et la fréquence ωµ (~k). Dans la théorie quantique, l’hamiltonien est
la somme sur tous les hamiltoniens de ces oscillateurs harmoniques indépendants
H=
XX
µ
~k
1
~ωµ (~k)(n̂µ (~k) + )
2
(2.23)
Le nombre moyen de phonons d’un mode (~k, µ) donné est donné par la distribution de
Planck
nµ (~k) =
1
eβ~ωµ (~k) − 1
(2.24)
(où β = 1/kB T )
L’énergie interne est la valeur moyenne thermique de H,
hHi =
XX
µ
~k
1
~ωµ (~k)h(n̂µ (~k) + )i
2
(2.25)
= E(T ) + E0
et la chaleur spécifique est cV (T ) = N −1 ∂E/∂T .
Le modèle de Debye dans sa version la plus simple consiste à simplifier encore ces
expressions en posant
ωµ (~k) = ĉk
(0 < k < kD )
(2.26)
où ĉ est la vitesse du son “moyenne” pour toutes les directions de l’espace (la définition
précise ne nous concernera pas ici), et où l’on a pris des vecteurs d’onde à l’intérieur d’une
sphère de rayon kD au lieu de les prendre dans la première zone de Brillouin. Le rayon de
la sphère est déterminé en demandant que la sphère ait le même volume que la première
zone de Brillouin. Cela donne pour le cristal cubique simple
4π 3
2π
kD = ( )3
3
a
2 1/3
kD = (6π ) a
(2.27)
On s’attend à ce que les approximations faites ci-dessus marchent bien, d’une part, quand
T est très basse, car alors seuls les phonons de basses énergies seront présents, pour lesquels 1) la relation de dispersion est effectivement linéaire, et 2) le changement de la
région d’intégration n’a aucune incidence. A l’autre extrême, à des valeurs de T très
élevées le modèle de Debye donnera les bons rśultats car alors la chaleur spécifique devient
indépendante de T quelque soit la relation de dispersion, du moment où l’on a conservé le
nombre totale de modes (3N ). Entre les deux limites, on peut effectivement constater des
déviations des prédictions du modèle de Debye.
Dans le modèle, on a la fréquence maximale caractéristique du solide, appellée fréquence
de Debye, ωD = ĉkD . On définit également une température de Debye TD = ~ωD /kB . Ces
quantitiés varient selon la substance considérée. Quelques valeurs de TD sont données dans
le tableau, ainsi que les températures de fusion Tm (on peut constater une corrélation entre
ces deux : plus TD est grande, plus la température de fusion est élevée).
37
Q5 : Calculer le vecteur d’onde de Debye, la fréquence maximale ωD , et la température de Debye
TD pour un cristal cubique simple ayant a = 2.5A, et dans lequel la vitesse de son est ĉ = 5000m/s.
Comparer avec la valeur de TF pour ce cristal en supposant que chaque atome libère un électron.
Q6 : Comparer les expressions de kD et kF pour un cristal cubique simple contenant N atomes
de valence Z dans un volume V . Pour Z = 1 est-ce que les deux vecteurs d’onde ont des valeurs
proches ?
métal
Li
Na
Al
C (dia.)
TD
700 K
150 K
394 K
1860 K
Tm
453 K
371 K
933 K
4300 K
Tableau 4. Quelques valeurs typiques de TD et la température de fusion Tm
Propriétés thermiques à des températures très élevées
Lorsque T >> TD , il n’est pas nécessaire de recourir à l’approximation de Debye, car le
nombre de photons est ≈ kB T /~ω pour tous les modes, et l’éq.2.26 devient
E(T ) = 3
X
~k
kB T
= 3N kB T
~ω(~k) ×
~ω(~k)
(2.28)
La chaleur spécifique est donc cV (T ) = 3kB , comme pour un gaz classique (résultat de
Dulong et Petit).
Températures très basses
Revenant à l’expression de l’énergie interne, on a
E(T ) = 3
V
=3
(2π)3
Z
X
~
Zk
~ω(~k)
1
eβ~ω − 1
(2.29)
1
dΩ~ck β~ck
e
−1
Z
3
3V c
k
=
dk β~ck
2
2π
e
−1
3V c 1
I ∝ T4
=
2π 2 (β~c)4
k 2 dk
où l’on a d’abord substitué la somme par une intégrale sur le rayon k et l’angle solide Ω et
dans la dernière ligne, on a éffectué un changement de variables en termes d’une nouvelle
variable sans dimensions x = ~βck. L’intégrale I,
Z xD
x3
I=
dx x
(2.30)
e −1
0
sera donc aussi sans dimension, et doit être calculée numériquement pour une valeur de
température donnée. Toutefois, pour de basses valeurs de T , la limite supérieure, xD =
38
β~ckD → ∞, et I approche rapidement sa valeur asymptotique de π 4 /15. La chaleur
spécifique est
cV (T ) =
1 ∂U
12π 4 T 3
=
(
) kB
N ∂T
15 TD
(2.31)
On a le comportement de CV en T 3 dû aux vibrations du solide auquel on a déjà fait
allusion dans le chapitre 1. La chaleur spécifique, puisque dépendant du rapport TTD sera
évidemment faible pour des températures petites devant TD . La théorie de Debye a ainsi pu
expliquer les observations expérimentales qui montraient un écart important par rapport
à la seule théorie qui était alors disponible, celle de Dulong et Petit. A partir des données
comme celles montrées dans la courbe de cV (T ), on peut extraire la valeur de la température
de Debye. C’est ce qui a été fait dans le tableau ci-dessous, où l’on donne donne quelques
valeurs représentatives.
Q7. Compléter les calculs qui donnent l’expression finale de la chaleur spécifique l’éq.2.31, partant
de la définition de E(T ) (dans l’éq.2.28) et de TD .
Les figures montrent la chaleur spécifique mesurée dans plusieurs matériaux, le cuivre,
l’aluminium et le diamant. On voit ( à gauche) que lorsque l’on porte cV en fonction de
T , les courbes sont toutes différentes, ce que l’on comprend facilement vu les différences de
valeur de TD de ces substances. La théorie de Debye prédit, par contre, que l’on trouvera une
seule courbe si l’on trace cV en fonction de la variable T /TD . On voit que c’est effectivement
le cas dans la figure de droite.
Fig. 2.6 – La chaleur spécifique de trois matériaux en fonction de T (gauche) ; en fonction
de T /TD (droite)
2.3.1
Comparaison des chaleurs spécifiques des électrons et des phonons
Pour une grande gamme de températures autour de la température ambiante, la chaleur
spécifique due aux électrons est une fonction linéaire de T , tandis que celle des phonons
dépend de T 3 . Pour voir laquelle des deux est plus importante, on peut considérer leur
rapport
ph
cel
V (T )/cV (T ) =
TD3
5
24π 2 TF T 2
(2.32)
où TF , la température de Fermi est typiquement dix fois plus que TD . On constate que
le rapport est grand, c.a.d. les électrons contribueront plus à la chaleur spécifique que les
39
phonons, si la température
T << T0 , tandis que pour T >> T0 , l’inverse est vrai. La
q
3
température T0 ≈ 5TD /(24π 2 TF ) est généralement très basse, ce qui veut dire que c’est
les phonons qui sont responsables de la chaleur spécifique des matériaux à température
ambiante.
Q8. Trouver la température T0 en dessous de laquelle la contribution des électrons à la chaleur
spécifique devient plus importante que celle des phonons dans le cuivre.
2.4
Quand l’approximation harmonique devient insuffisante
Nous avons mentionné le fait que, lorsque T augmente, l’amplitude des vibrations augmente. A partir d’une certaine température, l’approximation harmonique ne sera plus bonne,
et les forces de rappel seront, en général, nonlinéaires en fonction des déplacements. Il faut
alors prendre en compte des interactions anharmoniques entre atomes. Lorsque ces interactions sont petites, on peut considérer que les modes restent proches des phonons que nous
avons déjà décrits. Cependant, les phonons ne sont plus indépendants les uns des autres,
et il y a des collisions entre phonons (intéractions phonon-phonon), qui ont pour effet de
détruire le phonon au bout d’un temps τ caractéristique.
Ces interactions dues aux termes anharmoniques sont d’ailleurs essentielles pour comprendre pourquoi la conductivité thermique des matériaux n’est pas infinie. En effet, si les
phonons n’étaient jamais diffusés, la conductivité thermique serait infinie (penser au modèle
de conductivité électrique pour les électrons qui ne sont jamais diffusés). Dans la pratique,
la chaleur est transportée plus ou moins bien selon la probabilité de diffusion des phonons
par les autres phonons. Il faut aussi tenir compte les processus de diffusion des phonons par
~ (se rappeler que ~k
le réseau lui-même - le fait qu’un vecteur d’onde ~k peut devenir ~k + K
est défini à un vecteur d’onde du réseau réciproque près) où K est un multiple de 2π/a.
2.5
2.5.1
Collisions entre phonons et d’autres particules
Collisions avec des neutrons
Le neutron est utilisé très couramment dans les études de phonons. On bombarde le
cristal avec un faisceau de neutrons, dont les impulsions sont bien définies, et l’on trie les
neutrons sortant du cristal en fonction de leurs énergies et de leurs impulsions finales. Un
neutron d’impulsion p~ peut absorber ou émettre un phonon de vecteur d’onde ~k. Utilisant
les principes de conservation de quantité de mouvement et de l’énergie, on peut écrire
l’impulsion et l’énergie du neutron après la collision
~
p~0 = p~ ± ~(~k + K)
²0 = ² ± ~ω(~k)
(2.33)
où l’on a pris en compte la possibilité que le réseau puisse contribuer une l’impulsion ~K
~ K) = ω(~k)). On peut trier les neutrons sortant
(sans que cela coûte une énergie, car ω(k +
par leurs impulsions et leurs énergies, et ainsi remonter à des informations utiles sur les
phonons. Lorsque l’on ne connaı̂t pas la structure du réseau, la diffusion des neutrons
est utilisé dans la détermination de la structure – on considère uniquement des collisions
~ avec
élastiques où le neutron garde son énergie mais échange une quantité de mouvement ~K
40
~ du réseau
le réseau. En mesurant les impulsions p~ et p~0 , on peut remonter aux vecteurs K
réciproque. Une fois ces vecteurs connus, il est souvent facile d’en déduire la structure.
Q9. Que se passe-t-il quand un neutron “absorbe” un phonon - pouvez vous décrire qualitativement
l’état du cristal avant et après une telle collision ? Quelle est l’énergie en eV et la longueur d’onde
de de Broglie λ = h/p d’un neutron de vitesse 2000m/s ? (mn = 1.67 × 10−27 kg)
2.5.2
Collisions avec des photons
Les collisions entre phonons et photons sont régies par les mêmes principes de conservation d’énergie et d’impulsion que ceux énoncés ci-dessus. Il y a toutefois une différence
majeure entre les photons et les neutrons. Celle-ci provient de la grande différence des vitesses de propagation du photon et du phonon. En conséquence, pour un photon de lumière,
son vecteur d’onde est proche de zero, comparé aux valeurs de k possibles des phonons. Donc,
pour un photon incident avec impulsion ~~q et sortant après absorption d’un phonon, avec
une impulsion finale ~q~0 et sachant que
~
~q~0 = ~~q ± ~(~k + K)
(2.34)
on voit que K est obligatoirement égal à zero (pas de échange d’impulsion avec le réseau) et
que le phonon impliqué dans la collision aura une valeur de k proche de zero. On ne “verra”
ainsi que des phonons de très basse fréquence par la diffusion de la lumière.
Dans des expériences de diffusion de la lumière, on envoie un faisceau de lumière de
fréquence initiale connue, et on enregistre l’intensité de la lumière sortant en fonction de
la fréquence finale. Ce spectre de Brillouin montrera deux pics de part et d’autre du pic
central, qui correspondent aux photons après absorption/emission d’un phonon.
2.5.3
Collisions avec des électrons
Les phonons et les électrons, habitent le même espace – l’intérieur du solide – et les effets
des uns sur les autres sont diverses et variés. Le plus spectaculaire est l’état supraconducteur,
que l’on discutera plus tard (chapitre 3). Les deux particules ne sont pas sur un pied
d’égalité car un électron a une énergie beaucoup plus élevée qu’un phonon, pour des vecteurs
d’onde comparables. Toutefois, les phonons jouent un rôle important dans les propriétés
électroniques des solides.
(Les semiconducteurs sont des matériaux où les interactions entre électrons, photons et
phonons peuvent donner lieu à des propriétés optiques, thermiques et électriques diverses,
très utiles dans une variété d’applications technologiques. Nous n’aurons pas le temps dans
ce cours d’en parler plus.)
Parlons d’une des conséquences les plus évidentes de l’interaction entre phonons et
électrons. Il s’agit de la baisse de la conductivité électrique à cause de la diffusion des
électrons par les phonons, ce qui nous ramène à la discussion entamée dans le premier chapitre sur ce sujet (le modèle de Drude). Le libre parcours moyen l est fortement diminué
lorsque l’électron subit des diffusions multiples avec les phonons. Le temps de relaxation
τ (T ), qui est proportionnel au libre parcours moyen, diminue quand la température augmente à cause de l’augmentation du nombre de phonons. Le résultat en est que la conductivité électrique σ(T ) décroı̂t en fonction de T dans la plupart des métaux. Rappelons que
l’aluminium a une conductivité plus faible que celle du cuivre malgré un nombre plus élevé
41
d’électrons de conduction. On peut maintenant donner une explication de ce fait en notant
qu’à une température donnée, il est plus facile d’exciter des phonons dans l’Al à cause du
fait que les atomes sont plus légers que ceux du Cu.
2.6
Le gaz de phonons. Le second son
On termine ce chapitre avec un exemple de phénomène purement quantique associé à
l’existence des phonons. C’est la possibilité de créer des vibrations appelées “second son”
dans certains cristaux. Imaginons que le cristal est un conteneur d’un gaz de particules,
les phonons. Ces phonons ont une durée de vie finie (du fait des collisions avec le réseau
et avec les autres phonons) mais assez long pour que l’on puisse faire des observations
expérimentales. En analogie avec un gaz de molécules, la théorie montre qu’une onde de
compression/raréfaction pourrait s’établir dans le gaz de phonons sous certaines conditions.
Ces conditions sont réunies dans le He3 solide.
Une onde de compression/raréfaction dans un gaz de phonons correspond à des oscillations d’énergie interne dans l’espace et dans le temps. Si une telle onde était excitée, il
y aurait une oscillation de la température locale en fonction du temps. L’existence du second son a été démontré dans des expériences où l’on a réussi à faire propager un pulse de
chaleur avec une vitesse constante à travers un cristal de helium solide. Cette propagation
n’est possible que dans une gamme très réduite de T , en contraste avec le mode habituel de
propagation diffusif de la chaleur. He3 .
Chapitre 3
Magnétisme et supraconductivité.
Nous allons clore ce cours d’initiation aux modèles de la physique du solide avec une
discussion de quelques transitions de phase de la matière. On commence par les matériaux
tels le fer qui a donné son nom à toute une classe de matériaux appelés des ferromagnétiques.
Dans ce matériau, on a une transition de phase lorsque l’on baisse la température, d’un état
où les spins des atomes de Fe sont désordonnés, à un nouvel état où les spins sont alignés
selon une certaine direction. Nous allons parler très rapidement d’une transition de phase
qui a lieu dans beaucoup des métaux lorsque l’on baisse la température et le solide devient
supraconducteur. C’est le phénomène découvert par Kamerlingh Onnes en 1911, lorsqu’il
a constaté que la résistance d’un échantillon de mercure tombait brutalement à zero en
dessous d’une certaine température.
3.1
Description de composés magnétiques
Dans les matériaux magnétiques que nous allons considérer ici, le magnétisme provient
du moment magnétique total des électrons dans des orbitales d ou f partiellement remplies. Dans la figure, qui montre quatre différentes types de structures magnétiques dans
un cristal, on a représenté les moments magnétiques des atomes par des petites flêches. En
effet, contrairement aux électrons des orbitales p ou s, qui se libèrent (en ce qui concerne les
couches extérieures) de leurs atomes parents et se promène librement dans tout le volume
disponible, les électrons d et f sont moins mobiles. Ils contribuent donc de façon importante
au moment magnétique effectif de l’atome (ou ion). Avant d’en venir aux atomes, toutefois,
nous allons rapidement mentionner le rôle joué par les électrons de conduction. Ils contribuent, eux aussi, quoique plus modestement que les atomes que nous allons considérer, aux
propriétés magnétiques.
Propriétés sous champ du gaz d’électrons de conduction
Avant d’en venir aux atomes, on doit souligner que les propriétés magnétiques d’un
métal seront en partie aussi dues aux électrons de conduction. Rappelons que l’électron
est une particule de spin 12 , une propriété que nous n’avons pas, jusqu’ici, eu l’occasion
de considérer (hormis le facteur “2” dans les formules de la densité d’états électronique !)
Lorsqu’un champ extérieur B est appliqué, les électrons seront polarisés, et on aura une
petite contribution à l’aimantation M qui vient du fait qu’il y aura plus de spins parallèles
au champ que antiparallèles. On dit que c’est un comportement paramagnétique : M et
42
43
Fig. 3.1 – Quatre organisations possibles de moments magnétiques dans l’espace : sans
ordre (paramagnétique), alignés (ferromagnétique) ou antialignés (deux derniers cas)
H sont parallèles. Il y a un deuxième effet, à cause de la loi de Lenz – les électrons de
conduction vont tenter d’écranter le flux magnétique à l’intérieur du métal. Cela implique
qu’ils tentent de réduire autant que possible l’induction B = µ0 (H + M ) (µ0 = 4π × 10−7
NA−2 ). Pour donner une image classique, ils se tournent autour des lignes du champ, formant
des petites boucles de courant et créant une M négative. On dit que c’est un comportement
diamagnétique. Cependant, ces effets dûs au gaz d’électrons sont négligeables devant le
magnétisme des atomes que nous allons maintenant considérer.
Le moment magnétique associé aux atomes
Venons en maintenant aux atomes ayant une couche atomique extérieure d ou f qui est
remplie partiellement. Pour déterminer l’état électronique dans ces cas, on fait appel aux
règles de Hund. Nous rappelons la règle concernant la valeur de spin totale S lorsqu’une
orbitale comprend plusieurs électrons : l’état de plus basse énergie correspond à la valeur
la plus grande de S. (Les autres régles permettent de classer les niveaux selon la valeur du
moment cinétique orbital total L, et du moment cinétique total J). Les valeurs de S,L et
J prédites par les règles de Hund sont bien vérifiées dans les ions des terres rares, mais
doivent être modifiées dans le cas des métaux de transition. Sans entrer plus en détail, nous
nous contentons de donner dans le tableau les valeurs de L, S et J pour quelques ions : Fe
et Cu (des métaux de transition), et Gd et Dy (des terres rares). Le moment magnétique
de l’ atome µ
~ sera de magnitude
µ = gµB J
µB =
e~
= 9.27 × 10−24 J/T
2m
(3.1)
où µB (le magneton de Bohr) est une constante et g (le facteur de Landé) dépend de L,S
et J. g vaut 2 pour J = 12 (voir la définition ci-dessous).
p
Q1. On définit une quantité p (nombre effectif de magneton) par la relation p = g J(J + 1) où
g = 23 + 12 S(S+1)−L(L+1)
. Calculer, à l’aide du tableau 1 les valeurs de p des ions de Fe3+ ,Gd3+ et
J(J+1)
Cu2+ . Comparer aux valeurs obtenues experimentalement qui sont 5.9 (fer), 8 (gadolinium) et 1.9
(cuivre).
3+
Fe
Cu2+
Mn4+
Gd3+
Dy 3+
configuration
3d5
3d9
3d3
4f 7
4f 9
S
5
2
1
2
3
2
7
2
5
2
L
0
2
3
0
5
J
5
2
5
2
3
2
7
2
15
2
44
Tableau 1. Les valeurs de L, S et J d’un ion isolé de quelques métaux de transition et terres rares
3.1.1
L’aimantation et la susceptibilité magnétique.
L’aimantation M d’un ensemble de N atomes s’exprime en termes des valeurs moyennes
de chacun des moments magnétiques,
~ =
M
N
X
h~
µi i
(3.2)
i=1
On parle d’aimantation spontanée lorsque M 6= 0 même en l’absence d’un champ extérieur.
~ on a l’induction
Lorsque l’on soumet le solide à un champ magnétique H,
~ = µ0 (H
~ +M
~ ) ≈ µ0 H
~
B
(3.3)
où l’on a supposé que M est négligeable devant H. En présence du champ, chaque moment
magnétique a une énergie potentielle
~
Ep = −µ0 (µ~i .H)
(3.4)
~ sont parallèles. Enfin, on définit la susceptibilité magnétique,
qui sera minimisée lorsque µ
~ et H
χ,
χ(T ) = V −1 lim ∂M/∂H
H→0
(3.5)
où V est le volume. χ mesure la facilité avec laquelle les atomes se rangent parallèles au
champ extérieur. (Nb. Dans l’équation nous avons supposé que l’aimantation est alignée
avec le champ ; la fonction χ est appelée la suscéptibilité longitudinale).
Q2. Y a t-il une force d’attraction lorsqu’on approche un aimant près d’un matériau paramagnétique ?
d’un matériau diamagnétique ?
3.1.2
Symétries et brisure de symétrie
Pour les systèmes magnétiques isotropes que nous allons considérer dans les sections
suivantes, les para- et les ferromagnétiques, quand la température est très élevée, et en
l’absence d’un champ extérieur H, les moments magnétiques élémentaires n’ont pas de
préférence pour une orientation plutôt qu’une autre. Ils changent rapidement de direction,
avec une valeur moyenne de µ
~ nulle. Cet état complètement désordonnée possède la symétrie
d’invariance de l’hamiltonien sous des rotations globales de tous les spins. C’est une autre
façon de dire qu’il n y a pas de direction préférée dans ces systèmes. Lorsque l’on soumet le
système à un champ magnétique, l’hamiltonien n’est plus invariant sous rotations, car il y
a une direction privilégiée dans l’espace. Il apparait alors une aimantation induite, car les
atomes favoriseront l’alignement parallèle au champ, pour minimiser leur énergie potentielle.
On parle d’une brisure de symétrie “spontanée” lorsqu’il y a une aimantation M même
en l’absence de champ magnétique extérieur. C’est ce qui arrive dans les ferromagnétiques,
comme nous allons le voir plus loin. D’abord, dans la section suivante, nous allons parler
du cas le plus simple, celui des composés paramagnétiques.
45
3.1.3
Le paramagnétisme.
Nous considérons d’abord l’analyse d’un modèle simple où il n’y a pas d’interactions
entre les ions portant des moments magnétiques, qui agissent, donc, independamment les
uns des autres. C’est une situation à peu près réalisée dans certains composés à la base de
terres rares. Dans les atomes magnétiques de ces composés, la couche d’électrons f étant
très proche du noyau, les électrons sont relativement bien protégés des perturbations dues
aux atomes voisins. La seule interaction d’importance est celle avec le champ magnétique
extérieur. On considère un ensemble de moments µ
~ i , i = 1, ..., N , soumis à un champ
~ Nous allons calculer l’aimantation M
~ ainsi que la susceptibilité magnétique.
extérieur H.
Dans ce problème, il se trouve que la direction de l’aimantation est toujours celle du champ,
et nous allons en conséquence omettre les signes vectoriels, en supposant que tout se passe
dans la direction fixée par le champ extérieur. On s’attend à ce que l’aimantation dépende
du champ H et de la température T , les deux agissant en sens contraire : le premier veut
aligner les moments selon une direction commune, et l’autre favorise l’individualisme et
donc le désordre. Le calcul suivant pour des spins quantiques a été fait par L. Brillouin en
1927.
La fonction de partition d’un spin donné est
Z(T, H) =
J
X
e−β²j
(3.6)
j=−J
où l’énergie potentielle, qui dépend du nombre quantique j = −J, ...., J vaut, d’après l’éq.3.4
²j = −µ0 (gµB )jH
(3.7)
Il y a (2J + 1) termes dans l’expression de Z, qui sont autant de termes d’une série
géométrique
Z(T, H) = ex (1 + ex/J + ..... + e−2Jx/J )
=
ex
e−x e−x/J
−
1 − e−x/J
=
(3.8)
sinh( 2J+1
2J x)
1
sinh( 2J
x)
où x = µ0 (gµB )βH. La valeur moyenne du moment magnétique est hµi ≡ m(T, H) =
gµB hmJ i,
m(T, H) =
1 ∂ ln Z
βµ0 ∂H
(3.9)
1
1
1
) coth((1 +
)x) −
coth(x/2J)
2J
2J
2J
= gµB JBJ (x)
= gµB J((1 +
où l’on a introduit la fonction BJ (la fonction de Brillouin). Il est aisé de vérifier le comportement de BJ pour x très petit :
(x << 1)
BJ (x) ≈
J +1
x − ()x3
3J
(3.10)
tandis que pour x >> 1 BJ (x) ≈ 1 − e−x/J . L’aimantation par spin m(T, H) est linéaire
quand x est petit, et elle sature à sa valeur maximale de gµB J quand ce rapport est grand.
L’aimantation totale M est
N
M (T, H) = m(T, H)
(3.11)
V
46
Fig. 3.2 – La fonction de Brillouin pour différentes valeurs de J
La figure 3.2 montre les courbes de BJ (et donc l’aimantation) en fonction de x ∝ H/T
pour des valeurs de J différentes. On voit que dans la limite de H/T petit (c.a.d. à haute
température), l’aimantation est faible, et que dans la limite x grand (température basse)
elle approche sa valeur maximale de N gµB J/V . La figure montre aussi que l’aimantation
augmente plus lentement vers sa valeur asymptotique quand J est grand que lorsque J est
petit. Ceci traduit le fait que les fluctuations de spin sont plus grandes quand le spin est
grand. On note également que M = 0 quand le champ H = 0.
Passons maintenant à la susceptibilité magnétique. Pour une valeur de H petite, en
utilisant l’éq.3.10 on a
χ(T ) = limH→0
=
C
T
N
M
= µ0 (gµB )2 J(J + 1)/(3kB T )
H
V
(3.12)
Cette équation, appelée loi de Curie, donne une relation simple de χ en fonction de la
température. χ(T ) diminue quand la température augmente, traduisant le fait qu’il faut
un champ magnétique de plus en plus grand pour aligner les atomes.La loi de Curie a été
vérifiée dans des expériences sur les terres rares.
La constante de Curie, C, peut être extraite des données expérimentales. Elle fournit des
renseignements sur la magnitude de S des ions magnétiques, que l’on peut ensuite comparer
avec la valeur prédite par les règles de Hund. L’accord est bon pour la plupart des terres
rares. Pour les métaux de transition, on obtient un accord avec les expériences si l’on pose
J = S, ce qui revient à dire qu’il n y a aucune contribution orbitale à la valeur du moment
magnétique total de ces atomes-là. (Vous avez sans doute remarqué le désaccord flagrant
entre les valeurs de p théorique et expérimentale dans le cas du cuivre dans la Q1 !) La
justification de ce procédé se trouve dans le fait que pour les métaux de transition, les
atomes sont soumis à une forte anisotropie due au champ cristallin des atomes voisins. Pour
simplifier, on peut dire que les électrons effectueront un mouvement de précession et en
conséquence, la valeur moyenne de L sera nulle.
Q3. Montrer que pour le cas S =
1
2
la fonction de partition est Z = 2 cosh(x) et l’aimantation d’un
47
spin est proportionnelle à B 21 (x) = tanh(x).
3.1.4
Les ferromagnétiques.
Dans les métaux de transition, les électrons de la couche 3d subissent l’influence des
atomes voisins, et il est nécessaire de prendre en compte les interactions entre le spin d’un
atome avec ceux autour. Il est bien sur assez difficile d’écrire exactement la forme de ces
interactions, mais il existe une forme simple introduite par Heisenberg qui exprime le fait
que, grosso modo, l’énergie d’un état où deux spins voisins sont parallèles est plus basse que
celle de l’état où ils sont antiparallèles. On peut écrire un hamiltonien qui ne dépend que
~1 et S
~2 des deux atomes ayant la propriété d’invariance
des deux degrés de liberté, les spins S
sous une rotation globale des spins, qui exprime ce fait :
~1 .S
~2
−J S
(3.13)
Pour une constante de couplage J > 0 (ne pas confondre avec le symbole J de la section
précédente !) on a bien une énergie plus basse de l’état de spins parallèles. Pour un système
de N spins, on écrit l’hamiltonien de Heisenberg ferromagnétique,
X
~i .S
~j
S
(3.14)
H = −J
hi,ji
(3.15)
où le symbole hi, ji indique que la double somme n’inclut que des termes où i et j sont
proches voisins.
Bien que simple, cet hamiltonien n’a pas été résolu exactement au-delà d’une dimension !
Beaucoup d’efforts ont été consacrés à l’étude des propriétés thermodynamiques de l’hamiltonien de Heisenberg, dès les années 30. On comprend toutefois assez bien ses propriétés
essentielles, tant sur le plan qualitatif que quantitatif, grace aux méthodes analytiques
tr`’es poussées combinées avec des méthodes numériques. Nous allons ici résumer quelques
résultats connus.
Concernant la transition de phase dans le modèle de Heisenberg
– A T = 0, quelque soit la dimension de l’espace, l’invariance par rotations sera brisée,
et tous les moments seront alignés en parallèle selon une direction particulière. Cela
vient du fait que l’énergie libre F = E − T S est minimisée quand E est minimale.
L’énergie de cet état est E0 = − 12 zN JS 2 où z est la coordinance et N le nombre de
spins. A l’autre extrème de T → ∞ l’énergie libre sera minimisée lorsque l’entropie est
maximale, ce qui implique un état totalement désordonné. La question est de savoir
ce qui se passe entre ces deux limites.
– En une et deux dimensions, l’aimantation M (T ) = 0 pour T > 0. Il n y a donc jamais
de transition avec une Tc finie. L’impossibilité d’avoir un tel état est énoncée dans un
théorème (celui de Mermin, Wagner et Hohenberg) qui s’applique à tout hamiltonien
ayant une symétrie continue.
– En d > 2 il y a une transition de phase entre l’état de M = 0 (la phase paramagnétique) et la phase ferromagnétique, de M 6= 0 à une température critique Tc
qui dépend du réseau et de la dimension. Lorsque l’on baisse la température en dessous
de Tc , l’aimantation démarre de zero à Tc , et augmente jusqu’à atteindre son maximum à T = 0. A la transition, il y une divergence de la susceptibilité magnétique et
48
de la chaleur spécifique, et d’autres singularités des grandeurs thermodynamiques. Ce
modèle a été le sujet de beaucoup d’études théoriques, surtout danss les années 60 et
70, et diverses méthodes analytiques sophistiquées ont été développées pour calculer
toutes les propriétés interessantes du modèle de Heisenberg.
– Plus la dimension d est grande, moins sont importantes les fluctuations de spin. Dans
la limite formelle de d → ∞, les différentes méthodes convergent souvent à un résultat
exact. C’est une limite où la technique du champ moyen de la section suivante donne
la bonne solution.
Méthode du champ moyen.
Weiss a considéré une version simplifiée de l’hamiltonien de l’éq.3.15 où, au lieu de laisser
les deux spins fluctuer au gré des excitations thermiques, il a considéré les fluctuations des
spins placés dans un champ effectif crée par les z voisins autour (“le champ moléculaire de
~i donné, on a
Weiss”). En considérant l’hamiltonien d’un spin S
Hspin,i = −J
z
X
~i .S
~j
S
(3.16)
j=1
qui montre que le site central subit un champ effectif fluctuant de tous ses voisins. Si nous
~j par sa valeur moyenne (la même pour tous les sites), m = gµB hS
~j i,
remplaçons chacun des S
~i .Hef f où le champ effectif Hef f sur le site 1 (et sur tous
l’hamiltonien prend la forme −µ0 S
les sites, l’invariance translationnelle oblige) est
µ0 Hef f =
zJm
(gµB )2
(3.17)
où z est le nombre de proches voisins du site i. Nous avons auparavant résolu l’hamiltonien
d’un spin couplé au champ extérieur. On a donc une formule reliant la valeur moyenne du
~j au champ externe, l’éq.3.10. On a
spin S
m = gµB SBS (x);
où
x = (gµB )βµ0 Hef f =
zJm
gµB kB T
(3.18)
L’argument de la fonction de Brillouin contient m, et l’éq.3.18 est donc une relation d’autocohérence. Nous voulons déterminer la valeur de m(T ) à une température T donnée. Comme
l’équation n’a pas de solution m analytique simple, nous allons recourir à une solution graphique de l’éq.3.18. Les solutions de m sont données par les intersections de la droite, m = m
avec la courbe gµB SBS (x(m)). Cette dernière est une courbe convexe, ayant sa pente maximale à l’origine, (cf. la figure 3.2). Quand cette pente, qui dépend de la température, est
inférieure à 1, il n y a qu’une solution, m = 0. Quand la pente est supérieure à 1, la bonne
solution correspond à m 6= 0. (On peut vérifier que la suscéptibilité est négative pour la
solution m = 0, qui est donc une solution instable).
Nous avons bien une situation où l’aimantation totale M = N m/V est nulle pour T > Tc
et non-nulle en dessous de Tc . La température critique est ainsi donnée par la condition
kB Tc =
S(S + 1)
zJ
3S
Q4. Obtenir l’expression de Tc de l’éq.3.19) en utilisant l’éq.3.10.
Quelques remarques concernant ce résultat de la méthode du champ moyen :
(3.19)
49
Fig. 3.3 – Champ moyen : l’aimantation m/m(T = 0) en fonction de T /Tc
1. Tc n’est jamais nulle, et ne dépend pas de la dimension excepté à travers la coordinence
z. Cette méthode n’est visiblement pas adaptée aux systèmes en d = 1 et 2.
2. Pour T << Tc la variable x ∝ m/T devient très grande et la fonction de Brillouin
approche sa valeur asymptotique. L’éq.3.18 nous dit que m atteint donc sa valeur
maximale gµB S quand T → 0.
3. Tc augmente avec le nombre de proches voisins z, ce qui est logique (le champ local sur un site donné sera plus grand pour une coordinence plus élevée). On peut
donc s’attendre, par exemple, à ce que le système reste ferromagnétique jusqu’à
une température plus élevée dans un réseau carré (z = 4) que pour un réseau “nid
d’abéille” (z = 3) (voir les figures).
4. Tc augmente avec le couplage J, ce qui est logique. Il faut fournir plus d’énergie pour
“casser” des liaisons ferromagnétiques dans le cas où J est grand. Dans le cas des
métaux de transition on s’attend à ce que J soit plus grand que dans le cas des terres
rares (pour la raison évoquée dans la section sur le paramagnétisme).
5. Tc augmente avec le spin S. C’est un résultat également attendu, vu le fait que la
méthode du champ moyen ne prend pas compte des fluctuations, une grande valeur
du moment magnétique implique une grande valeur du champ local.
Le tableau ci-dessous donne quelques exemples de Tc (à éventuellement comparer avec
les prédictions de l’éq.3.19 !)
métal
Fe
Ni
Gd
Dy
S
5
2
1
7
2
9
2
Tc (K)
1043
627
293
85
M0 (gauss)
1752
510
1980
3000
Tableau 2. Tc et M0 (l’aimantation à T = 0) dans quelques métaux
50
Q5. Exprimer, avec la méthode du champ moyen, la fonction de partition et l’aimantation pour le
cas particulier de S = 12 . Obtenir, en développant autour de Tc , et en résolvant l’équation quadratique
ainsi obtenue, l’aimantation m(T ) en dessous de Tc . Montrer que celle-ci suit une loi de puissance
en t = |T − Tc |/Tc .
Fig. 3.4 – Photographie avec une microscope polarisante montrant l’intérieur d’une plaque
de ferrite, indiquant les domaines (voir texte)
3.1.5
Descriptions phénoménologiques des ferromagnétiques
Fig. 3.5 – Images IRM de l’intérieur du cerveau
Les domaines de Weiss
Le fer est l’exemple le plus connu de la classe de ferromagnétiques, et avec le cobalt et
le nickel, est à la base de beaucoup de alliages utilisées dans la fabrication d’instruments.
Pourtant, contrairement à tout ce que nous avons dit ci-dessus, l’aimantation spontanée
observée dans un échantillon d’une de ces alliages est souvent nulle ou presque nulle en
champ extérieur nul à température ambiente. Sachant que Tc est quelques centaines de
K, Weiss a proposé une résolution de cet apparent paradoxe en proposant que les spins
s’organisent dans une multitude de domaines, chacun préférant une direction différente des
autres, de telle sorte que l’aimantation totale soit nulle. Ces domaines ont depuis été mis en
évidence et sont de tailles allant de 10−7 à 10−7 m selon le matériau et le traitement qu’il a
subi.
La formation de domaines est due à l’interaction magnétique dipolaire entre chaque paire
des moment magnétiques. L’énergie de cette interaction dépend de l’orientation relative des
51
deux moments, ainsi que de leur position relative, ~r :
µi .~
µj ) 3(~
µi .~r)(~
µj .~r))
µ0 (~
[
−
]
(3.20)
3
5
4π
r
r
On peut vérifier que cette énergie favorise l’alignement antiparallèle dans certaines directions. Quoique très faible, comparée à l’énergie typique du couplage de Heisenberg entre
spins proches voisins, cette énergie dipolaire devient importante à cause du grand nombre
de paires impliquées. C’est pour cette raison que le système trouve qu’il est plus favorable de
s’organiser en petits ensembles de spins alignés entr’eux à courte échelle mais désordonnés
sur une échelle plus grande – expliquant ainsi l’existence des domaines.
²=
Fig. 3.6 – Un cycle d’hystérésis
Lorsque l’on applique un petit champ extérieur H, les domaines se réoriente, et les
domaines de spins parallèles au champ augmentent en taille pendant que ceux qui sotn
alignés retrécissent, le résultat de tout ceci étant une augmentation de M qui peut être
assez conséquente. Ainsi, grace à cette structure en domaines, on peut trouver des valeurs
de pérméabilité µ très élevées où l’on définit
B = µ0 (H + M ) = µ0 (1 + χ)H ≡ µH
(3.21)
On peut multiplier le champ effectif à l’intérieur d’une bobine en utilisant un entrefer
constitué d’un matériaux à µ élevée. Les deux bobines d’un transformateur sont couplées
à travers le flux magnétique, dans l’entrefer, d’où l’interêt d’utiliser ces matériaux dans
les transformateurs. Dans le même esprit, l’electroaimant schématisé par le circuit de la
figure 3.7, utilise un entrefer qui sert à canaliser et intensifier le flux magnétique φ. Le fer a
une pérméabilité µ ≈ 200µ0 . Pour des applications nécessitant des champs intenses (telles
l’IRM : imagerie par résonance magnétique), on dispose aussi d’alliages de Fe, Co et Ni
telles le permalloy (µ/µ0 ∼ 8000) ou le mu-métal (µ/µ0 ∼ 20, 000).
Cycle d’hystérésis. Champ coercitif. Aimantation rémanente.
Quand le champ appliqué, H, est assez fort, on constate que les changements de M en
fonction de H ne sont pas reversibles. La figure montre les valeurs de M pour un cycle
52
Fig. 3.7 – Circuit d’un electroaimant qui crée une force de collage entre les deux composantes. (symboles : l : longueurs, S : surfaces, µ : perméabilités, n :nombre de tours dans la
bobine, I : courant, φ : flux magnétique dans l’entrefer)
complète où l’on augmente le champ de 0 jusqu’à une valeur maximum positive, ensuite
jusqu’à une valeur maximum négative, et enfin vers sa valeur initiale nulle. On constate
que le matériau garde une aimantation Mr (aimantation rémanente) positive ou négative
en champ nul selon l’histoire récente de l’échantillon. Pour faire descendre M à 0 ; il faut
appliquer un champ Hc (champ coercitif) dans la direction opposée à l’aimantation. Le
rapport Mr /Mmax doit être grand pour les matériaux utilisés dans la fabrication des aimants
permanents.
3.2
La supraconductivité
Fig. 3.8 – Le lévitation d’un aimant au-dessus d’un supraconducteur
En 1911, Kamerlingh Onnes a découvert la supraconductivité dans le mercure lorsqu’il
a l’a refroidi en dessous de la température d’hélium liquide. Vers 4.1K, il a constaté que la
résistivité chutait abruptement à zéro. D’autres métaux ont été refroidis , et dans beaucoup
de cas, le même phénomène se produit à une température critique, Tc (voir le tableau)
typiquement de quelques Kelvins. La chasse aux supraconducteurs était ouverte, et l’on
53
a découvert une grande variété de composés supraconducteurs à une température assez
basse. La plus grande série de découvertes récentes a eu lieu autour des années 85-86, où
les records de Tc ont été successivement battus. Des membres d’une nouvelle famille de
supraconducteurs céramiques ( !) – les supras “haute-Tc – ont été successivement révélés aux
physiciens guettant chaque publication. Revenant aux supraconducteurs conventionnels,
l’explication théorique de la transition métal normal-supraconducteur s’est fait attendre
jusqu’à l’année 1957, où Bardeen,Schrieffer et Cooper (BCS) ont proposé leur modèle de la
supraconductivité. Nous allons d’abord on donnera une brève description de quelques-uns
des phénomènes nouveaux intéressants, avant de présenter un aperçu de la théorie de BCS.
3.2.1
Les conséquences d’une résistance nulle
Revenons un instant au modèle de Drude (Ch. 1)et ce qu’il prédit dans le cas où il n
y aurait plus de collisions et le libre parcours moyen l deviendrait infini. La conductivité,
quantité proportionnelle à l
σ=
ne2 l
mvF
(3.22)
tendrait vers l’infinie, et la résistivité serait nulle. Dans cette limite, rien n’empecherait
le courant d’augmenter sans limite lorsque l’on appliquait un champ électrique. De même,
il est évident qu’une fois un courant établi, dans l’absence de processus de relaxation, ce
courant ne diminuerait jamais. D’où la possibilité de faire circuler un courant électrique
permanent dans une boucle supraconductrices – les expériences ont été faites où l’on voit
que le courant circule sans s’affaiblir durant plusieurs années !
Fig. 3.9 – L’expulsion du flux magnétique de l’intérieur d’un supraconducteur
Considérons un tel métal dans un champ magnétique qui augmente subitement de zéro
à une valeur H. La loi de Lenz nous dit qu’il y aura des courants surfaciques qui tenteront
d’annuler l’induction B = µ0 (H +M ) à l’intérieur du solide. Si l’on fait l’expérience inverse :
annuler subitement un champ magnétique déjà présent dans le métal, la loi de Lenz prédit
qu’il y aura de nouveau des courants qui annuleront le changement, c.a.d. qui créeront une
induction non-nulle à l’intérieur du solide.
Un supraconducteur ne ressemble pas à un tel conducteur parfait. Quelque soit le sens
du changement de H, l’induction B à l’intérieur d’un supraconducteur sera toujours nulle !
54
Une expérience classique consiste à refroidir un supraconducteur sur lequel l’on a posé un
aimant. Dans son état normal, le matériau laisse pénétrer des lignes de B, et l’aimant
reste en contact avec la surface. En dessous de Tc , le supraconducteur crée des boucles
de courant à sa surface, qui annule le champ de l’aimant, et le résultat est une force de
répulsion entre la surface et l’aimant. Si l’aimant est suffisamment léger, il lévitera audessus du supraconducteur (voir la photo). Ce phénomène d’expulsion du flux magnétique
porte le nom d’effet Meissner.
Fig. 3.10 – Les courants surfaciques donnant lieu à la lévitation d’un aimant au-dessus d’un
supraconducteur
3.2.2
La théorie de BCS
A l’origine de cette théorie est l’observation de Cooper sur la possibilité de former des
états liés de deux électrons sous certaines conditions :
– Il faut d’abord une intéraction effective attractive, V > 0 entre les deux. Cette
hypothèse n’est pas aussi déraisonnable qu’il n y paraı̂t, car on savait déjà que
l’intéractions entre les électrons et le réseau peut donner lieu à une attraction faible.
Une image souvent présentée en guise d’explication a été donnée à fin du chapitre 1.
On y voit une déformation du réseau due au passage un électron – cette déformation
attire ensuite un autre électron, engendrant ainsi une intéraction effective attractive
entre les deux. Des calculs plus détaillés montrent que cette image traduit à peu
près ce qui se passe. Il faut toutefois que les deux électrons aient une énergie proche
de l’énergie de Fermi, et l’intéraction V provient surtout des phonons de fréquence
proches de ωD .
– Une telle paire est stabilisée même lorsque V est très petite (ce qui est le cas) à cause
de tous les autres électrons dans la mer de Fermi. C’est un problème à N corps, les
(N-2) autres électrons sont importants car ils limitent l’espace de phase de la paire
que l’on considère.
BCS ont généralisé cette idée en postulant que tous les électrons forment des paires, et
l’ensemble étant stable, et ayant une énergie plus basse que l’énergie de l’état fondamental
sans l’appariement. La fonction d’onde qu’ils proposérent a la forme
Ψ(~r1 , ~r2 , ..., ~rN ) = Aφ(~r1 − ~r2 )φ(~r3 − ~r4 )....φ(~rN −1 − ~rN )
(3.23)
55
Fig. 3.11 – Les états qui participent à la formation des paires de Cooper (région d’épaisseur
∆ autour du niveau de Fermi
où φ(~ri − ~rj ) est la fonction d’onde d’une paire d’électrons dans un état singulet (ayant
leurs spins opposés). De plus, φ correspond à un état qui est invariant par translation
(donc construit à partir des états de ~ki = −~kj . L’opérateur A effectue antisymétrisation
du produit des φ (c’est l’opération d’effectuer une somme de toutes les permutations 2
par 2 des électrons avec le signe − pour chaque permutation). On voit que Ψ est une
combinaison complexe des fonctions d’ondes des paires, toutes imbriquées et participant de
façon collective au transport de courant. Il coûte une énergie minimum ∆(T ) pour casser
une paire et rendre leur indépendance aux deux électrons. Cette énergie, appellé le “gap”
du supraconducteur a une valeur maximale ∆(0) à T = 0, et s’annule à Tc . La théorie BCS
donne le gap à T = 0 en termes des paramètres du modèle V (le potentiel attractif) et ω (la
fréquence du phonon médiateur de cette interaction) :
∆(0) = 2hωe−1/ρ(EF )V
(3.24)
où ρ(EF )V est la densité d’états du gaz d’électrons au niveau de Fermi du métal. La théorie
prédit une relation similaire pour la température critique, de sorte que le rapport ∆(0)/kB Tc
devient indépendant de tous les paramètres, et vaut
∆(0)
= 1.74
kB T c
(3.25)
Cette relation entre les deux quantités a été testée et confirmée avec une assez bonne
précision (compte tenu de la simplicité du modèle) dans des expériences.
On peut estimer la “taille” d’une de ces paires en utilisant le principe d’incertitude :
∆x∆p ∼ ~. Sachant que l’énergie des électrons de la paire est distribuée dans une peau
d’épaisseur ∆ autour de l’énergie de Fermi, on peut déduire l’incertitude de p
dE = ∆ =
p
dp ≈ vF dp
m
(3.26)
d’où le rayon de la paire ξ ∼ ∆x,
ξ=
~vF
∼ 103 A
∆
(3.27)
pour des valeurs de vF d’environ 108 cm/s et ∆ ∼ kB Tc d’environ 10−4 eV . On voit bien que
la distance entre partenaires est très grande, et qu’il n’est donc pas possible de considérer
56
la paire comme une particule composite même pour une échelle de distance grande devant
la distance interélectrons typique.
Pres de Tc , on peut montrer que le gap s’annule comme la racine de la température
réduite
r
Tc − T
∆(T ) = cste
(3.28)
Tc
exactement comme l’aimantation, dans la théorie du champ moyen d’un ferromagnétique
(l’approximation faite est la même).
3.2.3
Propriétés sous champs électriques et magnétiques de l’état supra
Une explication des phénomènes caractéristiques des supraconducteurs peut maintenant
être donnée, à la lumière de la solution de BCS. Sous l’influence d’un champ électrique
appliqué pendant une durée de temps finie, les paires de Cooper acquiereront une quantité
de mouvement identique pour toutes les paires. Au cours de leurs mouvements, il n y aura
pas, contrairement au cas des électrons normaux, les paires ne peuvent pas être diffusées dans
de nouveaux états et ainsi changer leur quantité de mouvement car tous les états disponibles
sont déjà occupés. Le courant passe donc sans atténuation dans un supraconducteur, en ce
qui concerne la conduction par les paires de Cooper.
L’expulsion du champ magnétique est un peu plus compliqué à expliquer. Un argument
possible consiste à écrire l’hamiltonien d’une des paires – on prend la forme conventionnelle
~:
pour une particule de charge −2e et de masse 2m soumi à un potentiel vecteur A
H=
1
~ 2 + V (~r)
(~
p − 2eA)
4m
(3.29)
~ ×A
~ = B.
~ La fonction d’onde de la paire φ est représentée sous la forme
où ∇
φ(~r) = |φ|eiθ(~r)
(3.30)
où l’on a explicitement écrit la module, que l’on suppose constante, et la phase, qui, elle,
~ La densité du courant électrique due à cette fonction est ~j(~r) =
dépend du champ A.
−2e
~ où les valeurs moyennes sont calculées dans l’état φ. L’élément de
−2eh~v i = 2m h~
p − 2eAi,
matrice de p~ est calculé à partir de l’équation
iθ(~
r)
~
~ r)φ(~r)
p~φ(~r) = (−i~∇)|φ|e
≈ ~∇θ(~
(3.31)
On trouve ainsi le courant, qui contient deux termes,
2
~ r) − 2eA)|φ|
~
~j(~r) = −e (~∇θ(~
m
(3.32)
Comme la densité de courant ~j(~r) est nul, la circulation de celle-ci autour d’un circuit fermé
entièrement contenue à l’intérieur du supraconducteur sera nulle aussi, c’est-à-dire
I
I
~ r) − 2eA).d
~ ~l
~j.d~l = 0 = (~∇θ(~
(3.33)
57
On en tire, en utilisant l’identité
que
R
Z
~ ~l =
A.d
R
~
B.dS
et la définition du flux magnétique ΦB
2e
ΦB
~
= 0
~ r).d~l =
∇θ(~
(3.34)
la deuxième égalité venant du fait que θ(~r) est une fonction analytique dans la région
considérée. Nous avons ainsi montré que le fait de pouvoir exprimer la fonction d’onde en
termes d’une phase bien définie dans l’état supraconducteur donne, comme un des résultats,
l’effet Meissner.

Université Paris-Sud - Espace des équipes scientifiques

Transcription

Documents pareils

Exercice 2 : Spectres d`émission Exercice 3 : Configurations

Module Astronomie-Astrophysique Université Pierre et Marie Curie

`A PROPOS DE CONDUCTION´ELECTRIQUE

RAPPORT DE LABORATOIRE DE PHYSIQUE Effet photoéléctrique

A.1) Tension Superficielle A.1.1) Le nombre de

Programme des cours de Physique 2013-2014

Exercices — Fonctions affines et linéaires

Intégration - Examen Terminal

Gaz Parfait Monoatomique

1 Fonte dùn glaçon 2 Chauffage dùne pièce