1er semestre 2012/13 M1 U 11 : Abrégé de cours Groupes de

Transcription

1er semestre 2012/13 M1 U 11 : Abrégé de cours Groupes de
1er semestre 2012/13
M1 U 11 : Abrégé de cours
Groupes de transformations
Les notes suivantes, disponibles à l’adresse http://www.iecn.u-nancy.fr/~bertram/,
contiennent les définitions et les résultats principaux du cours. Elles ne remplacent ni un
polycopié complet, ni le cours lui-même.
Le sujet principal du cours est une introduction à la géométrie projective qui met en relief
l’importance des groupes de symétrie. Il s’agit donc d’un cours de “géométrie avancée” :
tandis que le cadre des cours de géomètrie de Licence était toujours la géométrie euclidienne et l’espace euclidien (i.e., Rn , muni d’un produit scalaire), nous allons rencontrer
dans ce cours une “géométrie non-euclidienne” : le concept d’espace change. L’espace
projectif ne s’identifie pas à un espace Rn , mais peut être construit à partir de Rn de
plusieurs façons, par exemple, en rajoutant à Rn des “points à l’infini”.
Les raisons pour un tel changement du concept d’espace apparaissent historiquement avec
les débuts d’une étude approfondie des principes du dessin en perspective. En langage
moderne : les perspectives, ou projections centrales, d’un plan E sur un autre E 0 , sont
des applications obtenues en “projetant”, à partir d’un point de l’espace c (le centre de la
projection), un point x de E sur le point d’intersection x0 de la droite (cx) avec E 0 , si ce
point est bien défini. On peut visualiser ce genre d’application en utilisant une source de
lumière au centre c et en projetant des dessins d’un plan transparent E sur un autre plan
transparent E 0 . Par exemple, un cercle sur E donne lieu à un cône de lumière, et ce cône
de lumière intersecte un autre plan E 0 en une conique : ellipse, parabole ou hyperbole,
selon la position de E 0 (si le centre c n’appartient pas à E 0 ). L’application E → E 0
ainsi définie ne peut donc pas être une application affine, car une application affine ne
peut pas envoyer un cercle sur une hyperbole. Ainsi on voit apparaître un nouveau type
d’application, les applications projectives ou homographies, qui donne lieu à un groupe,
le groupe projectif. L’étude de ce groupe, ou plutôt de son action, ainsi que de ses sousgroupes, est en grande partie équivalente à l’étude de la géométrie projective elle-même
(c’est un point de vue expliqué pour la première fois par Felix Klein en 1872 dans son
célèbre “programme d’Erlangen”). Les espaces projectifs réels et complexes, RPn et CPn ,
se trouvent au carrefour de la plupart des branches des mathématiques modernes ayant
des liens avec la géométrie, et leur étude est indispensable pour toute poursuite d’études
en mathématiques, mais aussi en vue d’une préparation approfondie à l’enseignement des
mathématiques.
Littérature. Il existe de nombreux ouvrages qui traitent de ces sujets. L’œuvre
[Berger] Berger, M., “Géométrie” (plusieurs tômes), Nathan 1979 (traduction anglaise chez
Springer, en 2 volumes)
est une vraie mine d’or, avec de très nombreuses illustrations. Le niveau est assez élévé
et le contenu encyclopédique – l’achat est un très bon investissement pour toute la vie.
Une version plus facilement abordable est
[Audin] Audin, M., “Géométrie”, Belin 1998.
1
Un autre livre utile et utilisé dans la préparation de ce cours est
[Sidler] Sidler, J.-C., “Géométrie projective – cours et exercices et problèmes corrigés”,
Dunod, 2000.
Nous recommandons également d’imprimer et de lire l’introduction et le chapitre 1 du
projet d’un livre de géométrie projective par Daniel Perrin, disponible à l’adresse
http://www.math.u-psud.fr/~perrin/Livre_de_geometrie_projective.html
On y trouve de nombreuses autres références bibliographiques (nous donnons quelquesunes au fur et à mesure du cours). Des origines historiques de la géométrie projective –
la théorie ancienne grecque des coniques, le dessin en perspective de la Renaissance, les
débuts de la géométrique algébrique, liée à des noms comme Appolonius, Pappus, Pascal,
Desargues, Poncelet, Moebius, Klein et bien d’autres.... – y sont évoquées – voir aussi
[Berger], ou, pour un premier survol,
http://en.wikipedia.org/wiki/Projective_geometry
http://en.wikipedia.org/wiki/Perspective_(graphical)#History
http://fr.wikipedia.org/wiki/Programme_d’Erlangen
Le premier chapitre du cours suivant fournit une introduction plus précise et plus mathématique au sujet.
Chapitre 1 : Homographies, projections et perspectives
Dans ce chapitre introductoire, soit K = R, C ou un autre corps. Nous donnons une première approche à certaines applications définies sur Kn , d’abord sous un angle algébrique
et calculatoire, puis sous des points de vue géométriques.
A. Homographies.
1.1 Définition. Une homographie de Kn est une application f = fM de la forme suivante:
on se donne une matrice de taille (n + 1) × (n + 1)
A b
M=
,
c d
où A est de taille n × n, b une matrice-colonne (taille n × 1), c une matrice-ligne (taille
1 × n) et d un scalaire (taille 1 × 1), et pour x ∈ Kn (vecteur colonne) tel que cx + d 6= 0
on pose
1
f (x) := fM (x) :=
(Ax + b) .
cx + d
P
Noter que cx = i ci xi est bien un scalaire ; on multiplie donc un vecteur Ax + b par un
scalaire. Si n = 1 et K = R, ces applications sont connues depuis le cours d’analyse. Pour
le cas général, nous présentons quelques faits de base sous forme d’exercice:
1.2 Exercice : composée d’homographies. Soit M et M 0 tels que det M 6= 0 et
det M 0 6= 0. Calculer fM ◦ fM 0 (x) et montrer que, si tous les termes sont définies,
(!)
fM ◦ fM 0 (x) = fM M 0 (x) .
En déduire que fM est inversible d’inverse fM −1 , et que l’ensemble
Hn (K) := {fM | M ∈ GL(n + 1; K)}
2
forme un groupe, dit le groupe des homographies de Kn .
1.3 Exercice : Hn comme quotient du groupe linéaire. Montrer que fM = fN si la
matrice N est un multiple scalaire de la matrice M . Facultatif (pour le moment): essayer
de prouver la réciproque.
Conclure que l’application
φ : GL(n + 1; K) → Hn (K),
M 7→ fM
est un homomorphisme surjectif de groupes qui a comme noyau K× 1n+1 (multiples nonnulles de la matrice unité). Ainsi Hn est un groupe quotient du groupe linéaire :
Hn (K) ∼
= GL(n + 1; K)/(K× 1n+1 ) .
1.4 Exercice : quelques sous-groupes de Hn .
(a) Rappeler la définition du groupe affine de Kn et montrer que c’est un sous-groupe de
Hn . (Prendre c = 0, d = 1 et A une matrice inversible.)
(b) Caractériser le groupe des translations de Kn en termes de la matrice M .
(c) Montrer que l’ensemble {fM | A = 1n , d = 1, b = 0, c ∈ M (1, n; K)} est un sous-groupe
de Hn (K), que ce sous-groupe est isomorphe à (Kn , +) et qu’il n’est pas inclus dans le
groupe affine. Conclure que Hn (K) est strictement plus grand que le groupe affine.
1.5 Exercice : un peu d’analyse. Soit K = R. Montrer que, si c 6= 0 ou d 6= 0, le
domaine de définition de fM est un ouvert dense de Rn et que fM est continue et même
de classe C ∞ . Montrer que l’ensemble des x ∈ Rn pour lesquels les deux membres de
(!) sont définies, est un ensemble ouvert dense (et donc non-vide). Que peut-on dire si
K=C?
1.6 Problèmes. Le groupe des homographies comprend des symétries strictement plus
générales que les applications affines. Quelles sont alors les propriétés géométriques
préservées par ce genre de symétries? Ces propriétés vont être plus générales, et donc
plus fondamentales, que celles de la géométrie euclidienne usuelle.
D’autre part, comment comprendre le fait que les homographies ne sont pas définies
“partout” sur Kn : que se passe-t-il avec les x tels que cx + d = 0 ? Intuitivement, on
aurait envie de dire que la valeur de f en de tels points est “infinie” – mais peut-on donner
un sens précis à cela ?
Les deux questions sont liées entre elles: les applications en question proviennent de
la géométrie des projections ou perspectives. Historiquement et mathématiquement, on
distingue deux types de projection, la projection parallèle, et la projection centrale.
B. La projection parallèle. On se place dans un espace affine V sur un corps K.
1.7 Définition. Soit E un hyperplan de V (i.e., dim E = dim V − 1) et D une droite
supplémentaire (i.e., qui intersecte D en un seul point). Pour tout x ∈ V , soit Dx
l’unique droite par x et parallèle à D. Elle a un unique point d’intersection avec E. La
projection parallèle sur E le long D est l’application
PED : V → E,
x 7→ Dx ∩ E .
Si F est un autre sous-espace affine de V , la restriction à F ,
D
: F → E,
PF,E
x 7→ Dx ∩ E,
3
est la projection parallèle de F sur E le long D.
Exemple (important en dessin technique). Cas K = R, dim V = 3 : alors E est le
“plan du dessin” ou “écran” et D un axe. On fait la projection, le long de cet axe, d’objets
tridimensionnels sur le plan du dessin. Exemple: représenter de cette façon un cube, une
maison, un cercle, une voie de chemin de fer... cf. par exemple http://fr.wikipedia.
org/wiki/Projection_affine. Inconvenient: les objets plus ou moins éloignés du plan
du dessin apparaissent tous “en même grandeur” ; l’impression de profondeur manque :
le dessin “manque de perspective spatiale”. Avantage: mathématiquement, la description
est très simple:
1.8 Lemme. La projection parallèle est une application affine ; si on choisit le point
O := D ∩ E comme origine, elle est même linéaire, et si on choisit encore une base dans
E et la complète par un élément de D, alors la projection est décrite par la matrice
1n−1 0
.
0
0
Géométriquement, nous avons
1.9 Théorème. Toute application affine f (et donc toute projection parallèle) préserve
les structures suivantes:
(1) une ligne droite est envoyée en une ligne droite ou en un point ;
(2) deux lignes droites parallèles sont envoyés en deux lignes droites parallèles ou en deux
points ;
(3) le rapport de trois points alignés est préservé : R(x, y, z) = R(f (x), f (y), f (z)).
Pour rappel:
1.10 Définition. Une application affine est une application de la forme f (x) = Ax + b
avec b ∈ V et A linéaire (par rapport à une origine arbitraire de V ). Trois points x, y, z ∈
V avec y 6= z sont alignés ssi il existe r ∈ K avec
x = (1 − r)z + ry ;
alors r est uniquemenet déterminé par le triplet (x, y, z), dit le rapport de (x, y, z), noté
r = R(x, y, z).
Un autre rappel (?): toute application qui vérifie (1), (2), (3), est affine.
C. Perspective ou projection centrale. Gardons les notations V , K, etc.
1.11 Définition. Soit E un hyperplan de V et c un point de V , non sur E. Pour deux
points distincts x, y ∈ V , notons x ∨ y = {(1 − r)x + ry | r ∈ K} la droite affine passant
par x et y. La projection centrale sur E de centre c est l’application
PEc : V 99K E,
x 7→ (x ∨ c) ∩ E ,
où le symbôle 99K veut dire que l’application n’est pas définie pour tout x, mais seulement
pour les x ∈ V tels que la droite x ∨ c a effectivement un unique point d’intersection avec
E (i.e., elle n’est pas parallèle à E). Si F est n’importe quel autre sous-espace affine de
V , la restriction à F ,
c
PF,E
: F 99K E, x 7→ (x ∨ c) ∩ E,
4
est la projection centrale de F sur E de centre c.
1.12 Exemples.
(1) Le cas K = R, dim V = 2, dim E = dim F = 1 est le plus simple à dessiner : on parle
d’une perspective de la droite E sur la droite F , de centre c. Supposons que E et F ne
c
soient pas parallèles. Alors PE,F
est définie partout, sauf en un seul point (lequel ?), et
c
son image est tout F , à l’exception d’un seul point. Ainsi PE,F
est “presque” une bijection
c
(avec “presque” inverse PF,E ). Il est facile de voir que cette bijection ne préserve pas le
rapport, ainsi elle ne provient pas d’une application affine !
(2) Le cas K = R, dim V = 3, F = V est de plus grande importance pour le dessin : c’est
la représentation de l’espace en perspective centrale (vraiment maîtrisée seulement depuis
la renaissance). Prenons deux droites parallèles dans un plan P qui ne contient ni c, ni est
parallèle à E. Chacune détermine avec c un plan, qui coupe E en une droite, son image
sous PEc . Mais ces deux images se coupent en un point, ainsi elles ne sont pas parallèles
dans E (dessin en perspective d’une voie de chemin de fer: les deux rails, parallèles dans
l’espace, semblent dans le dessin se rencontrer en un point à l’horizon). Exercice : faire
des dessins en perspective d’un cube ; d’une maison ; d’un cercle...
c
1.13 Exercice: représentation calculatoire. On veut décrire PE,F
, où E et F sont
deux hyperplans, par des formules analytiques. Sans restriction, on peut choisir O := c
comme origine dans V , alors il existe deux formes linéaires α, β : V → K tels que E =
{x ∈ V | α(x) = 1} et F = {x ∈ V | β(x) = 1}.
1
x.
(1) Montrer que PEc (x) est définie si α(x) 6= 0, et qu’alors PEc (x) = α(x)
(2) On veut comparer les projections centrales auw projections parallèles. Pour cela, soit
D = Ku une droite, avec α(u) 6= 0 et β(u) 6= 0. Donner une formule pour les projections
D
D
parallèles PE,F
et PF,E
, et donner une formule pour les applications
D
c
PE,F
◦ PF,E
: F 99K F,
c
D
PF,E
◦ PE,F
: E 99K E .
Montrer que, dans les deux cas, il s’agit d’homographies.
1.14 Théorème. Une projection centrale envoit des lignes droites en des lignes droites
ou en un point, mais en général elle ne préserve ni parallélisme, ni rapports.
1.15 Résumé. La géométrie, dite “projective”, qui correspond aux propriétés préservés
par des projections centrales, est la géométrie d’incidence, i.e., une géométrie qui parle de
droites, plans, etc., et de leur propriétés d’intersection, mais non de longueurs, de mesures
d’angles, ou de rapports. La notion de parallélisme n’est pas adaptée à cette géométrie: il
semble plutôt que deux droites s’intersectent toujours, soit en un point “ordinaire”, soit en
un point “à l’horizon” ou “impropre”. On est donc amené à élargir l’espace affine usuel par
un ensemble “de points impropres” ou “de points à l’infini”. Nous allons voir que l’espace
projectif répond à ces exigences, et en rajoutant ces points à l’infini il fournit le domaine
naturel de définition pour les homographies.
Chapitre 2 : La complétion projective d’un espace affine
Nous allons “compléter” un espace affine A en lui rajoutant un ensemble H∞ (A) de “points
impropres” ou de “points à l’infini”, et expliquer que l’espace ainsi completé A := A ∪
H∞ (A) se prête mieux comme “univers” pour faire de la géométrie. Un “point à l’infini”
5
représente une “direction” de A, qu’on peut voir comme une classe d’équivalence de droites
parallèles:
2.1. Définition. L’espace affine de dimension n sur K est A = Kn où l’on “oublie”
l’origine. Pour o, p ∈ A, o 6= p, on note
Do,p := o ∨ p := {tp + (1 − t)o|t ∈ K}
la droite qui relie o et p, et soit
o
p,
o
∈
A,
p
=
6
o
n
D := DA := Do,p
l’ensemble des droites affines dans A. Rappellons que deux droites D = Dx,y et D0 =
Dx0 y0 sont parallèles si leur vecteurs directeurs sont proportionnelles : il existe r ∈ K,
r 6= 0, tel que
x0 − y 0 = r(x − y).
2.2. Lemme. La relation de parallélité est une relation d’équivalence sur D.
2.3. Définition. La classe d’équivalence d’une droite D est notée [D] ; elle représente la
direction commune à toutes les droites parallèles à D. L’ensemble des classes d’équivalence
est appellé hyperplan à l’infini ou : ensemble infini de A et est noté
H∞ (A) := {[D] | D ∈ D}.
L’espace affine completé ou : la complétion projective de A est
˙ ∞ (A) .
A := A∪H
2.4. Remarque importante. Si on fixe une origine O dans A, l’ensemble H∞ (A)
s’identifie avec l’ensemble des droites vectorielles passant par O. D’où la définition fondamentale :
2.5. Définition. Soit V un espace vectoriel sur un corps K. L’espace projectif de V , noté
PV , est l’ensemble des sous-espaces vectoriels de V de dimension 1 (droites vectorielles) :
o
n
PV = Kv v ∈ V \ {0}
où Kv := {tv| t ∈ K} = D0,v . Ainsi, si l’origine O est fixé, on a une bijection H∞ (A) =
P(A). (Remarque : la définition vaut aussi pour le cas où la dimension de V est infinie.
Dans ce cours, nous supposons toujours que dim V est finie.)
2.6. Exemple : le cas n = 1. Dans ce cas, il n’existe qu’une seule direction, ainsi
H∞ (K) = P(K) est un seul point, qu’on note ∞, de sorte que la droite projective
K = K ∪ {∞}
s’obtient à partir de K un rajoutant un unique point à l’infini. (Attention : en analyse,
donc pour K = R, on utilise souvent les symbôles +∞ et −∞. Il faut accepter qu’en
géométrie ces deux “points” représentent la même direction ! Ainsi, on pourra dire que
+∞ = −∞ ; on “identifie les deux bouts de la droite réelle” et on la referme ainsi sous
forme d’un cercle : R ressemble donc à un cercle. Si K 6= R, cette image est fausse.)
6
2.7. Exemple : le cas n = 2. On veut décrire les directions de K2 . Pour le faire, fixons
l’origine O et la base e1 , e2 habituelles. Alors on peut distinguer deux sortes de directions:
(a) la direction donnée par une droite fixée, disons Ke1 , i.e., [D] = [Ke1 ].
(b) les autres directions : elles sont données par les droites supplémentaires à Ke1 , donc
par Kx = K(x1 , x2 ) avec x2 6= 0. Puisque x et rx = ( xx12 , 1) avec r = x12 donnent la même
direction, elles s’écrivent tous de la forme K(λ, 1) avec un unique λ ∈ K. On identifie
K(λ, 1) avec λ, i.e., on identifie K avec l’ensemble des directions de type (b). Donc
H∞ (K2 ) = P(K2 ) = K ∪ {[D]},
et ainsi le plan projectif K2 se décompose sous la forme
2
K = K2 ∪ H∞ (K2 ) = K2 ∪ K ∪ {[D]}.
2.8. Théorème. Soit A l’espace vectoriel Kn et V := Kn+1 . Alors il existe une identification naturelle entre A et PV , ce qui s’écrit aussi
Kn = Kn ∪ P(Kn ) = P(Kn+1 ).
Dans cette identification, la partie P(Kn ) correspond aux directions dans l’hyperplan
xn+1 = 0, et la partie Kn correspond aux directions supplémentaires de cet hyperplan
(droites vectorielles Kx telles que xn+1 = 1). Plus précisément, l’application suivante est
bijective : Φ : Kn → P(Kn+1 ) définie par
Φ (x1 , . . . , xn ) = K(x1 , . . . , xn , 1)
si (x1 , . . . , xn ) ∈ A,
Φ K(x1 , . . . , xn ) = K(x1 , . . . , xn , 0)
si K(x1 , . . . , xn ) ∈ P(A).
Pour une ilustration, on dessinera Kn+1 avec les hyperplans affines, pour t ∈ K,
At := {x ∈ Kn+1 | xn+1 = t};
chacun d’eux est en bijection avec A via x 7→ (x1 , . . . , xn ). Dans l’écriture P(A ⊕ K) =
A ∪ P(A), la partie A s’identifie maintenant avec A1 et la partie P(A) avec P(A0 ).
2.9. Corollaire. Par récurrence,
P(Kn+1 ) = Kn ∪ Kn−1 ∪ . . . ∪ K ∪ {∞} .
Exercice. Si K est un corps fini de cardinalité q, quelle est la cardinalité de P(Kn+1 ) ?
2.10. Définition. Soit E un sous-espace affine de l’espace affine A = Kn . L’ensemble
des points à l’infini de E est l’ensemble des directions de E,
P(E) := {[D] | D ∈ DA , D ⊂ E},
et la complétion projective de E est E := E ∪ P(E) ⊂ A. Si dim E = 1, l’ensemble E est
une droite de A, et si dim E = n − 1, l’ensemble E est un hyperplan de A. Les hyperplans
de cette forme sont dits propres, et il y a un hyperplan impropre, à savoir H∞ (A).
2.11. Théorème. Soit A = Kn , D une droite affine et H un hyperplan affine de A.
Alors seulement les deux cas suivants peuvent se produire dans A :
7
(a) D ⊂ H ;
(b) |D ∩ H| = 1.
Nous avons ainsi atteint un de nos buts : dans la complétion projective A, le cas D∩H = ∅
n’apparaît plus ! En effet, si D ∩ H = ∅ en géométrie affine, D et H s’intersectent au
point impropre [D]. Si dim A = 2, la situation est particulièrement agréable :
2.12. Théorème. Soit P := K2 le plan projectif sur K et DP l’ensemble de ses droites
(propres et impropres ; noter que H∞ (K2 ) est l’unique droite impropre). Alors :
(P1) Deux droites distinctes déterminent un unique point d’intersection.
(P2) Deux points distincts déterminent une unique droite qui les relie.
(P3) Toute droite contient au moins 3 points.
(P4) Il existe au moins 3 points non-colinéaires.
La preuve consiste en une distinction de cas. On remarquera l’analogie formelle entre (P1)
et (P2) : elles sont liées en interchangeant les termes “point” et “droite”, resp. “intersection”
et “liaison”. Cette dualité est un trait profond de la géométrie projective. En géométrie
affine, cette dualité n’est pas visible, à cause du rôle “exceptionnel” des droites parallèles.
2.13. Exemple : Le plan de Fano. Le plus petit corps est K = F2 := Z/2Z. Le plan
projectif K2 a 4 + 2 + 1 = 7 points. Dans K2 , il y a 6 droites affines, dans DP il y a
donc 6 droites propres et une droite impropre. Ainsi |P| = |DP |. Dessin schématique :
cf. http://fr.wikipedia.org/wiki/Plan_de_Fano
Finalement, nous pouvons définir les projections centrales de façon satisfaisante. Pour
faire simple, nous ne considérons ici que le cas d’un plan projectif :
2.14. Définition. Soit P comme dans le théorème 2.12, c ∈ P et D ∈ DP telle que
c∈
/ D. Alors la projection centrale sur D et de centre c est l’application
PDc : P \ {c} → D,
x 7→ (c ∨ x) ∩ D,
où c ∨ x est l’unique droite qui relie c et x (propriété (P2)) ; l’intersection existe par (P1).
2.15. Théorème. Avec c, D comme ci-dessus, et si D0 est une autre droite qui ne
contient pas c, la perspective de D0 sur D et de centre c suivante est une bijection :
PDc 0 ,D : D0 → D,
x 7→ (c ∨ x) ∩ D .
Chapitre 3 : L’espace projectif et ses sous-espaces
L’objet d’étude dans la suite est l’espace projectif A. Il serait trop fatiguant de l’écrire
toujours sous la forme A = A ∪ H∞ (A) et de procéder par des distinctions de cas. La
forme P(V ) avec V = Kn+1 (théorème 2.8) est beaucoup mieux adaptée pour comprendre
la géométrie projective car elle la relie directement à l’algèbre linéaire de V . Ainsi nous
allons re-développer la théorie en partant de cette définition. Dans toute la suite, V est
un espace vectoriel sur K, de dimension finie n + 1.
8
3.1. Définition. Pour v ∈ V avec v 6= 0, on note [v] := Kv la droite vectorielle engendrée
par v. Ainsi P(V ) = {[v] | v ∈ V, v 6= 0}. L’application
π : V \ {0} → PV,
v 7→ [v]
s’appelle la projection canonique.
3.2. Lemme. Soient v, w ∈ V \ {0}. On a π(v) = π(w) si et seulement s’il existe r ∈ K×
tel que w = rv. La relation ∼ définie sur V \ {0} par : v ∼ w si “existe r ∈ K× tel que
w = rv”, est une relation d’équivalence, et PV s’identifie canoniquement avec les classes
d’équivalence de cette relation.
Exercice. Du lemme, déduire que, si |K| = q et n = dim PV , alors |PV | =
q n+1 −1
.
q−1
Remarque. Uniquement dans le cas réel, si V = Rn+1 , il existe un lien étroit entre la
sphère S n = {x ∈ Rn+1 | kx| = 1}, et l’espace projectif PV : à savoir, chaque classe [v]
contient exactement deux représentants appartenant à la sphère S n , de sorte qu’on peut
identifier PV aussi avec S n / ± 1. On reviendra plus tard sur cette remarque.
3.3. Définition. La dimension de PV est dim V − 1, de sorte que dim A = dim A. Pour
l’espace projectif “standard” de dimension n, on utilise aussi les notations
KPn := Pn K := P(Kn+1 ).
Un sous-espace projectif de dimension k dans PV est une partie de PV de la forme
[E] := π(E \ {0}) = [v] | v ∈ E \ {0} ,
où E ⊂ V est un sous-espace vectoriel de dimension k + 1. Un sous-espace de dimension 0 se confond avec un point de PV , un sous-espace de dimension 1 de PV est une
droite (projective), un sous-espace de dimension 2 de PV est un plan (projectif), etc. Un
hyperplan (projectif) est un sous-espace projectif de dimension dim V − 1.
3.4. Lemme. Un sous-espace [E] de dimension k est lui-même un espace projectif de
dimension k ; en effet, il se confond avec P(E).
3.5. Théorème. Soient A = [E] et B = [F ] deux sous-espaces projectifs de PV .
(i) L’intersection A ∩ B est un sous-espace projectif. De plus, on a
A ∩ B = [E ∩ F ].
(ii) Il existe un unique plus petit sous-espace projectif A ∨ B qui contient A et B. De
plus, on a
A ∨ B = [E + F ].
(iii) Pour toute partie S ⊂ PV , l’intersection de tout les sous-espaces contenant S est
un sous-espace, et c’est le plus petit sous-espace contenant S. On le note hSi.
3.6. Lemme. Pour des sous-espaces A, B, C de PV , avec la notation A ∧ B := A ∩ B,
(i) A ∧ B = B ∧ A, A ∨ B = B ∨ A (commutativité) ;
(ii) A ∧ (B ∧ C) = (A ∧ B) ∧ C, A ∨ (B ∨ C) = (A ∨ B) ∨ C (associativité) ;
9
(iii) A ∧ (A ∨ B) = A = A ∨ (A ∧ B) (loi d’absorption).
Exercice. Montrer que, pour 3 sous-espaces projectifs A, B, C :
(M1) si A ⊂ B, alors A ∨ (C ∧ B) = (A ∨ C) ∧ B (mais si A 6⊂ B, cela devient faux),
(M2) (A ∧ B) ∨ (C ∧ G) = ((A ∧ B) ∨ C) ∧ B.
3.7. Définition. L’ensemble, dit la Grassmannienne de PV et noté Gras(PV ), de tous les
sous-espaces projectifs de PV , muni des opérations ∨ et ∧, est un treillis, i.e., il vérifie (i),
(ii), (iii) ci-dessus. Ce treillis est modulaire, i.e., il vérifie la loi modulaire (M1) ci-dessus.
Noter que, via [E] ↔ E, Gras(PV ) est en bijection avec l’ensemble Gras(V ) de tous les
sous-espaces vectoriels de V , dit la Grassmanienne de V . Le sous-espace vectoriel {0} de
V correspond alors au sous-espace vide de PV . Les operations +, ∩ correspondent à ∨, ∧.
3.8. Théorème. Pour des sous-espaces projectifs A = [E], B = [F ] de PV ,
dim(A ∧ B) + dim(A ∨ B) = dim A + dim B .
Exercice. Redemontrer les théorèmes 2.11 et 2.12 en utilisant cette formule de dimension.
3.9. Corollaire. Soient A = [E], B = [F ] des sous-espaces projectifs de PV et dim A = i
et dim B = j. Alors sont équivalents :
(i) A ∧ B = ∅ et A ∨ B = PV ;
(ii) E ∩ F = {0} et E + F = V , i.e., V = E ⊕ F ;
(iii) i + j = n − 1 et A ∧ B = ∅ ;
(iv) i + j = n − 1 et A ∨ B = PV .
3.10. Définition. Si A et B satisfont les conditions de 3.9, on écrit A>B.
3.11. Définition. Un repère projectif dans un espace projectif PV de dimension n est
la donnée de n + 2 points p0 , p1 , . . . , pn+1 de PV tels que : il existe une base b1 , . . . , bn+1
de V telle que
∀i = 1, . . . , n + 1 :
pi = [bi ],
p0 = [b1 + . . . + bn+1 ] .
(Noter que les bi ne sont pas déterminés par cette condition, mais la condition sur p0
assure que, si on les change par un facteur scalaire, ce facteur scalaire doit être commun
pour tout les bi .) Si V = Kn+1 et bi = ei la base canonique, le repère ainsi obtenu s’appelle
le repère canonique de KPn .
Le point p0 semble jouer un rôle particulier dans cette définition. Mais le résultat suivant
montre que n’importe quelle permutation de ces n + 2 points est également un repère :
3.12. Proposition. Pour n + 2 points p0 , p1 , . . . , pn+1 de PV sont équivalents :
(1) p0 , p1 , . . . , pn+1 est un repère ;
(2) n + 1 quelconques des points p0 , p1 , . . . , pn+1 engendrent PV , i.e., ils ne sont pas dans
un hyperplan commun.
10
3.13. Corollaire. Un triplet de points (a, b, c) dans KP1 est un repère projectif, si, et
seulement si, ces points sont deux à deux distincts : a 6= b, b 6= c, a 6= c.
Pour le repère canonique de KP1 , on utilise aussi la notation
∞ = [e1 ],
0 = [e2 ],
1 = [e1 + e2 ] .
Chapitre 4 : Le groupe projectif
Après avoir défini les “objets” de notre étude (les espaces projectifs PV ), nous devons
expliquer la notion de “morphisme”, les “applications” ou “flèches” entre deux espaces
projectifs X = PV et X 0 = PV 0 . C’est plus compliqué que dans le cas des structures vues
en Licence (groupes, anneaux, espaces métriques...) – en effet, il y a plusieurs réponses
possibles :
– (a) géométrique : application préservant la structure géométrique (mais laquelle ?) ;
– (b) calculatoire : application donnée par des “formules” ou “constructions” explicites.
4.1. Définition. Une collinéation entre deux espaces projectifs est une application
f : PV → PV 0 telle que, si pi , i = 1, 2, 3 sont trois points alignés (i.e., se trouvant sur
une droite projective D = [E], E ⊂ V de dimension deux), alors f (pi ), i = 1, 2, 3, sont
également alignés.
Cette définition est de type (a) ; le problème est alors : comment décrire concrètement
les collinéations par une formule ? – à noter aussi que, si dim PV = 1 = dim PV 0 , cette
condition est vide : dans ce cas, n’importe quelle application sera une collinéation, la
notion est alors inutile. Pour ces raisons nous partons du point de vue (b) :
4.2. Définition. Une homographie, ou application projective F : PV → PV 0 est une
application telle qu’il existe une application linéaire et injective f : V → V 0 telle que,
pour tout v ∈ V \ {0}, F ([v]) = [f (v)]. On note alors F = [f ], ou encore F = Pf .
C’est bien défini : d’abord, si v ∼ w, i.e., w = λv, on a bien f (v) = λf (w), donc
f (v) ∼ f (w). Mais il faut aussi que f (v) 6= 0 si v 6= 0, et ceci peut être en défaut en
général, mais c’est vrai si ker(f ) = 0, i.e., f est injective.
4.3. Lemme. On a [g ◦ f ] = [g] ◦ [f ] et [idV ] = idPV , et les homographies de PV forment
un groupe, dit le groupe projectif de V , noté
PGL(V ) = {[f ] | f ∈ GL(V )}.
L’application
π : GL(V ) → PGL(V ),
g 7→ [g]
est un homomorphisme de groupes, surjectif par définition de PGL(V ).
Notation : on écrit aussi PGL(n, K) = PGL(Kn ).
4.4. Lemme. On a [f ] = [g] ssi il existe λ ∈ K× tel que g = λf . Ainsi le noyau de π
est le groupe K× id des multiples de l’identité de V . Par conséquent,
PGL(V ) ∼
= GL(V )/(K× id) .
11
4.5. Exercice. L’application SL(V ) → PGL(V ), g 7→ [g], est-elle surjective ? injective ?
Rappel : SL(V ) = {g ∈ GL(V )| det(g) = 1}. Indication : regarder d’abord le cas K = C,
puis K = R et distinguer les cas dim V paire, resp. impaire.
4.6. Exercice. Soit [g] ∈ PGL(V ) et v ∈ V \ {0}. Montrer que [v] est un point fixe de
[g] ssi v est un vecteur propre de g. Si dim PV = 1 et K = R, montrer que [g] a, soit 0,
1, 2 ou une infinité de points fixes et que, dans le dernier cas, [g] = id.
4.7. Lemme. Si [E] est un sous-espace projectif de dimension k et [g] ∈ PGL(V ), alors
[g]([E]) = [g(E)] est un sous-espace projectif de même dimension k. En particulier, [g]
est une collinéation.
Remarque. Toute homographie est donc une collinéation. Que dire de la réciproque ? En
dimension 1, toute application est une collinéation, et la réciproque est alors fausse. On
verra plus tard, qu’en dimension n > 1, et pour K = R, la réponse est positive, mais pour
K = C, elle ne l’est pas.
4.8. Théorème (“Premier théorème fondamental de la géométrie projective”).
Le groupe projectif PGL(V ) agit simplement transitivement sur l’ensemble des repères
projectifs, i.e.: soient (p0 , . . . , pn+1 ) et (q0 , . . . , qn+1 ) deux repères projectifs de PV ; alors
il existe un unique élément [g] ∈ PGL(V ) tel que [g](pi ) = qi pour i = 0, . . . , n + 1.
Ce théorème est une façon d’exprimer le fait que le groupe projectif est “gros” : il agit
simplement transitivement sur certaines n + 2-uplets (les repères). En géométrie affine, le
groupe affine agit simplement transitivement sur certaines n+1-uplets (les repères affines),
et algèbre linéaire, le groupe linéaire agit simplement transitivement sur certaines n-uplets
(les bases). Ainsi le groupe affine est “plus gros” que le groupe linéaire, et le groupe
projectif est “plus gros” que le groupe affine.
Puisque tout singleton p, resp. tout couple (p, p0 ) de points distincts, peut être completé
en un repère, il s’ensuit du théorème :
4.9. Corollaire. Avec les notations du théorème:
(1) Le groupe projectif PGL(n + 1, K) agit transitivement sur KPn , i.e., pour toute paire
(x, y) ∈ (KPn )2 , il existe [g] ∈ PGL(n + 1, K) tel que [g]([x]) = [y].
(2) Le groupe projectif agit transitivement sur l’ensemble des couples (x, y) ∈ (PV )2 tels
que x 6= y.
(3) Soit PV une droite projective (n = dim V − 1 = 1). Alors le groupe projectif agit
simplement transitivement sur les triplets d’éléments deux à deux distincts de KP1 :
si (a, b, c) et (a0 , b0 , c0 ) sont deux triplets d’éléments deux à deux distincts de KP1 , il
0
existe une unique application projective f = faabc
0 b0 c0 ∈ PGL(2, K) telle que f (a) = a ,
f (b) = b0 , f (c) = c0 .
4.10. Rappel. Si un groupe G agit transitivement sur un ensemble M , et si on note
par H := {g ∈ G | g.o = o} le groupe stabilisateur d’un point de base o ∈ M , alors M
s’identifie à l’espace homogène M = G/H.
Exemple: G = GL(n + 1, K) agit transitivement sur KPn . Le stabilisateur de o := e1 est
o
na b a ∈ K× , b ∈ Kn , c ∈ GL(n, K) ,
P =
0 c
et on peut identifier ainsi KPn avec l’espace homogène GL(n + 1; K)/P .
12
Lien avec les homographies du chapitre 1
Les homographies définies ci-dessus correspondent bien aux homographies de Kn de la
forme “fraction rationnelle” définies au chapitre 1 : fixons une décomposition KPn =
Kn ∪ H∞ (Theorème 2.8) ; alors l’effet de [g] sur la partie affine Kn est précisément celui
donné par la formule rationnelle ; lorsque le dénominateur s’annule, cela signifie que le
point x ∈ Kn est “envoyé à l’infini”, c-a-d, que son image est dans la partie H∞ :
4.11. Théorème. On a PGL(n + 1, K) = Hn (K). Plus précisément: soit f := [g] ∈
PGL(n + 1, K) et écrivons g ∈ GL(n + 1, K) sous forme de matrice en blocs,
A B
g=
,
A ∈ M (n, n; K), B ∈ M (n, 1; K), γ ∈ M (1, n; K), d ∈ K .
γ d
Soit z ∈ Kn , identifié avec [z1 , . . . , zn , 1] ∈ KPn . Alors sont équivalents :
(1) l’image f (z) de z est “finie”, i.e., elle appartient encore à Kn ,
(2) γ(z) + d 6= 0.
Alors l’effet de f sur z est donné par la formule
f (z) = (γ(z) + d)−1 Az + B .
4.12. Exemples. Revoir l’exercice 1.4 : quels éléments de PGL(n + 1, K) correspondent
aux translations de Kn ? au groupe affine de Kn ? aux homothéties de Kn ?
Lien avec les projections et perspectives
Par un calcul en coordonnées, on peut montrer que les projections centrales sont données
par des formules de type “fraction rationnelle” comme ci-dessus (cf. exo. 1.13) ; on en
déduit que ce sont des applications projectives. Voici une explication conceptuelle :
4.13. Définition. Soit PV un espace projectif, et A = [E] et B = [F ] deux
sous-espaces tels que A>B (i.e., V = E ⊕ F , cf. 3.10). L’application suivante, dite
projection centrale sur B, de centre A, est bien définie:
PBA : P(V ) \ A → B,
x 7→ (x ∨ A) ∧ B
(en effet, pour un point x ∈ P(V ) \ A, le sous-espace x ∨ A est de dimension dim A + 1,
donc (x ∨ A) ∧ B est de dimension 0 (d’après le thm. 3.8), c’est donc un point).
4.14. Théorème. Avec les notations ci-dessus, soit g : V → V la projection linéaire de
V sur F , de noyau E. Alors, pour tout x = [v] avec v ∈
/ E, on a
PBA ([v]) = [g(v)] .
Il s’ensuit que, si C = [H] est un autre sous-espace tel que A>C, la restriction de PBA
à C est une homographie bijective de C sur B, induite par l’application linéaire bijective
H → F , v 7→ g(v).
En particulier, pour dim PV = 2, dim A = 0, dim B = dim C = 1, une perspective d’une
droite C sur une autre droite B (cf. déf. 2.14 et thm. 2.15) est une homographie ; elle est
donc uniquement déterminée par son effet sur trois points deux à deux distincts.
13
Chapitre 5 : Cartes et liaison affine-projective
Dans le chapitre 2, nous avons associé à chaque espace affine A un espace projectif A =
A ∪ H∞ (A) = P(A ⊕ K), muni d’un “hyperplan à l’infini” H∞ (A). Nous allons montrer
qu’il y a une réciproque de cette construction :
5.1. Théorème. Soit P = PV un espace projectif et H un hyperplan de P. Alors
UH := P \ H porte une structure naturelle d’espace affine (dite une partie affine de P).
Autrement dit, si on enlève un hyperplan H d’un espace projectif P(V ), alors l’ensemble
qui reste est un espace affine. En formalisant un peu, on dit qu’il existe une bijection
naturelle entre (la catégorie des) espaces affines et (la catégorie des) espaces projectifs
munis d’un hyperplan distingué (“hyperplan à l’infini”). Cette correspondence bijective est
parfois appelée la liaison affine-projective. Pour bien comprendre le lien entre géométrie
projective et géométrie affine, il est important de noter que tout choix d’hyperplan H dans
un espace projectif P donne lieu à un espace affine P \ H, dite “partie” ou “carte affine”
de P. Ainsi, par un choix convenable d’hyperplan, tout point de P peut être vu comme
un “point à l’infini” d’une partie affine convenable.
Il est intéressant de donner et de comparer plusieurs preuves du théorème. Une première
preuve part de la remarque suivante : soit H = [E] ; alors [v] ∈
/ [E] si, et seulement si,
la droite Kv est un supplémentaire de E, ie., V = E ⊕ Kv, puis on applique le résultat
plus général suivant :
5.2. Théorème. Soit E ⊂ V un sous-espace vectoriel quelconque. Alors l’ensemble
SE := {F sous-espace vectoriel de V | V = E ⊕ F }
des supplémentaires de E porte une structure naturelle d’espace affine, dont l’espace vectoriel de translations associé est Hom(V /E, E).
Noter que l’espace SE n’a pas de point de base préféré ; ainsi c’est un des premiers
exemples de “vrais espaces affines dans la nature mathématique”. La preuve de ce résultat
(élémentaire, mais un peu abstraite) sera donnée ailleurs. Pour une autre preuve de 5.1,
5.3. Lemme. Rappelons que E ⊂ V est un hyperplan vectoriel ssi il existe une forme
linéaire non-nulle α : V → K telle que E = ker(α). Alors α est déterminée par E à un
facteur non-nul près.
Soit donc H = ker(α). Alors
Aα = α−1 (1) = {v ∈ V | α(v) = 1}
est un espace affine et
Aα → UH ,
x 7→ [x]
est une bijection, qu’on peut utiliser pour définir sur Uα une structure d’espace affine. On
montre alors que cette structure ne change pas si on remplace α par un multiple de α.
Ainsi UH porte une structure naturelle d’espace affine.
5.4. Cartes : parties affines déterminées par une base. Fixons une base b1 , . . . , bn+1
de V . Elle donne lieu à n + 1 formes linéaires pri , les projections sur la i-e coordonnée,
et cela donne lieu à n + 1 parties affines: on appelle une carte canonique de PV la partie
Ui = {[
n+1
X
xj bj ] ∈ P(V )| xi 6= 0},
j=1
14
ou, plus précisément, les isomorphismes d’espaces affines φi : Kn → Ui donné par
x1 . . . xi−1 x̂i xi+1 . . . xn+1 7→ [x1 b1 +. . .+xi−1 bi−1 +bi +xi+1 bi+1 +. . .+xn+1 bn+1 ]
(où le signe ˆ au-dessus d’une lettre signifie que cette variable est à supprimer).
L’application inverse supprime la variable i et divise les autres composantes par xi . Noter
que PV = ∪n+1
i=1 Ui (car si x 6= 0, alors xi 6= 0 pour au moins un index i), et que les intersections Uij = Ui ∩Uj sont non-vides. Si i 6= j, nous avons la formule de changement de cartes
suivante : φ−1
j ◦ φi envoit x1 . . . xi−1 x̂i xi+1 . . . xn+1 (avec xj 6= 0) sur
xn+1
x1
1
.
.
.
x̂
.
.
.
.
.
.
j
xj
xj
xj
(où x1j se trouve en i-ème position). Par exemple, si n = 1, il n’y a que deux cartes affines
canoniques, et les deux changements de cartes sont donnés par
K× → K,
1
t 7→ .
t
Si n = 2, il y a trois cartes affines canoniques, avec changement de cartes typiques
x1 x2 7→ xx21 x12 ,
x2 x3 7→ x12 xx23 .
5.5. Remarque. Les cartes Ui forment un recouvrement de X = PV . On montrera
plus tard que (si K = R ou C) X les Ui sont en fait des ouverts par rapport à une
topologie naturelle de X : on parle alors d’un recouvrement ouvert. On constate que les
formules de changement de carte sont rationnelles, donc, si K = R ou C, les applications
n
φij = φ−1
j ◦ φi sont différentiables. On dira alors que les espaces projectifs X = KP
sont des variétés différentiables avec atlas (Ui , φi )i=1,...,n+1 . On peut dire qu’une variété
différentiable ressemble localement, mais pas globalement à un espace Rn . Dans cette
perspective, on s’intéresse à des “formules locales”, i.e., des formules qui décrivent des
structures localement, “dans une carte” – par exemple, le thm. 4.10 sur la description des
homographies dans une carte est un résultat de ce genre.
Pour terminer, revenons sur le rôle important des formes linéaires dans ce chapitre :
5.6. Définition. Soit P = PV un espace projectif. Son espace projectif dual est l’espace
projectif P0 := P(V ∗ ), où V ∗ = HomK (V, K) est l’espace vectoriel dual de V (l’espace des
formes linéaires sur V ). D’après le lemme 5.3, [α] 7→ [ker α] définit une bijection entre
P0 et l’ensemble des hyperplans de P. Nous dirons qu’un couple ([v], [α]) ∈ P × P0 est
incident si α(v) = 0 (autrement dit, si [v] appartient à l’hyperplan [ker α]). Rappelons
aussi que dim V = dim V ∗ , donc dim P = dim P0 .
Chapitre 6 : Quelques théorèmes classiques : Pappus, Desargues,...
Les résultats de ce chapitre sont des théorèmes d’incidence classiques, i.e., des théorèmes
traitant de configurations de droites et de leurs intersections. En voici un :
6.1. Théorème de Pappus. Soient D et D0 deux droites distincts dans le plan projectif KP2 , et soient a, b, c ∈ D, a0 , b0 , c0 ∈ D0 , deux à deux distincts. Alors les trois
points d’intersection u, v, w suivants sont alignés (et la droite contenant u, v, w est dite la
droite de Pappus) :
u := (b ∨ c0 ) ∧ (b0 ∨ c),
v := (c ∨ a0 ) ∧ (c0 ∨ a),
15
w := (a ∨ b0 ) ∧ (a0 ∨ b) .
Et voici une autre façon d’énoncer ce théorème. Par définition, un triangle (resp. hexagon)
est la donnée d’un triplet (resp. d’un 6-uplet) de points deux à deux distincts.
6.1. Pappus, bis. Soit (a, b0 , c, a0 , b, c0 ) un hexagon dont les sommets se trouvent à tour
de rôle sur deux droites distincts D et D0 et sont deux à deux distincts. Soient u, v, w les
points d’intersection de cotés opposés de cet hexagone. Alors, u, v, w sont alignés.
Faire un dessin ! Pour la preuve, il y a deux stratégies possibles, opposées en un certain
sens :
(A) Choisir de façon appropriée une “droite à l’infini” H = H∞ , et se ramener ainsi à un
énoncé et à une preuve “affines” dans l’espace affine KP2 \ H∞ . Dans notre cas : on pourra
choisir la droite u ∨ v comme droite à l’infini H∞ . Alors, dans l’espace affine KP2 \ H∞ ,
l’énoncé devient
(P2) (Pappus affine) Soient (b ∨ c0 ) k (b0 ∨ c) et (c ∨ a0 ) k (c0 ∨ a) ; alors w appartient aussi
à H∞ , i.e., (a ∨ b0 ) k (a0 ∨ b).
Or, ceci est le théorème classique de Pappus en géométrie affine (vu en Licence). Exercice:
revoir sa preuve (elle repose sur le théorème de Thales)!
(B) Donner une preuve “intrensèquement projective”, ce qui redemontre en même temps,
via (A), le théorème classique affine. Dans notre cas : on se sert du théorème 4.14 sur
les perspectives. On considère les trois perspectives fa : D0 → a0 ∨ b (de centre a) et
fc : b ∨ c0 → D0 (de centre c) et fv : b ∨ c0 → a0 ∨ b (centre v). On montre que fa ◦ fc et fv
ont même effet sur trois points distincts ; d’après 4.14, il s’ensuit donc que fa ◦ fc = fv .
On en déduit que fv (u) = fa ◦ fc (u) = fa (b0 ) = w, donc w se trouve sur la droite u ∨ v.
6.2. Théorème de Brianchon. Soient d et d0 deux points distincts du plan projectif
KP2 et soient A, B, C trois droites passant par d et A0 , B 0 , C 0 trois droites passant par d0 ,
deux à deux distincts. Alors les trois droites U, V, W suivants sont concourantes :
U := (B ∧ C 0 ) ∨ (B 0 ∧ C),
V = (C ∧ A0 ) ∨ (C 0 ∧ A),
W := (A ∧ b0 ) ∨ (A0 ∧ B) .
Comparons avec l’énoncé du théorème de Pappus : on obtient Brianchon si on remplace
dans Pappus le terme “point” par “droite” et inversement, le signe ∨ par ∧ et des termes
“passe par” par “se trouve sur”, etc. De cette façon, chaque théorème d’incidence admet
un théorème dual ou théorème correlatif.
6.3. Méta-théorème : “Principe de dualité”. Un théorème d’incidence (T) est
valable pour tout espace projectif PV de dimension n sur K si, et seulement si, son
théorème correlatif (T’) est valable pour tout espace projectif de dimension n sur K, où
(T’) est l’énoncé obtenu en remplaçant dans (T) le terme “point” par “hyperplan”, “sousespace projectif de dimension k” par “sous-espace projectif de dimension n − k − 1”, le
signe ∨ par ∧ et le signe ∧ par ∨.
Ce principe de dualité est propre à la géométrie projective et la distingue de la géométrie
affine ou euclidienne. La preuve consiste en l’observation que le théorème (T), énoncé
pour X = PV , peut être “lu” dans l’espace projectif dual X 0 = P(V ∗ ) : un hyperplan
dans PV est la même chose qu’un “point” dans PV ∗ (Définition 5.6), et un point de PV
correspond à un hyperplan {[α] ∈ X 0 | α(v) = 0} de X 0 . Plus précisément:
6.4. Lemme. Soit V un espace vectoriel de dimension m = n + 1 sur K. Pour un
sous-espace vectoriel E ⊂ V soit
FE := {α ∈ V ∗ | ∀e ∈ E : α(e) = 0},
16
et pour un sous-espace vectoriel F ⊂ V ∗ soit
EF := {v ∈ V | ∀α ∈ F : α(v) = 0} .
Alors E 7→ FE est une bijection de l’ensemble Grask (V ) des sous-espaces de dimension k
de V (la Grassmannienne des k-espaces dans V ) sur l’ensemble Grasm−k (V ∗ ) des sousespaces de dimension m − k de V ∗ , avec application réciproque F 7→ EF . Ces bijections
sont des anti-isomorphismes de treillis, i.e., ils renversent les inclusions et échangent les
opérations ∧ (intersection) et ∨ (somme de sous-espaces) :
FE1 ∩ FE2 = FE1 +E2 ,
FE1 + FE2 = FE1 ∩E2 .
Exercice : revoir la preuve de ce lemme (algèbre linéaire élémentaire) !
6.5. Théorème de la polaire, ou “Petit Pappus”. Soient A et B deux droites
distincts dans le plan projectif KP2 et a, a0 , a00 ∈ A, b, b0 , b00 ∈ B deux à deux distincts tels
que les droites a ∨ b, a0 ∨ b0 et a00 ∨ b00 soient concourantes en d. Alors les points o, u, v
suivants sont colinéaires :
o := A ∧ B,
u := (a ∨ b0 ) ∧ (b ∧ a0 ),
v := (a0 ∨ b00 ) ∧ (b0 ∨ a00 )
Il s’agit ici du cas particulier de la situation du théorème de Pappus où la droite de Pappus
passe par le point o = D ∩ D0 .
6.6. Théorème de Desargues. Soient (abc) et (a0 b0 c0 ) deux triangles dans le plan
projectif KP2 , ayant sommets et cotés distincts. Soient A = b ∨ c, B = a ∨ c, C = a ∨ b les
cotés de (abc) et A0 = b0 ∨ c0 , B 0 = a0 ∨ c0 , C 0 = a0 ∨ b0 les cotés de (a0 b0 c0 ). Si les droites
a ∨ a0 et b ∨ b0 et c ∨ c0 sont concourantes, alors les points A ∧ A0 et B ∧ B 0 et C ∧ C 0 sont
alignés (ils se trouvent sur une droite dite la droite de Desargues).
Concernant la preuve, les mêmes remarques comme pour la preuve du théorème de Pappus
s’appliquent. Le théorème correlatif (D’) du théorème de Desargues (D) s’énonce : si les
points A ∧ A0 et B ∧ B 0 et C ∧ C 0 sont alignés, alors les droites a ∨ a0 et b ∨ b0 et c ∨ c0
sont concourantes. Ainsi, (D’) est la réciproque logique de (D). Ainsi on peut énoncer le
théorème de Desargues en remplaçant le “si... alors...” par “...si et seulement si...”.
6.7. “Petit Desargues”. C’est le cas particulier où la droite de Desargues passe par le
point o = (a ∨ b) ∧ (a0 ∨ b0 ). Faire un dessin affine de cette situation, d’abord en prenant
la droite de Desargues comme droite à l’infini, puis en prenant une autre droite comme
droite à l’infini !
6.8. Desargues dans l’espace de dimension 3 ou plus. Soient (abc) et (a0 b0 c0 ) deux
triangles dans un espace projectif PV de dimension > 2, ayant sommets et cotés distincts,
et non dans un même plan. Soient A = b ∨ c, B = a ∨ c, C = a ∨ b les cotés de (abc) et
A0 = b0 ∨ c0 , B 0 = a0 ∨ c0 , C 0 = a0 ∨ b0 les cotés de (a0 b0 c0 ). Si les droites a ∨ a0 et b ∨ b0 et
c ∨ c0 sont concourantes en un point o, alors les points d’intersection A ∧ A0 et B ∧ B 0 et
C ∧ C 0 existent et sont alignés.
La preuve est plus simple que celle de 6.6 : les points d’intersection en question existent
car o, a, b, a0 , b0 , etc., sont coplanaires ; alors forcément ces points d’intersection se trouvent
sur l’intersection E ∩ E 0 , si E est le plan contenant (abc) et E 0 celui contenant (a0 b0 c0 ).
Ainsi E ∩ E 0 et non-vide, et comme E 6= E 0 , l’intersection E ∩ E 0 est une droite, et c’est
la droite de Desargues.
17
Chapitre 7 : Remarques sur les “fondations de la géométrie”
Les théorèmes de Pappus et de Desargues jouent un rôle particulier pour les fondations
de la géométrie projective. Revenons au chapitre 2 :
7.1. Définition. Un plan projectif abstrait est un ensemble P (de “points”) et un ensemble D de parties de P (dites des “droites de P”) tels que les propriétés (P1) – (P4) du
théorème 2.12 sont vérifiées.
Le théorème 2.12 affirme ainsi que KP2 est un plan projectif abstrait. Est-ce que tout
plan projectif abstrait est de cette forme, pour un certain corps K ? La réponse est “non”.
On peut, par exemple, remplacer le corps K dans la définition d’un espace projectif KPn
par un anneau de division (= corps non-commutatif). L’exemple le plus important est le
corps non-commutatif des quaternions H. Mais les contre-exemples ne s’arrêtent pas là :
il existe d’autres plans projectifs plus “exotiques”, comme le plan octonion OP2 .
Liée à cette question est une autre : on remarque que les énoncés des théorèmes d’incidence
(Pappus, Desargues, etc.), ont un sens dans un plan projectif abstrait P ; est-ce qu’on
peut alors affirmer que ces énoncés sont toujours vrais dans P ? La réponse est “non” :
par exemple, Pappus est en défaut dans le “plan quaternionien” HP2 , et Desargues est en
défaut dans le “plan octonion” OP2 . Plus précisément :
7.2. Théorème. Soit (P, D) un plan projectif abstrait. Alors le théorème de Pappus est
vrai dans P si, et seulement si, il existe un corps K tel que P est de la forme KP2 . Le
théorème de Desargues est vrai dans P si, et seulement si, il existe un anneau de division
D tel que P est de la forme DP2 .
Ce résultat figure dans le texte “Grundlagen der Geometrie” (“Fondations de la géométrie”)
de David Hilbert (1899), cf. http://fr.wikipedia.org/wiki/Axiomes_de_Hilbert.
Pendant plus de deux mille ans, les “Éléments” d’Euclide servait comme base et modèle de
tout développement en géométrie. Au cours du 19e siècle, les mathématiciens se rendaient
compte que ce fondement était incomplet, donc à revoir. Le texte de Hilbert a répondu à ce
besoin. Les axiomes les plus basiques que Hilbert propose sont des “axiomes d’incidence”,
du type de ceux définissant un plan projectif abstrait (déf. 7.1). Pour prouver le théorème
7.2, Hilbert construit géométriquement le corps gauche D à partir des axiomes d’incidence.
L’associativité de la multiplication de D correspond alors au théorème de Desargues, et
Hilbert a montré qu’alors D est commutatif ssi Pappus est vérifié.
En dimension > 2, la situation est plus simple – cela correspond au fait que notre preuve
du théorème de Desargues dans l’espace (Thm. 6.8) est plus simple que celle dans le plan
(Thm. 6.6). Pour un espace projectif de dimension quelconque, se basant sur le texte de
Hilbert, Oswald Veblen a proposé les axiomes d’incidence suivant :
7.3. Définition. Un espace projectif abstrait est un ensemble P (de “points”) et un
ensemble D de parties de P (dites des “droites de P”) tels que
(1) deux points distincts a, b appartient à une unique droite a ∨ b ;
(2) si a, b, c, c sont des points 2 à 2 dictincts et si a ∨ b et b ∨ d s’intersectent en un point,
alors a ∨ c et b ∨ d aussi s’intersectent en un point (“axiome de Veblen”) ;
(3) toute droite contient au moins 3 points ;
(4) il existe au moins 3 points non colinéaires.
18
Un sous-espace projectif de P est une partie E de P telle que, si x, y ∈ E, alors tous les
points de x ∨ y appartiennent aussi à E. La dimension de E est le plus grand nombre k
(s’il existe) tel qu’il existe un drapeau maximal de longueur k, i.e., une chaîne d’inclusions
de sous-espaces projectifs
E1 ⊂ E2 ⊂ . . . ⊂ Ek ⊂ E
de sorte que chaque inclusion est stricte. (Exemple : “pt. ⊂ droite ⊂ E drapeau maximal”
veut dire que E est un plan.)
7.4. Théorème. Le théorème de Desargues est vrai dans tout espace projectif abstrait de
dimension n > 2. Il s’ensuit qu’un tel espace est toujours de la forme DPn , n > 2, avec
un anneau de division D.
Il existe d’autres théorèmes de ce type qui relient des propréteés d’incidence à des structures algébriques, dont, par exemple, des résultats de la mathématicienne Ruth Moufang,
cf. http://fr.wikipedia.org/wiki/Ruth_Moufang. Le théorème 7.4 révèle un fait très
profond : des structures “exceptionnels” en géométrie se trouvent seulement en “basse
dimension” (ici : des espaces projectifs autres que les DPn n’existe qu’en dimension 2).
Voir [Berger] pour d’autres exemples de ce principe (polytopes), et le web pour des spéculations le relatant au fait que notre univers a 4 dimensions (ou 11, ou 27, selon d’autres
auteurs...).
Le (deuxième) théorème fondamental de la géométrie projective
Rappelons (Lemme 5.6) que toute homographie est une collinéation. La réciproque n’est
pas vraie : en dimension 1 elle est clairement fausse.
7.5. Théorème fondamental de la géométrie projective. Soit f : PV → PV une
bijection d’un espace projectif de dimension plus grand que 1. Alors sont équivalents :
(1) f est une semi-homographie ;
(2) f est une collinéation.
7.6. Définition. Une application f : V → W entre K-espaces vectoriels est dite
semi-linéaire si elle est additive : f (u + v) = f (u) + f (v), et si, pour tout v ∈ V et
r ∈ K, on a f (rv) = Φ(r)f (v), où Φ est un automorphisme du corps K. Toute bijection
semi-linéaire f : V → W induit une application bien-définie [f ] : PV → PW , [v] 7→ [f (v)],
dite une semi-homographie.
Exercice. Montrer que (1) ⇒ (2) : une semi-homographie est une collinéation (copier les
arguments utilisés pour une collinéation).
La preuve de l’autre implication est plus longue et plus difficile. L’étape cruciale de la
preuve est celle qui fait le lien entre des constructions d’incidence et les lois de corps de
K (addition, multiplication), de sorte que f préserve ces lois si f préserve les relations
d’incidence. Cette preuve fait intervenir des idées proches de celles utilisées dans les
preuves de 7.2 et 7.4, cf. [Berger].
Exercice, rappel ou remarque. Les corps Q et R n’ont qu’un seul automorphisme:
l’identité. Le corps C a une infinité d’automorphismes, mais seulement deux d’entre eux
sont continues : l’identité et la conjugaison complexe. Ainsi l’application CPn → CPn ,
[z] 7→ [z] est une semi-homographie, donc c’est une collinéation. Le corps Z/pZ admet un
automorphisme non-trivial : k 7→ k p . Remarque. La théorie de Galois met en relation la
structure des corps et leurs groupes d’automorphismes.
19
Chapitre 8 : Le birapport sur la droite projective
La théorie de la droite projective se distingue nettement de la théorie en dimension
supérieure : une raison en est qu’il n’y a pas de sous-espaces projectifs propres autres
que les points eux-mêmes, ainsi on ne peut pas faire de “géomètrie d’incidence sur une
droite”, et il n’y a pas de définition raisonnable d’une “droite projective abstraite” !
Ce défaut est contrebalancé par le fait que, sur les droites KP1 , il existe un invariant
numérique utile et important, le birapport (ou rapport anharmonique, anglais : crossratio; cf. http://fr.wikipedia.org/wiki/Rapport_anharmonique pour un premier survol). Notre point de départ est la remarque que un hyperplan dans KP1 est exactement la
même chose qu’un point dans KP1 ; autrement dit, l’espace X = KP1 est canoniquement
la même chose que son espace projectif dual X 0 . Sur le plan de l’algèbre linéaire, cela
se traduit par le fait qu’il y a une façon naturelle d’identifier un espace vectoriel V de
dimension 2 avec son espace dual V ∗ :
8.1. Définition. Une forme symplectique sur un espace vectoriel V est une application bilinéaire et alternée ω : V × V → K (i.e., ω(v, v) = 0 pour tout v ∈ V ) qui est
non-dégénérée (i.e., si ω(v, w) = 0 pour tout w ∈ V , alors v = 0). Remarque : l’alternance
(ω(v, v) = 0) implique que ω est antisymétrique : ω(u, v) = −ω(v, u).
8.2. Lemme. Soit dim V = 2 et b1 , b2 une base de V . Alors il existe une unique forme
symplectique ω : V × V → K telle que ω(b1 , b2 ) = 1. Cette forme est donnée par
ω(x1 b1 + x2 b2 , y1 b1 + y2 b2 ) = x1 y2 − x2 y1 .
Toute autre forme symplectique est un multiple de cette forme.
Ainsi ω est “unique à un scalaire non-nul près” ; on l’appelera la forme symplectique
canonique sur V .
8.3. Corollaire. Soit ω une forme symplectique sur un espace vectoriel de dimension 2.
Alors, pour tout g ∈ GL(V ) et pour tout u, v ∈ V ,
ω(gv, gu) = det(g) · ω(v, u) .
De plus, u et v sont linéairement indépendants ssi ω(u, v) 6= 0.
8.4. Corollaire. Soit dim V = 2. L’application
ι : PV → P(V ∗ ),
[v] 7→ [ω(·, v)]
est bien définie et indépendant du choix de forme symplectique ω sur V .
Le corollaire décrit donc une identification canonique d’une droite projective avec son dual.
Tout point p = [v] de la droite projective PV s’identifie avec l’hyperplan ι(p). Noter que
p et ι(p) sont toujours incidents, ce qui correspond au fait que ω(v, v) = 0.
8.5. Définition du birapport. Soit dim V = 2 et ω une forme symplectique sur V , et
soient ([a], [b], [c], [d]) ∈ (PV )4 , deux à deux distincts. Leur birapport est la quantité
BR([a], [b], [c], [d]) :=
ω(c, a) ω(d, a)
ω(c, a) ω(d, b)
:
=
·
∈ K.
ω(c, b) ω(d, b)
ω(c, b) ω(d, a)
Ceci est bien défini : la quantité ne change pas si on remplace ω, resp. a, b, c ou d, par
des multiples ! Remarque : cette définition s’applique aussi à 4 points colinéaires dans
20
un espace projectif de dimension supérieur – en effet les 4 vecteurs correspondants se
trouvent dans un plan vectoriel, auquel la définition précédente s’applique. Par rapport
à n’importe quelle base, on a la formule
BR([a], [b], [c], [d]) =
c1 a2 − a1 c2 d1 a2 − a1 d2
:
.
c1 b2 − b1 c2 d1 b2 − b1 d2
(∗)
8.6 Lemme. Le birapport est un invariant du groupe projectif : pour tout g ∈ GL(V ),
BR([ga], [gb], [gc], [gd]) = BR([a], [b], [c], [d]) .
Le birapport peut être interprétée comme un rapport dans l’espace affine PV \ {[d]} :
8.7. Théorème. Choisissons un repère projectif 0 = [e2 ], ∞ = [e1 ], 1 = [e1 + e2 ] et
écrivons a = a1 e1 + a2 e2 , etc.
(1) Supposons que a, b, c, d sont finis (i.e., 6= ∞) et normalisons a2 = 1 = b2 = c2 = d2 .
Alors on a la “formule dans la carte canonique”
BR([a], [b], [c], [d]) =
(c1 − a1 ) × (d1 − b1 )
c 1 − a1 d 1 − a1
:
=
.
c1 − b1 d1 − b1
(c1 − b1 ) × (d1 − a1 )
(A)
(2) Si d = ∞ et a2 = 1 = b2 = c2 , en utilisant le rapport dans l’espace affine, cf. déf.
1.10,
c 1 − a1
(B)
BR([a], [b], [c], [∞]) = R(a1 , b1 , c1 ) =
c 1 − b1
(3) Finalement,
BR(∞, 0, 1, d) =
d1
.
d2
(C)
La formule (A) peut servir pour définir le birapport de 4 points sur une droite affine. La
formule (C) s’écrit, en identifiant x 6= ∞ avec un élément de K, BR(∞, 0, 1, x) = x.
Notation : dans la suite, nous travaillons souvent directement avec un point a ∈ KP1 au
lieu d’écrire [a] ∈ KP1 . Si besoin est, on peut toujours écrire a sous la forme [v], v ∈ V .
8.8. Théorème. Fixons un repère projectif, comme dans le théorème précédent, et
∞01
identifions PV \ {∞} avec K. Soit a, b, c ∈ PV , deux à deux distincts, et soit f = fabc
l’unique élément de PGL(2, K) tel que f (a) = ∞, f (b) = 0, f (c) = 1 (cf. 4.9 (3) ). Alors
on a
∞01
BR(a, b, c, d) = fabc
(d).
En effet, par rapport à l’inclusion K ⊂ KP1 , on a, en utilisant (C) ci-dessus,
f (d) = BR(∞, 0, 1, f (d)) = BR(f (a), f (b), f (c), f (d)) = BR(a, b, c, d).
8.9. Remarque : birapport à valeurs dans la droite projective. Le théorème
donne une autre définition possible du birapport (utilisée par beaucoup d’auteurs) : on
fixe un repère, et pour a, b, c deux à deux distincts et d ∈ KP1 quelconque, on définit
∞01
BR(a, b, c, d) := fabc
(d) ∈ KP1 .
21
Comme le plongement de K dans KP1 dépend du repère, cette définition n’est plus indépendant du repère. Son avantage est qu’elle donne un sens au valeurs du birapport
suivantes :
BR(a, b, c, c) = 1, BR(a, b, c, b) = 0, BR(a, b, c, a) = ∞.
8.10. Théorème. La réciproque du lemme 8.6 est vraie aussi : soit f : PV → PV une
bijection qui préserve le birapport, alors f est une homographie.
Pour la preuve, on se ramène au cas f (∞) = ∞ ; alors la restriction de f à la droite affine
K = PV \ {∞} préserve les rapports. Il suffit alors de montrer que une application d’une
droite affine qui préserve les rapports est une application affine.
L’ordre des 4 points dans la définition du birapport est important. Rappelons que le
groupe S4 de permutations de 4 lettres agit par permutation sur les 4 variables d’un
quadruplet de points.
8.11. Théorème. Le birapport est invariant sous les permutations σ1 := (12)(34) et
σ2 := (14)(23) :
BR(a, b, c, d) = BR(b, a, d, c) = BR(d, c, b, a) .
Il s’ensuit qu’il est invariant aussi sous σ3 = (13)(24), et donc sous le groupe de Klein
{id, σ1 , σ2 , σ3 }. Sous les permutations (12) et (23), le birapport se transforme selon
BR(b, a, c, d) =
1
,
BR(a, b, c, d)
BR(a, c, b, d) = 1 − BR(a, b, c, d).
Les permutations données dans le théorème engendrent S4 , et donc on connait maintenant
le comportement du rapport sous toute permutation.
8.12. Exercice. À partir de λ = BR(a, b, c, d), on obtient par permutation les valeurs
λ,
1 − λ,
λ−1 ,
(1 − λ)−1 ,
1 − λ−1 ,
(1 − λ−1 )−1 .
Montrer que ces six valeurs sont 2 à 2 différentes, sauf si l’un deux appartient à liste
πi
suivante : −1, 1, e 3 (ce dernier si, par exemple, K = C). Etudier les valeurs possibles du
birapport dans chacun des trois cas.
8.13. Définition. Si BR(a, b, c, d) = −1, on dit que les quatre points sont en division harmonique. Étant donné un triplet de points (a, b, c), l’unique point d tel que
BR(a, b, c, d) = −1, s’appelle le conjugué de c par rapport à a et b.
8.14. Lemme. Prenons d comme point à l’infini. Alors BR(a, b, c, d) = −1 si et
seulement si, dans la droite affine K = KP1 \ {d}, on a
c − a = b − c,
ou encore :
2c − a = b,
ce qui veut dire que a et b sont symétriques par rapport au point c, ou encore (si car(K) 6=
2): c = a+b
est le milieu (barycentrique) de a et de b dans la droite affine KP1 \ {d} .
2
Si on choisit ∞ différent de d, on peut dire (pour K = R) que a, b, c, d ∈ K sont en
division harmonique ssi l’un des deux points c et d est à l’intérieur du segment [ab] et
l’autre à l’extérieur, et de plus les rapports de longueur ca
et da
sont égaux. Exemple :
cb
db
1
1
(0, n+1
, n1 , n+2
) sont en division harmonique.
22
8.15. Définition. Soit KP2 le plan projectif sur K. Un quadrilatère complet est la
donnée de 4 droites dans KP2 telles que trois quelconques parmi elles ne soit pas concurrentes. Alors ces droites ont 6 points d’intersection, et parmi les droites reliant ces
points entre eux il y a exactement 3 “nouvelles” droites que l’on appelera les “diagonales
du quadrilatère”. (Faire un dessin !)
8.16. Théorème. Soit D une diagonale d’un quadrilatère complet, par deux points,
disons a et b, du quadrilatère. Soient i et j les points d’intersection de D avec les deux
autres diagonales. Alors j est le conjugué harmonique de i par rapport à a et b, i.e.:
BR(a, b, i, j) = −1.
La preuve la plus simple consiste à choisir l’une des trois diagonales comme droite à l’infini.
Les autres deux diagonales deviennent alors les diagonales d’un parallèlogramme affine.
Or, en géométrie affine on montre facilement que les sommets d’un parallèlogramme sont
symétriques par rapport au point d’intersection des deux diagonales.
Chapitre 9 : Coniques et quadriques projectives
9.1. Introduction : exercice préliminaire. Soit C := {x ∈ R3 | q(x) = 0}, avec
q(x) = x21 + x22 − x23 , le cône circulaire. Faire un dessin et montrer que l’intersection de C
avec un plan affine E de R3 peut être, selon la position de ce plan :
0) un point ;
1) une droite ;
2) deux droites qui s’intersectent ;
3) une ellipse ;
4) une hyperbole ;
5) une parabole.
La figure d’intersection du cône C avec un plan affine E est dite une conique affine. Montrer que l’ensemble PC := [C] := {[x] ∈ P(R3 ) | q(x) = 0}, dite une conique projective,
est bien défini, et que les figures 3) – 5) peuvent apparaitre comme intersection PC ∩ A
de PC avec une partie affine A de P(R3 ). Ainsi ellipses, hyperboles et paraboles sont
des images affines différentes d’une même conique projective, et ils ont donc des propriétés “projectives” en commun – propriétés étudiées depuis l’antiquité (Appolonius),
puis de nouveau grâce au développement des idées générales de la géométrie projective
(Pascal, Poncelet,...), voir, pour des remarques historiques, http://fr.wikipedia.org/
wiki/Conique.
9.2. Rappel : formes quadratiques. Passons au cas d’un corps quelconque K (de
caractéristique 6= 2). Rappelons qu’une forme quadratique sur un K-espace vectoriel V
est une application q : V → K de la forme q(x) = β(x, x) où
β :V ×V →K
est une application bilinéaire symétrique. Le rang de q est le rang de l’application linéaire
β̂ : V → V ∗ ,
v 7→ β(v, ·)
et le noyau de β (ou : de g est, par définition, le noyau de β̂ :
ker(q) := ker(β) := ker(β̂) = {v ∈ V | ∀w ∈ V : β(v, w) = 0}.
23
Après choix d’une base, en identifiant V à Kn , on peut mettre q : Kn → K sous la forme
q(x) =
n
X
aij xi xj = xt Ax
i,j=1
avec la matrice symétrique A = (aij ) = (β(bi , bj )). La forme bilinéaire associée est alors
β(x, y) = xt Ay.
Le rang de q est alors celui de la matrice A, et on dit que q et β sont non-dégénérées si
le rang est maximal, i.e., si det(A) 6= 0. Un vecteur v ∈ V est dit isotrope si q(v) = 0 et
v 6= 0. L’ensemble
C = {x ∈ Kn | q(x) = 0}
est homogène par rapport au scalaires dans le sens que x ∈ C ssi λx ∈ C pour λ ∈ K× .
Le choix d’une forme quadratique sur V a deux effets sur l’espace projectif P(V ) :
A), elle définit une quadrique projective, et
B), via β̂, elle définit une polarité :
9.3. Définition. Une quadrique projective est une partie [C] ⊂ P(V ) de la forme
[C] := {[x] ∈ P(V ) | q(x) = 0, x 6= 0},
où q : V → K est une forme quadratique non-nulle. Elle est dite propre si q est nondégénérée. Si dim P(V ) = 2, on parle d’une conique. Une quadrique (conique) affine
est un ensemble de la forme [C] ∩ A, où [C] est une quadrique (conique) projective et
A = PV \ H est une partie affine de PV (H un hyperplan). Si H = [ker α], cette image
affine est donnée par
{x ∈ V | α(x) = 1, q(x) = 0}.
9.4. Exemple.
(1) Ellipse, hyperbole et parabole sont des images affines provenant de la même conique
projective, selon le cas où la droite à l’infini H∞ est extérieure, sécante ou tangente de la
conique (exercice 9.1).
(2) Attention : une quadrique peut être vide ! Soit q(x) = x21 + x22 + x23 . Si K = R, la
conique [C] ⊂ RP2 est vide (car le seul vecteur isotrope est 0). Si K = C, la conique
[C] ⊂ CP2 est non-vide : par exemple, [(0, i, 1)], [(0, −i, 1)] ∈ [C] (l’image affine pour
x3 = 1 est {(x1 , x2 ) ∈ C2 | x21 + x22 = −1}).
9.5. Définition. Soit x ∈ V tel que la forme linéaire β(x, ·) : V → K est non-nulle.
Alors l’ensemble
x⊥ := ker(β(x, ·)) = {y ∈ V | β(x, y) = 0}
est un hyperplan de V (i.e., un élément de P(V )0 ), et l’hyperplan projectif
[x]⊥ := [x⊥ ] = [ker(β(x, ·))] ⊂ P(V )
s’appelle la polaire du pôle [x]. Noter qu’un point [x] ∈ P(V ) appartient à la quadrique
Q si et seulement si [x] est sur sa polaire [x⊥ ].
9.6. Lemme. Si q est non-dégénérée, alors l’application
[β̂] : P(V ) → P(V )0 ,
24
[x] 7→ [x⊥ ]
est une homographie bijective, dite une polarité.
9.7. Exemple.
(a) Cas d’un produit scalaire sur V = Rn+1 . La quadrique est vide, mais la polarité est
bien définie. Pour n = 1: produit scalaire q(x) = x21 + x22 , avec polarité:
RP1 → RP1 ,
[(x1 , x2 )] 7→ [(−x2 , x1 )]
P
(b) Cas de la forme Lorentzienne sur Rn+1 : q(x) = ni=1 x2i − x2n+1 . La quadrique [C] est
donnée par le cône circulaire. Pour n = 1, q(x) = x21 − x22 , la quadrique a exacement deux
points : [(1, 1)] et [(1, −1)], et la polarité est décrite par :
RP1 → RP1 ,
[(x1 , x2 )] 7→ [(x2 , x1 )]
Passons au cas d’un corps général pour classifier les quadriques en dimesion un :
Le cas d’une droite projective (dimension 1)
9.8. Théorème (quadriques en dimension 1). Soit dim V = 2 et q : V → K une
forme quadratique. Alors précisément les 4 cas suivants peuvent se produire :
(0) rang nul : q = 0 ;
(1) rang un : il existe une base b1 , b2 de V telle que q(x) = λ1 x21 avec λ1 6= 0 ;
(2a) rang deux, anisotrope : q n’admet pas de vecteur isotrope ;
(2b) rang deux, isotrope : il existe une base b1 , b2 de K2 par rapport à laquelle
0 1
q(x1 b1 + x2 b2 ) = 2x1 x2 ,
matrice p.r. à cette base :
1 0
(K2 muni d’une telle forme s’appelle un plan hyperbolique).
Pour la quadrique Q dans la droite projective P(V ), précisement les 4 cas suivants peuvent
se produire:
(0) rang nul : Q = PV ;
(1) rang un : Q contient un seul point ;
(2a) rang deux, anisotrope : Q = ∅ ;
(2b) rang deux, isotrope : Q contient deux points (à savoir, [b1 ] et [b2 ]).
Noter que sur C, le cas (2a) ne peut pas se produire. Géométriquement, le cas (2b) est
le plus intéressant. Noter que, dans ce cas, par un chagement de base, on peut aussi
se ramener à la forme normale q(x) = x21 − x22 (matrice diagonale dia(1, −1)). Pour la
polarité, on a :
9.9. Proposition. Soit dim V = 2 et supposons Q est de type (2b) ci-dessus, et écrivons
Q = {a, b} avec a, b ∈ PV , a 6= b. Alors la polaire du point x ∈ PV s’identifie au point
y ∈ PV tel que le quadruplet (a, b, x, y) soit harmonique, i.e., BR(x, y, a, b) = −1.
25
Le cas des coniques (dimension 2)
9.10. Théorème (classification des coniques). Soit dim V = 3 et q : V → K une
forme quadratique. Alors précisément les cas suivants peuvent se produire:
(0) rang nul : q = 0 ;
(1) rang un : il existe une base b1 , b2 , b3 de V telle que q(x) = λ1 x21 avec λ1 6= 0 ;
(2a) rang deux, anisotrope : V = P ⊕ K avec P un plan anisotrope et K = ker(β) ;
(2b) rang deux, isotrope : V = H ⊕ K avec H un plan hyperbolique et K = ker(β) (alors
il existe une base b1 , b2 , b3 de V par rapport à laquelle q(x) = 2x1 x2 )
(3a) rang trois, anisotrope : q n’admet pas de vecteur isotrope
(3b) rang trois, isotrope : il existe une base b1 , b2 , b3 de V par rapport à laquelle


0 λ 0
λ 0 0  (λ 6= 0).
matrice p.r. à cette base :
q(x) = λ(2x1 x2 + x23 );
0 0 λ
Pour la conique correspondante, précisément les cas suivants se produisent :
(0) rang nul : Q = P(V ) ;
(1) rang un : Q est une droite projective (dite “double”) ;
(2a) rang deux, anisotrope : Q est un point ( = [ker β]) ;
(2b) rang deux, isotrope : Q est la réunion de deux droites (qui s’intersectent en [ker β]);
(3a) rang trois, anisotrope : Q = ∅ ;
(3b) rang trois, isotrope : Q ∼
= {[x] ∈ KP2 | 2x1 x2 + x23 = 0}
Le seul cas d’une conique propre et non-vide est donc (3b) ; pour cette raison on parle
de “la” conique propre non-vide. Noter que, par un changment de base, on peut alors
mettre la matrice de β sous forme diagonale dia(−1, 1, 1), ce qui correspond au cas du
cône circulaire si K = R ; dans ce cas, on retrouve donc les coniques classiques (exercice
9.1). Nous allons étudier ce cas plus en détail dans le chapitre suivant.
Classification des quadriques en dimension quelconque
9.11. Pour un corps K quelconque, si dim V > 3, il n’existe plus de classification complète
de formes quadratiques. (Cependant, pour K = C et K = R, une telle classification est
relativement simple : revoir les cours de Licence !) Cependant, une classification grossière
selon les principes du théorème précédent est toujours possible: on peut décomposer
V = A ⊕ H1 ⊕ . . . ⊕ Hk ⊕ K,
avec K = ker(β), A un sous-espace anisotrope (i.e., q|A est une forme anisotrope) et
H1 , . . . , Hk des plans hyperboliques. Tout les problèmes mathématiques de classifications
se cachent maintenant dans la partie A. Si q est non-dégénérée (i.e., K = 0), on peut
donc gossièrement distinguer deux types:
26
(a) A 6= 0 ;
(b) A = 0, i.e., V = H1 ⊕ H2 ⊕ . . . Hk (cas dit artinien).
En genéral, le cas (a) est “sauvage” : une classification explicite est très difficile. (Si
K = C, le cas (a) ne se produit pas ; pour K = R, dim A est lié à la signature de q.) Dans
le cas (b), dim V = 2k est paire, et on peut regrouper les vecteurs de base telle que la
matrice de β soit
0 1k
1k 0
ou bien, via un changement de base :
.
1k 0
0 −1k
Le cas k = 1 est celui du théorème 9.8 ; le cas suivant est k = 2, donc dim V = 4 :
(4a) V = A ⊕ H ;
(4b) V = H1 ⊕ H2 .
Pour un corps quelconque, le type (4a) peut donner lieu à beaucoup de sous-cas ; si
K = R, (4a) donne lieu à un seul cas, le cas lorentzien : q(x) = x21 + x22 + x23 − x24 .
Pour x4 = 1, nous avons la sphère S 2 comme image affine ; pour x1 = 1, nous trouvons
l’hyperboloïde à deux nappes comme image affine. Le cas artinien (4b) est très intéressant: par rapport à une base convenable, q(x) = x21 + x22 − x23 − x24 ; pour x4 = 1, son
image affine est l’hyperboloïde à une nappe {x ∈ R3 | x21 + x22 − x23 = 1}. Devoir : faire
un beau dessin...
Sécantes et tangentes
Soit D = [E] une droite de P(V ) et Q une quadrique. On veut décrire la position de D
par rapport à Q. L’intersection D ∩ Q est une conique dans [E]. Le théorème 9.8 donne :
9.12. Proposition. Soit Q une quadrique projective dans un espace projectif PV et D
une droite de PV . Pour l’intersection D ∩ Q, précisément les cas suivants peuvent se
produire:
(0) rang nul : D ⊂ Q ;
(1) rang un : D ∩ Q contient un seul point ;
(2a) rang deux, anisotrope : D ∩ Q = ∅ ;
(2b) rang deux, isotrope : D ∩ Q contient deux points.
9.13. Définition. Si Q ∩ D est de rang nul ou un (cas (0) ou (1)), D est dite une
tangente de Q. Dans le cas (2b), D est dite une sécante de Q, et dans le cas (2a) une
droite extérieure.
9.14. Exemples.
(1) Soit dim V = 3 et D = [E] avec dim E = 2, et considérons le cas de la conique propre
non-vide. Alors il n’existe aucun planE isotrope dans V (i.e, tel que β(E, E) = 0, car
sinon, la matrice de β serait de rang 2 : contradiction). Ainsi, le cas (0) ne se produit pas
pour la conique propre. Toute tangente à la conique propre est donc de type (1), i.e., elle
touche la conique en un seul point.
(2) Soit dim V = 4, cas (4b) (cas artinien). Par rapport à une base convenable, q(x) =
x1 x2 +x3 x4 . Si D = [E] avec E ⊂ K4 le plan de base e2 , e3 , alors E est un plan totalement
isotrope, i.e., q(E) = 0, donc D ⊂ Q: on est dans le cas (0). Il existe donc des droites
27
tangentes à Q complètement inclues dans Q (revoir la géométrie affine de l’hyperboloide
à une nappe !).
9.15. Lemme. Soit Q une quadrique non-dégénérée de P(V ), soit p ∈ Q et Tp Q := p⊥
son hyperplan polaire. Soit D ⊂ P(V ) une droite passant par p. Alors D est une tangente
de Q si, et seulement si, D ⊂ p⊥ . Ainsi Tp Q, dit l’hyperplan tangent de Q au point p, est
la réunion de toutes les droites tangentes à Q et passant par le point p.
Images affines d’une quadrique projective
9.16. Définition. Soit Q ⊂ P(V ) une quadrique propre et H = [E] ⊂ P(V ) un
hyperplan, considéré comme “hyperplan à l’infini” de la partie affine A = P(V ) \ H.
L’image affine QA := Q ∩ A de Q est dite
– complète ou elliptique si H est extérieur à Q dans le sens que Q ∩ H = ∅ ;
– parabolique si H est tangent à Q dans le sens qu’il existe p ∈ Q tel que H = Tp Q ;
– hyperbolique sinon.
9.17. Exercice. Montrer : avec les notations ci-dessus,
(1) l’image affine QA est parabolique ssi la restriction q|E est dégénérée ;
(2) l’image affine QA est elliptique ssi la restriction q|E est anisotrope ;
(3) l’image affine QA est hyperbolique ssi la restriction q|E est non-dégénérée et admet
au moins un vecteur isotrope.
9.18. Exemples.
(1) Pour K = R, la sphère est une image complète de la quadrique définie par la forme
Lorentzienne. Une autre image (hyperbolique) est L’hyperboloïde à deux nappes. Pour
K = C, il n’y a jamais d’image affine complète.
(2) L’hyperboloïde à une nappe est une image hyperbolique de la quadrique artiniebbe Q
dans RP3 . Cette quadrique n’admet aucune image affine complète. Plus généralement: si
E est un hyperplan non-dégénéré de V , on décompose V = E ⊕E ⊥ , avec E ⊥ de dimension
1. En écrivant v = (x, t) ∈ E ⊕ E ⊥ et q(v) = q 0 (x) + at2 , avec a 6= 0, puis en divisant par
a, l’image affine QA peut être mis sous la forme
QA ∼
= {z ∈ A | q 0 (z) = −1}.
Si l’équation q 0 (x) n’a pas de solution non-nulle dans E, l’image est complète.
9.19. Image affine parabolique d’une quadrique. Ce type d’image généralise la
parabole (=graphe de l’application R → R, t 7→ t2 ) : on vera que QA est le graphe d’une
application quadratique W → K, où W est de dimension dim V − 2.
Définition. Soit V = W × K avec dim W = n. Un paraboloïde affine dans V est un
ensemble de la forme suivante, où q 0 : W → K est une forme quadratique :
{(y, t) | x ∈ V, t = q 0 (x)}
Autrement dit, c’est le graphe de l’application q 0 : W → K.
28
Soit Q = Qβ une quadrique propre non-vide, et fixons deux points p = [P ] et s = [S]
dans Q, tels que p ∨ s soit une sécante (i.e., β(P, S) 6= 0 ; on peut alors normaliser P tel
que β(P, S) = 1). Soit F := KP ⊕ KS le plan hyperbolique de base P, S ; on a alors une
décomposition
V = F ⊕ F ⊥ = KP ⊕ KS ⊕ B,
B := F ⊥ = P ⊥ ∩ S ⊥ .
Noter que S ⊥ = KS ⊕ F ⊥ et P ⊥ = KP ⊕ F ⊥ .
9.20. Lemme. Soit H := Tp Q et A := P(V ) \ H. Alors A est un espace affine qui
s’identifie à
{v ∈ V | β(v, P ) = 1} = {S + tP + b | t ∈ K, b ∈ B} ∼
= B × K.
Le point S + tP + b correspond au couple (b, t). L’image affine Q ∩ A s’identifie alors au
graphe
1
{(b, − q(b)) | b ∈ B}
2
de l’application − 21 q : B → K.
Preuve. Soit α = β(P, ·), donc H = [ker α]. On identifie A avec {v ∈ V | α(v) = 1}.
Tout élément v ∈ A s’écrit donc v = S + tP + b avec t ∈ K et b ∈ B. La condition
0 = β(v, v) = β(S + tP + b, S + tP + b) équivaut alors à
1
1
t = − β(b, b) = − q(b),
2
2
ainsi l’image affine Q ∩ A ∼
= {− 12 q(b)P + b | b ∈ B} de la quadrique s’identifie au graphe
1
de l’application − 2 q : B → K.
Remarque. Pour toute fonction f : M → N , l’application m 7→ (m, f (m)) établit une
bijection entre M et le graphe de f . Ainsi, B → Q ∩ A, b 7→ (b, − 21 q(b)) est une bijection.
Exemple. La conique propre non vide. Comme dim B = 1, le graphe {(x, f (x)) | x ∈ B}
d’une fonction f : B → K est en bijection avec K via x 7→ (x, f (x)). De plus, dans ce cas
Q ∩ Tp Q est le point p, de sorte que Q ∼
= {p} ∪ K. Noter que cette décomposition de Q
1 ∼
ressemble à celle de KP = K ∪ {∞}. Nous allons voir dans le chapitre suivant que cette
identification de la conique Q avec la droite projective KP1 est naturel dans plusieurs
regards.
9.21. Remarque : comparaison des points de vue projectifs et affines. En
géométrie affine, on définit une quadrique affine comme partie d’un espace affine A de
la forme {x ∈ A | f (x) = 0}, où f : A → K est une fonction quadratique, i.e., f (x) =
q(x) + a(x) + c, avec q : A → K une forme quadratique, a : A → K une forme linéaire et c
une constante. Nous avons vu que toute image affine d’une quadrique projective est une
quadrique affine. La réciproque est vraie aussi (cf. TD) : si on fixe une origine dans A et
on pose V := A ⊕ K, montrer qu’alors la fonction
F : V → K,
F (x, t) := t2 f (t−1 x)
est homogène quadrique ; comme F (x, 1) = f (x), l’image affine t = 1 de la quadrique
{[v] | F (v) = 0}, où v = (x, t), redonne la quadrique du départ.
29
Chapitre 10 : Projection stéréographique et applications
10.1. Exercice : la projection stéréographique classique. Cette application sert à
identifier la sphère S n à la réunion de Rn avec un unique point ; elle joue un rôle important
en géométrie, en topologie et (si n = 2) en cartographie (cf. [Berger] !). L’exercice suivant
est au niveau de cours de Licence : soit S n = {x ∈ Rn+1 | hx, xi = 1} la
Psphère unité de
n+1
l’espace euclidien R
muni de son produit scalaire standard hu, vi = i ui vi . Le point
N = en+1 (dernier vecteur de la base canonique) est appelé le pôle nord de S n , et le point
S = −N le pôle sud. Dans la suite, la lettre P désignera indifféremment le point N ou le
point S. On note UP := S n \ P et P ⊥ = {x ∈ Rn+1 | hx, P i = 0} = {x ∈ Rn+1 |xn+1 = 0}
l’hyperplan orthogonal à P que l’on identifiera avec Rn en identifiant y = (y1 , . . . , yn ) ∈ Rn
avec (y1 , . . . , yn , 0) ∈ Rn+1 .
• Pour tout point x ∈ S n , x 6= P , montrer que la droite x ∨ P admet un unique point
d’intersection avec P ⊥ , qu’on note ΦP (x), et qu’il est donné par la formule
ΦP (x) =
1
x − hx, P iP .
1 − hx, P i
• La projection stéréographique (du pôle P sur P ⊥ ) est définie par
ΦP : UP → P ⊥ ,
x 7→ ΦP (x).
Montrer que l’application ΦP est bijective et calculer l’application réciproque.
• Montrer que ΦP est un homéomorphisme (i.e., continu dans les deux sens).
• Soit n = 1. Faire un dessin du plan R2 avec S 1 , N , S, P ⊥ , y = ΦS (x) et z = ΦN (x)
(pour un choix générique de x ∈ S 1 ). Par un argument de géométrie élémentaire
(observer que les triangles Sy0 et N 0z sont semblables), montrer que
ΦN (Φ−1
S (y)) =
y
.
||y||2
Montrer que cette formule est valable aussi dans le cas de n général (on pourra faire
un calcul direct, ou invoquer le cas n = 1 par un argument géométrique).
• Montrer que l’application
h : P ⊥ \ {0} → P ⊥ \ {0},
y 7→ ΦN (Φ−1
S (y))
est un difféomorphisme de classe C ∞ et calculer sa différentielle Dh(y).
10.2. La projection stéréographique : définition projective. Nous allons
généraliser la construction classique en remplaçant la sphère S n par une quadrique projective Q et R par un corps K. La définition reste presque inchangée, le seul changement important étant qu’il ne faut pas seulement enlever le pôle P , mais tout l’ensemble
Q ∩ TP Q, pour que le projection Φ(x) soit définie pour un x ∈ Q. (Rappel : pour une
conique, Q ∩ TP Q est toujours réduit à un point, mais pour un hyperboloïde à une nappe,
cet ensemble est bien plus grand : il contient deux droites.)
30
Proposition. Soit Q une quadriqe projective et p ∈ Q. Soit A := P(V ) \ Tp Q et
QA := Q ∩ A. Soit F un hyperplan de P(V ) tel que p ∈
/ F , et FA = F ∩ A (hyperplan
affine de A). Alors la projection stéréographique depuis p
Φp := ΦpQ,F : QA → FA ,
x 7→ (x ∨ p) ∧ F
est bien définie et bijective, d’application réciproque FA → QA , y 7→ (y ∨ p) ∧ QA .
10.3. Remarque : dépendance de F . La dépendance du choix de l’hyperplan F est
inessentielle, dans le sens suivant : si on choisit un autre hyperplan F 0 différent de Tp Q,
alors la nouvelle projection stéréographique est obtenue en composant l’ancienne par une
homographie (projection centrale de F sur F 0 ; cela découle directement de la définition):
ΦpQ,F 0 = PFp 0 ,F ◦ ΦpQ,F .
Plus important est d’étudier la dépendance du pôle de projection : par la réciproque
d’une projection stéréographique depuis un point s, on va d’un hyperplan F sur Q, puis
on reprojette depuis un autre point n sur le même hyperplan. La composée Φn ◦ (Φs )−1
n’est pas définie pour tous les points de F , mais elle le sera pour “presque tout point”
de F . Cela ressemble beaucoup à la situation de “changement de carte” décrite dans le
chapitre 5 : en effet, le projections stéréographiques peuvent servir pour définir un atlas
sur Q (cf. la remarque 5.5). La description deviendra plus simple si nous fixons le choix
de F tel que, dans l’image affine parabolique, la projection stéréographique sera décrite
par la projection naturelle (x, f (x)) 7→ x d’un graphe {(x, f (x)) | x ∈ M } sur M :
10.4. Théorème. Soit n, s ∈ Q deux points tel que n ∨ s soit une sécante de Q, et soit F
un hyperplan de PV tel que Tn Q∩Ts Q = F ∩Tn Q = F ∩Ts Q. (Un tel hyperplan est obtenu
par le choix d’un point ` ∈ n ∨ s différent de n et de s et en posant F := (Tn Q ∩ Ts Q) ∨ `.)
Soit A l’espace affine P(V ) \ Tn Q. L’hyperplan affine E := FA = F ∩ A, s’identifie alors
avec B = S ⊥ ∩ N ⊥ (cf. 9.19 et 9.20). L’application
Φn,s : E 99K E,
s
n
x 7→ PQ,F
(PQ,F
)−1 (x)
b
, définie si β(b, b) 6= 0, et où γ 0 ∈ K×
est alors donnée par la formule B 99K B, b 7→ γ 0 β(b,b)
est une constante dépendante du choix de `.
Preuve. Faire un dessin de la situation géométrique (tel que l’intersection Tn Q ∩ Ts Q
apparaît dans le dessin comme un point ; ce point représente en réalité un sous-espace
projectif de dimension n − 2 !) On utilise les notations de 9.19 et 9.20, avec n = [N ] au
lieu de p = [P ] : V = KN ⊕ KS ⊕ B, et soit ` = [L] avec L = S + γN (où γ ∈ K× ) et
F = [E]. Alors
E ∩ S ⊥ = E ∩ N ⊥ = S ⊥ ∩ N ⊥ = B,
et grâce à ces choix, l’hyperplan affine FA est parallèle à Ts Q dans l’espace affine A ∼
=
B × K. Dans l’identification A ∼
= B × K,
– le point s = [S + 0 + 0] correspond à (0, 0) ;
– l’espace tangent Ts Q correspond à B × 0 ;
– l’espace affine FA correspond aux couples (b, γ) avec b ∈ B ;
– la droite s ∨ n correspond à 0 × K (dont n est le point à l’infini) ;
– la quadrique affine QA correspond aux couples (b, − 12 q(b), b ∈ B ;
– la projection stéréographique depuis n est la projection (b, − 21 q(b)) 7→ (b, γ) ;
31
– la projection stéréographique depuis s est décrite par (b, − 12 q(b)) 7→ r(b, − 12 q(b)), où
r · (− 12 q(b)) = γ. En mettant tout cela ensemble, on obtient la formule de l’énoncé : Soit
x = (b, γ) ∈ FA ; alors (Φn )−1 (b, γ) = (b, − 21 q(b)) et
1
b
Φs (Φn )−1 (b, γ) = Φs (b, − q(b)) = −γ
,γ .
2
2q(b)
10.5. Définition. Soit W un espace vectoriel muni d’une forme quadratique non-nulle
q : W → K. L’inversion définie par ces données est alors l’application définie par
i := iq : U := {x ∈ W | q(x) 6= 0} → W,
x 7→
1
x.
q(x)
Noter que l’ensemble des points fixes est {x | q(x) = 1} et que i ◦ i = idW . Exemples:
W = R et q(x) = x2 : alors i(x) = x1 (points fixes : ±1)
1
W = R et q(x) = kx2 : alors i(x) = kx
(si k = −1 : pas de points fixes !)
x
2
2
2
W = R et q(x) = x1 + x2 : alors i(x) = x1 +x
2 , dite l’inversion par rapport au cercle.
1
2
Cette application a des propriétés géométriques très intéressantes (exercice) : montrer
qu’elle transforme une droite ne passant pas par 0 en un cercle passant par 0 et un cercle
ne passant pas par 0 en un cercle ne passant pas par 0 ; ce n’est donc pas une homographie!
W = Rn+1 et q(x) = hx, xi le produit scalaire usuel : inversion par rapport à S n .
Le cas dim W = 1 est en effet le seul cas où l’inversion est une homographie ! D’où le rôle
particulier de ce cas : dans la suite, supposons que Q soit une conique propre non-vide.
10.6. Projection stéréographique pour une conique. Rappelons (exemple 9.14 (1))
que, pour la conique Q, une tangente au point n touche Q au seul point n (le “cas (0)” ne
se produit pas), ainsi la projection Φn met en bijection Q \ {a} et une droite affine FA .
On peut donc la “compléter” en décrétant que le point a devra correspondre au point à
l’infini ∞ = F ∩ Ta Q de cette droite affine. Ainsi on a complété Φn en une application
définie partout
Φn = ΦnQ,F : Q → F,
x 7→ Φn (x) = ∞ si x = n,
Φn (x) = (x ∨ n) ∩ F sinon.
Le lecteur complètera cette définition par un dessin :
10.7. Théorème (Birapport sur la conique). Soit dim P(V ) = 2 et Q une conique
propre non-vide. Fixons deux points s, n ∈ Q, s 6= n et une droite F qui ne contient ni s,
32
ni n. Alors s ∨ n est une sécante, et l’application
Φn,s : F → F,
x 7→ Φs (Φn )−1 (x)
est une homographie. Soit (a, b, c, d) ∈ Q4 , deux à deux distincts. Alors la quantité
BR(a, b, c, d) := BR Φn (a), Φn (b), Φn (c), Φn (d)
est indépendante du choix du point n ∈ Q; on l’appelle le birapport du quadruplet
(a, b, c, d) ∈ Q4 .
En effet, si on fait la définition du birapport en projetant depuis s, les 4 images seront liées
à celles de la projection depuis n par une homographie, et ont donc le même birapport.
(Compléter le dessin ci-dessus en y indiquant ces points !)
10.8. Théorème (Hexagramme Mysticum de Pascal). Soient a, b0 , c, a0 , b, c0 les
sommets d’un hexagone inscrit dans une conique propre non-vide Q. Alors les points
d’intersection des cotés opposés sont alignés, i.e., les points suivants sont alignés :
u := (bc0 ) ∩ (cb0 ),
v := (ac0 ) ∩ (ba0 ),
w := (ab0 ) ∩ (ba0 ) .
Faire ici un dessin du cas K = R, avec image affine de Q une ellipse, et a, b, c, c0 , b0 , a0
sur Q pris dans cet ordre en parcourant l’ellipse au sens de l’aiguille, et l’hexagon étant
donné par des segments successifs a0 bc0 ab0 ca0 . On marquera les points x := (bc0 ) ∩ (ca0 ) et
y := (ac0 ) ∩ (ba0 ).
Montrer que u, v, w sont alignés revient à montrer que pv (u) = w, pour la perspective
centrale pv : (bc0 ) → (ba0 ). Comme pv envoit b 7→ b et c0 7→ y, et x 7→ a0 , l’affirmation
pv (u) = w revient à montrer que,
BR(b, c0 , x, u) = BR(b, y, a0 , w) .
La preuve vient alors du fait que, par projection stéréographique depuis a, respectivement
depuis c, ces birapports sont tous les deux égaux à BR(b, c0 , a0 , b0 ), pris sur la conique Q.
Pour énoncer le théorème dual de celui de Pascal, il faut observer que, sous la dualité
entre P(V ) et P(V )0 , les points d’une quadrique projective correspondent aux hyperplans
tangents de cette quadrique.
10.9. Théorème (Brianchon). Les diagonales joignant les sommets opposés d’un
hexagone circonscrit à une conique sont concourantes.
33
Chapitre 11 : Topologie de RPn et de CPn
Les espaces projectifs RPn et CPn (et, par ailleurs, aussi HPn ainsi que le “plan octonion”)
portent une topologie naturelle : on peut donc parler d’applications continues dans ce
contexte, et des propriétés comme la compacité et la connexité sont définies. Le but
de ce chapitre est de définir cette topologie naturelle et de démontrer quelques résultats
fondamentaux : les espaces projectifs réels et complexes sont compacts et connexes, et
d’étudier des propriétés de la projection des sphères sur ces espaces. Nous supposons
connue (→ cours “Analyse Complexe”) les notions suivantes :
–
–
–
–
–
–
espace topologique, topologie séparée (Hausdorff),
parties ouvertes, fermées,
topologie induite (sur une partie d’un espace topologique),
applications continues entre espaces topologiques, homéomorphismes,
connexité et connexité par arcs,
compacité.
11.1. Rappel-exercice. Les espaces vectoriels V = Kn avec K = R ou C portent une
topologie naturelle, qui peut être définie par une norme (quelconque : équivalence des
normes !) sur V : cette topologie est celle associée à la métrique d(x, y) = kx − yk.
Propriétés géométriques (l’équivalence des normes est toujours la clef) :
(0) Cn est homéomorphe à R2n ;
(1) si E ⊂ V est un sous-espace vectoriel ou affine, alors la topologie naturelle de E
coincide avec sa topologique induite par celle de V ;
(2) soit α : V → K une forme linéaire et E = {x ∈ V | α(x) = 1} un hyperplan de V et
U ⊂ E une partie. On définit le cône solide de base U par
CU := {v := ru | u ∈ U, r ∈ K× } ⊂ V.
Alors sont équivalents (faire un dessin, en prenant K = R et n = 3) :
(i) U est ouvert dans E ;
(ii) CU est ouvert dans V .
(Puisque U = CU ∩ E, l’implication (ii) ⇒ (i) est triviale ; pour la réciproque, on peut,
grâce à l’équivalence des normes, se ramener au cas particulier d’un “vrai” cône solide,
i.e., E = {x ∈ Rn | hx, vi = 1} pour un vecteur normé v, et U = {x ∈ E | kx − vk < ε}
un disque de rayon ε > 0 dans E. Il s’agit alors de montrer que le cône solide CU est
ouvert.)
11.2. Définition. Soit K = R ou C et V = Kn+1 , muni de sa topologie naturelle. Soit
π : V \{0} → P(V ) la projection canonique. Alors on munit P(V ) de sa topologie quotient
par rapport à cette projection.
(Rappel : Soit Y un espace topologique et p : Y → X une application surjective. La
topologie quotient sur X est alors définie par : on dira que U ⊂ X est ouvert si l’image
réciproque p−1 (U ) est un ouvert de Y . Il s’agit là en effet d’une topologie car l’opération
“image réciproque” est compatible avec les opérations ensemblistes ∪i∈I et ∩i∈I .)
Exemple. Soit E = ker(α) un hyperplan de V . Alors V \ E = α−1 (K× ) est ouvert et
donc la partie affine A := P(V ) \ [E] est ouverte dans P(V ).
11.3. Lemme. La projectijon canonique π : Kn+1 \ {0} → KPn est continue et ouverte
(i.e., l’image directe d’un ouvert est un ouvert).
34
En effet, la continuité découle directement de la définition de la topologie quotient, et le
fait que π est ouverte du fait que, pour tout ensemble U 0 ⊂ V ,
[
π −1 (π(U 0 )) =
rU 0 ,
r∈K×
et que U 0 est ouvert ssi rU 0 l’est. – Est-ce que la topologie de P(V ) est séparée ? Faire un
dessin de la situation géométrique pour se convaincre que cette question est non-triviale!
11.4. Théorème. Soit A = P(V ) \ H une partie affine de P(V ). Alors la toplogie
naturelle de A (en tant qu’espace affine de dimension n) coincide avec la topologie induite
de A (en tant que partie de P(V )). Il s’ensuit que P(V ) est séparé (Hausdorff ) et connexe
par arcs.
Pour la preuve, soit H = ker(α) ; puis appliquer le rappel 11.1, (i) ⇔ (ii), en identifiant
A et E = {x ∈ V | α(x) = 1} : pour U ⊂ A sont équivalents :
– U est ouvert dans A muni de sa topologie d’espace affine ;
– U est ouvert dans E muni de sa topologie de sous-espace affine ;
– CU est ouvert dans V ; or, CU = π −1 (U ), donc ceci équivaut à
– π −1 (U ) est ouvert dans V , donc U est ouvert dans P(V ).
Les dernières affirmations découlent alors du fait que, pour deux points x, y ∈ P(V ), il
existe toujours une partie affine A tel que x, y ∈ A.
Exercice : montrer que V \ {0} est connexe par arcs, sauf au cas où K = R et dim V = 1.
En déduire une autre preuve du fait que P(V ) est connexe par arcs.
Remarque. Le théorème dit que les applications “cartes” φi : Kn → Ui , pour i =
1, , . . . , n + 1, définies dans la remarque 5.4, sont des homéomorphismes. De plus, les
changements de cartes φ−1
j φi , sont continues, même différentiables (remarque 5.5), et
nous avons ainsi maintenant démontré que les espaces RPn et CPn sont des variétés
différentiables (au sens explique dans la remarque 5.5).
11.5. Théorème. L’espace topologique P(V ) est compact. Plus précisément, la partie
SV := {x ∈ V = Kn+1 | hx, xi = 1}
est compacte, et la restriction π 0 := π|SV : SV → P(V ) est continue et surjective.
Remarque. Si K = Q, on peut toujours définir une topologie sur P(V ) selon le schéma
précédent. Mais π 0 ne sera plus surjectif, et P(V ) ne sera plus compact.
11.6. Théorème. Soit Q ⊂ P(V ) une quadrique projective. Alors Q est fermé dans
P(V ), donc c’est une partie compacte. Il en est de même pour toute partie de la forme
{[x] ∈ P(V )| q(x) = 0} avec q : V → K une application polynomiale homogène de degré
d ∈ N.
Pour d = 1, cela montre que tout sous-espace projectif est compact. – Pour une étude
plus détaillée de la topologie de P(V ), il faut, à partir d’ici, distinguer :
11.7. Le cas réel. Dans ce cas, SV = S n est la n-sphère. L’application π 0 : S n → RPn
est 2:1 (tout élément de [v] ∈ P(V ) a exactement 2 images réciproques).
11.8. Le cas complexe. Comme Cn+1 ∼
= R2n+2 en tant qu’espace métrique, SV
s’identifie à la sphère S 2n+1 . L’ensemble des images réciproques sous π 0 d’un point x ∈ CPn
est alors en bijection avec le cercle S 1 .
35
Les calculs dans les deux cas sont similaires, mais l’interprétation est différente : dans le
cas réel, l’application π 0 : S n → RPn est un revêtement d’ordre 2, ie.: tout point x ∈ RPn
admet un voisinage ouvert Ux tel que π −1 (Ux ) soit homéomorphe à la réunion disjointe
de deux copies de Ux . En effet, fixons x ∈ V avec kxk = 1 et posons
Ux := {[y] ∈ RPn | hx, yi =
6 0}.
Alors π −1 (U ) = U+ ∪˙ U− avec
U+ := {y ∈ S n | hx, yi > 0},
U− := {y ∈ S n | hx, yi < 0}.
La restriction π|U± : U± → Ux est alors une bijection continue dans les deux sens. Dans
le cas complexe, π 0 : S 2n+1 → CPn est une fibration de fibre type S 1 : l’image réciproque
de Ux est un produit direct U1 × S 1 ; localement, il s’agit d’un espace produit, mas pas
globalement.
Cas de petites dimensions (cf. TD). L’espace RP1 est homéomorpe au cercle S 1 , et
l’espace CP1 est homéomorphe (via une projection stéréographique) à S 2 . L’application
π 0 donne la célèbre fibration de Hopf
S 1 → S 3 → CP1 = S 2 .
n = 2 : on ne peut pas visualiser RP2 comme une partie de R3 . Une autre façon de
“visualiser” est de réaliser RP2 comme un ruban de Moebius sur le bord duquel on colle
un disque – cf. illustrations dans [Berger], ou voir sur google images.
Remarque. On peut se demander pourquoi nous n’avons pas défini la topologie des
espaces RPn et CPn par une métrique : existe-t-il une métrique sur ces espaces telle que
la topologie métrique coincide avec celle définie ci-dessus ? La réponse est “oui, mais...”:
la définition (et surtout la preuve de l’inégalité triangulaire) d’une telle métrique n’est
pas chose triviale. Exercice : essayer pour le cas de RP1 (la distance entre [x] et [y] devait
correspondre à l’angle entre les droites Rx et Ry, mais attention, quand l’angle est π,
cette distance devra être zéro; puis attaquer le cas de RP2 ...).
Chapitre 12 : Étude du groupe projectif
Soit G l’un des groupes GL(V ), PGL(V ), SL(V ) ou PSL(V ), où V est un espace vectoriel
de dimension n + 1 sur un corps K. L’étude systématique d’un tel groupe commence par
les questions suivantes :
12.1. Questions. (1) Ce groupe, admet-il des sous-groupes distingués ? En particuler :
(a) quel est son centre Z(G) = {g ∈ G | ∀h ∈ G : gh = hg} ?
(b) quel est son groupe dérivé D(G) ? Rappel : dans un groupe G, on définit le
commutateur de g, h ∈ G par
[g, h] := ghg −1 h−1 .
Noter que [g, h] = e ssi g et h commutent. On note [G, G] = {[g, h] | g, h ∈ G}
l’ensemble des commutateurs et D(G) := h[G, G]i le groupe dérivé (groupe engendré
par [G, G] ; c’est un sous-groupe distingué).
36
(c) le groupe, est-il simple ? Rappel : un groupe G est dit simple s’il n’admet aucun
sous-groupe distingué à part {e} et G.
(2) Peut-on trouver un ensemble générateur “sympathique” S de G (pas trop grand, et
vérifiant des relations pas trop compliquées entre les éléments de S) ?
(3) Y a-t-il “d’autres réalisations ou représentations de G”, ou encore : quels sont les liens
de G avec d’autres groupes connus ? quels sont les actions possibles de G ?
La réponse aux questions du (1) sera facilitée par une étude préalable de la question (2):
pour G = GL(V ), il existe en effet des ensembles générateurs bien sympathiques.
12.2. Définition. Soit g ∈ GL(V ), g 6= idV , fixant un hyperplan point par point : il
existe un hyperplan E = ker(α) de V tel que g(v) = v pour tout v ∈ E. L’application
h := g − idV est donc de rang 1 et son noyau est E. La droite vectorielle D := h(V ) =
im(g − idV ) s’appelle la droite de g. Noter : comme h est de rang 1 il existe un vecteur
a 6= 0 tel qu’on peut écrire h(x) = α(x)a. Nous dirons que
(D) g est une dilatation si g est diagonalisable (i.e., admet une base de vecteurs propres);
(T) g est une transvection si g n’est pas diagonalisable.
12.3. Théorème. Soit E ⊂ V un hyperplan (dim E = n, dim V = n + 1) et g ∈ GL(V )
tel que g fixe E point par point, mais g 6= idV . Alors sont équivalents
(1) g est une dilatation ;
(2) λ := det g 6= 1 ;
(3) la droite de g n’est pas incluse dans E : im(g − id) 6⊂ E ;
(4) il existe une base de V par rapport à laquelle g est représentée par la matrice
1n 0
Dλ :=
.
0 λ
12.4 Théorème. Avec les notations du théorème précédent, sont équivalents
(1) g est une transvection ;
(2) λ := det g = 1 ;
(3) la droite de g est incluse dans E : im(g − id) ⊂ E ;
(4) il existe a ∈ E, a 6= 0, tel que h(x) = α(x)a, ou bien : g(x) = x + α(x)a ;
(5) il existe une base de V par rapport à laquelle g est représentée par la matrice


0

.. 

.
1n


F := 
.
0



1
0 ··· 0
1
37
12.5. Définition. Si g est comme dans le théorème 12.4, nous écrivons
g(x) = Tα,a (x) = x + α(x)a,
et nous dirons que g est une transvection d’hyperplan E = ker(α) et de droite D :=
im(g − id) = Ka. Noter que D ⊂ E.
Interprétation projective des transvections et dilatations. Si α(x) = 1, alors Tα,a (x) =
x + a. Ainsi une transvection agit par translation (par a) dans la partie affine A =
P(V ) \ [ker α]. De même, une dilatation agit par homothétie sur A (de centre [D], et de
rapport λ−1 ). Noter que l’hyperplan projectif H := [E] est fixé point par point par ces
applications. Les transvections sont celles parmi elles qui n’ont pas de point fixe dans A,
et le dilatations celles qui en ont.
12.6. Corollaire.
(i) Deux transvections quelconques sont conjuguées dans GL(V ).
(ii) Deux dilatations sont conjuguées dans GL(V ) ssi elles ont même déterminant.
12.7. Exercice. Est-ce que deux transvections quelconques T, T 0 sont toujours conjuguées dans SL(V ), i.e., existe-t-il h avec det h = 1 et T 0 = hT h−1 ? (Indication :
distinguer les cas dim V > 2, dim V = 2 et dim V = 1. Voir Daniel Perrin, “Cours
d’Algèbre”, pour plus d’informations.)
12.8. Remarque. Par des calculs directs, pour a, b ∈ ker(α), a0 ∈ ker(α0 ), a ∈ ker(β),
(a) Tα,a ◦ Tα,b (x) = Tα,a+b (x), ainsi Tα := {Tα,a | a ∈ ker(α)} est un groupe ;
Tα,a ◦ Tβ,a (x) = Tα+β,a (x), ainsi Ta := {Tα,a | α ∈ V ∗ , α(a) = 0} est un groupe ;
(b) Tα,a = Tα0 ,a0 ssi ∃λ ∈ K× : a0 = λa, α = λα0 ;
(c) pour tout h ∈ GL(V ), on a h ◦ Tα,a ◦ h−1 = Tα◦h−1 ,h(a) .
12.9. Théorème.
(i) Le centre Z(GL(V )) de GL(V ) est le groupe K× idV .
(ii) Le centre de SL(V ) est le groupe {λ id| λdim V = 1}.
Preuve. Si h commute avec tout g ∈ SL(V ), on a aura en particulier pout tout a et α
Tα◦h−1 ,h(a) = h ◦ Tα,a ◦ h−1 = Tα,a ,
donc h(a) est un multiple de a et donc [h] = id ; le lemme 4.4 implique alors que h ∈ K× id.
Corollaire : PGL(V ) = G/Z(G) pour G = GL(V ) et PSL(V ) = G/Z(G) pour G = SL(V ).
12.10. Théorème. Soit G := hTα,a | α ∈ V ∗ , a ∈ V : α(a) = 0i le sous-groupe de SL(V )
engendré par les transvections.
(i) G = SL(V ), ie., le groupe SL(V ) est engendré par les transvections.
(ii) Le groupe GL(V ) est engendré par les transvections et les dilatations.
38
Preuve. Noter d’abord que (i) ⇒ (ii) : si g ∈ GL(V ), il suffit d’appliquer (i) à g 0 :=
(Dλ )−1 g avec λ := det g et Dλ une dilatation de rapport λ. Pour prouver (i), l’inclusion
G ⊂ SL(V ) est claire. Pour démontrer l’autre inclusion, on procède par récurrence sur
dim V . Le cas dim V = 1 est trivial. Soit dim V = n + 1. Si g ∈ SL(V ) est tel qu’il
existe un vecteur a 6= 0 avec g(a) = a et un hyperplan E tel que V = E ⊕ Ka et
g(E) = E, on peut appliquer l’hypothèse de récurrence à g|E et conclure que g ∈ G. Pour
g quelconque, on se ramène à ce cas particulier: fixons n’importe quels v ∈ V et α ∈ V ∗
tels que α(v) = 1, on a donc une décomposition V = ker(α) ⊕ Ka. Posons w := g(v)
et β := α ◦ g −1 . Le lemme suivant montrera qu’il existe g 0 ∈ G ayant le même effet:
g 0 (v) = w et β = α ◦ (g 0 )−1 . Alors h := g −1 g 0 remplit les conditions du cas particulier, et
on pourra conclure que g = g 0 h−1 appartient à G.
12.11. Lemme. L’action de G sur l’ensemble
M := {(v, α) ∈ V × V ∗ | α(v) = 1},
donée par g.(v, α) = (gv, α ◦ g −1 ), est transitive.
Preuve du lemme. Soient (v, α), (w, β) ∈ M . Alors il existe γ : V → K linéaire tel que
γ(v) = γ(w) = 1, et alors Tγ,v−w (w) = w + γ(w)(v − w) = w + v − w = v. Quitte à
remplacer w, on peut donc supposer que v = w. Alors on a
α(Tv,α−β )−1 (x) = α(Tv,β−α (x)) = α(x + β(x)v − α(x)v) = α(x) + β(x) − α(x) = β(x)
et Tv,α−β (v) = v − v + v = v, donc Tv,α−β .(v, α) = (v, β), d’où la transitivité.
Exercice. Ecrire une rotation du plan Rφ sous forme de comosée de deux transvections.
Remarque. En élaborant cette preuve, on montre plus précisément que g ∈ SL(V ) peut
être écrit comme un produit d’au plus n = dim V transvections, sauf si g est une homothétie, auquel cas il en faut n + 1 (cf. Perrin “Cours d’algèbre”).
12.12. Théorème. Supposons que la caractéristique de K est différente de 2. Alors
(i) le groupe dérivé de GL(n, K) est donné par D(GL(n, K)) = SL(n, K) ;
(ii) si dim V > 2, alors D(SL(n, K)) = SL(n, K).
Preuve. (i) L’inclusion “⊂” est une conséquence du fait que det[g, h] = 1, pour tout
g, h ∈ GL(V ). Prouvons l’autre inclusion : si T = Tα,a est une transvection, alors
T 2 = Tα,2a en est une aussi (c’est ici que la condition car(K) 6= 2 est utilisée !). Si c’est
le cas, d’après 12.6, T 2 et T sont conjugués dans GL(V ): il exste h ∈ GL(V ) tel que
T 2 = hT h−1 , donc T = hT h−1 T −1 = [h, T ], donc toute transvection est un commutateur.
Comme les transvections engendrent SL(V ), les commutateurs engendrent SL(V ), d’où
(i). Pour (ii), utiliser l’exercice 12.7. (On peut affiner ce résultat : il reste vrai dans tous
les cas sauf dim V = 2 et K = Z/2Z ou K = Z/3Z ; cf. D. Perrin “Cours d’algèbre”.)
12.13. Théorème. Supposons que la caractéristique de K est différente de 2 et que
dim V > 2. Alors le groupe PSL(V ) est simple. (Pour le cas dim V = 2 : voir Perrin
“Cours d’algèbre” pour des énoncés précis.)
La méthode suivante de démontrer ce résultat est due à Iwasawa.
(1) Lemme. L’action du groupe G = PSL(V ) sur X = P(V ) est doublement transitive,
i.e., pour tous les couples (x, x0 ), (y, y 0 ) ∈ X 2 tels que x 6= x0 et y 6= y 0 , il existe g ∈ G
tel que g.x = y et g.x0 = y 0 . (Cf. Corollaire 4.9, (2) : il faut se convaincre qu’on peut y
choisir g de déterminant 1).
39
(2) Soit G un groupe quelconque opérant sur un ensemble X, soit o ∈ X et H = {g ∈ G |
g.o = O} le stabilisateur de o. Alors :
(a) L’action G×X → X est doublement transitive ssi [elle est transitive sur X et l’action
de H est transitive sur X \ {o}]. Supposons-le dans la suite.
˙
˙
(b) Si g ∈
/ H, alors G = H ∪HgH.
(En effet, soit p = gH 6= o = eH. Alors X = {o}∪H.p,
˙
˙
donc G/H = eH ∪H.gH et G = H ∪HgH.)
(c) Le stabilisateur H est un sous-groupe maximal de G (i.e., maximal parmi les sousgroupes propres de G ; en effet, si H ⊂ H 0 ⊂ G est une inclusion de sous-groupes
et g ∈ H 0 , g ∈
/ H, alors HgH ⊂ H 0 donc H 0 = G d’après (b)).
(d) Soit N un sous-groupe distingué de G. Alors N H := {nh | n ∈ N, h ∈ H} est
un sous-groupe de G. Il contient H, donc, soit N H = H, soit N H = G. Dans
le deuxième cas, toute classe gH est de la forme nH avec n ∈ N , donc N opère
transitivement sur X. Dans le premier cas, n.gH = gg −1 ngH = gn0 H = gH pour
tout g ∈ G, i.e., N agit trivialement sur X.
(e) Supposons qu’on a, pour tout x ∈ X, un sous-groupe Tx de G tel que:
i) Tx est commutatif,
ii) Tgx = gTx g −1 ,
iii) les sous-groupes (Tx )x∈X engendrent G.
Soit N un sous-groupe distingué de G qui n’opère pas trivialement sur X. Alors
N To est un sous-groupe de G ; il contient nTo n−1 = Tn.o pour tout n ∈ N ; comme
N agit transitivement d’après (d), il contient tout les Tx , et donc il contient G car
les Tx engendrent G. Ainsi G = N To . Soit g = nt et h = ms ∈ G, avec n, m ∈ N ,
t, s ∈ To . Alors (en utilisant, pour la seconde égalité, que To est commutatif)
[g, h] = ntmst−1 n−1 s−1 m−1 = n(tmt−1 )(sn−1 s−1 )m−1 ∈ N .
Ainsi N contient le groupe des commutateurs D(G).
(3) On applique (e) à la situation suivante : G = PSL(V ) et X = P(V ) ; soit x = [a] ∈ X;
si α, β sont des formes linéaires telles que α(a) = β(a) = 0, on a Tα,a ◦ Tβ,a = Tα+β,a , donc
Tx := {Tα,a | α ∈ V ∗ , α(a) = 0}
est une famille de groupes vérifiant i), ii), iii). Conclusion : soit N un sous-groupe
distingué de PSL(V ) ; alors soit N opère trivialement sur X (dans ce cas N est le groupe
trivial car seule l’identité de PSL(V ) agit trivialement sur P(V )) ; sinon, par (e), N
contient le groupe dérivé D(G) qui est P(SL(V ) (d’après le théorème 12.12), donc N
contient PSL(V ), donc N = PSL(V ).
Quelques remarques pour conclure
Après l’étude du groupe projectif, l’étude des groupes orthogonaux serait la suite logique
du cours : pour un espace projectif P(V ) muni d’une quadrique projective Q = Qβ , les
40
groupes orthogonaux jouent à peu près le même rôle que les groupes GL(V ) et PGL(V )
dans le chapitre précédent. Leur étude est un peu plus délicate que celle menée au chapitre
précédent ; là aussi, voir le livre “Cours d’algèbre” de Daniel Perrin. Rappelons seulement:
Lemme. Pour toute forme bilinéaire β : V × V → K,
O(β) := {g ∈ GL(V ) | ∀v, w ∈ W : β(gv, gw) = β(v, w)}
est un sous-groupe de GL(V ), dit le groupe orthogonal de β. Ce groupe agit naturellement
sur la quadrique projective Q = Qβ par
O(β) × Q → Q,
(g, [v]) 7→ [g(v)].
Définition. On note SO(β) := O(β) ∩ SL(V ). Le groupe orthogonal projectif est
PO(β) := {[g] | g ∈ O(β)} ⊂ PGL(V ). Rappelons aussi l’écriture matricielle : si V = Kn
et β(x, y) = xt By avec B ∈ Mn (K), alors
O(β) = A ∈ GL(n, K) | At BA = B .
Si B = 1n , i.e., β(x, y) = xt y, on note O(n, K), parfois dit “le” groupe orthogonal.
Pour étudier les questions 12.1 pour le groupe orthogonal, on commence par établir que
l’action de O(β) sur Q est transitive, puis on s’intéresse à des générateurs qui sont des
symétries orthogonales. La condition At BA = B ci-dessus donne det(A) = ±1, ce qui
implique que le centre de O(β) est toujours un groupe fini. La preuve de la simplicité de
PSO(β) est techniquement un peu plus difficile que celle pour PSL(V ).
Le cas des corps finis
C’est un cas particulier intéressant : on peut alors utiliser des arguments “de comptage”.
Soit K = Fq un corps de cardinalité q. Alors q est de la forme q = pk , p premier. Rappelons
n
qu’alors |KPn | = 1 + q + . . . + q n = 1−q
=: N . Le groupe PGL(n + 1; K) peut alors être
1−q
vu comme un sous-groupe du groupe de permutations SN . Si q et n sont petits, il peut y
être des cas où ces groupes sont égaux.
Exercice. Les cardinaux des groupes linéaires sur Fq sont:
|GL(n, Fq )| = (q n − 1)(q n − 2) · · · (q n − q n−1 )
|SL(n, Fq )| = (q n − 1)(q n − 2) · · · (q n − q n−1 )q n−1
|PGL(n, Fq )| = |SL(n, Fq )|
|PSL(n, Fq )| = |SL(n, Fq )|/d, avec d = P GCD(n, q − 1).
Exercice. On a les isomorphismes suivants :
GL(2, F2 ) = SL(2, F2 ) = PSL(2, F2 ) ∼
= S3
∼
∼
PGL(2, F3 ) = S4 ; P(SL(2, F3 ) = A4
PGL(2, F4 ) ∼
= PSL(2, F4 ) ∼
= A5 ;
∼
PGL(2, F5 ) = S5 ; PSL(2, F5 ) ∼
= A5 .
Exercice. Lesquels parmi les groupes ci-dessus sont simples ?
On est loin de “connaître explicitement” tous les groupes simples ; mais, après un très
long travail, les mathématiciens ont pu classifier tous les groupes finis simples : cf. http:
//fr.wikipedia.org/wiki/Liste_des_groupes_finis_simples. Pour les groupes infinis, les mieux étudiés sont des groupes de type “groupe matriciel”, dont les “groupes classiques” GL(V ), O(β), cf. http://fr.wikipedia.org/wiki/Groupe_classique, ou plus
généralement, les groupes de Lie, cf. http://fr.wikipedia.org/wiki/Groupe_de_Lie.
41