Vorlesungstext

Transcription

Vorlesungstext

Vorlesungen über Algebra
Mainz, Wintersemester 2015
Manfred Lehn
1
Korrekturstand: 25. Januar 2015
Algebra I im Wintersemester 2015
3
I NHALTSVERZEICHNIS
§1.
1.1.
1.2.
§2.
2.1.
Polynomgleichungen
Nullstellen
Lösungsformeln
Ringe
Grundbegriffe
5
5
6
11
11
2.2.
2.3.
2.4.
§3.
3.1.
3.2.
3.3.
Ideale und Faktorringe
Lokalisierung und Quotientenringe
Aufgaben
Polynomringe
Polynomringe in einer Variablen
Polynomringe in mehreren Variablen
(*) Potenzreihenringe
12
14
15
17
17
19
20
3.4.
§4.
4.1.
4.2.
4.3.
4.4.
4.5.
Aufgaben
Symmetrische Polynome
Symmetrische Polynome in zwei Variablen
Symmetrische Polynome in beliebig vielen Variablen
Potenzsummen und Newtonsche Formeln
Invarianten der alternierenden Gruppe
Aufgaben zu symmetrischen Polynomen
21
22
22
24
27
29
30
§5.
5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
Euklidische Ringe
Allgemeine Teilbarkeitsbegriffe
Euklidische Ringe
Der euklidische Algorithmus
Lineare Kongruenzen
Einheiten in Z/n
(*) Die Einheitengruppe von Z/pm
32
32
32
33
35
37
39
5.7.
5.8.
5.9.
§6.
6.1.
6.2.
6.3.
§7.
(*) Minimale Euklidische Gradfunktionen
√
(*) Der Ring Z[ 21 (1 + −19)]
Aufgaben
Faktorielle Ringe
Primfaktorzerlegungen
Der Satz von Gauß
Irreduzibilitätskriterien
Grundbegriffe der Gruppentheorie
41
42
44
45
45
47
49
51
7.1.
7.2.
7.3.
7.4.
7.5.
7.6.
§8.
Gruppen, Homomorphismen, Erzeuger
Nebenklassen, Index, Faktorgruppen
Konjugationsklassen, Automorphismen, semidirekte Produkte
Kommutatoruntergruppen
Endliche abelsche Gruppen
Aufgaben
Auflösbare Gruppen
51
52
54
56
57
58
60
8.1.
8.2.
8.3.
8.4.
8.5.
§9.
9.1.
Gruppenwirkungen
p-Gruppen
Auflösbare Gruppen
Kompositionsreihen
Aufgaben zur Gruppentheorie
Die symmetrische Gruppe
Partitionen
60
61
64
65
67
71
71
9.2. Zykelzerlegung und Konjugationsklassen
9.3. Der Signaturhomomorphismus und die alternierende Gruppe
9.4. Die Gruppe S3
71
73
75
4
9.5. Die Gruppe S4
9.6. Einfachheit der alternierenden Gruppen An , n ≥ 5
75
76
9.7.
§10.
10.1.
10.2.
10.3.
§11.
11.1.
(*) Zur Kombinatorik der Zahlen 5 und 6.
(*) Lineare Gruppen
Matrizengruppen
Transitive und imprimitive Wirkungen
Endliche lineare Gruppen
Körpererweiterungen
Charakteristik und Grad
77
81
81
83
84
86
86
11.2.
11.3.
11.4.
11.5.
§12.
12.1.
12.2.
Algebraische Erweiterungen
Nullstellen und algebraisch abgeschlossene Körper
Fortsetzungen von Einbettungen
Endliche Körper
Galoistheorie
Separabilität
Normale Erweiterungen und Zerfällungskörper
88
91
94
96
98
98
102
12.3.
§13.
§14.
§15.
15.1.
15.2.
15.3.
Galoiserweiterungen
Kreisteilungskörper
Konstruktionen mit Zirkel und Lineal
Auflösbarkeit von Gleichungen
Spur und Norm
Zyklische Erweiterungen
Auflösbare Gleichungen
103
112
119
125
125
126
129
§16.
16.1.
16.2.
§17.
§18.
18.1.
18.2.
Zur Galoisgruppe
Berechnung der Galoisgruppe
Das inverse Galoisproblem
(*) Normalbasen
Transzendenzfragen
Transzendente Zahlen
Die Transzendenz von e und π
133
133
137
141
145
145
146
18.3.
(*) Transzendenzbasen
151
5
§1. Polynomgleichungen
1.1. Nullstellen. Der Ausgangspunkt für die Entwicklung der modernen Algebra war die Frage, wie
man eine algebraische Gleichung der Form
f0 xn + f1 xn−1 + . . . + fn−1 x + fn = 0
(1.1)
löst. Dabei stammen die Koeffizienten f0 , . . . , fn der Gleichung aus einem Körper K, so daß man
die linke Seite als ein Polynom f = f0 xn + . . . + fn ∈ K[x] auffassen und die Gleichung kürzer
f (x) = 0 schreiben kann. Lösungen α ∈ K der Gleichungen heißen Nullstellen oder Wurzeln des
Polynoms. Wenn der Leitkoeffizient f0 nicht 0 ist, spricht man von einer Gleichung vom Grad n und
für kleine Werte n = 1, 2, 3 und 4 auch von linearen, quadratischen, kubischen und biquadratischen
Gleichungen.
Für jedes α ∈ K erhält man durch Polynomdivision eine Darstellung
(1.2)
f (x) = q(x)(x − α) + r,
wobei der Rest r ein Polynom vom Grad < 1, also eine Konstante ist. Indem man auf beiden Seiten
x = α setzt, erhält man
(1.3)
r = f (α).
Statt der Polynomdivision kann man auch die Relation
(1.4)
xm − αm = (x − α)(xm−1 + αxm−2 + . . . + αm−1 )
verwenden und erhält so einen Ausdruck für den Quotienten.
(1.5)
q(x) =
n
X
f (x) − f (α)
fm (xm−1 + αxm−2 + . . . + αm−1 ).
=
(x − α)
m=1
Wenn nun α eine Nullstelle von f (x) ist und damit der Restterm verschwindet, ergibt sich eine
Faktorisierung
(1.6)
f (x) = (x − α)q(x).
Jede weitere von α verschiedene Nullstelle muß dann eine Nullstelle von q sein, die sich in gleicher
Weise ausfaktorisieren läßt. Auf diese Weise erhält man eine Zerlegung
(1.7)
f (x) = (x − α1 )m1 (x − α2 )m2 · . . . (x − αs )ms g(x)
mit Nullstellen α1 , . . . , αs ∈ K, Vielfachheiten m1 , . . . , ms ∈ N und einem (möglicherweise
konstanten) Polynom g(x), das keine Nullstellen in K hat. Insbesondere hat ein Polynom f vom
Grad n höchstens n verschiedene Nullstellen. Die Zerlegung ist bis auf die Reihenfolge der Faktoren
eindeutig. Man sagt, αi ist eine doppelte Nullstelle, wenn mi ≥ 2, eine dreifache Nullstelle, wenn
mi ≥ 3 usw.
Man kann die Vielfachheit einer Nullstelle mit Hilfe der formalen Ableitungen eines Polynoms
P
k
messen: Für Polynome f = n
k=0 fk x ∈ R[X] mit Koeffizienten in einem beliebigen kommutativen Ring wird durch
(1.8)
f ′ :=
n
X
kfk xk−1
k=1
auf rein algebraischem Wege und ohne Grenzprozeß eine Ableitung definiert. Man verifiziert dann
leicht, daß die übliche Summen- und Produktregel gelten:
(1.9)
(f + g)′ = f ′ + g ′ ,
(f g)′ = f ′ g + f g ′ .
Allerdings kann es vorkommen, daß f ′ = 0, ohne daß f ein Polynom vom Grad 0 ist. Das passiert
zum Beispiel für das Polynom xp ∈ Fp [x]. Dieses Phänomen wird später noch wichtig werden.
6
Polynomgleichungen
Aus einer Zerlegung f (x) = (x − α)m g(x), m > 0, erhält man durch Ableiten
(1.10) f ′ (x) = (x − α)m g ′ (x) + m(x − α)m−1 g(x) = (x − α)m−1 ((x − α)g ′ (x) + mg(x)).
Wir können deshalb schließen:
Satz 1.1 (Huddesche1 Regel) — α ∈ K ist genau dann eine mehrfache Nullstelle von f ∈ K[x],
wenn α eine gemeinsame Nullstelle von f und f ′ ist.
Wenn der Körper K die Charakteristik 0 hat, d.h. wenn alle natürlichen Zahlen in K invertierbar
sind, kann man die Vielfachheit mit Hilfe höherer Ableitungen genau angeben:
Satz 1.2 — Es sei K ein Körper der Charakteristik 0. Ein Polynom f ∈ K[X] hat in α ∈ K eine
Nullstelle der Vielfachheit m, wenn
f (α) = f ′ (α) = . . . = f (m−1) (α) = 0
(1.11)
und
f (m) (α) 6= 0.
Beweis. Ohne Einschränkung ist f nicht konstant und ℓ ∈ N0 maximal mit der Eigenschaft, daß
es eine Zerlegung f (x) = (x − α)ℓ g(x) gibt. Alle Ableitungen f (k) , k < ℓ, enthalten den Faktor
(x − α)ℓ−k und damit die Nullstelle α, und
f (ℓ) (x) =
(1.12)
ℓ−1
X
i=0
Es folgt f
(ℓ)
ℓ!2
(x − α)ℓ−i g (ℓ−i) (x) + ℓ!g(x).
i!(ℓ − i)!2
(α) = ℓ!g(α) 6= 0.
1.2. Lösungsformeln.
Wir wollen die klassischen Lösungsformeln für Polynomgleichungen f (x) = 0 für reelle Polynome vom Grad ≤ 4 besprechen.
Lineare Gleichungen
(1.13)
f0 x + f1 = 0
mit f0 6= 0 haben stets die eindeutige Lösung x = −f1 /f0 . Allgemeiner kann man in jeder Gleichung f0 xn + . . . + fn = 0 mit nichttrivialem Leitkoeffizienten stets durch f0 teilen und deshalb
ohne Einschränkung annehmen, daß f0 = 1.
Eine quadratische Gleichung
x2 + f 1 x + f2 = 0
(1.14)
wird durch quadratische Ergänzung vereinfacht:
2
f1
f1
f2
f2
(1.15)
x+
= x2 + 2 x + 1 = 1 − f 2 .
2
2
4
4
Setzt man y = x + f21 , so hat man die ursprüngliche Gleichung auf eine sogenannte reine Gleichung
(1.16)
y2 = b
mit der Diskriminante
b=
f12
− f2
4
zurückgeführt. Man erhält die formale Lösung
r
f12
f1
(1.17)
x=− ±
− f2
2
4
der Gleichung f = 0. Damit diese formale Lösung für konkrete Zahlenwerte wirklich Lösungen
liefert, muß die Diskriminante Wurzeln besitzen.
Das Wissen, wie man quadratische Gleichungen löst, ist uralt. Die berühmte Keilschrifttafel
‘Plimpton 322’ ist ca 3700 Jahre alt und wird heute als Beispielsammlung für Zahlen verstanden,
die in Rechenaufgaben zu quadratischen Gleichungen eingehen.
1Johan Hudde, b23. April 1628, d15. April 1704 jeweils in Amsterdam.
7
Dagegen ist die Auflösung kubischer Gleichung ein Ergebnis des 16. Jahrhunderts. Die Entdeckung der im Folgenden erklärten Verfahren geht auf die italienischen Mathmematiker S CIPIONE
DEL F ERRO (1465 - 1526), H ANNIBAL DEL NAVE (1500 - 1558), A NTONIO M ARIA F IOR , N ICCO LO (F ONTANA ) TARTAGLIA (ca 1499 - 1557), G EROLAMO C ARDANO (1501–1576), L ODOVICO
F ERRARI (1522 - 1565) zurück. Für die ebenso spannende wie verwickelte Geschichte verweise
ich auf Bücher zur Mathematikgeschichte, insbesondere das Buch ‘A History of Algebra: From alKhwarizmi to Emmy Noether’ von VAN DER WAERDEN.
Wir betrachten eine kubische Gleichung
x3 + f 1 x2 + f 2 x + f 3 = 0
(1.18)
und nehmen der Einfachheit an, der Koeffizientenkörper sei der Körper der reellen Zahlen. Der Vergleich mit dem binomischen Ausdruck
3
f1
f2
f3
(1.19)
x+
= x3 + f 1 x2 + 1 x + 1
3
3
27
legt nahe, die Substitution
(1.20)
y =x+
f1
,
3
x=y−
f1
3
durchzuführen. Man erhält
x3 + f 1 x2 + f 2 x + f 3
=
=
3
2
f1
f1
f1
y−
+ f1 y −
+ f2 y −
+ f3
3
3
3
2 3
1
1
f1 .
y 3 + f2 − f12 y + f3 − f1 f2 +
3
3
27
Durch diese Substitution kann man also den quadratischen Term eliminieren, erhält aber nicht sofort
eine reine Gleichung vom Typ y 3 = b. Wenn wir die Unbestimmte wieder mit x bezeichnen und der
Tradition folgend die konstanten und linearen Terme auf der anderen Seite des Gleichungszeichens
sammeln, ist das Ausgangsproblem auf eine Gleichung der Form
x3 = ax + b
(1.21)
zurückgeführt. Wenn a = 0, handelt es sich um eine reine Gleichung, die man sofort lösen kann,
wenn man weiß, wie man Kubikwurzeln zieht. Wir nehmen also an, daß a 6= 0. Mit dem Ansatz
x = u + v mit zwei neuen Unbestimmten und der Identität
(1.22)
x3 = (u + v)3 = (u3 + v 3 ) + (3uv)x
folgt, daß die Gleichung (1.21) jedenfalls dann gelöst wird, wenn
(1.23)
3uv = a
gilt. Aus u3 + v 3 = b und (u3 )(v 3 ) =
Gleichung
(1.24)
und
a3
27
u3 + v 3 = b
folgt, daß u3 und v 3 Lösungen der quadratischen
0 = (t − u3 )(t − v 3 ) = t2 − bt +
a3
27
sind. Bis auf eine irrelevante Vertauschung der Variablen bedeutet dies:
r
r
b
b2
b2
a3
b
a3
3
3
(1.25)
u = +
−
, v = −
−
.
2
4
27
2
4
27
Man erhält so die sogenannte Cardanische Formel
s
s
r
r
3
2
3 b
3 b
a
a3
b
b2
+
−
+
−
−
.
(1.26)
x=
2
4
27
2
4
27
8
Polynomgleichungen
Dabei ist bei der Bildung der dritten Wurzeln das Folgende zu beachten: Bekanntlich hat jede komplexe Zahl 6= 0 nicht eine, sondern drei dritte Wurzeln, die sich um Potenzen der dritten Einheitswur√
zel ρ = 12 (−1 + i 3) unterscheiden. Das Wurzelzeichen ist also auf gefährliche Weise mehrdeutig.
Aber nicht jede der 9 Kombinationen der beiden Wurzeln ist zulässig, denn u und v müssen der Nebenbedingung 3uv = a genügen. Deshalb legt die Wahl der Wurzel für u die Wahl der Wurzel für v
fest.
Zum Beispiel hat die Gleichung
x3 = 18x + 35
(1.27)
die Lösung
x1
=
=
s
r
3 35
352
352
183
183
−
+
−
−
4
27
2
4
27
r
r
19
19
3 35
3 35
+
+
−
= 3 + 2 = 5,
2
2
2
2
s
3
35
+
2
r
aber auch die Lösungen
(1.28)
x2 = 3ρ + 2ρ2 = −2 + ρ
und
x3 = 3ρ2 + 2ρ = −3 − ρ.
(Es ist ρ2 + ρ + 1 = 0!)
Es ist verblüffend, daß zwischen der Entdeckung der Lösungsmethoden für quadratische und für
kubische Gleichungen drei Jahrtausende liegen, daß die Lösung für biquadratische Gleichungen fast
zeitgleich mit der Lösung für kubische Gleichungen gefunden wurde, und zwar von L UDOVICO F ER RARI . Beide Lösungen wurden von C ARDANO in seinem Buch Ars Magna de Regulis Algebraicis
(1545) veröffentlicht.
Mit demselben Trick wie im Falle der quadratischen und kubischen Gleichungen kann man bei
allen Polynomgleichungen f (x) = xn + f1 xn−1 + . . . + fn = 0 mit der Substitution y = x + fn1
den Term vom Grad n − 1 eliminieren:
(1.29)
f (x) = F (y) = y n + (f2 −
n−1 2 n−2
f )y
2n 1
+ ...
Bei einer biquadratischen Gleichungen kann man also stets den Term vom Grad 3 eliminieren.
Wir gehen gleich von der normalisierten Form
x4 = ax2 + bx + c
(1.30)
aus und geben zunächst eine leicht modifizierte Form des ursprünglichen Arguments von F ERRARI,
natürlich ausgedrückt in der modernen symbolischen Sprache, die F ERRARI noch nicht zur Verfügung stand. Die Idee besteht darin, auf beiden Seiten einen quadratischen Ausdruck so zu addieren,
daß jede Seite für sich ein Quadrat ist:
(1.31)
x4 + 2px2 + p2 = (a + 2p)x2 + bx + (c + p2 ).
Dabei ist p ein Parameter, über dessen Wert noch zu verfügen ist. Die linke Seite ist offensichtlich
(x2 + p)2 . Die rechte Seite ist genau dann ein Quadrat, wenn die Diskriminante des quadratischen
Polynoms verschwindet, d.h. wenn
4(a + 2p)(c + p2 ) − b2 = 0.
(1.32)
Dies ist eine kubische Gleichung
(1.33)
(2p)3 + a(2p)2 + 4c(2p) + (4ac − b2 ) = 0
9
für den Parameter p. Diese Gleichung nennt man eine kubische Resolvente für die Ausgangsgleichung. Wenn man nun eine Nullstelle p der kubischen Resolventen bestimmt hat und in (1.31) einsetzt, kann man auf beiden Seiten die Wurzel ziehen und erhält
p
p
(1.34)
x2 + p = ±( a + 2p x + c + p2 ),
wobei die beiden Wurzeln so zu wählen sind, daß sie die Nebenbedinung
p
p
(1.35)
2 a + 2p c + p2 = b
erfüllen, was nach Wahl von p stets möglich ist. Auf diese Weise ist die Lösung der biquadratischen
Gleichung (1.30) auf das Lösen einer kubischen und mehrerer quadratischer Gleichungen zurückgeführt.
D ESCARTES löst die Gleichung
x4 − ax2 − bx − c = 0
(1.36)
mit dem Ansatz
x4 − ax2 − bx − c = (x2 − ux + v)(x2 + ux + w)
(1.37)
mit den Unbestimmten u, v, w. Durch Koeffizientenvergleich erhält man die Bedingungsgleichungen
−a
=
−u2 + v + w
−b
=
u(v − w)
−c
=
vw
Aus der ersten Gleichung kann man w eliminieren: w = −a + u2 − v. Wenn b = 0, ist die Ausgangsgleichung eine quadratische Gleichung in x2 und kann sofort mit den üblichen Mitteln gelöst
werden. Wir nehmen deshalb ohne Einschränkung an, daß b 6= 0 ist. Falls das Gleichungssystem
also überhaupt eine Lösung hat, muß jedenfalls auch u 6= 0 gelten, und man kann aus der ersten und
der zweiten Gleichung auch v elimineren:
u3 − au − b
u3 − au + b
, w=
.
2u
2u
Die dritte Bedingungsgleichung liefert dann nach Multiplikation mit dem Hauptnenner
(1.38)
v=
0
=
=
(u3 − au − b)(u3 − au + b) + 4cu2
u6 − 2au4 + (a2 + 4c)u2 − b2 .
Dies ist eine kubische Gleichung für u2 , die im Übrigen durch eine einfache Substitution in (1.33)
übergeht.
Ein anderer sehr eleganter Ansatz geht auf E ULER zurück: Man setzt
(1.39)
x=u+v+w
mit drei Unbestimmten u, v, w. Zur Abkürzung führen wir die Bezeichnungen
A = u2 + v 2 + w 2 ,
(1.40)
B = u2 v 2 + v 2 w 2 + w 2 u2 ,
T = uvw
ein. Dann gilt
(1.41)
x2 = (u2 + v 2 + w2 ) + 2(uv + vw + wu) = A + 2(uv + vw + wu)
und
(x2 − A)2
=
4(uv + vw + wu)2
=
4 · (u2 v 2 + v 2 w2 + w2 u2 ) + 2(u2 vw + v 2 uw + w2 uv)
=
4B + 8(u + v + w)uvw = 4B + 8T x.
10
Polynomgleichungen
Zusammengenommen heißt das
x4 = 2Ax2 + 8T x + (4B − A2 ).
(1.42)
Substituiert man diesen Ausdruck in (1.30),
(2A − a)x2 + (8T − b)x + (4B − A2 − c) = 0,
(1.43)
so ist diese Gleichung offenbar identisch erfüllt, wenn u, v und w so gewählt werden, daß
1
1
1
1 2
(1.44)
A = a, T = b, B = c +
a .
2
8
4
16
Konstruktionsgemäß sind u2 , v 2 und w2 die Nullstellen des kubischen Polynoms
(Y − u2 )(Y − v 2 )(Y − w2 )
=
=
=
Y 3 − (u2 + v 2 + w2 )Y 2 + (u2 v 2 + v 2 w2 + w2 u2 )Y − u2 v 2 w2
Y 3 − AY 2 + BY − T 2
1
1
1 2
1 2
Y 3 − aY 2 +
c+
a Y −
b .
2
4
16
64
Bezeichnen also λ1 , λ2 , λ3 die drei Nullstellen dieses Polynoms, so ist
√
√
√
(1.45)
x = u + v + w mit u = ± λ1 , v = ± λ2 , w = ± λ3
eine Lösung der biquadratischen Gleichung (1.30), wobei die Vorzeichen der Wurzeln so zu wählen
sind, daß die Nebenbedingung
1
(1.46)
uvw = T = b
8
erfüllt ist. Von den 23 = 8 denkbaren Vorzeichenwahlen scheiden also 4 aus, und die übrigen liefern
vier Lösungen x1 , x2 , x3 , x4 . Im Ausnahmefall, daß b = 0, verschwindet eine Nullstelle, etwa λ3 ,
√
√
und die vier Lösungen der biquadratischen Gleichung ergeben sich aus ± λ1 ± λ2 .
In der Folgezeit haben viele Mathematiker vergeblich versucht, auch für Gleichungen vom Grad 5
Lösungsformeln zu finden, bis sich das Verständnis durchgesetzt hat, daß es solche Lösungsformeln
vielleicht nicht gibt. Daß es Lösungsformeln für Polynomgleichungen vom Grad ≥ 5 nicht geben
kann, wurde 1799 von RUFFINI (mit unvollständigem Argument) und schließlich 1824 von N IELS
A BEL bewiesen. Allerdings bedeutet dies nicht, daß es nicht Gleichungen vom Grad 5 gibt, deren
Nullstellen man durch Wurzelausdrücke angeben kann. So hat A LEXANDRE -T HÉOPHILE VANDER 2πk
MONDE 1771 gezeigt, daß die Zahlen 2 cos 11 , k = 1, . . . , 5, die die Nullstellen des Polynoms
x5 + x4 − 4x3 − 3x2 + 3x + 1 sind, durch iterierte Wurzelausdrücke angegeben werden können. Es entsteht so das Problem zu bestimmen, für welche Gleichungen man eine oder alle reellen
oder komplexen Nullstellen durch iterierte Wurzelausdrücke schreiben kann. Diese Frage wurde von
E VARISTE G ALOIS 1832 auf ein kombinatorisches Problem zurückgeführt, das in der weiteren Entwicklung zur Entstehung der modernen Gruppentheorie führte. Ich empfehle die Bücher von Tignol
Galois’ theory of algebraic equations und van der Waerden A history of Algebra als vertiefende
Lektüre zur Entstehungsgeschichte des Gruppenbegriffs.
11
§2. Ringe
2.1. Grundbegriffe.
Definition 2.1. — Ein Ring ist eine Menge A mit zwei Verknüpfungen + und · mit den folgenden
Eigenschaften:
(1) (A, +) ist eine kommutative Gruppe. Das Neutralelement der Addition wird mit 0 bezeichnet, das additive Inverse zu a mit −a.
(2) Die Multiplikation · ist assoziativ.
(3) Es gelten die Distributivgesetze (a + b)c = ac + bc und a(b + c) = ab + ac für alle
a, b, c ∈ A.
Ein Element 1 ∈ A heißt Einselement, wenn 1 · a = a = a · 1 für alle a ∈ A. Falls ein Einselement
existiert, ist es eindeutig bestimmt.
Der Nullring 0 ist die Menge {0} mit den trivialen Verknüpfungen 0 + 0 = 0 · 0 = 0. Im Nullring
ist 0 zugleich Null- und Einselement.
Aus den Ringaxiomen folgt, daß 0 · a = 0 = a · 0 für alle a ∈ A. In der Regel sollten keine
Mißverständnisse daraus erwachsen, daß wir alle Nullelemente in allen Ringen mit 0 und alle Einselemente mit 1 bezeichnen. Wenn es darauf ankommt, schreiben wir 0A und 1A , um zu betonen, daß
es sich um die Neutralelemente der Addition und der Multiplikation in A handelt.
Definition 2.2. — Ein Ring A heißt kommutativ, wenn es ein Einselement gibt und die Multiplikation kommutativ ist.
Definition 2.3. — Es sei A ein Ring mit Einselement 1 6= 0. Ein Element b ∈ A ein Rechtsinverses
von a ∈ A und a ein Linksinverses von b, falls ab = 1. Ein Ring A ist ein Schiefkörper, wenn jedes
von 0 verschiedene Element ein Rechtsinverses besitzt. In diesem Falle hat jedes Element a 6= 0
auch ein Linksinverses, und Links- und Rechtsinverse sind gleich und werden mit a−1 bezeichnet.
Ein kommutativer Schiefkörper heißt Körper.
Definition 2.4. — Eine Abbildung f : A → B von Ringen ist ein Ringhomomorphismus, wenn
f (a + b) = f (a) + f (b) und f (ab) = f (a)f (b). Wenn A und B kommutative Ringe sind, wird
zusätzlich vorausgesetzt, daß f (1A ) = 1B .e
Weil jeder Ringhomomorphismus f : A → B auch ein Gruppenhomomorphismus der zugrundeliegenden additiven Gruppen ist, gilt stets f (0A ) = 0B und f (−a) = −f (a) für alle a ∈ A.
Man definiert für alle a ∈ A und n ∈ Z induktiv 0Z · a = 0A , (n + 1) · a = n · a + a, falls n ≥ 0,
und n · a = −((−n) · a), falls n < 0. Für jedes a ist dann die Abbildung Z → (A, +), n 7→ na, ein
Gruppenhomomorphismus. Wenn es ein Einselement gibt, ist die Abbildung
(2.1)
Z → A, n 7→ nA := n · 1A ,
ein Ringhomomorphismus.
Ähnlich definiert man für n ∈ N und a ∈ A rekursiv Potenzen a1 := a, an+1 := an · a und,
falls A ein Einselement besitzt, a0 := 1. Es gelten dann die Rechenregeln an+m = an · am und
(an )m = anm für alle n, m ∈ N bzw. N0 .
Definition 2.5. — Es sei A ein kommutativer Ring.
(1) Ein Element a ∈ A ist invertierbar oder eine Einheit, wenn es ein b ∈ A mit ab = 1 gibt.
Die Einheiten in A bilden eine Gruppe mit der Ringmultiplikation als Verknüpfung, die mit
A× bezeichnete Einheitengruppe von A.
(2) a ∈ A ist ein Nullteiler, wenn es ein b ∈ A \ {0} mit ab = 0 gibt. A ist nullteilerfrei oder
ein Integritätsbereich, wenn A 6= 0 und wenn 0 der einzige Nullteiler in A ist. In einem
12
Ringe
Integritätsbereich gilt für a, b, c ∈ A mit c 6= 0 die Kürzungsregel:
a = b.
(3) a ∈ A ist nilpotent, falls an = 0 für ein n ∈ N.
(4) e ∈ A ist idempotent, falls e2 = e.
ac = bc
⇒
2.2. Ideale und Faktorringe.
(1) Eine nichtleere Teilmenge I ⊂ A ist ein Ideal, wenn für alle x, x′ ∈ I und alle a ∈ A gilt:
x + x′ ∈ I und ax ∈ I.
(2) Für jedes a ∈ A ist die Menge (a) = {ra | r ∈ A} ein Ideal, das von a erzeugte Hauptideal. In jedem Ring gibt es daes Nullideal (0) = {0} und das Einsideal (1) = A. Schließlich
ist A ein Hauptidealring, wenn jedes Ideal in A ein Hauptideal ist.
(3) Für S ⊂ A ist (S) := {a1 s1 + . . . + an sn | n ∈ N0 , ai ∈ A, si ∈ S} das von S erzeugte
Ideal. (S) ist auch der Durchschnitt aller Ideale in A, die S enthalten. Ist S = {s1 , . . . , sn },
schreibt man (s1 , . . . , sn ) := (S). Ein Ideal I ist endlich erzeugt, wenn es s1 , . . . , sn ∈ A
mit I = (s1 , . . . , sn ) gibt. Der Ring A heißt noethersch2, wenn jedes Ideal endlich erzeugt
ist.
Für jeden Ringhomomorphismus ϕ : A → A′ von kommutativen Ringen ist der Kern
(2.2)
ker(ϕ) = ϕ−1 (0)
ein Ideal in A. Das Bild eines Ringhomomorphismus ist ein Unterring in A′ , aber im Allgemeinen
T
kein Ideal. Ist {Is }s∈S eine Familie von Ideal in A, so sind auch der Durchschnitt s∈S Is und
P
die Summe s∈S Is := ∪s∈S Is Ideale in A. Und sind I1 und I2 Ideale in A, so ist auch
I1 I2 := {x1 x2 | xi ∈ Ii } ein Ideal in A.
Definition 2.7. — Es sei nun A ein kommutativer Ring mit einem Ideal I. Nach einer von Gauß3
eingeführten Bezeichnungsweise sagt man, zwei Elemente a, b ∈ A seien kongruent modulo I, in
Zeichen
(2.3)
a ≡ b mod I,
wenn a + I = b + I, oder äquivalent, wenn a − b ∈ I. Für jedes a ∈ A bezeichne a := a + I die
Restklasse von a modulo I, und A/I die Menge aller Restklassen. Die Abbildung π : A → A/I,
die jedes a ∈ A auf seine Restklasse a = a + I schickt, heißt kanonische Projektion.
Lemma 2.8 — Es gibt genau eine Ringstruktur auf A/I, bezüglich der π ein Ringhomomorphismus
wird, nämlich
(2.4)
a + b := a + b,
a · b := ab.
Beweis. Es ist klar, daß die Verknüpfungen nur so definiert werden können, weil π surjektiv ist.
Man zeigt dann, daß die so definierten Verknüpfungen wohldefiniert sind. Für die Wohldefiniertheit
der Addition wird nur benutzt, daß I eine additive Untergruppe ist. Für die Wohldefiniertheit der
Multiplikation wird die Idealeigenschaft gebraucht: Es seien a, a′ und b, b′ Elemente aus A mit
a + I = a′ + I und b + I = b′ + I, also a′ = a + x und b′ = b + y mit x, y ∈ I. Dann hat man
(2.5)
a′ b′ = (a + x)(b + y) = ab + (ay + xb + xy) ∈ ab + I.
2Emmy Noether, b23. März 1882 in Erlangen, d14. April 1935. Begründerin der modernen Algebra.
3Carl Friedrich Gauß, b30. April 1777 in Braunschweig, d23. Februar 1855 in Göttingen.
13
Daß die Ringaxiome in A/I erfüllt sind, folgt dann automatisch, weil π surjektiv ist und die Verknüpfungen erhält und weil A ein Ring ist.
Definition 2.9. — Es sei A ein kommutativer Ring und I ⊂ A ein Ideal. Der Ring A/I heißt
Restklassenring von A bezüglich I.
Satz 2.10 (Universelle Eigenschaft des Restklassenrings) — Es sei A ein kommutativer Ring, I ⊂ A
ein Ideal und π : A → A/I die kanonische Projektion. Zu einem Ringhomomorphismus ϕ : A → B
gibt es genau dann einen Ringhomomorphismus ϕ : A/I → B mit ϕ = ϕ ◦ π, wenn I ⊂ ker(ϕ).
In diesem Falle ist ϕ eindeutig bestimmt.
Man sagt, ϕ faktorisiere über π und ϕ.
Beweis. Falls ein solches ϕ existiert, so ist es offensichtlich eindeutig bestimmt, weil π surjektiv
ist. Außerdem gilt in diesem Falle für jedes x ∈ I, daß ϕ(x) = ϕ(π(x)) = ϕ(0) = 0, also
I ⊂ ker(ϕ). Es gelte nun umgekehrt I ⊂ ker(ϕ). Wir definieren ϕ(π(a)) := ϕ(a). Es genügt zu
zeigen, daß ϕ wohldefiniert ist. Für a, b ∈ A mit π(a) = π(b) folgt a − b ∈ I ⊂ ker(ϕ), also
ϕ(a) − ϕ(b) = ϕ(a − b) = 0.
(1) Ein Ideal p ⊂ A ist ein Primideal, ewenn p 6= A, und wenn für beliebige Ringelemente
a, b ∈ A aus ab ∈ p folgt: a ∈ p oder b ∈ p.
(2) Die Menge Spec(A) := {p | p ist ein Primideal} heißt das Primspektrum oder kurz das
Spektrum von A.
(3) Ein Ideal m ⊂ A ist ein maximales Ideal, wenn m 6= A, und wenn für jedes Ideal I mit
m ⊂ I gilt m = I oder I = A.
Lemma 2.12 — Es sei A ein kommutativer Ring und p ⊂ A ein Ideal.
(1) p ist ein Primideal ⇔ A/p ist ein Integritätsbereich.
(2) p ist ein maximales Ideal ⇔ A/p ist ein Körper.
Beweis. Zu 1: p ist genau dann ein Primideal, wenn aus ab ∈ p und a ∈
/ p folgt b ∈ p. Das ist
äquivalent zu der Aussage: Wenn ab = 0 ∈ A/p und a 6= 0 ∈ A/p, so ist a = 0. Aber das ist genau
die Definition der Nullteilerfreiheit von A/p.
Zu 2: p ist genau dann ein maximales Ideal, wenn für alle x ∈ A\p gilt p+(x) = A oder äquivalent:
1 − xy ∈ p für ein y ∈ A. Das ist äquivalent zu der Aussage: Für alle x ∈ (A/p) \ {0} existiert ein
y ∈ A mit xy = 1 ∈ A/p. Und das bedeutet genau, daß A/p ein Körper ist.
Satz 2.13 — Es sei A ein kommutativer Ring und I ( A ein echtes Ideal. Dann gibt es ein maximales Ideal m ⊂ A mit I ⊂ m.
Beweis. Beweis durch transfinite Induktion: Es sei X die Menge aller echten Ideale J ( A mit
I ⊂ J. Da X das Ideal I enthält, ist X nicht leer. Die Inklusionsordnung ist eine Halbordnung
S
auf X. Jede nichtleere Kette K ⊂ X besitzt die obere Schranke: Es sei nämlich JK := J∈K J.
Offensichtlich enthält JK das Ideal I. Das Ideal JK ist nicht der ganze Ring, denn andernfalls läge 1
in JK , und definitionsgemäß müßte es ein J ∈ K mit 1 ∈ J geben. Deshalb liegt JK in der Menge
X, und nach der Definitions von JK ist klar, daß JK eine obere Schrankte von K ist. Damit ist
gezeigt, daß X induktiv geordnet ist. Nach dem Zornschen Lemma gibt es ein maximales Element
m ∈ X. Für jedes a ∈ A folgt nun: m + (a) = A oder m + (a) ∈ X. Wegen der Maximalität von
m muß im zweiten Fall m = m + (a) gelten. Es gibt also keine Ideale, die echt zwischen m und A
liegen.
14
Ringe
Eine unmittelbare Folgerung daraus ist, daß jeder Ring A 6= 0 wenigstens ein maximales Ideal
und damit wenigstens ein Primideal besitzt, d.h. Spec(A) = ∅ genau dann, wenn A = 0.
2.3. Lokalisierung und Quotientenringe.
Weil in den ganzen Zahlen die multiplikativen Inversen fehlen, führt man in der elementaren
Arithmetik die rationalen Zahlen ein. Allgemeiner konstruiert man zu einem Integritätsbereich A
seinen Quotientenkörper Q(A), in dem alle Elemente aus A \ {0} invertierbar sind. Lokalisierung
ist ein Verfahren, zu einem gegebenen kommutativen Ring A einen neuen Ring zu konstruieren, in
dem eine vorgegebene Menge von Elementen invertierbar wird.
Definition 2.14. — Es sei A ein kommutativer Ring. Eine Teilmenge S ⊂ A ist multiplikativ
abgeschlossen, wenn 1 ∈ S und wenn f1 f2 ∈ S für alle f1 , f2 ∈ S.
Beispiele 2.15. — Es sei A ein kommutativer Ring.
(1) Für jedes f ∈ A ist {1, f, f 2 , . . .} multiplikativ abgeschlossen.
(2) Für ein Ideal I ⊂ A ist A \ I genau dann multiplikativ abgeschlossen, wenn I ein Primideal
ist.
(3) Ist A ein Integritätsbereich, so ist A \ {0} multiplikativ abgeschlossen.
Es sei nun A ein kommutativer Ring und S ⊂ A ein multiplikativ abgeschlossene Teilmenge.
Wir betrachten auf der Menge A × S die folgende Relation:
(2.6)
(a, s) ∼ (a′ , s′ )
:⇔
es gibt ein t ∈ S mit tas′ = ta′ s.
Lemma 2.16 — Die Relation ∼ ist eine Äquivalenzrelation.
Beweis. Reflexivität und Symmetrie sind offensichtlich. Zum Beweis der Transitivität seien Paare
(a, s) ∼ (a′ , s′ ) ∼ (a′′ , s′′ ) vorgegeben. Definitionsgemäß gibt es dann u, t ∈ S mit as′ t = a′ st
und a′ s′′ u = a′′ s′ u. Nun folgt:
(2.7)
as′′ (s′ tu) = (as′ t)(s′′ u) = (a′ st)(s′′ u) = (a′ s′′ u)(st) = (a′′ s′ u)(st) = (a′′ s)(s′ tu).
Weil S multiplikativ ist, ist s′ tu ∈ S. Definitionsgemäß folgt (a, s) ∼ (a′′ , s′′ ).
Wenn A ein Integritätsbereich ist und 0 6∈ S, kann wegen der Gültigkeit der Kürzungsregel in der
Definition der Relation stets t = 1 gewählt werden. Würde man für einen beliebigen kommutativen
Ring diese Definition wählen, also
(2.8)
(a, s) ≈ (a′ , s′ )
:⇔
as′ = a′ s
setzen, so stößt man bei dem Versuch, die Transitivität zu beweisen, auf das folgende Problem:
(2.9)
(as′′ )s′ = (as′ )s′′ = (a′ s)s′′ = (a′ s′′ )s = (a′′ s′ )s = (a′′ s)s′ .
Im Ring der ganzen Zahlen und allgemeiner in einem Integritätsbereich kann mit der Kürzungsregel
jetzt auf as′′ = a′′ s schließen, in einem allgemeinen kommutativen Ring nicht. Das ist der Grund
für den merkwürdigen zusätzlichen Faktor in der Definition von ∼.
Wir bezeichnen mit S −1 A := A × S/ ∼ den Quotienten nach der Relation ∼ und mit as die
Klasse von (a, s).
Satz 2.17 — Auf S −1 A wird durch
a
a a′
a′
as′ + a′ s
aa′
(2.10)
und
+ ′ :=
·
:=
s
s
ss′
s s′
ss′
−1
eine Ringstruktur definiert. Die Abbildung i : A → S A, a 7→ a/1, ist ein Ringhomomorphismus.
S −1 A ist genau dann der Nullring, wenn 0 ∈ S. Der Homomorphismus i ist genau dann injektiv,
wenn S keine Nullteiler enthält.
15
Beweis. Übung
−1
−1
Der Ring S A oder genauer: die Abbildung i : A → S A heißt Lokalisierung von A nach
der Menge S. Im Ring S −1 A ist das Bild i(s) = s/1 von s ∈ S invertierbar: i(s)−1 = 1/s. Der
Ring S −1 A ist durch diese Eigenschaft charakterisiert:
Satz 2.18 (Universelle Eigenschaft der Lokalisierung) — Es sei A ein kommutativer Ring, S ⊂ A
eine multiplikativ abgeschlossene Menge und i : A → S −1 A die zugehörige Lokalisierung. Ist
ϕ : A → B ein Ringhomomorphismus in einen kommutativen Ring B mit ϕ(S) ⊂ B × , dann gibt
es einen eindeutig bestimmten Ringhomomorphismus ψ : S −1 A → B mit ϕ = ψ ◦ i.
Beweis. Falls ψ existiert, muß wegen ϕ(a) = ψ(a/1) = ψ(a/s)ψ(s/1) = ψ(a/s)ϕ(s) gelten:
ψ(a/s) = ϕ(a)ϕ(s)−1 . Daher ist ψ jedenfalls eindeutig. Definiert man umgekehrt ψ auf diese
Weise, dann ist ψ wohldefiniert und ein Homomorphismus.
In den folgenden Fällen werden spezielle Bezeichnungen verwendet: A sei ein kommutativer
Ring.
(1) Für f ∈ A schreibt man Af := {f n | n ∈ N0 }−1 A.
(2) Für ein Primideal p ⊂ A setzt man Ap := (A \ p)−1 A.
(3) Die Menge N N T (A) der Nichtnullteiler von A ist multiplikativ abgeschlossen. Die zugehörige Lokalisierung Q(A) := NNT(A)−1 A heißt der totale Quotientenring von A. Wenn
A ein Integritätsbereich ist, ist Q(A) ein Körper, der sogenannte Quotientenkörper von A.
Beispiele 2.19. — 1. Der Quotientenkörper von Z ist der Körper der rationalen Zahlen Q(Z) = Q.
2. Q(Z[i]) = Q(i) := {a + bi | a, b ∈ Q} ⊂ C.
3. Es sei K ein Körper. Der Polynomring K[X] ist ein Integritätsbereich. Der Körpere
(2.11)
K(X) := Q(K[X])
heißt Körper der rationalen Funktionen (mit Koeffizienten in K). Im Falle K = R kann man die
formalen Brüche p(X)/q(X) als Funktionen f : R \ D → R, die außerhalb der Nullstellenmenge
D des Nenners definiert sind, auffassen.
4. Es sei p ∈ N eine Primzahl und (p) ⊂ Z das zugehörige Primideal. Man unterscheide die Lokalisierungen:
o
na
∈ Q der einzige Primfaktor von s ist p.
(2.12)
Zp :=
s
und
(2.13)
Z(p) :=
na
s
o
∈ Q kein Primfaktor von s ist p.
e Insbesondere ist Zp ∩ Z(p) = Z. Der Umgang mit diesen Bezeichnungen wird dadurch erschwert,
daß in vielen mathematischen Texten Zp für den Restklassenring Z/p verwendet wird, und in wieder
anderen Texten Zp den Ring der ganzen p-adischen Zahlen bezeichnet. Da hilft nur: Auf den Kontext
achten!
2.4. Aufgaben.
Aufgabe 2.20. — Es seien A1 , . . . , An Ringe. Das kartesische Produkt A = A1 × . . . × An mit
den komponentenweise definierten Verknüpfungen
(2.14)
(a + b)i = ai + bi ,
(ab)i = ai bi für alle i = 1, . . . , n
ist ein Ring. A besitzt genau dann eine Eins bzw. ist kommutativ, wenn dies für alle Faktoren
A1 ,. . . ,An gilt.
16
Ringe
Aufgabe 2.21. — Es sei A ein kommutativer Ring mit 1 und einem idempotenten Element e1 . Man
zeige:
(1) e2 := 1 − e1 ist ebenfalls idempotent, und e1 e2 = 0.
(2) Die Teilmenge Ai := ei A = {ei a | a ∈ A}, i = 1, 2, ist ein Unterring mit Einselementei .
(3) Die Abbildung A → A1 × A2 , a 7→ (e1 a, e2 a) ist ein Ringisomorphismus.
Aufgabe 2.22. — Es sei A ein Ring mit nilpotenten Elementen f und g. Wenn f und g vertauschen,
d.h. wenn f g = gf , so ist auch f + g nilpotent.
17
§3. Polynomringe
3.1. Polynomringe in einer Variablen.
Es sei A ein kommutativer Ring. Wir betrachten auf der Menge
(3.1)
A(N0 ) = {(a0 , a1 , . . .) | ai ∈ A, und ai = 0 für alle hinreichend großen i.}
aller endlichen Folgen in A die folgenden Verknüpfungen:
(3.2)
und
(a + b)n := an + bn
(ab)n :=
n
X
ak bn−k .
k=0
Man sieht leicht, daß a + b und ab tatsächlich endliche Folgen sind, so daß + und · wirklich Verknüpfungen auf A(N0 ) sind, und ebenso, daß (A(N0 ) , +, ·) ist ein kommutativer Ring mit Nullelement
0 := (0, 0, . . .) und Einselement 1 := (1, 0, 0, . . .) ist. Genauer ist die Abbildung
(3.3)
i : A 7→ A(N0 ) ,
a 7→ (a, 0, 0, . . .)
ein injektiver Ringhomomorphismus. Wir identifizieren deshalb jedes a ∈ A mit seinem Bild in A
und fassen A als Unterring von A(N0 ) auf. Es bezeichne nun
(3.4)
X := (0, 1, 0, 0, . . .).
Dann ist die Potenz X m die Folge, die eine einzige 1 an der m-ten Stelle und sonst nur Nulleinträge
hat, wenn man die Folgenglieder beginnend mit dem Index 0 zählt. Tatsächlich gilt für beliebige
Elemente aus A(N0 ) :
(3.5)
(a0 , a1 , a2 , . . .)
=
a0 + a1 X + a2 X 2 + . . . ,
wobei die Summe auf der rechten Seite endlich ist, weil nur endlich viele Folgenterme 6= 0 sind.
Üblicherweise schreibt man
(3.6)
A[X] := (A(N0 ) , +, ·)
für diesen Ring. Der Name X für die angegebene Folge ist natürlich beliebig austauschbar. Elemente
in A[X] heißen Polynome in der Unbestimmten X mit Koeffizienten in A. Dieser Polynomring hat
die folgenden wichtigen Strukturmerkmale: Einen Ringhomomorphismus i : A → A[X] und ein
ausgezeichnetes Element X ∈ A[X]. Er ist durch die folgende universelle Eigenschaft charakterisiert:
Satz 3.1 (Universelle Eigenschaft des Polynomrings) — Es sei B ein Ring mit Eins und ψ : A → B
ein Ringhomomorphismus mit ψ(1A ) = 1B . Zu jedem α ∈ B, das mit allen Elementen aus dem Bild
ψ(A) kommutiert, gibt es genau einen Ringhomomorphismus Ψ : A[X] → B mit Ψ(a) = ψ(a) für
alle a ∈ A und Ψ(X) = α.
Beweis. Da jedes Polynom eine Linearkombination aus Potenzen von X mit Koeffizienten aus A ist,
ist ein Ringhomomorphismus auf A[X] vollständig bestimmt, wenn man seine Werte auf A und auf
X kennt. Damit ist Ψ in jedem Falle eindeutig bestimmt und muß wie folgt aussehen:
(3.7)
Ψ((a0 , a1 , a2 , . . .)) :=
∞
X
ψ(ak )αk .
n=0
Es bleibt zu verifizieren, daß die so definierte Abbildung ein Homomorphismus ist. Dabei ist klar,
daß Ψ additiv ist, und die Null- und Einselemente jeweils ineinander überführt werden. Es bleibt zu
zeigen, daß Ψ auch multiplikativ ist. An dieser Stelle geht ein, daß α mit ψ(A) vertauscht: Es seien
18
Polynomringe
a = (a0 , a1 , . . .), b = (b0 , b1 , . . .) gegeben und c = ab mit cn =
alle Summen endlich sind und beliebig vertausch werden dürfen:
Ψ(a)Ψ(b)
=
∞
X
ψ(ak )αk
k=0
ak bn−k . Dann gilt, weil
ψ(bℓ )αℓ
ℓ=0
k=0
X
=
∞
X
Pn
ψ(ak )αk ψ(bℓ )αℓ
k,ℓ≥0
X
=
ψ(ak )ψ(bℓ )αk αℓ
k,ℓ≥0
=
(weil ψ ein Ringhomomorphismus ist)
X
ψ(ak bℓ )αk+ℓ
k,ℓ≥0
=
X
n≥0
=
X
n
X
k=0
ψ(ak bn−k
!
αn
ψ(cn )αn = Ψ(c).
n≥0
Definition 3.2. — Der Grad eines nichtverschwindenden Polynoms f =
(3.8)
deg(f ) := max{k | fk 6= 0},
Pn
k=0
fk X k ist
und deg(0) := 0. Ist f ∈ A[X] ein nichttriviales Polynom vom Grad d, dann heißt Lt(f ) := fd X d
der Leitterm von f , Lc(f ) := fd der Leitkoeffizient und Lm(f ) := X d das Leitmonom.
Für alle f, g gilt: deg(f + g) ≤ max{deg(f ), deg(g)} und deg(f g) ≤ deg(f ) deg(g).
Satz 3.3 (Polynomdivision) — Es sei q = qn X n + . . . + q0 ein Polynom vom Grad n, dessen Leitkoeffizient qn eine Einheit in A ist. Dann gibt es zu jedem Polynom f ∈ A[X] eindeutig bestimmte
Polynome p, r ∈ A[X] mit
(3.9)
f = pq + r
und
deg(r) < deg(q)
oder
r = 0.
Beweis. Beweis durch vollständige Induktion nach deg(f ). Wenn deg(f ) < deg(q), ist nichts zu
zeigen: Man setzt p = 0 und r = f und ist fertig. Es sei also m := deg(f ) ≥ n := deg(q) ≥ 0
X m−n q
und die Behauptung für alle Polynome kleineren Grades schon gezeigt. Das Polynom fqm
n
hat denselben Leitterm wie f . Deshalb hat die Differenz
(3.10)
g=f−
fm m−n
X
q
qn
einen kleineren Grad als f und besitzt nach Induktionsannahme eine Darstellung g = bq + r mit
deg(r) < deg(q). Dann hat man
(3.11)
f =g+
fm m−n
fm m−n
X
q = (b +
X
)q + r.
qn
qn
Mit p = b + fqm
X m−n folgt die Existenz der Darstellung durch Induktion. Zur Eindeutigkeit: Sind
n
′
f = pq + r = p q + r′ zwei Zerlegungen, so gilt (p − p′ )q = r′ − r. Die rechte Seite ist entweder
0 oder hat Grad < deg(q), während die rechte Seite entweder 0 ist oder einen Grad ≥ deg(q) hat,
weil der Leitkoeffizient von q eine Einheit ist und deshalb deg((p − p′ )q) = deg(p − p′ ) + deg(q)
gilt. Aus dem Vergleich folgt: r = r′ und pq = p′ q, und weil der Leitkoeffizient von q invertierbar
ist, muß auch p = p′ gelten.
19
3.2. Polynomringe in mehreren Variablen.
Auf analoge Weise können wir Polynomringe mit beliebig vielen Unbestimmten einführen: Dazu
bezeichne S eine beliebige Indexmenge, im endlichen Falle etwa die Menge {1, . . . , ℓ}. Weiter sei
(S)
M := N0 die Menge aller Folgen (ns )s∈S mit ns ∈ N0 und ns 6= 0 für höchstens endlich viele
s ∈ S. Durch die Verknüpfung
(n + n′ )s := ns + n′s
(3.12)
wird M zu einem abelschen Monoid mit dem Nullelement 0 = (0)s∈S . Bezeichnet es ∈ M für
P
s ∈ S die Folge (es )s′ = δs,s′ , so kann man jedes Element n ∈ M in der Form n = s∈S ns es
schreiben. In der formal unendlichen Summe sind nur endlich viele Summanden ungleich Null. Wir
definieren auf
(3.13)
B := {f : M → A | fm = 0 für fast alle m ∈ M }
wie folgt zwei Verknüpfungen:
(3.14)
(f · g)m =
(f + g)m := fm + gm ,
X
m′ +m′′ =m
fm′ · gm′′ .
Summe und Produkt sind wohldefiniert, weil man aus den endlich vielen Termen {m′ | fm′ 6= 0}
und den endlich vielen Termen {m′′ | gm′′ 6= 0} auch nur endlich viele Summen kombinieren
kann. Man rechnet sofort nach, daß (B, +, ·) ein kommutativer Ring ist. Speziell können wir für
jedes s ∈ S die Abbildung Xs : M → A mit der Eigenschaft (Xs )m = δes ,m betrachten, und
Q
für jedes m ∈ M das Monom X m := s∈S Xsms . Mit diesen Bezeichnungen gilt nun X 0 = 1,
′
′
X m · X m = X m+m für alle m, m′ ∈ M und
X
fm X m für jedes f ∈ B.
(3.15)
f=
m∈M
Außerdem ist die Abbildung A → B, a 7→ aX 0 , ein injektiver Ringhomomorphismus. Wir identifizieren A mit dem Bild in B und bezeichnen mit A[{Xs }s∈S ] := B den Polynomring in den
Unbestimmten {Xs }s∈S .
Satz 3.4 (Universelle Eigenschaft des Polynomrings) — Es sei ϕ : A → R ein Ringhomomorphismus in einen kommutativern Ring R und r = (rs )s∈S eine Folge von Elementen in R. Dann gibt es
genau einen Ringhomomorphismus
(3.16)
Φ : A[{Xs }s∈S ] −→ R
mit Φ|A = ϕ und Φ(Xs ) = rs .
P
n
Beweis. Falls Φ existiert, muß Φ jedenfalls auf einem Polynom f =
n fn X folgendermaßen
aussehen:
Y n
X
Y
X
rs s .
ϕ(fn )
Φ(Xs )ns =
ϕ(fn )
(3.17)
Φ(f ) =
n
s
n
s
Definiert man umgekehrt eine Abbildung Φ auf diese Weise, so hat Φ alle gewünschten Eigenschaften.
Der Ringhomomorphismus Φ heißt Auswertungsabbildung in b. Wir schreiben kurz f (r) :=
Φ(f ). Die Aussage bleibt auch für nichtkommutative Ringe R mit Eins richtig, solange die Elemente
rs , s ∈ S, untereinander und mit ϕ(A) vertauschen.
Meist hat man mit Polynomringen in endlich vielen Variablen zu tun, etwa
(3.18)
A[X1 , . . . , Xℓ ].
20
Polynomringe
Wir verwenden dann die folgenden Multiindexbezeichnungen und schreiben
(3.19)
n
X n := X1n1 · . . . · Xℓ ℓ .
für einen Multigrad n = (n1 , . . . , nℓ ) ∈ Nℓ0 . Die Summe |n| = n1 + . . . + ns ist der Gesamtgrad
oder Totalgrad des Monoms X n . Jedes f ∈ A[X1 , . . . , Xℓ ] schreibt sich nun in der Form
X
fn X n ,
(3.20)
f=
n∈Nℓ0
wobei für fast alle n ∈ Nℓ0 der Koeffizient fn verschwindet.
3.3. (*) Potenzreihenringe.
Es sei A ein kommutativer Ring. Auf der Menge
(3.21)
B := {f : N0 → A}
Pn
wird durch (f + g)n := fn + gn und (f g)n :=
d=0 fd gn−d die Struktur eines kommutativen
Rings mit Eins definiert. Der Unterschied zur Konstruktion des Polynomrings besteht darin, daß von
den Abbildungen f nicht verlangt wird, daß fast alle Werte 0 sind. Wir notieren Elemente in B durch
(3.22)
f=
∞
X
fn X n .
n=0
Die Summe hat also zunächst lediglich den Charakter einer Notation. Wir werden erst später im
Zusammenhang mit der Vervollständigung von Ringen sehen, daß die Summe tatsächlich wie in
der Analysis als Grenzwert einer Summation von unendlich vielen Folgentermen aufgefaßt werden
kann. Elemente in B heißen (formale) Potenzreihen mit Koeffizienten in A, und man nennt den Ring
A[[X]] := B den Potenzreihenring.
P∞
n
∈ A[[X]] ist genau dann invertierbar, wenn der
Satz 3.5 — Eine Potenzreihe f =
n=0 fn X
konstante Term f0 eine Einheit in A ist.
P
m
Beweis. Wir machen einen Ansatz g = ∞
für die Identität
m=0 gm X
(3.23)
1 = f g = (f0 g0 ) + (f1 g0 + f0 g1 )X + (f2 g0 + f1 g1 + f0 g2 )X 2 + . . . .
Wenn f invertierbar ist, d.h. wenn ein solches g existiert, zeigt der Koeffizientenvergleich, daß
f0 g0 = 1, d.h. f0 ist eine Einheit in A. Es sei umgekehrt f0 in A invertierbar und g0 := f0−1 .
Für alle m > 0 soll die Identität
(3.24)
0 = f0 gm + f1 gm−1 + . . . + fm g0
bestehen. Wir können induktiv annehmen, daß Elemente g0 , . . . , gn−1 bereits so bestimmt sind, daß
diese diese Identität für alle m < n tatsächlich gilt. Aber weil f0 invertierbar ist, kann man die
Gleichung für m = n nach gn auflösen:
(3.25)
gn := −g0 (f1 gn−1 + . . . + fn g0 ).
Mit dieser Wahl ist die Identität auch für m = n richtig. Induktiv kann man so g = f −1 konstruieren.
In diesem Sinne gilt die aus der elementaren Analysis bekannte Identität
(3.26)
1
= 1 + X + X2 + . . .
1−X
für die geometrische Reihe auch im Ring A[[X]].
21
3.4. Aufgaben.
Aufgabe 3.6. — Es sei n eine natürliche Zahl und A ein kommutativer Ring, in dem n invertierbar
ist. Dann gibt es zu jeder Potenzreihe F ∈ A[[X]] mit F ≡ 1 mod (X) eine eindeutig bestimmte
√
Reihe G mit G ≡ 1 mod (X) und Gn = F . Man schreibt n F := G.
22
Polynomringe
§4. Symmetrische Polynome
Es sei A ein kommutativer Ring. Ein Polynom f ∈ A[x1 , . . . , xn ] in n Unbestimmten x1 , . . . , xn
heißt symmetrisch, wenn es invariant unter allen Vertauschungen der Variablen ist. Das bedeutet, daß
(4.1)
f (x1 , . . . , xn ) = f (xπ(1) , . . . , xπ(n) )
für alle Permutationen π ∈ Sn . Es ist klar, daß Summen und Produkte von symmetrischen Polynomen wieder symmetrisch sind. Die symmetrischen Polynome bilden deshalb einen Unterring
A[x1 , . . . , xn ]Sn im Ring aller Polynome.
4.1. Symmetrische Polynome in zwei Variablen.
Wir betrachten zunächst den Fall von zwei Variablen x1 und x2 . Die Polynome s1 = x1 + x2
n
und s2 = x1 x2 sind symmetrisch. Auch die Polynome xn
1 + x2 sind für jedes n ∈ N symmetrisch.
Man sieht sofort:
x21 + x22 = (x1 + x2 )2 − 2x1 x2 = s21 − 2s2
(4.2)
und
(4.3) x31 + x32 = (x1 + x2 )3 − 3x21 x2 − 3x1 x22 = (x1 + x2 )3 − 3(x1 + x2 )(x1 x2 ) = s31 − 3s1 s2 .
Tatsächlich gilt allgemein:
Satz 4.1 — Zu jedem symmetrischen Polynom f (x, y) mit Koeffizienten in einem kommutativen
Ring A gibt es ein Polynom g ∈ A[z1 , z2 ] mit der Eigenschaft, daß f (x, y) = g(x + y, xy).
Beweis. Ein Polynom
(4.4)
f (x, y) = f0 xn + f1 xn−1 y + . . . + fn y n
ist genau dann symmetrisch, wenn f0 = fn , f1 = fn−1 usw. Man kann deshalb das Polynom
folgendermaßen zusammenfassen:
(4.5)
f (x, y) = f0 (xn + y n ) + f1 (xy)(xn−2 + y n−2 ) + . . .
wobei der letzte Term fm (xy)m bzw. fm (xy)m (x + y) ist je nachdem, ob n = 2m gerade oder
n = 2m + 1 ungerade ist. Die Aufgabe f (x, y) als Polynom in x + y und xy zu schreiben, wird also
darauf zurückgeführt, dies für die Polynome xn + y n zu tun. Nun gilt:
(4.6)
xn + y n = (x + y)(xn−1 + y n−1 ) − xy(xn−2 + y n−2 ).
Induktiv hat man das Problem damit auf die trivialen Fälle x1 + y 1 und x0 + y 0 zurückgeführt. Palindromische Gleichungen — Man nennt ein Polynom
(4.7)
a(x) = an xn + an−1 xn−1 + . . . + a1 x + a0 ∈ C[x]
palindromisch, wenn ai = an−i für alle i = 0, . . . , n, d.h. wenn die Koeffizienten symmetrisch zur
Mitte des Polynoms sind.
Satz 4.2 — Gleichungen der Form a(x) = 0 mit einem palindromischen Polynom lassen sich immer
auf Gleichungen kleineren Grades und ein quadratisches Polynom zurückführen.
Dazu macht sich zunächst klar:
Lemma 4.3 — Ist a ein palindromisches Polynom von ungeradem Grad, so ist a(x) durch x + 1
teilbar, und der Quotient ist wieder palindromisch.
23
Beweis. Übung.
Deshalb kann man sich auf den Fall von Polynomen geraden Grades beschränken. Es sei also
n = 2m gerade und an 6= 0. Weil dann auch a0 6= 0, ist 0 jedenfalls keine Lösung der Gleichung
a(x) = 0. Wir dividieren die Gleichung formal durch xm und erhalten:
(4.8)
an xm + an−1 xm−1 + am−1 x + . . . + am + am+1 x−1 . . . + a0 x−m = 0.
Mit einer neuen Variablen y = x−1 können wir diese Gleichung wie folgt umschreiben:
(4.9)
an xm + an−1 xn−2 + . . . + am−1 x + am + am+1 y + . . . + a0 y m = 0.
Weil a palindromisch ist, ist die linke Seite ein in x und y symmetrisches Polynom vom Grad m = n2
und kann Satz 4.1 als ein Polynom a(x)x−m = g(x + y, xy) in u := x + y = x + x1 und xy = 1
ausgedrückt werden. Das Lösen der Ausgangsgleichung a(x) = 0 wird also darauf zurückgeführt,
zunächst die Gleichung
(4.10)
g(u, 1) = 0
von halbem Grad in der Variablen u und anschließend eine quadratische Gleichung
(4.11)
x2 − ux + 1 = 0
für x zu lösen.
Wir betrachten dazu das folgende Beispiel:
Regelmäßige Fünfecke und fünfte Einheitswurzeln — Wie kann man mit Zirkel und Lineal ein
reguläres Fünfeck konstruieren? Man kann sowohl geometrisch wie algebraisch zu einer Konstruktionsmethode kommen. Ich skizziere zunächst einen geometrischen Weg, bevor wir zur algebraischen
Methode kommen: Dazu betrachten wir ein reguläres Fünfeck
und bezeichnen die Länge der Diagonale mit d, die einer Seite mit s. Ein Blick auf die Zeichnung
zeigt einem ähnliche gleichschenklige Dreiecke mit den Seitenlängen (d, d, s) und (s, s, d − s). Das
Seitenverhältnis
d
s
1
(4.12)
x := =
=
s
d−s
x−1
genügt also der quadratischen Gleichung
(4.13)
x2 − x − 1 = 0,
und weil x > 1 ist, hat man
√
1
(1 + 5).
2
Gibt man sich also eine Strecke s vor, so genügt es, eine Strecke der Länge d = xs zu konstruieren,
was mit Zirkel und Lineal leicht ist, und dann über der Strecke s das entsprechende spitzwinklige
Dreieck zu errichten. Es ist dann leicht, das Dreieck zu einem Fünfeck zu vervollständigen.
√
Das Verhältnis − − −d : s = 21 (1 + 5) heißt der Goldene Schnitt. Der numerische Wert ist
ungefähr 1, 618.
(4.14)
x=
24
Algebraisch kann man so vorgehen: Die fünften Einheitswurzeln e2πik/5 , k = 0, . . . , 4 lassen
sich alle als Potenzen einer Wurzel ζ = e2πi/5 schreiben. Als Punkte der komplexen Ebene gelesen,
bilden sie die Ecken eines regulären Fünfecks, das dem Einheitskreis einbeschrieben ist.
ζ
ζ2
1
ζ3
ζ4
Definitionsgemäß genügt ζ der Gleichung ζ 5 − 1 = 0. Weil ζ 6= 1, können wir durch ζ − 1 teilen.
Man erhält
ζ 4 + ζ 3 + ζ 2 + ζ + 1 = 0.
(4.15)
Die linke Seite ist das sogenannte fünfte Kreisteilungspolynom Φ5 (ζ). Wir werden später allgemeiner Φn für beliebige n ∈ N definieren. Allerdings gilt nur für Primzahlen p die einfache Beziehung
Φp (X) = (X p − 1)/(X − 1). Die Gleichung Φ5 (ζ) = 0 ist palindromisch und hat geraden Grad.
Mit der oben eingeführten Substitution u = ζ + ζ1 wird man auf die quadratischen Gleichungen
(4.16)
Φ5 (ζ)
1
1
= ζ 2 + ζ + 1 + + 2 = u2 + u − 1 = 0
ζ2
ζ
ζ
und ζ 2 − uζ + 1 = 0
geführt. Also gilt
(4.17)
u=ζ+
1
= 2 cos
ζ
2π
5
=
√
1
(−1 + 5).
4
Um den Punkt ζ wirklich zu konstruieren, genügt es, u/2 zu kennen, weil man dann ζ und ζ −1 als
Schnittpunkte der Senkrechten zur x-Achse durch u/2 mit dem Einheitskreis gewinnt.
4.2. Symmetrische Polynome in beliebig vielen Variablen.
Die Vorüberlegungen zum Falle von zwei Variablen lassen sich wie folgt auf den Fall von n
Variablen x1 , . . . , xn verallgemeinern:
Die Potenzsummen pk := xk1 + . . . + xkn , k > 0, sind symmetrische Polynome.
Mit einer Hilfvariablen t kann man das folgende Produkt bilden und nach Potenzen von t zusammenfassen:
(4.18)
(1 + tx1 ) · . . . · (1 + txn ) = 1 + s1 t + s2 t2 + . . . + sn tn .
Dabei sind s1 , . . . , sn gewisse Polynome in den xi vom Grad deg(si ) = i. Weil die linke Seite
offensichtlich invariant unter Vertauschung der xi ist, gilt dasselbe für die rechte Seite, d.h. die
Polynome s1 , . . . , sn sind symmetrisch. Man nennt si das i-te elementarsymmetrische Polynom
in den Variablen x1 , . . . , xn . Konstruktionsgemäß ist
X
(4.19)
sk :=
x i1 · · · x i k ,
i1 <...<ik
für 0 < k ≤ n. Ausgeschrieben lauten die elementarsymmetrischen Polynome für n = 4:
s1
=
x1 + x2 + x3 + x4
s2
=
x1 x2 + x1 x3 + x1 x4 + x2 x3 + x2 x4 + x3 x4
s3
=
x1 x2 x3 + x1 x2 x4 + x1 x3 x4 + x2 x3 x4
s4
=
x1 x2 x3 x4
25
Die Bezeichnungen sk sind nicht ganz befriedigend, weil man nur aus dem Kontext auf die Anzahl der relevanten Variablen schließen kann. Aber zusätzliche Indizierungen würden die Lesbarkeit
unnötig erschweren.
Formeln von Girard4 und Viète5 — In A[x1 , . . . , xn , t] gilt die Beziehung
(4.20)
(t − x1 ) · . . . · (t − xn ) = tn − s1 tn−1 + s2 tn−2 + . . . + (−1)n sn .
Das liefert die Formeln von Girard und Viète über den Zusammenhang zwischen den Koeffizienten
eines Polynoms und seinen Nullstellen: Sind λ1 , . . . , λn ∈ A die Nullstellen eines Polynoms
(4.21)
f = xn + f1 xn−1 + f2 xn−2 + . . . + fn−1 x + fn ,
so gilt
(4.22)
fk = (−1)k sk (λ1 , . . . , λn ).
Dabei sind die Nullstellen so häufig einzusetzen, wie es ihrer Vielfachheit entspricht.
Der folgende Satz ist die Verallgemeinerung von Satz 4.1 für beliebig beliebig viele Variablen:
Satz 4.4 (Hauptsatz über symmetrische Polynome, Waring6 1762) — Es sei A ein kommutativer
Ring. Jedes symmetrische Polynom f ∈ A[x1 , . . . , xn ] läßt sich auf eindeutige Weise als Polynom
mit Koeffizienten in A in den elementarsymmetrischen Polynomen s1 , . . . , sn ausdrücken.
Etwas formaler kann man den Satz wie folgt umschreiben: Wir betrachten zwei Polynomringe
mit den Unbestimmten x1 , . . . , xn bzw. y1 , . . . , yn . Wenn man y1 , . . . , yn in dieser Reihenfolge auf
s1 , . . . , sn abbildet, setzt sich diese Abbildung auf eindeutige Weise zu einem Ringhomomorphismus
(4.23)
Φ : A[y1 , . . . , yn ] → A[x1 , . . . , xn ],
yi 7→ s i ,
fort. Es ist klar, daß das Bild von Φ im Invariantenunterring liegt. Man kann den Sachverhalt des
Satzes deshalb auch so ausdrücken:
Satz 4.5 — Der Ringhomomorphismus Φ : A[y1 , . . . , yn ] → A[x1 , . . . xn ]Sn ist ein Isomorphismus.
Die Surjektivität von Φ entspricht dann die Darstellbarkeit eines beliebigen symmetrischen Polynoms durch elementarsymmetrische und die Injektivität der Eindeutigkeit einer solchen Darstellung.
Beweis. Der Beweis ist konstruktiv: Wir geben zwei Algorithmen an, die für jedes symmetrische
Polynom eine Darstellung als Polynom in elementarsymmetrischen Polynomen liefern.
Algorithmus 1: Der erste Algorithmus verwendet Monomordnungen, wie sie in erweiterter Form
heute in der Computeralgebra von zentraler Bedeutung sind. Wir ordnen die Monome
xd = xd11 · · · xdnn
lexikographisch nach ihren Exponentenfolgen d = (d1 , . . . , dn ) und d′ = (d′1 , . . . , d′n ), d.h. wir
′
setzen xd > xd genau dann, wenn es ein i mit der folgenden Eigenschaft gibt: dj = d′j für alle
P
j < i und di > d′i . Das Leitmonom eines Polynoms f = t ft xt ist das größte Monom, dessen
zugehöriger Koeffizient nicht 0. Das Produkt aus diesem Leitkoeffizienten und dem Leitmonom ist
der Leitterm.
4Albert Girard, b1595 in St Mihiel, d8.12.1632 in Leiden.
5François Viète, b1540 in Fontenay-le-Comte, d13.12.1603 in Paris.
6Edward Waring, b1736 in Old Heath, d15 August 1798 in Pontesbury.
26
P
Es sei nun f =
ft xt ein symmetrisches Polynom. Für das Leitmonom xd von f gilt wegen
der Symmetrieannahme, daß d1 ≥ d2 ≥ . . . ≥ dn . Das symmetrische Polynom
(4.24)
d
n−1
g := fd sd11 −d2 sd22 −d3 · · · sn−1
−dn dn
sn
hat denselben Leitterm wie f . Die Differenz f −g hat daher einen strikt kleineren Leitterm bezüglich
der Monomordnung als f . Durch Induktion folgt nun die Behauptung.
Ähnlich beweist man die Injektivität: Das Polynom sν11 · · · sνnn hat das Leitmonom
(4.25)
x1ν1 +...+νn xν22 +...+νn · · · xνnn .
Die Bilder verschiedener Monome y1ν1 · · · ynνn unter dem Ringhomomorphismus Φ : yn 7→ sn haP
ben verschiedene Leitmonome. Deshalb kann es in Φ( ν aν y ν ) nicht zu einer vollständigen Auslöschung aller Monome in den Variablen xi kommen.
Algorithmus 2: Wir argumentieren durch Induktion über die Anzahl der Variablen. Im Falle
n = 1 ist die Aussage trivialerweise richtig. Es sei also n > 1, und die Aussage sei für alle kleineren
Anzahlen von Variablen schon bewiesen. Es sei f ∈ A[x1 , . . . , xn ] ein symmetrisches Polynom in
n Variablen. Das Polynom
(4.26)
f˜(x1 , . . . , xn−1 ) := f (x1 , . . . , xn−1 , 0)
in n − 1 Variablen ist ebenfalls symmetrisch. Nach Induktionsannahme gibt es ein Polynom g ∈
A[y1 , . . . , yn−1 ] mit der Eigenschaft, daß
(4.27)
f˜(x1 , . . . , xn−1 )) = g(s′1 , . . . , s′n−1 ),
wobei s′i (x1 , . . . , xn−1 ) = si (x1 , . . . , xn−1 , 0) für i = 1, . . . , n − 1 das i-te elementarsymmetrische Polynom in den Variablen x1 , . . . , xn−1 bezeichnet. Das Polynom F := f − g(s1 , . . . , sn−1 )
verschwindet konstruktionsgemäß, sobald man xn = 0 setzt, ist also durch xn teilbar. Weil F symmetrisch ist, ist es auch durch die anderen Variablen x1 , . . . , xn−1 teilbar und somit auch durch das
Produkt sn = x1 · · · xn . Es gibt deshalb ein Polynom h(x1 , . . . , xn ) so, daß f − g(s1 , . . . , sn−1 ) =
F = sn h. Notwendigerweise ist auch h symmetrisch. Weil h kleineren Grad als f hat, kann man
durch Induktion über den Grad annehmen, daß h = k(s1 , . . . , sn ) für ein gewisses Polynom k. Es
folgt:
(4.28)
f = g(s1 , . . . , sn−1 ) + sn k(s1 , . . . , sn ).
Das beweist die Existenz. Die Eindeutigkeit kann man ähnlich zeigen: Angnommen, p ist ein Polynom mit p(s1 , . . . , sn ) = 0. Setzt man xn = 0, so folgt p(s′1 , . . . , s′n−1 , 0) = 0. Induktiv kann
man annehmen, daß die Injektivität für n − 1 Variablen schon gezeigt ist. Dann weiß man, daß
p(y1 , . . . , yn−1 , 0) = 0. Das bedeutet, daß p durch yn teilbar ist, etwa p = yn q. Nach Voraussetzung ist 0 = p(s1 , . . . , sn ) = sn q(s1 , . . . , sn ). Aber dann ist schon q(s1 , . . . , sn ) = 0. Durch
Induktion über den Grad von p schließt man auf q = 0 und somit p = 0.
Eine fundamentale Konsequenz des Hauptsatzes, die wir in der Folge häufig anwenden werden,
ist das folgende Prinzip:
Folgerung 4.6 — Es seien A ⊂ B Ringe und f = xn + a1 xn−1 + . . . + an ∈ A[x] ein Polynom,
das über B in Linearfaktoren zerfällt:
(4.29)
f (x) = (x − λ1 ) · . . . · (x − λn ),
λi ∈ B.
Dann liegt jedes Element b ∈ B, das sich symmetrisch und polynomiell in den Nullstellen λ1 , . . . , λn
ausdrücken läßt, schon in A.
27
Beweis. Es sei ϕ : A[x1 , . . . , xn ] → B der Ringhomomorphismus mit ϕ : xi 7→ λi . Die Annahme über b besagt, daß es ein symmetrisches Polynom f mit ϕ(f ) = b gibt. Nun gilt nach den
Formeln von Girard und Viète, daß ϕ(si ) = (−1)i ai ∈ A. Nach dem Hauptsatz gibt es ein Polynom g ∈ A[y1 , . . . , yn ] mit f = g(s1 , . . . , sn ). Es folgt b = ϕ(f ) = g(Φ(s1 ), . . . , ϕ(sn )) =
g(−a1 , a2 , . . .) ∈ A.
4.3. Potenzsummen und Newtonsche Formeln.
Die Potenzsummen pk := xk1 + . . . + xkn , k ∈ N, sind besonders wichtige Beispiele von symmetrischen Polynomen. Deswegen gehen wir näher auf die Frage ein, wie sich denn pk konkret durch
s1 , . . . , sn ausdrücken läßt. Zum Beispiel gilt für n = 3 und k = 1, 2, 3:
p1
=
s1
p2
=
s21 − 2s2
p3
=
s31 − 3s1 s2 + 3s3
Im Folgenden setzen wir sk = 0, wenn k größer als die Anzahl der betrachteten Variablen ist.
Newton hat für die Berechung der pk die folgenden Rekursionsgleichungen angegeben:
Satz 4.7 (Newton7) — Für alle k ≥ 1 gilt
(4.30)
pk − s1 pk−1 + s2 pk−2 − . . . + (−1)k ksk = 0.
Dabei ist sℓ = 0 zu setzen, wenn ℓ größer als die Anzahl der Variablen ist.
Beweis. Es sei n die Anzahl der Unbestimmten x1 , . . . , xn . Wertet man Gleichung (4.20) in xi aus,
erhält man
(4.31)
n−1
0 = xn
+ . . . + (−1)n sn .
i − s 1 xi
Summation über alle i = 1, . . . , n liefert die Behauptung für den Fall k = n. Wenn k > n erhält man
zunächst die Gültigkeit der Formel für k Variablen x1 , . . . , xk . Die Substitution xn+1 = . . . = xk =
0 liefert die Behauptung. Für den Fall k < n kann man so argumentieren: Wir wissen, daß sich alle
pi durch die elementarsymmetrischen Polynome s1 , . . . , sn ausdrücken lassen. Aus Gradgründen
können in dem Ausdruck für pk aber aber nur s1 , . . . , sk vorkommen. Wenn man nun eine Formel
pk = Φ(s1 , . . . , sk ) betrachtet und nun xk+1 = . . . = xn = 0 setzt, erhält man eine gültige Formel
derselben Gestalt. Jede Gleichung zwischen symmetrischen Polynomen vom Grad ≤ k muß also
richtig bleiben, wenn man die Zahl der Variablen von k auf n erhöht.
Daraus lassen sich die pi rekursiv durch die sk , k ≤ n, ausdrücken, ohne daß man auf den
allgemeinen Algorithmus des Hauptsatzes 4.4 zurückgreifen muß. Man beachte den Vorfaktor n vor
sn in der Identität (4.30). Deshalb entstehen beim umgekehrten Auflösen nach den sn Nenner. Die
Formeln
s1
=
s2
=
s3
=
p1
1 2
(p1 − p2 )
2
1 3 1
1
p1 − p1 p2 + p3
6
2
3
gelten daher nur in Q-Algebren, d.h. in kommutativen Ringen, in denen alle natürlichen Zahlen
invertierbar sind.
Die Umrechnungsformeln zwischen elementarsymmetrischen Polynomen und Potenzsummen
lassen sich einigermaßen geschlossen ausdrücken. Um solche Ausdrücke herzuleiten, verwenden
7Sir Isaac Newton, b1643 d1727
28
wir erzeugende Funktionen. Mit einer Hilfsvariablen t betrachten wir die Identität
n
Y
(4.32)
(1 + xi t) =
i=1
n
X
s k tk ,
k=0
wobei auf der rechten Seite s0 = 1 ist. Wenn wir wieder sk = 0 für k > n verabreden, können wir
den Laufindex k auf der rechten Seite auch gegen ∞ gehen lassen. Das erleichtert das Aufschreiben
der Formeln. Wir nehmen auf beiden Seiten den Logarithmus, und zwar im Sinne von formalen
Potenzreihen in t. Deshalb spielen Konvergenzfragen hier keine Rolle. Man erhält:
n
X
(4.33)
log(1 + xi t) = log(1 +
i=1
und somit
(4.34)
∞
X
(−1)m−1
m
m=1
n
X
k=1
n
X
i=1
xm
i
!
tm =
∞
X
(−1)ℓ−1
ℓ
ℓ=1
Der Koeffizientenvergleich für die Monome tm zeigt:
pm
= Koeffizient von tm in
(−1)m
m
∞
X
X
(−1)ℓ
ℓ
ℓ=1
s k tk )
ℓ1 +...+ℓn =ℓ
n
X
s k tk
k=1
!ℓ
.
ℓ!
sℓ1 · · · sℓnn tℓ1 +2ℓ2 +...+nℓn
ℓ1 ! · · · ℓn ! 1
Die Summanden auf der rechten Seite, die zum Koeffizienten von tm beitragen, gehören zu den
Indextupeln (ℓ1 , . . . , ℓn ) mit ℓ1 + 2ℓ2 + . . . + nℓn = m. Deshalb erhält man schließlich:
Satz 4.8 — Für alle m ≥ 1 gilt:
(4.35)
(−1)m
pm
=
m
X
(−1)ℓ1 +...+ℓn
ℓ1 +2ℓ2 +...+nℓn =m
(ℓ1 + . . . + ℓn − 1)! ℓ1
s1 · · · sℓnn .
ℓ1 ! · · · ℓ n !
Analog findet man umgekehrt Formeln, die die elementarsymmetrischen Polynome durch Potenzsummen ausdrücken:
!!
n
n
X
X
i
si t = exp log
(1 + xj t)
i=0
j=1
=
=
∞
X
(−1)m
p m tm
exp
m
m=1
∞
X
i=0
(−t)i
X
i1 +2i2 +3i3
Durch Koeffizientenvergleich erhält man also wieder:
!
Y 1 p j ij
−
ij !
j
...=i j
Satz 4.9 — Für alle m gilt:
(4.36)
sm = (−1)m
X
m1 +2m2 +3m3
Y 1 p j mj
−
mj !
j
...=m
j≥1
Für m = 4 ist die Summe über die Tupel (m1 , m2 , . . .) mit den Werten (4, . . .), (2, 1, . . .),
(1, 0, 1, . . .), (0, 2, . . .), (0, 0, 0, 1, . . .) zu nehmen, wobei irrelevante Nullen nicht aufgezählt sind.
Man findet so, ohne in eine Rekursion einsteigen zu müssen:
(4.37)
s4 =
1 4 1 2
1
1
1
p1 − p1 p2 + p1 p3 + p22 − p4 .
4!
4
3
8
4
29
4.4. Invarianten der alternierenden Gruppe. Wenn man statt der Symmetrie unter der vollen
symmetrischen Gruppe Sn von einem Polynom f ∈ R[x1 , . . . , xn ] nur verlangt, daß es invariant
unter allen geraden Permutationen der alternierenden Gruppe An ist, erwartet man einen größeren
Invariantenring:
R[X1 , . . . , Xn ]Sn ⊂ R[X1 , . . . , Xn ]An ⊂ R[X1 , . . . , Xn ].
Diesen Unterring kann man wie folgt bestimmen:
Es sei dazu zunächst f ein An -invariantes Polynom. Für eine beliebige Transposition τ ist dann
τ (f ) wieder An invariant, denn für π ∈ An hat man πτ = τ (τ −1 πτ ) = τ π ′ mit π ′ = τ −1 πτ ∈
An , so daß π(τ (f )) = τ (π ′ (f )) = τ (f ). Weil sich jede Permutation σ ∈ Sn in der Form σ = π
oder σ = τ π mit π ∈ An schreiben läßt, hat man in jedem Falle σ(f ) ∈ {f, τ (f )}. Genauer gilt
mit den Abkürzungen
1
1
f+ := (f + τ (f ))
f− := (f + τ (f ))
2
2
die Beziehungen
f = f+ + f− ,
σ(f+ ) = f+ ,
σ(f− ) = sgn(σ)f−
für alle σ ∈ Sn . Damit wir f+ und f− bilden können, setzen wir voraus, daß R ein Integritätsbereich
ist, in dem 2 invertierbar ist. Man nennt Elemente h mit der Eigenschaft σ(h) = sgn(σ)h für alle
σ ∈ Sn Antiinvarianten oder relative Invarianten von Sn zum Charakter sgn : Sn → {±1}.
Jedes An -invariante Polynom zerfällt also in einen Sn -invarianten und einen Sn -antiinvarianten
Anteil. Wir müssen den letzteren genauer verstehen. Wir entwickeln ein vorgelegtes antiinvariantes
Polynom h nach Potenzen von x1 − x2 und x1 + x2 :
X
(x1 − x2 )a (x1 + x2 )b hab (x3 , . . . , xn ).
h(x1 , . . . , xn ) =
a,b
Unter der Wirkung der Transposition (12) wechselt h das Vorzeichen, aber auf der rechten Seite
wechseln nur die Terme zu ungeradem a das Vorzeichen. Folglich ist hab = 0 für gerade a. Insbesondere ist h durch x1 − x2 teilbar. Aus Symmetriegründen ist h dann auch durch das Produkt
Y
(xi − xj )
δ :=
i<j
teilbar. Tatsächlich ist der Quotient h/δ nun eine Sn -Invariante, denn
σ(h)
sgn(σ)h
h
h
=
= .
σ
=
δ
σ(δ)
sgn(σ)δ
δ
Das zeigt: Jede An -Invariante f hat die Form
f = a + bδ
mit a, b ∈ R[x1 , . . . , xn ]Sn = R[s1 , . . . , sn ],
wo s1 , . . . , sn wie oben die elementarsymmetrischen Polynome bezeichnen. Erst recht weiß man
nun: R[x1 , . . . , xn ]An wird von s1 , . . . , sn , δ erzeugt.
Außerdem weiß man noch, daß δ 2 nicht nur An -invariant, sondern sogar Sn -invariant ist, denn
σ(δ 2 ) = (σ(δ))2 ) = (sgn(σ)δ)2 = δ 2 .
Nach dem Hauptsatz über symmetrische Polynome gibt es ein eindeutig bestimmtes Polynom discn ∈
R[s1 , . . . , sn ], die sogenannte Diskriminante, mit δ 2 = discn . Damit haben wir zusammengefaßt
den folgenden Satz bewiesen:
Satz 4.10 — R[x1 , . . . , xn ]An = R[s1 , . . . , sn , δ]/(δ 2 − discn (s1 , . . . , sn )).
30
4.5. Aufgaben zu symmetrischen Polynomen.
Aufgabe 4.11. — Finden Sie eine Konstruktion mit Zirkel und Lineal für ein regelmäßiges Fünfeck,
das
(1) auf einer gegebenen Seite errichten werden soll;
(2) einem gegebenen Kreis einbeschrieben werden soll.
Aufgabe 4.12. — Bestimmen Sie ein Polynom vom Grad 3 mit rationalen Koeffizienten, das 2 cos(2π/7)
als Wurzel hat, und zwar
(1) indem Sie die Argument des Textes für siebte Einheitswurzeln anpassen.
(2) Aus den Additionsformeln für die trigonometrischen Funktionen und dem Umstand, daß
cos(6π/7) = cos(8π/7).
Aufgabe 4.13. — Leiten Sie aus der Geometrie des regelmäßigen Dreiecks, Vierecks und Fünfecks
für die Winkel 30o , 45o , 72o Wurzelausdrücke ihrer Sinus und Cosinus her. Wenn man weiß, wie
man Wurzeln aus reellen Zahlen bis zu einer vorgegebenen numerischen Genauigkeit ziehen kann,
kann man mit Hilfe der Additionstheoreme für die trigonometrischen Funktionen die Werte sin(3o )
und cos(3o ) bis zu jeder vorgegebenen Genauigkeit berechnen. Berechnen Sie diese Werte auf diese
Weise bis auf vier Nachkommastellen. Wieder mit den Additionstheoremen erhält man eine grobe
Sinus- und Cosinustabelle für alle Winkel der Form 3n0 , n ∈ N. Informieren Sie sich über Berechnungsmethoden für Tabellen für Sinus- und Sehnenwerte bei den Griechen bis Ptolemaios und bei
den Mathematikern der indischen Keralaschule.
Aufgabe 4.14. — Programmieren Sie einen oder beide Algorithmen in Mupad (oder Maple oder
...). Präzisieren Sie zunächst die Aufgabenstellung: Sie übergeben eine beliebigen Ausdruck, in dem
viele Bezeichner vorkommen können, eine Liste von Bezeichnern, die den Unbestimmten im Satz
entsprechen, sowie eine Liste von Werten (!), die den elementarsymmetrischen Polynomen entsprechen. Da Sie nicht wissen, welche Werte übergeben werden, dürfen Sie nicht zu früh substituieren...
Aufgabe 4.15. — Drücken Sie die folgenden symmetrischen Polynome durch elementarsymmetrische Polynome aus:
(1) x41 + x42 + x43 + x44 .
(2) Es sei hk ∈ A[x1 , . . . , xn ] die Summe aller Monome vom Grad k. Die hk heißen vollständige symmetrische Polynome. Schreiben Sie hk für n = 3 und k = 1, . . . , 3 als Polynom
in den elementarsymmetrischen Polynomen.
Q
(3) ∆ := 1≤i<j≤3 (xi − xj )2 .
Q
Aufgabe 4.16. — Das Polynom ∆ := i<j (xi − xj )2 ∈ Z[x1 , . . . , xn ] ist symmetrisch. Deshalb gibt es ein Polynom discn , die sogenannte Diskriminante, mit ∆ = discn (s1 , . . . , sn ), wobei
s1 , . . . , sn die elementarsymmetrischen Polynome in den xi bezeichnen.
(1) Bestimmen Sie disc2 und disc3 .
(2) Es sei f = xn − f1 xn−1 + . . . + (−1)n fn . Zeigen Sie: f hat genau dann eine mehrfache
Nullstelle, wenn disc(f1 , . . . , fn ) = 0.
(3) Wir betrachten den Raum V = {f = x3 − ax − b | a, b ∈ R} ∼
= R2 . Bestimmen Sie die
Orte V1 ⊂ V aller Polynome mit mehrfacher Nullstelle und V0 ⊂ V1 aller Polynome mit
dreifacher Nullstelle. (Zeichnung).
Aufgabe 4.17. — Betrachten Sie die letzte Frage aus Aufgabe 4.16 auch für Polynome vom Grad 4:
Es sei V = {f = x4 + ax2 + bx + c | a, b, c ∈ R}. Bestimmen Sie die Orte V2 aller Polynome mit
mindestens doppelter Nullstelle, V22 mit mindestens zwei doppelten Nullstellen, V3 mit mindestens
einer dreifachen Nullstelle und V4 mit einer vierfachen Nullstelle.
31
Aufgabe 4.18. — Wir betrachten den Polynomring S = C[xij , 1 ≤ i, j ≤ n] in n2 Unbestimmten.
Das charakteristische Polynom χA (t) = tn − χ1 tn−1 + . . . + (−1)n χn der Matrix A = (xij ) ∈
Mn (C) hat Koeffizienten χk ∈ S. Für jede Matrix M ∈ Mn (C) sind (−1)i χi (M ) die Koeffizienten
des charakteristischen Polynoms von M .
(1) Es gibt ein Polynom p ∈ S mit der Eigenschaft, daß jede Matrix M ∈ Mn (C) genau dann
paarweise verschiedene Eigenwerte hat, wenn p(M ) 6= 0.
(2) Finden Sie für n = 4 eine Formel, die die Koeffizienten χi (M ), i = 1, . . . , n durch die
Spuren tr(M k ), k = 1 . . . , n, ausdrückt.
Hinweis zum zweiten Teil: Betrachten Sie zunächst diagonalisierbare Matrizen und verwenden Sie
dann ein Stetigkeitsargument.
32
§5. Euklidische Ringe
5.1. Allgemeine Teilbarkeitsbegriffe.
(1) a ∈ A ist ein Teiler von b ∈ A und b ein Vielfaches von a, wenn es ein c ∈ A mit b = ac
gibt. In Zeichen: a|b. Falls a kein Teiler von b ist, schreibt man a6 | b.
(2) d ∈ A ist ein gemeinsamer Teiler von S ⊂ A, wenn d|a für alle a ∈ S, und d ist ein größter
gemeinsamer Teiler von S, wenn d ein gemeinsamer Teiler ist und wenn für jeden anderen
gemeinsamen Teiler x von S gilt x|d.
(3) a, b ∈ A sind assoziiert, in Zeichen: a ∼ b, wenn a = ub für eine Einheit u.
(4) v ∈ A ist ein gemeinsames Vielfaches von S, wenn a|v für alle a ∈ S, und v ist ein
kleinstes gemeinsames Vielfaches von S, wenn v ein gemeinsames Vielfaches ist und wenn
für jedes andere gemeinsame Vielfache y gilt v|y.
Für die Teilbarkeitsrelation gelten die folgenden Rechenregeln:
(1)
(2)
(3)
(4)
(5)
(6)
1|a|0 für alle a ∈ A.
a|b und a|c ⇒ a|(λb + µc) für alle λ, µ ∈ A.
a|b und b|c ⇒ a|c.
a ∼ b ⇔ a|b und b|a.
Falls ein größter gemeinsamer Teiler für S ⊂ A existiert, ist er eindeutig bis auf Einheiten.
Falls ein kleinstes gemeinsames Vielfaches für S ⊂ A existiert, ist es eindeutig bis auf
Einheiten.
Satz 5.2 — Es sei A ein Hauptidealring. Dann besitzt jede Menge S ⊂ A einen größten gemeinsamen Teiler d. Außerdem gibt es Elemente s1 , . . . , sn ∈ S und α1 , . . . , αn ∈ A mit
d = α1 s1 + . . . + αn sn .
Die Koeffizienten α1 , . . . , αn heißen Bézout-Koeffizienten von d.
Beweis. Das von S erzeugte Ideal ist ein Hauptideal, etwa S = (d). Dann besitzt d wegen d ∈ (S)
eine additive Darstellung wie angegeben. Wegen s ∈ S ⊂ (S) = (d) gilt d|s für alle s ∈ S.
P
Schließlich folgt aus x|s für alle s ∈ S auch x| i αi si = d. Damit ist d ein größter gemeinsamer
Teiler.
5.2. Euklidische Ringe.
Definition 5.3. — Ein euklidischer Ring ist ein Integritätsbereich A mit einer Gradfunktion δ :
A \ {0} → N0 und der Eigenschaft, daß es für alle a ∈ A und b ∈ A \ {0} Elemente q, r ∈ A mit
a = qb + r und r = 0 oder δ(r) < δ(b) gibt.
Das Element r ist der Rest bei Division von a durch b. Dabei muß man allerdings daran denken,
daß das Paar (q, r) im allgemeinen durch (a, b) nicht eindeutig bestimmt ist. Dies ist nicht einmal
im Ring Z der ganzen Zahlen mit δ(a) := |a| der Fall: 7 = 1 · 5 + 2 = 2 · 5 − 3.
Beispiel 5.4. — Der Ring der ganzen Zahlen Z ist ein euklidischer Ring mit Gradfunktion δ(a) :=
|a|. Die Division mit Rest ist die gewöhnliche ganzzahlige Division. Wenn man zusätzlich vereinbart,
daß der Rest grundsätzlich ≥ 0 sein soll, ist die Division sogar eindeutig.
Beispiel 5.5. — Der Ring der sogenannten G AUSSschen Zahlen
Z[i] = {m + ni ∈ C | m, n ∈ Z}
ist ein euklidischer Ring mit Gradfunktion δ(m, ni) = |m + ni|2 = m2 + n2 . Zum Beweis dieser
Aussage seien Elemente a = α + α′ i ∈ Z[i] und b = β + β ′ i ∈ Z[i] \ {0} vorgegeben. Wir können
Algebravorlesung im Wintersemester 2015
33
im Körper C den Quotienten z = a/b bilden und Real- und Imaginärteil von z durch ganze Zahlen
approximieren. Es gibt sicher m, m′ ∈ Z mit
| Re(z) − m| ≤
1
,
2
| Im(z) − m′ | ≤
1
.
2
Es folgt |z − (m + m′ i)|2 ≤ 21 . Wir setzen nun q = m + m′ i und r = a − bq = b(z − q) ∈ Z[i].
Es folgt:
1
δ(r) = |r|2 = |b|2 |z − q|2 ≤ δ(b) < δ(b).
2
Wenn man sich die G AUSSschen Zahlen als Gitterpunkte in einem quadratischen Gitter in C vorstellt,
so landet der Quotient z in einem der Gitterquadrate, und q ist die durch die Wahl eines nächstliegenden Gitterpunktes bestimmt. Diese Wahl ist nicht eindeutig.
Beispiel 5.6. — Auf ähnliche Weise zeigt man, daß der Ring der Ring der E ISENSTEINzahlen
Z[ρ] = {m + nρ | m, n ∈ Z}
mit ρ = exp(2πi/3) ein euklidischer Ring mit Gradfunktion δ(m + nρ) = |m + nρ|2 = m2 −
mn + n2 ist.
Beispiel 5.7. — Für jeden Körper K ist der Polynomring K[X] ein euklidischer Ring mit Gradfunktion δ(f ) = deg(f ). Dies ergibt sich unmittelbar aus dem Satz über Polynomdivision 3.3.
Satz 5.8 — Euklidische Ringe sind Hauptidealringe.
Beweis. Es sei (A, δ) ein euklidischer Ring und I ⊂ A ein Ideal. Falls I = 0, ist nichts zu zeigen.
Es sei also I 6= 0 und b ∈ I \ {0} ein Element mit
δ(b) = min{δ(c) | c ∈ I \ {0}}.
Offensichtlich gilt (b) ⊂ I. Es sei a ∈ I beliebig und r = a − qb ein Rest bei Division von a
durch b, so daß also r = 0 oder δ(r) < δ(b). Da r = a − qb ∈ I, ist die zweite Möglichkeit
wegen der Minimalitätsbedingung an b ausgeschlossen. Deshalb bleibt nur Option r = 0 und somit
a = qb ∈ (b). Das zeigt die umgekehrte Inklusion I ⊂ (b).
Die Umkehrung ist falsch, obwohl es nicht so leicht ist, dies an Gegenbeispielen zu nachzu√
weisen. R ICHARD D EDEKIND zeigt, daß R = Z[ 21 (1 + −19)] ein Hauptidealring ist (vgl. das
bekannte Lehrbuch: Dirichlet-Dedekind: Vorlesungen über Zahlentheorie. 4. Aufl 1894). T HEODO RE M OTZKIN zeigt in dem Aufsatz The Euclidean algorithm. Bull. Amer. Math. Soc. 55, (1949), pp.
1142–1146, daß R kein euklidischer Ring ist. Eine elementare Darstellung beider Aussagen findet
man bei JACK W ILSON: A principal ideal ring that is not a eulidean ring, Mathematics Magazine
vol. 46, No. 1 (1973), pp. 34-38). M OTZKIN und W ILSON verwenden eine Definition des Begriffs
Euklidischer Ring, die scheinbar enger ist, als die von uns verwendete. Daß dem nicht so ist, zeigt
P IERRE S AMUEL: About Euclidean Rings. J. Alg. vol. 19 (1971), pp. 282 - 301. Details dazu im
Abschnitt 5.7
5.3. Der euklidische Algorithmus.
Unter dem euklidischen Algorithmus versteht man das folgende Verfahren, um zu gegebenen a,
b in einem euklidischen Ring (A, δ) einen größten gemeinsamen Teiler d und Bézout-Koeffizienten
zu berechnen.
Wir setzen a0 = a und a1 = b und berechnen an rekursiv wie folgt: Es sei n ≥ 1 und an schon
berechnet. Falls an = 0 bricht das Verfahren ab. Andernfalls gibt es Elemente qn , an+1 ∈ A mit
an−1 = qn an + an+1
und
an+1 = 0
oder
δ(an+1 ) < δ(an ).
34
Euklidische Ringe
Dieses Verfahren muß abbrechen, d.h. man muß nach endlich vielen Schritten auf ein Element an =
0 stoßen, weil andernfalls (δ(an )) eine strikt monoton fallende Folge natürlicher Zahlen wäre.
Aus der trivialen Umformung
⇔
an−1 = qn an + an+1
an+1 = an−1 − qn an
folgt: Jeder (größte) gemeinsame Teiler von an−1 und an ist auch ein (größter) gemeinsamer Teiler
von an und an+1 und umgekehrt. Wenn das Verfahren mit aN +1 = 0 abbricht, so gilt offenbar
aN |aN −1 . Deshalb ist aN ein größter gemeinsamer Teiler des Paares (aN −1 , aN ) und damit auch
des Paares (a0 , a1 ) = (a, b). Zusammengefaßt:
Das letzte nichtverschwindende Glied der Folge (a1 , a2 , . . .) ist ein größter gemeinsamer Teiler
von a und b.
Zur Berechnung der Bézout-Koeffizienten betrachten wir die Identitäten
a0
=
q1 a 1 + a 2
a1
=
..
.
q2 a 2 + a 3
aN −2
=
qN −1 aN −1 + aN
a N1
=
qN a N + 0
und machen den Ansatz
(5.1)
ai = αi a + βi b,
mit (α0 , β0 ) = (1, 0) und (α1 , β1 ) = (0, 1). Aus an+1 = an−1 − qn an folgt rekursiv:
an+1 = (αn−1 a + βn−1 b) − qn (αn a + βn b) = (αn−1 − qn αn )a + (βn−1 − qn βn )b,
also
αn+1 = αn−1 − qn αn ,
βn+1 = βn−1 − qn βn .
Die Bézoutkoeffizienten genügen also exakt denselben Rekursionsgleichungen wie die an selbst,
und man erhält für den größten gemeinsamen Teiler die Darstellung
aN = αN a + βN b.
Beispiel 5.9. — Es seien a = 412 und b = 34 im euklidischen Ring Z vorgegeben. Der euklidische
Algorithmus verläuft dann so:
412
=
12 · 34 + 4
34
=
8·4+2
4
=
2 · 2 + 0.
Deshalb ist 2 ein größter gemeinsamer Teiler von 412 und 34 (aber −2 auch!), und die BézoutKoeffizienten findet man so:
412
=
1 · 412 + 0 · 34
34
=
0 · 412 + 1 · 34
4
=
1 · 412 − 12 · 34
2
=
(0 − 8 · 1) · 412 + (1 − 8 · (−12)) · 34,
also 2 = (−8) · 412 + 97 · 34.
35
5.4. Lineare Kongruenzen. G AUSS hat in den 1801 erschienenen Disquisitiones Arithmeticae
die folgende Notation eingeführt: Er nennt zwei ganze Zahlen a, b ∈ Z kongruent nach dem Modul
m ∈ N, wenn m|(a − b), und schreibt in diesem Falle
(5.2)
a ≡ b mod m.
Das Kongruenzzeichen ≡ ist dabei bewußt so gewählt, daß es an ein Gleichheitszeichen erinnert.
In moderner Sprache betrachtet man das von m erzeugte Hauptideal (m) und geht zum Faktorring
Z/(m) über, den wir in der Regel kürzer Z/m schreiben. Die Aussage (5.2) ist dann äquivalent
zu der Aussage, daß a und b dieselbe Restklasse in Z/m haben. Wir erweitern die Begriffsbildung
für beliebige Ideale I in kommutativen Ringen A und verwenden mit äquivalenter Bedeutung die
Schreibweisen:
a ≡ b mod I
⇔
a−b∈I
⇔
ā = b̄ ∈ A/I.
Unter einer linearen Kongruenz in Z versteht man eine Gleichung der Form
ax ≡ b mod m.
Dazu sind eigentlich zwei Zahlen x, y ∈ Z mit
ax + my = b
zu bestimmen.
Satz 5.10 — Es seien a, b, m ∈ Z, m 6= 0, und d ein größter gemeinsamer Teiler von a und m. Die
lineare Kongruenz
ax ≡ b mod m
hat genau dann eine Lösung, wenn b ein Vielfaches von d ist, etwa b = ℓd. Gilt d = αa + µm mit
Bézoutkoeffizienten α, µ ∈ Z, so sind alle Lösungen der Kongruenz von der Form
x ≡ ℓα mod m/d.
Beweis. Wenn es eine Darstellung b = ax + my gibt, liegt b definitionsgemäß im Ideal (a, m) = (d)
und ist ein Vielfaches von d. Die Bedingung ist also sicher notwendig. Ist umgekehrt b = ℓd und
d = αa + µm, so erhält man durch Multiplikation mit ℓ die Aussage b = ℓd = (ℓα)a + (ℓµ)m.
Deshalb ist x = ℓα eine Lösung der Kongruenz. Damit schließlich eine andere Zahl x′ = x + u
die Kongruenz löst, muß gelten m|(au). Das ist äquivalent zu der Aussage (m/d)|(a/d)u, und weil
m/d und a/d teilerfremd sind, bedeutet dies m/d | u, also x′ ≡ x mod m/d.
Der Satz gilt analog mit identischem Beweis für jeden nullteilerfreien Hauptidealring.
Man beachte, daß die Kongruenz, falls sie überhaupt lösbar ist, eine eindeutige Lösung x0 nach
dem möglicherweise kleineren Modul m/d hat, die aber in mehrere Klassen
x0 ,
x0 +
m
,
d
...,
x0 + (d − 1)
m
d
mod m
aufspaltet, falls d keine Einheit ist.
Beispiel 5.11. — Die Kongruenz 6x ≡ 4 mod 10 ist lösbar, weil 2 ein ggT von a = 6 und m = 10
ist und ein Teiler von b = 4. Mit 4 = 2 · 2 und 2 = 2 · 6 + (−1) · 10 ist x = 2 · 2 = 4 eine Lösung, die
aber nur eindeutig modulo 10/2 = 5 ist. Bezüglich dem Ausgangsmodul 10 hat man zwei Lösungen
4 und 9.
36
Euklidische Ringe
Unter einer simultanen linearen Kongruenz versteht man ein System von Kongruenzen
a1 x
≡
b1 mod m1
a2 x
≡
..
.
b2 mod m2
an x
≡
bn mod mn
Nach dem gerade beschriebenen Verfahren für lineare Kongruenzen kann man jede einzelne Kongruenz so ersetzen, daß die Koeffizienten ai der linearen Terme alle gleich 1 werden. Dabei ändern
sich aber auch die Koeffizienten bi und die Moduln mi . Wir können also der Einfachheit halber von
einem System
x
(5.3)
x
≡
..
.
≡
b1 mod m1
bn mod mn
ausgehen.
Satz 5.12 (Chinesischer Restklassensatz) — Es seien m1 , . . . , mn paarweise teilerfremde ganze
Zahlen 6= 0. Dann hat das System (5.3) für beliebige b1 , . . . , bn eine eindeutige Lösung x mod m1 ·
. . . · mn .
Beweis. Es sei M = m1 · . . . · mn und Mi = M/mi = m1 . . . mi−1 mi+1 · · · mn für alle i =
1, . . . , n. Weil jedes mi teilerfremd zu allen mj , j 6= i, ist, ist mi auch teilerfremd zu Mi . Deshalb
gibt es Koeffizienten αi , βi ∈ Z mit 1 = αi mi + βi Mi . Dann hat ei := βi Mi die Eigenschaften
ei ≡ δij mod mj .
Folglich erfüllt x0 :=
P
i
bi ei die Bedingung
X
X
δij bi ≡ bj mod mj
bi e i ≡
x0 ≡
i
i
für alle j = 1, . . . , n. Eine andere Zahl x löst dieselbe Kongruenz, wenn mi |(x − xi ) für alle i. Und
weil die mi paarweise teilerfremd sind, ist das äquivalent zu M |(x − xi ). Die Lösung x = x0 ist
also eindeutig modulo M .
Satz und Beweis bleiben wieder für beliebige nullteilerfreie Hauptidealringe richtig, und über
euklidischen Ringen mit einer effektiven Division mit Rest ist das im Beweis verwendete Verfahren
ein effektiver Algorithmus.
Man kann den Satz auch wie folgt umformulieren: Für jeden Index i = 1, . . . , n hat man eine
surjektive Abbildung ψi : Z → Z/mi , und diese setzen sich zu einem Ringhomomorphismus
ψ=
n
Y
i=1
ψi : Z → Z/m1 × . . . × Z/mn
zusammen. Unter den Bedingungen des Satzes ist die Abbildung surjektiv und hat als Kern das Ideal
(m1 · · · mn ). Deshalb kann man den Satz auch so aussprechen:
Satz 5.13 — Es seien m1 , . . . , mn ∈ Z\{0} paarweise teilerfremde Zahlen. Dann ist die natürliche
Abbildung
ψ : Z/(m1 · · · mn ) −→ Z/m1 × . . . × Z/mn
ein Ringisomorphismus.
37
Die im Beweis zum Chinesischen Restklassensatz konstruierten Zahlen e1 , . . . , en besimmen die
zu ψ inverse Abbildung
ψ −1 : (b̄1 , . . . , b̄n ) 7→ b1 e1 + . . . + bn en .
Man kann den Chinesischen Restklassensatz für beliebige kommutative Ringe verallgemeinern:
Definition 5.14. — Es sei A ein kommutativer Ring. Zwei Ideale I, J ⊂ A heißen koprim, wenn
I + J = A.
Offenbar sind I und J genau dann koprim, wenn es x ∈ I und y ∈ J mit x + y = 1 gibt.
Satz 5.15 — Es sei A ein kommutativer Ring mit paarweise koprimen Idealen I1 , . . . , In → A. Es
sei weiter pi : A → A/Ii die kanonische Projektion. Dann ist die zusammengesetzte Abbildung
p = (p1 , . . . , pn ) : A → A/I1 × . . . A/In surjektiv mit Kern I1 ∩ . . . ∩ In = I1 · . . . · In .
Insbesondere ist die natürliche Abbildung
A/(I1 · · · In ) → A/I1 × . . . × A/In
ein Isomorphismus.
Beweis. Wir wählen für jedes Paar i 6= j Elemente aij ∈ Ii mit aij + aji = 1. Dann gilt aij ≡
0 mod Ii und aij ≡ 1 mod Ij für alle j 6= i. Insbesondere hat
Y
aij
ej :=
i6=j
die Eigenschaft ej ≡ 0 mod Ii für alle i 6= j und ej ≡ 1 mod Ij . Sind also Klassen [aj ] ∈ A/Ij ,
P
j = 1, . . . , n mit Repräsentanten aj ∈ A vorgegeben, so hat a := j aj ej die Eigenschaft a ≡
T
aj mod Ij für alle j. Deshalb ist p surjektiv. Der Kern von p ist offensichtlich das Ideal I = j Ij .
Es bleibt zu zeigen, daß I = I1 · · · In . Dabei ist die Inklusion ⊃ offensichtlich. Die Rückrichtung
zeigt man durch Induktion: Im Falle n = 2 gilt für jedes Element a ∈ I1 ∩ I2 die Beziehung
a = a(a12 + a21 ) = aa12 + aa21 . Weil a12 ∈ I2 , ist aa12 ∈ I1 I2 , und weil a21 ∈ I2 , ist
aa21 ∈ I1 I2 . Das zeigt: I1 ∩ I2 ⊂ I1 I2 . Die Behauptung folgt nun induktiv aus der Tatsache, daß
I1 koprim zum Produkt I2 · · · In ist, sofern I1 koprim zu jedem einzelnen Ideal I2 , . . . , In ist:
A = A · · · A = (I1 + I2 ) · · · (I1 + In ) ⊂ I1 + I2 · · · In .
5.5. Einheiten in Z/n.
Ein Element ā ∈ Z/n ist eine Einheit, wenn es ein x̄ ∈ Z/n mit ā x̄ = 1 gibt. Das ist äquivalent
zur Kongruenz ax ≡ 1 mod n. Bezeichnet wie üblich (Z/n)× die Gruppe der Einheiten in Z/n, so
folgt:
(Z/n)× = {ā ∈ Z/n | 0 < a < n und a ist teilerfremd zu n.}
Satz 5.16 — Sind A1 , . . . , As kommutative Ringe, so gilt
×
(A1 × . . . × As )× = A×
1 × . . . × As .
Beweis. Addition und Multiplikation in A1 × . . . × As werden komponentenweise ausgeführt. Deshalb ist ein Element (a1 , . . . , as ) genau dann invertierbar, wenn jede Komponente ai in Ai invertierbar ist. Daraus erhält man die angegebene Bijektion. Aus demselben Grund ist es auch ein Homomorphismus von Gruppen.
38
Euklidische Ringe
Folgerung 5.17 — Sind m1 , . . . , ms paarweise teilerfremde natürliche Zahlen und m = m1 · . . . ·
ms , so gilt
×
×
(Z/m)× ∼
= (Z/m1 ) × . . . × (Z/ms )
Beweis. Nach dem Chinesischen Restklassensatz gilt Z/m = Z/m1 × . . . × Z/ms . Die Behauptung
folgt dann aus dem vorigen Satz.
Definition 5.18. — Die Abbildung ϕ : N → N mit
ϕ(n) = |(Z/n)× | = |{a ∈ {1, . . . , n − 1} | a teilerfremd zu n.}|
für n ≥ 2 und ϕ(1) = 1 heißt E ULERsche phi-Funktion.
Satz 5.19 — Die ϕ-Funktion hat die folgenden Eigenschaften:
(1) Sind m1 , . . . , ms ∈ N paarweise teilerfremd, so gilt
ϕ(m1 · · · ms ) = ϕ(m1 ) · · · ϕ(ms ).
(2) Für jede Primzahl p gilt ϕ(pn ) = pn−1 (p − 1).
(3) Für jede natürliche Zahl n gilt
Y ϕ(n)
1
=
.
1−
n
p
p|n prim
(4) Für jede natürliche Zahl n gilt
n=
X
ϕ(d).
d|n
wobei d durch alle positiven Teiler von n läuft.
Beweis. Die erste Aussage ergibt sich aus Folgerung 5.17 durch Übergang zu den Gruppenordnungen. Die zweite Aussage erhält man durch einfaches Abzählen: Eine Zahl a ist genau dann teilerfremd zu pn , wenn sie nicht durch p teilbar ist. Die durch p teilbaren Zahlen in {1, . . . , pn } sind
p, 2p, . . . , pn−1 p. Die Mächtigkeit des Komplements ist daher pn − pn−1 = pn−1 (p − 1). Für die
Q
dritte Aussage zerlegt man n in Primfaktoren: n = p|n pνp und schließt:
Y
Y ν −1
Y
p p (p − 1) = n (1 − p1 ).
ϕ(pνp ) =
ϕ(n) =
p|n
p|n
p|n
Die letzte Aussage erhält man so: Jede Zahl a ∈ {1, . . . , n} hat einen eindeutig bestimmten positiven größten gemeinsamen Teiler d mit n. Weiter ist dann a/d teilerfremd zu n/d. Ist umgekehrt
α teilerfremd zu n/d, so hat αd den größten gemeinsamen Teiler d mit n. Deshalb hat die Menge
der a, die zum Teiler d|n gehören, die Mächtigkeit ϕ( nd ). Da aber jede Zahl a zu irgendeinem Teiler
P
P
gehören muß, ergibt sich: n = d|n ϕ( nd ) = t|n ϕ(t). Die letzte Gleichung ergibt sich daraus,
daß man statt über d über den komplementären Teiler t = n/d summiert.
Für eine Primzahl p ist ϕ(p) = p − 1, so daß (Z/p)× = (Z/p) \ {0}. Das ist das bekannte
Ergebnis, daß
Fp := Z/p
ein Körper ist. Wir wollen die wichtige Aussage herleiten, daß die Einheitengruppe F×
p selbst eine
zyklische Gruppe ist. Das bedeutet: Es gibt eine natürliche Zahl g < p mit der Eigenschaft, daß
1, g, g 2 , . . . , g p−2
ein Vertretersystem für F×
p ist. Solche Zahlen heißen Primitivwurzeln modulo p.
Für p = 7 ist g = 3 eine Primitivwurzel:
30 ≡ 1,
31 ≡ 3,
32 ≡ 2,
33 ≡ 6,
34 ≡ 4,
35 ≡ 5
mod 7.
39
Für p = 11 ist g = 2 eine Primitivwurzel:
20 ≡ 1,
25 ≡ 10,
21 ≡ 2,
26 ≡ 9,
22 ≡ 4,
27 ≡ 7,
23 ≡ 8,
28 ≡ 3,
24 ≡ 5,
29 ≡ 6
mod 11.
Satz 5.20 — Die Einheitengruppe F×
p ist zyklisch. Insbesondere gibt es zu jeder Primzahl p eine
Primitivwurzel g mit der Eigenschaft, daß die Exponentialabbildung
Z/(p − 1) → (Z/p)× ,
m 7→ g m ,
ein Gruppenisomorphismus ist. Die Anzahl der Primitivwurzeln modulo p ist ϕ(p − 1).
Wir zeigen gleich etwas allgemeiner:
Satz 5.21 — Es sei K ein Körper und G < K × eine endliche Untergruppe der Einheitengruppe
von K. Dann ist G zyklisch. Genauer ist die Anzahl der Erzeuger gleich ϕ(|G|). Insbesondere ist
für jeden endlichen Körper F die Einheitengruppe F× zyklisch.
Beweis. Es sei d die Ordnung eines Elements a ∈ G. Dann gilt ad = 1. Die Potenzen ai , i =
0, . . . , d−1 sind nach Definition der Ordnung paarweise verschieden, und alle haben die Eigenschaft
(ai )d = (ad )i = 1, sind also d verschiedene Nullstellen des Polynoms X d − 1 ∈ K[X]. Dieses
Polynom hat aber nur höchstens d Nullstellen. Deshalb ist jedes Element b ∈ G der Ordnung d in der
∼ Z/d enthalten. Ein Element in der additiven Gruppe Z/d hat die maximale
zyklischen Gruppe hai =
Ordnung d genau dann, wenn es teilerfremd zu d ist. Deshalb gibt es in G genau ϕ(d) Elemente der
Ordnung d. Natürlich ist d ein Teiler der Ordnung n := |G|. Es sei nun ψ(d) die Anzahl der Elemente
der Ordnung d in G. Die bisherigen Überlegungen sagen: Entweder ist ψ(d) = 0 oder ψ(d) = ϕ(d).
Da jedes Element in G aber eine Ordnung besitzt, die n teilt, folgt mit Satz 5.19:
X
X
ϕ(d) = n.
ψ(d) ≤
|G| =
d|n
d|n
Die Endterme der Ungleichung sind gleich, deshalb muß an jeder Stelle ψ(d) = ϕ(d) gelten. Insbesondere ist die Anzahl der Elemente der Ordnung |G| gleich ϕ(|G|).
Folgerung 5.22 — Es sei p eine Primzahl. Die Kongruenz x2 ≡ −1 mod p besitzt genau dann eine
Lösung, wenn p = 2 oder wenn p ≡ 1 mod 4 ist.
Beweis. Die Behauptung für p = 2 ist offensichtlich. Für jede natürliche Zahl x ist x2 ≡ 0 mod 4,
falls x gerade ist, und x2 ≡ 1 mod 4, falls x ungerade ist. Die quadratische Kongruenz x2 ≡
−1 mod p kann also keine Lösung haben, wenn p ≡ 3 mod 4 ist. Es bleibt der Fall zu betrachten,
daß p eine ungerade Primzahl der Form p = 4m + 1 ist. Es sei g eine Primitivwurzel mod p.
Definitionsgemäß hat g die Ordnung 4m. Also ist y = g 2m nicht kongruent zu 1, genügt aber der
Kongruenz y 2 ≡ 1 mod p, deren einzige Lösungen 1 und −1 sind. Das bedeutet: (g m )2 = g 2m ≡
−1 mod p. Somit sind x = ±g m Lösungen der Kongruenz x2 ≡ −1 mod p.
5.6. (*) Die Einheitengruppe von Z/pm .
Lemma 5.23 — 1. Es sei p eine ungerade Primzahl. Dann gilt
(1 + gpm )p ≡ 1 + gpm+1 mod pm+2
für alle m ≥ 1 und g ∈ Z.
2. Für die Primzahl p = 2 gilt
(1 + g2m )2 ≡ 1 + g2m+1 mod 2m+2
für alle m ≥ 2 und g ∈ Z.
40
Euklidische Ringe
Der Unterschied ist also der Geltungsbereich für den Exponenten m. Die Behauptung ist für
≡ 1 mod 23 .
p = 2 und m = 1 falsch: (1 + 2g)2 = 1 + 8 g+1
2
Beweis. Für alle Primzahlen p gilt
m p
(1 + gp ) = 1 + gp
m+1
!
p−1
X
p i mi
+
g p + g p ppm .
i
i=2
Der Exponent von p in den Summanden zu 2 ≤ i < p ist ≥ 1 + mi ≥ m + 2 für i ≥ 2. Der
Exponent von p im letzten Term ist pm, und dies ist ≥ m + 2, sobald m ≥ 2 oder p ≥ 3.
Satz 5.24 — Es sei p eine ungerade Primzahl. Die Einheitengruppe (Z/pn )× ist zyklisch von der
Ordnung pn−1 (p − 1).
Beweis. Jede zu pn teilerfremde Zahl ist auch zu p teilerfremd. Durch Reduktion modulo p erhält
man also eine exakte Sequenz
1 −→ U −→ (Z/pn )× −→ (Z/p)× −→ 1.
Dabei ist
(5.4)
U := {ā ∈ Z/pn | a ≡ 1 mod p} = {1 + pg |g = 0, . . . , pn−1 }
die sogenannte Gruppe der Einseinheiten. Offenbar ist U = |pn−1 |. Wir zeigen zunächst:
1. Schritt: U ist zyklisch mit Erzeuger 1 + p.
Die Ordnung von 1 + p ist in jedem Falle eine p-Potenz. Andererseits wissen wir aus Lemma 5.23
ℓ
durch Induktion, daß (1 + p)p ≡ 1 + pℓ+1 mod pℓ+2 für alle ℓ ≥ 0. Deshalb hat 1 + p in U
jedenfalls keine Ordnung < pn−1 .
2. Schritt: Es gibt eine Element g ∈ (Z/pn )× der Ordnung p − 1.
Wir zeigen dies durch Induktion über n, wobei der Induktionsanfang einfach die Existenz einer
Primitivwurzel modulo p ist. Wir nehmen also induktiv an, es sei g eine Primitivwurzel modulo p,
die der verschärften Bedingung g p−1 ≡ 1 mod pn−1 genügt, d.h. g p−1 ≡ 1 + ℓpn−1 mod pn . Mit
dem Ansaz g ′ = g + xpn−1 ist g ′ sicher wieder eine Primitivwurzel modulo p, und es gilt
(g ′ )p−1 ≡ 1 + ℓpn−1 + (p − 1)g p−2 xpn−1 mod pn .
Weil (p − 1) und g Einheiten modulo p sind, kann man die Kongruenz
ℓ + (p − 1)g p−2 x ≡ 0 mod p
nach x auflösen. Mit einem solchen x erfüllt g ′ die Bedingung (g ′ )p−1 ≡ 1 mod pn .
3. Schritt: Ist g das im zweiten Schritt konstruierte Element der Ordnung p − 1, so erzeugen
offenbar g und 1 + p eine Untergruppe, deren Ordnung ein Vielfaches von p − 1 und von pn−1 ist
und deshalb mit (Z/pn )× zusammenfällt. Es gilt also
n−1 ∼
n
(Z/pn )× ∼
= h1 + pi × hgi ∼
= Z/(p − 1) × Z/p
= Z/ϕ(p ),
wie behauptet.
Satz 5.25 — Für m ≥ 3 ist die Abbildung
Z/2 × Z/2m−2 −→ (Z/2m )× , (ε, ℓ) 7→ (−1)ε 5ℓ ,
ein Isomorphismus.
41
5.7. (*) Minimale Euklidische Gradfunktionen. Es gibt Definitionen des Begriffs des euklidischen Rings, die verschieden von Definition 5.3, aber dazu äquivalent sind.
Definition 5.26. — Es sei A ein Integritätsbereich. Eine Abbildung ϕ : A → N ist eine euklidische
Gradfunktion, wenn es zu a, b ∈ A mit b 6= 0 stets Elemente q, r ∈ A mit a = bq + r und
0 ≤ ϕ(r) < ϕ(b) gibt.
Wenn A eine euklidische Gradfunktion ϕ besitzt, ist A sicher euklidisch im Sinne von Definition
5.3. Ist umgekehrt δ eine Gradfunktion im Sinne von 5.3, genügt es, ϕ(0) := 0 und ϕ(a) := δ(a)+1
für alle a 6= 0 zu setzen.
Der Grund für unsere frühere Wahl der Definition ist der, daß im Falle eines Polynomrings K[X]
der ’natürliche’ Grad eines Polynoms die Definition 5.3 erfüllt, aber nicht 5.26. Dafür hat die neue
Definition 5.26 Vorteile, die wir in diesem Abschnitt betrachten wollen. Die Ideen dazu gehen auf
die folgenden Arbeiten zurück:
Theodore Motzkin:The Euclidean algorithm. Bull. Amer. Math. Soc. 55, (1949), pp. 1142–1146
Jack Wilson: A principal ideal ring that is not a eulidean ring, Mathematics Magazine vol. 46, No. 1 (1973), pp. 34-38.
Pierre Samuel: About Euclidean Rings. J. Alg. vol. 19 (1971), pp. 282 - 301.
Lemma 5.27 — Es sei A ein Integritätsbereich und S die Menge aller euklidischen Gradfunktionen
auf A. Wenn S nicht leer ist, ist
ϕ0 (a) := min{ϕ(a) | ϕ ∈ S}
eine euklidische Gradfunktion auf A.
Beweis. Es seien a, b ∈ A mit b 6= 0 gegeben. Es gibt ein ϕ ∈ S mit ϕ0 (b) = ϕ(b). Es gibt dann
q, r ∈ A mit a = bq + r und 0 ≤ ϕ(r) < ϕ(b). Definitionsgemäß gilt dann auch ϕ0 (r) ≤ ϕ(r) <
ϕ(b) = ϕ0 (b).
Jeder Integritätsbereich, der also überhaupt eine euklidische Gradfunktion besitzt, hat also eine
ausgezeichnete minimale solche.
Es sei also A ein Integritätsbereich mit einer minimalen euklidischen Gradfunktion. Für n ∈ N0
S
sei An := {a ∈ A | ϕ0 (a) = n} und A′n = A0 ∪ A1 ∪ . . . ∪ An gesetzt, so daß A = n≥0 An . Es
gilt dann A0 = A′0 = {0}. Denn einerseits gilt 0 < ϕ0 (b) für alle b 6= 0 nach Definition 5.26, und
andererseits gilt ϕ0 (0) = 0, weil man im Falle ϕ0 (0) > 0 durch ϕ′ (0) := 0 und ϕ′ (a) = ϕ0 (a) für
a 6= 0 eine neue Gradfunktion erhielte, die der Minimalität von ϕ0 widerspräche.
Lemma 5.28 — Für alle n > 0 gilt:
An = {a ∈ A \ A′n−1 | Die Komposition A′n−1 → A → A/(a) ist surjektiv.}.
Beweis. Es bezeichne Bn die rechte Seite der Identität im Lemma. Damit ϕ0 eine euklische Gradfunktion ist, muß es für a 6= 0 in jeder Restklasse A/(a) mindestens einen Vertreter r mit ϕ(r) <
ϕ(a) geben. Wenn also ϕ0 (a) = n, muß die Zusammensetzung A′n−1 → A → A/(a) surjektiv
sein, d.h. a ∈ Bn . Das zeigt An ⊂ Bn . Wenn nun umgekehrt a ∈ Bn ist, so ist die Abbildung ψ mit
ψ(a) = n und ψ(b) = ϕ0 (b) für alle b 6= a wieder eine euklidische Normfunktion. Aus der Minimalität von ϕ0 folgt ψ = ϕ0 , also ϕ0 (a) = n. Damit hat man auch die Umkehrung Bn ⊂ An . In gewissen Fällen kann man das Lemma zur Berechnung der minimalen Gradfunktion verwenden:
Beispiel 5.29. — Im Ring Z hat man zunächst A0 = {0}. Die Menge A1 besteht dann aus allen
a ∈ A mit A/(a) = (0), d.h. den Einheiten von Z, also A1 = {±1} und A′1 = {a | |a| < 21 }.
Tatsächlich gilt allgemein: A′n = {a | |a| < 2n } wie man durch Induktion sieht. Daraus folgt:
ϕ0 (a) = ⌊log2 (a) + 1⌋ für a 6= 0. Die minimale Gradfunktion unterscheidet sich also sehr von der
’natürlichen’ Gradfunktion a 7→ |a|.
42
Euklidische Ringe
Beispiel 5.30. — Im Polynomring K[X] über einem Körper findet man A0 = {0}, A1 = K \ {0}
und allgemein An = {f | deg(f ) = n + 1} für n > 0. Die minimale Gradfunktion ist also
ϕ0 (f ) = deg(f ) + 1 für f 6= 0.
Man kann das Lemma aber auch verwenden, um zu zeigen, daß ein gegebener Ring nicht euklidisch ist.
Satz 5.31 — Es sei A ein Integritätsbereich. Die Mengen An , A′n seien rekursiv durch die Festsetzungen A0 = A′0 = {0},
An := {a ∈ A \ A′n−1 | A′n−1 → A → A/(a) ist surjektiv}
S
und A′n = A′n−1 ∪ An definiert. A ist genau dann euklidisch, wenn A = n≥0 An .
S
Beweis. Wenn A euklidisch ist, folgt aus Lemma 5.28, daß A = n≥0 An . Gilt umgekehrt diese Gleichheit, so wird durch ϕ(a) := n für a ∈ An eine euklidische Gradfunktion definiert. die
Behauptung
Es ist aus der rekursiven Definition der Mengen An für einen beliebigen Integritätsbereich klar,
daß die Folge A′0 ⊂ A′1 ⊂ A′2 ⊂ . . . stationär wird, sobald einmal A′n = A′n+1 gilt. Daraus ergibt
sich das Kriterium:
Satz 5.32 — Ist A ein Integritätsbereich und gilt für ein n ∈ N die Beziehung A′n = A′n+1 ( A, so
ist A nicht euklidisch.
√
5.8. (*) Der Ring Z[ 12 (1 + −19)].
√
Wir betrachten den Ring Z[ω] = {x0 + x1 ω | xi ∈ Z}, wobei zur Abkürzung ω := 12 (1 + 19i)
√
gesetzt sei. Z[ω] ist wirklich ein Ring, denn ω 2 = 41 1 + 2 19i − 19 = −5 + ω. Als Unterring des
Körpers C ist Z[ω] nullteilerfrei. Wir zeigen in diesem Unterabschnitt, daß Z[ω] ein Hauptidealring,
aber nicht euklidisch ist.
Die Normfunktion N : Z[ω] → R, z 7→ |z|2 , nimmt Werte in den ganzen Zahlen, denn
N (x0 + x1 ω) = x20 + x0 x1 (ω + ω) + x21 ωω = x20 + x0 x1 + 5x21 ,
und ist multiplikativ. Deshalb ist x0 + x1 ω genau dann eine Einheit, wenn N (x0 + x1 ω) = 1. Aber
die einzigen ganzzahligen Lösungen der Gleichung x20 + x0 x1 + 5x21 = 1 sind x0 = ±1, x1 = 0.
Das zeigt:
Z[ω]× = {±1}.
Satz 5.33 — Z[ω] ist ein Hauptidealring.
Beweis. Es sei dazu I ⊂ Z[ω] ein nichttriviales Ideal und x ∈ I \ {0} ein Element mit minimaler
Norm N (x) > 0. Falls I kein Hauptideal ist, gibt es ein Element y ∈ I \ (x). Es sei y so gewählt,
daß N (y) minimal ist. Wir setzen z = y/x ∈ C∗ und leiten eine Reihe von Ungleichungen für z
her, die nicht simultan erfüllbar sind. Das liefert den gesuchten Widerspruch.
(1) Indem man gegebenenfalls y durch −y ersetzt, kann man zunächst ohne Einschränkung
annehmen, daß Im(z) ≥ 0.
(2) Und weil y von minimaler Norm in I \ (x) ist, gilt N (y) ≤ N (y − ux) für alle u ∈ Z[ω].
Das bedeutet N (z) ≤ N (z − u) für alle u ∈ Z[ω], d.h. z liegt vom Ursprung nicht weiter
entfernt als von jedem anderen Punkt des Gitters Z[ω].
Das läßt für z nur den folgenden schraffierten Bereich zu (linkes Bild):
43
(3) Weil x ein nichttriviales Element in I von minimaler Norm ist, gilt N (uy − vx) ≥ N (x)
für alle u, v ∈ Z[ω] mit uy 6= vx, also speziell N (y) ≥ N (x) sowie N (2y − ωx) ≥
N (x) und N (2y + ωx) ≥ N (x). Deshalb muß z außerhalb der Vereinigung der offenen
Kreisscheiben vom Radius 1 um den Ursprung und vom Radius 12 um die Punkte ω/2 und
(ω − 1)/2 = −ω/2 liegen (rechtes Bild).
Da die Kreisscheiben das schraffierte Fünfeck ganz überdecken, gibt es keine Lösungen für z.
Wir benötigen noch einen Satz aus der Zahlentheorie:
Satz 5.34 — Für jedes nichttriviale Elemente u ∈ Z[ω] gilt:
|Z[ω]/(u)| = N (u).
Beweis. 1. Schritt: Wenn u ∈ Z, ist die Aussage sicher richtig: Ist nämlich n1 , . . . , n|u| ∈ Z ein
Restklassensystem von Z modulo u, so bilden die Elemente ni + nj ω ein Restklassensystem von
Z[ω] modulo u. Die Anzahl dieser Elemente ist |Z[ω]/(u)| = |u|2 = N (u).
2. Schritt: Weil ω = −ω+1, geht der Unterring Z[ω] ⊂ C unter komplexer Konjugation isomorph
in sich über. Dabei wird das Ideal (u) auf das Ideal (u) abgebildet, und man erhält einen Ringisomorphismus Z[ω]/(u) → Z[ω]/(u), a mod u 7→ a mod u. Das zeigt: |Z[ω]/(u)| = |Z[ω]/(u)|,
und es gilt sowieso N (u) = N (u).
3. Für beliebige nichttriviale Elemente u, v ∈ Z[ω] gilt N (uv) = N (u)N (v) und
|Z[ω]/(uv)| = |Z[ω]/(u)| · |Z[ω]/(v)|.
Weil nämlich (uv) ⊂ (u), hat man einen natürlichen surjektiven Ringhomomorphismus
π : Z[ω]/(uv) → Z[ω]/(u),
a mod uv 7→ a mod u.
Der Kern besteht aus allen Restklassen der Form tu mod vu mit t ∈ Z[ω]. Deshalb ist die Abbildung
Z[ω]/(v) → ker(π), t mod v 7→ tu mod vu ein Isomorphismus von Gruppen. Es folgt:
|Z[ω]/(u)| = [Z[ω]/(uv) : ker(π)] = |Z[ω]/(uv)| / |Z[ω]/(v)|,
wie behauptet.
4. Für ein beliebiges nichttriviales u ist a := uu ∈ Z. Deshalb schließt man wie folgt:
|Z[ω]/(u)|2
=
=
|Z[ω]/(u)| · |Z[ω]/(u)| = |Z[ω]/(uu)|
|Z[ω]/(a)| = N (a) = N (uu) = N (u)N (u) = N (u)2 .
Das war zu zeigen.
Damit haben wir alle Bausteine zusammen, um den letzten Stein der Gesamtargumentation zu
setzen:
Satz 5.35 — Z[ω] ist nicht euklidisch.
Beweis. Wir wollen das Kriterium 5.32 verwenden. Man hat A0 = {0} und A1 = Z[ω]× = {±1}.
Deshalb hat A′1 = {−1, 0, 1} drei Elemente, und wenn A′1 → A/(a) für ein a ∈ A2 surjektiv sein
44
Euklidische Ringe
soll, darf A/(a) höchstens aus 3 Restklassen bestehen. Nach dem vorstehenden Lemma geht das nur,
wenn N (a) ≤ 3. Aber die einzigen ganzzahligen Lösungen der Ungleichung
N (x0 + x1 ω) = x20 + x0 x1 + 5x21 = (x0 + 12 x1 )2 +
19 2
x
4 1
≤3
sind x1 = 0 und x20 ≤ 1, also x0 + x1 ω ∈ A′1 . Deshalb ist A2 leer. Aus A′1 = A′2 folgt mit 5.32,
daß Z[ω] nicht euklidisch ist.
5.9. Aufgaben.
Aufgabe 5.36. (Satz von Wilson) — Man zeige:
(1) Es sei p eine Primzahl. Zeige, daß (p − 1)! ≡ −1 mod p.
2
! ≡ −1 mod p.
(2) Für ungerade Primzahlen der Form p = 4m + 1 gilt p−1
2
[Hinweis: Man kann dies auf verschiedene Weisen angehen: Man gruppiert die Elemente in (Z/p)×
zu Paaren {x, x1 }. Oder man wählt eine Primitivwurzel g modulo p.]
Aufgabe 5.37. (Primfaktorzerlegungen in Z[i]) — Es bezeichne
ge:
die komplexe Konjugation. Zei-
(1) Die Einheiten in Z[i] sind 1, i, −1, −i.
(2) Wenn π = a + bi ein Primelement in Z[i] ist und ein Primfaktor von n ∈ Z, so ist ππ ein
Teiler von n.
(3) Alle Primelemente in Z[i] sind bis auf Einheiten entweder Primzahlen aus Z oder von der
Form a + bi mit natürlichen Zahlen a, b, für die a2 + b2 eine Primzahl ist.
Zum Beispiel hat die Primfaktorzerlegungen 2 = (−i)(1+i)2 , 5 = (2+3i)(2−3i) in Z[i], während
3 unzerlegbar ist, weil sich 3 nicht in der Form a2 + b2 mit ganzen Zahlen a, b ∈ Z schreiben läßt.
Zeige:
(4) Ist p eine Primzahl mit p ≡ 3 mod 4, so ist p auch in Z[i] prim.
(5) Ist p ≡ 1 mod4, so gibt es natürliche Zahlen a, b mit a2 + b2 = p. Insbesondere ist p in
Z[i] nicht prim, sondern besitzt eine Faktorisierung p = (a + bi)(a − bi).
[Hinweise zu (5): Wähle m mit m2 ≡ −1 mod p, so daß also m2 + 1 = pℓ, und bestimme einen
ggT für p und m + i in Z[i].]
Aufgabe 5.38. — Bekanntlich gilt die Formel (a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 . Zeige:
Eine natürliche Zahl n läßt sich genau dann also Summe von genau zwei Quadratzahlen schreiben,
wenn n keinen ungeraden Primfaktor p mit p ≡ 3 mod 4 hat. (Unter einer Quadratzahl wird hier
eine Zahl der Form u2 mit u ∈ Z verstanden.)
Aufgabe 5.39. (Euklidischer Algorithmus im Ring der Hurwitzquaternionen) — Wir betrachen im
Ring H der Quaternionen die Teilmenge
H := { 21 (a + bi + cj + dk) | a, b, c, d ∈ Z, die alle gerade oder alle ungerade sind.}.
Zeige:
(1) H ist ein (nichtkommutativer) Ring mit 1, der Zh1, i, j, ki als Unterring enthält.
(2) Für alle z ∈ H ist δ(z) := zz ganzzahlig, und es gilt δ(zw) = δ(z)δ(w).
(3) Für alle z ∈ H gibt es ein q ∈ H mit δ(z − q) < 1.
Der Ring H ist nichtkommutativ. Deshalb müssen wir bei der Division mit Rest eine linke und eine
rechte Variante unterscheiden. Zeige:
(4) Sind a, b ∈ H mit b 6= 0, so gibt es Elemente q1 , r1 und q2 , r2 ∈ H mit a = bq1 + r1 =
q2 b + r2 und δ(r1 ) < δ(b) und δ(r2 ) < δ(b).
45
§6. Faktorielle Ringe
6.1. Primfaktorzerlegungen.
Definition 6.1. — Es sei A ein Integritätsbereich und f ∈ A \ ({0} ∪ A× ).
(1) f ∈ A ist irreduzibel, wenn f = ab ⇒ f ∼ a oder f ∼ b.
(2) f ∈ A ist prim, wenn f |ab ⇒ f |a oder f |b.
Lemma 6.2 — Jedes Primelement ist irreduzibel.
Beweis. Es sei f prim und f = ab. Dann gilt ohne Einschränkung f |a, also a = f c. Daraus folgt
f = f bc, also f (1 − bc) = 0. Weil A ein Integritätsbereich ist und f 6= 0, folgt 1 = bc, so daß b
und c Einheiten sein müssen und f ∼ a.
Beispiel 6.3. — Die Umkehrung ist im Allgemeinen falsch, wie das folgende Beispiel zeigt: Wir
betrachten den Ring
(6.1)
√
√
A = Z[ −5] = {a + b −5 | a, b ∈ Z} ⊂ C.
√
√
Die Normabbildung N : A → Z, a + b −5 7→ |a + b −5|2 = a2 + 5b2 , ist multiplikativ, d.h.
N (xy) = N (x)N (y) für alle x, y ∈ A. Wenn x eine Einheit mit Inversem y ist, folgt N (x)N (y) =
√
N (xy) = N (1) = 1. Umgekehrt hat x = a + b −5 die Norm N (x) = 1 nur dann, wenn
a2 + 5b2 = 1, was nur für b = 0 und a = ±1, also x = ±1 möglich ist. Deshalb sind ±1 die
einzigen Einheiten in A.
Weiter ist z ∈ A sicher irreduzibel, wenn in jeder nichttrivialen Faktorzerlegung N (z) = u · v
wenigstens einer der Faktoren u oder v nicht im Bild von N liegt. Nun gibt es in A die Zerlegung
(6.2)
6 = 2 · 3 = (1 +
√
−5)(1 −
√
−5).
Die Normen
(6.3)
N (2) = 4,
N (3) = 9,
N (1 ±
√
−5) = 6
haben in jeder nichttrivialen Zerlegung wenigstens einen Faktor 2 oder 3, während diese Zahlen in
√
der Menge im(N ) = {1, 4, 5, 6, . . .} nicht vorkommen. Deshalb sind 2, 3 und 1 ± −5 irreduzibel.
√
√
Aber keiner dieser Faktoren ist prim, denn aus 2 · 3 = (1 + −5)(1 − −5) müßte für einen primen
Faktor folgen, daß er einen der beiden Faktoren auf der anderen Seite teilt. Dasselbe müßte dann für
ihre Normen gelten. Aber zwischen 4, 6 und 9 gibt es keine Teilbarkeitsbeziehungen.
√
√
All das zeigt, daß 2, 3 und 1 ± −5 irreduzible Elemente in Z[ −5] sind, die aber nicht prim
sind.
Definition 6.4. — Ein kommutativer Ring A heißt faktoriell, wenn A nullteilerfrei ist und wenn
jedes Element a ∈ A \ {0} eine Produktdarstellung a = ǫ · p1 · . . . · pℓ mit einer Einheit ǫ ∈ A×
und primen Elementen pi , i = 1, . . . , ℓ, ℓ ∈ N0 , besitzt.
Lemma 6.5 — Es sei A ein faktorieller Ring und a ∈ A \ {0}. Die Primfaktorzerlegung a =
ǫ·p1 ·. . .·pℓ ist eindeutig bis auf Einheiten und die Reihenfolge der Faktoren, d.h. sind a = ǫ·p1 ·. . .·pℓ
und a = ǫ′ · p′1 · . . . · p′n zwei Primfaktorzerlegungen, dann gilt ℓ = n, und es gibt eine Permutation
π ∈ Sn mit der Eigenschaft, daß pi ∼ p′π(i) für i = 1, . . . , ℓ.
Beweis. Ohne Einschränkung ist ℓ ≤ n. Wenn ℓ = 0, ist a = ε eine Einheit. Dann sind auch alle
Faktoren ε′ und p′i Einheiten. Das geht nur, wenn auch n = 0.
Es sei also ℓ > 0. Dann teilt p1 das Element a = ε′ p′1 · · · p′n , also auch einen der Faktoren p′i .
Nach Umordnung kann man annehmen, daß es p′1 ist. Es gilt nun p′1 = p1 x mit einem x ∈ A. Da p′1
46
Faktorielle Ringe
irreduzibel ist und p1 keine Einheit, ist x eine Einheit, d.h. p1 ∼ p′1 . Nach Kürzen von p1 hat man
Zerlegungen
εp2 · · · pℓ = (ε′ x)p′2 · · · p′n .
(6.4)
Induktion nach ℓ zeigt n = ℓ und p′i ∼ pi für i = 2, . . . , n, nach passender Umordnung.
Satz 6.6 — Es sei A ein Integritätsbereich. A ist genau dann faktoriell, wenn gilt:
(1) Jedes irreduzible Element in A ist prim.
(2) Jede aufsteigenden Kette von Hauptidealen in A wird stationär.
Beweis. Es sei zunächst A faktoriell und f ein irreduzibles Element. Nach Voraussetzung gibt es eine
Primfaktorzerlegung f = εp1 · · · pℓ . Da f irreduzibel ist, gilt f |pi für ein i. Weil pi auch irreduzibel
ist, hat man f ∼ pi für ein i. Insbesondere ist f prim. Weiter sei (a1 ) ⊂ (a2 ) ⊂ (a3 ) ⊂ . . .
eine aufsteigende Kette von Hauptidealen. Das ist äquivalent dazu, daß a2 |a1 , a3 |a2 , etc. Aus der
Eindeutigkeit der Primfaktorzerlegung folgt, daß die Primfaktoren von a2 bis auf Assoziation eine
Teilmenge der Primfaktoren von a1 sind. Sind die Primfaktoren einschließlich Vielfachheit gleich,
unterscheiden sich a1 und a2 höchstens um eine Einheit, was (a1 ) = (a2 ) impliziert. Ist also die
Inklusion (a2 ) ⊂ (a1 ) echt, so hat a2 weniger Primfaktoren als a1 . In der Idealkette kann echte
Inklusion demnach nur endlich oft vorkommen.
Es gelte umgekehrt die Bedingung (2). Ein Element a ∈ A \ {0} heiße zerlegbar, wenn sich a als
Produkt aus Einheiten und irreduziblen Elementen darstellen läßt. Offenbar sind alle Einheiten und
alle irreduziblen Elemente zerlegbar, ebenso alle Produkte aus zerlegbaren Elementen. Angenommen, es gibt ein unzerlegbares Element a ∈ A \ {0}. Dann ist a weder eine Einheit noch irreduzibel
und besitzt deshalb eine Zerlegung a = a′ a′′ in Faktoren, die beide keine Einheit sind. Wenigstens
einer der Faktoren ist ebenfalls unzerlegbar, etwa a′ . Wir setzen a1 = a und a2 = a′ und verfahren
mit a′ analog. Dies führt auf eine Idealkette (a1 ) ⊂ (a2 ) ⊂ . . ., in der alle Inklusionen echt sind, im
Widerspruch zur Annahme. Demnach besitzen alle nichttrivialen Elemente in A eine multiplikative
Zerlegung in irreduzible Elemente und Einheiten. Gilt zusätzlich die Bedingung (1), so besitzt jedes
nichttriviale Element eine Primfaktorzerlegung.
Satz 6.7 — Nullteilerfreie Hauptidealringe sind faktoriell.
Beweis. Es sei A ein nullteilerfreier Hauptidealring. Dann wird jede aufsteigende Kette von Idealen
stationär. Nach Satz 6.6 genügt es zu zeigen, daß jedes irreduzible Element f prim ist. Es gelte dazu
f |ab und f6 | a. Das Ideal (f, a) ist ein Hauptideal, etwa (f, a) = (c). Es bestehen dann Gleichungen
(6.5)
f = mc,
a = nc,
c = pf + qa,
ab = f r
mit geeigneten Koeffizienten m, n, p, q, r ∈ A. Da f irreduzibel ist, ist entweder c ∼ f oder c ∼
1. Der erste Fall ist wegen c|a und f6 | a ausgeschlossen. Im zweiten Falle folgt b = (bc−1 )c =
(bc−1 )(pf + qa) = c−1 (bpf + qf r) = c−1 (bp + qr)f , also f |b.
Es sei A ein faktorieller Ring und D ⊂ A ein Vertretersystem für die Klassen assoziierter
Primelemente, d.h. jedes Primelement ist zu genau einem Primelement in D assoziiert. In manchen Ringen läßt sich ein solches Vertretersystem durch eine einfache Konvention auszeichnen:
In Z unterscheiden sich assoziierte Primelemente höchsten um ein Vorzeichen und wir können
D = {p ∈ N | p Primzahl} wählen. Im Polynomring K[X] über einem Körper X unterscheiden sich assoziierte Primelemente höchstens um eine nichttriviale Konstante. In jeder Klasse gibt
es also genau ein normiertes Polynom, d.h. ein Polynom mit Leitkoeffizienten 1, und wir können
D = {f | f ist normiert und irreduzibel} setzen.
47
Mit einem solchen Vertretersystem D können wir jedes Element a ∈ A \ {0} auf eindeutige
Weise in der Form
Y ν
(6.6)
a=u
p p
p∈D
schreiben, wobei νp = 0 für fast alle p ∈ D. Man nennt ordp (a) := νp die Ordnung von a bezüglich
p. Wir setzen formal ordp (0) := ∞. Man verifiziert leicht die Eigenschaften:
(1) ordp (ab) = ordp (a) + ordp (b) für alle a, b ∈ A und p ∈ D.
(2) a|b ⇔ ordp (a) ≤ ordp (b) für alle p ∈ D.
Inbeondere ist für ein Tupel a1 , . . . , an ∈ A, die nicht alle verschwinden, die Zahl
Y min{ord (a ) | i=1,...,n}
p i
p
(6.7)
d=
d∈D
ein größter gemeinsamer Teiler von a1 , . . . , an .
Zwischen den Begriffen euklidischer Ring, Hauptidealbereich und faktorieller Ring haben wir
also die folgenden Beziehungen:
(6.8)
{euklidischer Ringe} ⊂ {Hauptidealbereiche} ⊂ {faktorielle Ringe} ⊂ {Integritätsbereiche}
In faktoriellen Ringen kann man immer größte gemeinsame Teiler finden. Diese sind aber nur durch
die Primfaktorzerlegung, also multiplikativ bestimmt. In Hauptidealbereichen gibt es eine additive
Darstellung des größten gemeinsamen Teilers, und in euklidischen Ringen kann man die zugehörigen
Bézout-Koeffizienten mit dem euklidischen Algorithmus berechnen.
√
Die Inklusionen sind echt: Wir haben in Abschnitt 5.8 gesehen, daß der Ring Z[ 12 (1+ −19)] ein
nullteilerfreier Hauptidealring, aber nicht euklidisch ist. Die Ringe Z[X] und C[X, Y ] sind faktoriell,
wie wir bald sehen werden (Folgerung 6.13), aber sicher keine Hauptidealringe, denn die Ideale
√
(2, X) bwz. (X, Y ) sind keine Hauptideale. Und der Ring Z[ −5] ist als Unterring des Körpers C
sicher ein Integritätsbereich, aber nach Beispiel 6.3 nicht faktoriell.
6.2. Der Satz von Gauß. Im Folgenden wollen wir für einen faktoriellen Ring A die Eigenschaften
von A[X] untersuchen. Dazu betrachten wir auch noch den Quotientenkörper K = Q(A) und den
zugehörigen Polynomring, so daß wir die folgenden Inklusionsverhältnisse haben:
(6.9)
A
∩
K
⊂
⊂
A[X]
∩
K[X]
Wir verwenden, daß A nach Voraussetzung faktoriell ist und daß K[X] ein Hauptidealring ist, weil
K ein Körper ist.
Zunächst erweitern wir die Primfaktorzerlegung auf den Quotientenkörper: Für a = b/c ∈
Q(A)× mit b, c ∈ A und p ∈ D bezeichne
(6.10)
ordp (a) := ordp (b) − ordp (c) ∈ Z
die Ordnung von a. Um die Wohldefiniertheit zu verifizieren, ist zu zeigen, daß aus b/c = b′ /c′ folgt
ordp (b) − ordp (c) = ordp (b′ ) − ordp (c′ ) für alle p ∈ D. Aber das folgt aus der Additivität der
Ordnung, angewandt auf bc′ = b′ c. Aus der Eindeutigkeit der Primfaktorzerlegung folgt nun, daß
(6.11)
ordp : Q(A)× → Z
ein Gruppenhomomorphismus ist. Mit diesen Bezeichnungen haben wir dann für jedes a ∈ Q(A)×
eine eindeutige Zerlegung
Y ord (a)
p p
(6.12)
a=u
p∈D
48
Faktorielle Ringe
mit einer Einheit u ∈ A.
Definition 6.8. — Es sei A ein faktorieller Ring, D ⊂ A ein Repräsentantensystem der Klassen
assoziierter Primelemente.
(1) Für ein Tupel {a0 , . . . , an } von Elementen in Q(A), die nicht alle gleichzeitig verschwinden, heißt
Y min{ord (a )|i=0,...,n}
p i
p
∈ Q(A)
(6.13)
Inh(a0 , . . . , an ) =
p∈D
der Inhalt des Tupels.
P
n
∈ Q(A)[X] \ {0} heißt Inh(f ) = Inh(f0 , . . . , fn ) der Inhalt des
(2) Für f = n
i=0 fn X
Polynoms f .
(3) Ein Polynom f ∈ Q(A)[X] \ {0} heißt primitiv, wenn Inh(f ) = 1.
Im Folgenden gehen wir, wenn von einem faktoriellen Ring A die Rede ist, immer davon aus, daß
ein Vertretersystem D ⊂ A für Primelemente gewählt ist, und die Begriffe ’Inhalt’ und ’primitiv’
beziehen sich stets auf dieses fest gewählte System. Man verifiziert leicht die folgenden Aussagen:
(1) Für jedes a ∈ Q(A)× ist a/ Inh(a) eine Einheit in A.
(2) Für a ∈ Q(A)× und f ∈ Q(A)[X] \ {0} gilt Inh(af ) = Inh(a) Inh(f ).
(3) Ein nichttriviales Polynom f ∈ Q(A)[X] ist genau dann primitiv, wenn f ∈ A[X] und
wenn die Koeffizienten von f teilerfremd sind.
(4) Für f ∈ Q(A)[X] \ {0} ist f / Inh(f ) primitiv.
Es folgen eine Reihe von Sätzen, die in der Regel nach Gauß benannt werden. Gauß beweist
in Disq. Arith. Art. 42 eigentlich den folgenden Satz: Sind f, g ∈ Q[X] normierte Polynome von
positivem Grad und ist f g ∈ Z[X], dann haben auch f und g ganzzahlige Koeffizienten. Die Beweismethode verallgemeinert sich auf faktorielle Ringe und führt zu den folgenden Aussagen:
Lemma 6.9 — Es sei A ein faktorieller Ring. Sind f, g ∈ A[X] nichttriviale primitive Polynome,
so ist auch f g ∈ A[X] primitiv.
Beweis. Wir machen den Ansatz
(6.14)
f = f0 + f1 X + . . . + fn X n ,
g = g 0 + g1 X + . . . + g m X m ,
und f g =: h = h0 + h1 X + . . . + hn+m X n+m . Es sei ein Primelement p ∈ D fixiert. Da f und
g primitiv sind, gibt es Indizes i und j mit ordp (fi ) = 0 und ordp (gj ) = 0. Es seien i0 bzw. j0
die größten Indizes mit dieser Eigenschaft. Das bedeutet, daß p6 | fi0 aber p|fi für alle i > i0 , und
analog p6 | gj0 aber p|gi für alle j > j0 . Mit der Bezeichung k0 = i0 + j0 gilt dann: Im Ausdruck
X
X
(6.15)
h k 0 = f i 0 gj 0 +
fi gk0 −i +
fk0 −j gj .
i>i0
j>j0
ist im zweiten Summanden jeweils der erste Faktor durch p teilbar, und im dritten Summanden
jeweils der zweite Faktor. Andererseits ist fi0 gi0 nicht durch p teilbar. Folglich ist hi0 +j0 nicht durch
p teilbar und somit p kein Faktor des Inhalts von h. Da dies für alle p ∈ D gilt, ist h primitiv.
Lemma 6.10 — Es sei A ein faktorieller Ring. Für nichttriviale Polynome f, g ∈ Q(A)[X] gilt:
Inh(f g) = Inh(f ) Inh(g).
Beweis. Die Polynome f / Inh(f ) und g/ Inh(g) sind primitiv, nach Lemma 6.9 also auch der Bruch
f g/(Inh(f ) Inh(g)). Daraus folgt
Inh(f g)
fg
.
=
(6.16)
1 = Inh
Inh(f ) Inh(g)
Inh(f ) Inh(g)
49
Satz 6.11 — Es sei A ein faktorieller Ring. Ein nichtkonstantes Polynom f ∈ A[X], das in A[X]
irreduzibel ist, ist auch in Q(A)[X] irreduzibel.
Beweis. Es sei f ∈ A[X] ein nichtkonstantes irreduzibles Polynom. Dann ist f insbesondere primitiv
und Inh(f ) = 1. Angenommen, es gibt eine Zerlegung f = gh mit nichtkonstanten Polynomen
g, h ∈ Q(A)[X]. Dann gilt 1 = Inh(f ) = Inh(g) Inh(h) und somit
(6.17)
f=
h
g
.
Inh(g) Inh(h)
Auf der rechten Seite stehen zwei nichtkonstante Polynome in A[X] im Widerspruch zur Irreduzibilität von f .
Satz 6.12 (Satz von Gauß) — A faktoriell ⇒ A[X] faktoriell.
Beweis. A[X] genügt der Kettenbedingung für Hauptideale: Hat man (f1 ) ⊂ (f2 ) ⊂ . . ., so fällt
der Grad der Polynome fn monoton und muß konstant werden, etwa für alle n ≥ n0 . Dann ist
fn /fn0 =: an ∈ A für n ≥ n0 eine Folge von Ringelementen mit (an ) ⊂ (an+1 ) ⊂ . . .. Weil A
der Kettenbedingung für Hauptideale genügt, wird auch diese Kette stationär.
Nach Satz 6.6 genügt es zu zeigen, daß jedes in A[X] irreduzible Element f prim ist. Wenn
f konstant ist, ist dies klar. Es sei also f ein nicht konstantes, irreduzibles Polynom, und es gelte
f |ab für Polynome a, b ∈ A[X]. Nach Satz 6.11 ist f in Q(A)[X] irreduzibel, und weil Q(A)[X]
ein Hauptidealring ist, auch prim. Ohne Einschränkung können wir daher annehmen, daß f |a in
Q(A)[X], etwa a = f c mit c ∈ Q(A)[X]. Gemäß Lemma 6.10 hat man
(6.18)
Inh(a) = Inh(f ) Inh(c) = Inh(c) ∈ A.
Aber dann ist auch c ∈ A[X]. Deshalb ist f schon in A[X] ein Teiler von a. Zusammengenommen
zeigt dies, daß f prim ist.
Durch Induktion über die Anzahl der Variablen erhält man:
Folgerung 6.13 — Für jeden faktoriellen Ring A ist A[X1 , . . . , Xℓ ] faktoriell. Insbesondere ist
Z[X1 , . . . , Xℓ ] und für jeden Körper K auch K[X1 , . . . , Xℓ ] faktoriell.
6.3. Irreduzibilitätskriterien.
Die folgenden Kriterien erweisen sich als außerordentlich nützlich, wenn man die Irreduzibilität
eines Polynoms testen will.
Satz 6.14 — Es sei K ein Körper. Ein nichtkonstantes Polynom f ∈ K[X] vom Grad ≤ 3 ist genau
dann irreduzibel, wenn es keine Nullstelle hat.
Beweis. Das ist offensichtlich: In jeder Zerlegung müßte wenigstens ein linearer Faktor vorkommen.
Satz 6.15 (Eisensteinkriterium) — Es sei A ein faktorieller Ring und p ein Primelement in A. Gilt
für das nichtkonstante primitive Polynom f = f0 + . . . + fn X n , daß
(6.19)
p6 | fn ,
p|fn−1 ,
...,
p|f0 ,
p26 | f0 ,
so ist f in A[X] irreduzibel.
Beweis. Es sei f = gh eine Zerlegung mit Polynomen g = g0 +. . .+gm X m , h = h0 +. . .+hℓ X ℓ ∈
A[X], die keine Einheiten sind. Da f primtiv ist, sind g und h auch nicht konstant. Wir betrachten die
kanonische Projektion A[X] → A/(p)[X] und schreiben f für das Bild von f etc. Nach Annahme
ist gh = f = X n . Notwendigerweise ist dann g = g m X m und h = hℓ X ℓ . Das bedeutet, daß p
50
Faktorielle Ringe
ein Teiler von g0 und von h0 ist. Aber dann teilt p2 das Produkt g0 h0 = f0 , im Widerspruch zur
Annahme.
Satz 6.16 (Reduktionskriterium) — Es sei A ein faktorieller Ring und p ⊂ A ein Primideal mit
Restklassenring A. Es sei f ∈ A[X] ein nichtkonstantes primitives Polynom mit Lc(f ) 6∈ p. Ist die
Reduktion f ∈ A[X] irreduzibel, so ist auch f irreduzibel.
Beweis. Angenommen, f ist nicht irreduzibel und besitzt eine Zerlegung f = gh, in der g und
h keine Einheiten sind. Da f primitiv ist, können g und h keine Konstanten sein. Die Annahme
Lc(f ) 6∈ p bedeutet, daß f und f denselben Grad haben. Wegen f = gh haben daher auch g und
h denselben Grad wie g bzw. h und sind nichtkonstante Polynome. Das Widerspricht der Annahme,
daß f irreduzibel ist.
Algebra I Wintersemester 2015
51
§7. Grundbegriffe der Gruppentheorie
7.1. Gruppen, Homomorphismen, Erzeuger.
Die folgenden Grundbegriffe der Gruppentheorie sollten aus den Anfängervorlesungen bekannt
sein.
Definition 7.1. — Eine Menge G mit einer assoziativen Verknüpfung ◦ : G × G → G ist eine
Halbgruppe. Ein Element e einer Halbgruppe G ist ein Neutralelement, wenn a ◦ e = a = e ◦ a
für alle a ∈ G. Falls ein Neutralelement existiert, ist es eindeutig. Eine Halbgruppe mit einem
Neutralelement ist ein Monoid. Wenn in einem Monoid die Relation a ◦ b = e besteht, heißt b
ein Rechtsinverses von a und a ein Linksinverses von b. Ein Monoid ist eine Gruppe, wenn jedes
Element ein Rechtsinverses besitzt. Die Gruppe, die nur aus dem Neutralelement besteht, heißt die
triviale Gruppe und wird mit dem Symbol 1 bezeichnet.
Wenn kein anderes spezifisches Symbol für die Gruppenmultiplikation vereinbart ist, schreiben
wir a · b und kürzer ab für die Verknüpfung und verwenden wegen der Gültigkeit des Assoziativitätsgesetzes Klammern nur zur graphischen Hervorhebung bestimmter Teile eines Produkts oder lassen
sie ganz weg.
Lemma 7.2 — Ist G eine Gruppe und b ein Rechtsinverses von a, so ist b auch ein Linksinverses
von a und eindeutig bestimmt. Es gelten die Rechenregeln e−1 = e, (a−1 )−1 = a und (ab)−1 =
b−1 a−1 .
Man spricht deshalb einfach vom Inversen von a und schreibt es als a−1
Beweis. Es sei also b ein Rechtsinverses von a und c ein Rechtsinverses von b. Dann folgt: c = ec =
(ab)c = a(bc) = ae = a. Somit ist a ein Links- und ein Rechtsinverses von b. Ist b′ ein anderes
Rechtsinverses von b, so hat man b = be = b(ab′ ) = (ba)b′ = eb′ = b′ . Von den Rechenregeln
sind die beiden ersten trivial, und die dritte ergibt sich aus (ab)(b−1 a−1 ) = a(bb−1 )a−1 = aa−1 =
e.
Definition 7.3. — Eine Halbgruppe, ein Monoid oder eine Gruppe heißt abelsch8, wenn die Verknüpfung kommutativ ist, d.h. wenn g ◦ h = h ◦ g für je zwei Elemente g, h ∈ G. Häufig wird
die Verknüpfung in einer abelschen Gruppe additiv geschrieben, d.h. mit dem Symbol +. In diesem Falle wird das Neutralelement meist mit 0 bezeichnet und das Inverse zu g mit −g. Die triviale
Untergruppe einer abelschen Gruppe wird in der Regel mit dem Symbol 0 bezeichnet.
Definition 7.4. — Eine Teilmenge H ⊂ G ist eine Untergruppe, wenn H nicht leer ist, wenn
h ◦ h′ ∈ H für alle h, h′ ∈ H, und wenn H mit der Einschränkung der Verknüpfung wieder eine
Gruppe ist. Eine Untergruppe H < G heißt normal oder ein Normalteiler, wenn ghg −1 ∈ H für alle
h ∈ H und g ∈ G.
Um zu prüfen, ob eine nichtleere Teilmenge H ⊂ G eine Untergruppe ist, genügt es zu verifizieren, daß gh−1 ∈ H für alle g, h ∈ H. Gelegentlich schreiben wir H < G, um auszudrücken, daß
H eine Untergruppe von G ist. Wir schreiben H ⊳ G um auszudrücken, daß H ein Normalteiler von
G ist.
Beispiele 7.5. — 1. In abelschen Gruppen ist jede Untergruppe ein Normalteiler.
2. Das Zentrum einer Gruppe ist die Menge
(7.1)
Z(G) := {g ∈ G | hg = gh für alle h ∈ G}.
8Niels Abel, norwegischer Mathematiker, b5. August 1802 auf Finnøy, d6. April 1829 in Froland.
52
Das Zentrum ist ein Normalteiler von G.
3. Ist H ⊂ G eine Untergruppe, so heißt
(7.2)
ZG (H) := {g ∈ G | ghg −1 = h für alle h ∈ H}
der Zentralisator und
(7.3)
NG (N ) := {g ∈ G | ghg −1 ∈ H für alle h ∈ H}
der Normalisator von H in G. Beides sind Untergruppen in G. Es gilt ZG (H) ∩ H = Z(H) und
H ⊂ NG (H). Dabei ist H ein Normalteiler in NG (H).
Definition 7.6. — Ein Gruppenhomomorphismus ϕ : G → G′ ist eine Abbildung von Gruppen
mit ϕ(gh) = ϕ(g)ϕ(h). Für einen solchen Gruppenhomomorphismus gilt stets ϕ(e) = e′ und
ϕ(a)−1 = ϕ(a−1 ) für alle a ∈ G. Ein Gruppenhomomorphismus ϕ ist ein Isomorphismus, wenn
ϕ bijektiv ist. In diesem Falle ist die inverse Abbildung ϕ−1 automatisch ein Homomorphismus.
Ein Isomorphismus ϕ : G → G von einer Gruppe G in sich selbst heißt Automorphismus von G.
Wir bezeichnen einen trivialen Homomorphismus ϕ : G → G′ , der ganz G auf das Neutralelement
e′ ∈ G′ abbildet, durch ϕ = e′ .
Ist ϕ : G → G′ ein Gruppenhomomorphismus, so ist der Kern ker(ϕ) = ϕ−1 (e′ ) ⊂ G stets ein
Normalteiler, das Bild im(ϕ) = ϕ(G) ⊂ G′ in der Regel aber zunächst nur eine Untergruppe.
Definition 7.7. — Eine endliche oder unendliche Folge
(7.4)
ϕ
ψ
. . . −→ Gn−1 −−→ Gn −−→ Gn+1 . . .
von Gruppenhomomorphismen heißt exakt an der Stelle Gn , wenn ker(ψ) = im(ϕ).
Zum Beispiel ist eine Sequenz 1 → G′ → G exakt an der Selle G′ , wenn G′ → G injektiv ist,
und G → G′′ → 1 ist exakt an der Stelle G′′ , wenn G → G′′ surjektiv ist.
Definition 7.8. — Ist S eine Teilmenge einer Gruppe G, so bezeichnet hSi die von S erzeugte
T
Untergruppe. Definitionsgemäß ist hSi = S⊂H H, wobei H durch die Menge der Untergruppen,
die S enthalten, läuft. Alternativ ist
(7.5)
hSi = {s1 · . . . · sn | n ∈ N0 , s1 , . . . , sn ∈ S ∪ S −1 }.
Im Falle der leeren Menge ist h∅i = {e} die triviale Untergruppe. S ist ein Erzeugersystem von
G, wenn G = hSi. Eine Gruppe heißt endlich erzeugt, wenn sie ein endliches Erzeugendensystem
besitzt. Eine Gruppe, die von einem Element erzeugt wird, heißt zyklisch.
Ist G eine zyklische Gruppe mit einem Erzeuger g, so ist die Abbildung ϕ : Z → G, n 7→ g n ,
ein surjektiver Gruppenhomomorphismus. Der Kern ist entweder die trivialer Untergruppe {0}, oder
die Menge (m) = {nm | n ∈ Z} einer natürlichen Zahl m. Im ersten Fall ist G isomorph zu Z, im
zweiten Fall zu Z/m.
7.2. Nebenklassen, Index, Faktorgruppen.
Definition 7.9. — Für eine Untergruppe H < G und ein Gruppenelement a ∈ G bezeichnet
(7.6)
aH = {ah | h ∈ H}
die von a erzeugte Linksnebenklasse von H und
(7.7)
Ha = {ha | h ∈ H}
die von a erzeugte Rechtsnebenklasse zu H. Die Menge aller Linksnebenklassen wird mit G/H, die
Menge aller Rechtsnebenklassen mit H\G bezeichnet.
53
Das Invertieren von Gruppenelementen i : G → G, g 7→ g −1 , bildet die Linksnebenklasse
aH bijektiv auf die Rechtsnebenklasse Ha−1 ab. Die so definierte Abbildung G/H → H\G,
aH 7→ Ha−1 , ist eine Bijektion. Dies führt auf den Begriff des Indexes einer Untergruppe:
Definition 7.10. — Es sei H ⊂ G eine Untergruppe.
(7.8)
[G : H] := |G/H| = |H\G|
heißt der Index von H in G.
Satz 7.11 (Satz von Lagrange9) — Für jede Untergruppe H von G gilt
(7.9)
|G| = |H| · [G : H]
Dabei spielt es keine Rolle, ob G oder H endliche oder unendliche Gruppen sind.
Beweis. Offensichtlich haben alle Nebenklassen dieselbe Mächtigkeit wie H. Außerdem sind je zwei
Links- bzw. Rechtsnebenklassen entweder disjunkt oder gleich, d.h. G ist die disjunkte Vereinigung
ihrer Links- bzw. Rechtsnebenklassen. Die Mächtigkeit jeder Linksnebenklasse ist |H|, die Mächtigkeit der Menge der Linksnebenklassen ist [G : H]. Daraus folgt die Behauptung.
Definition 7.12. — Es sei G eine Gruppe. Für g ∈ G heißt
(7.10)
ord(g) := inf{n ∈ N | g n = e} ∈ N ∪ {∞}
die Ordnung von g.
Es gilt: ord(g) = |hgi|. Mit dem Satz von Lagrange folgt, daß die Ordnung jedes Elements g ∈ G
die Gruppenordnung |G| teilt.
Eine Untergruppe N ist genau dann ein Normalteiler, wenn aN = N a für alle a ∈ G. In diesem
Falle sind die Mengen G/N und N \G nicht nur gleichmächtig, sondern tatsächlich gleich.
Satz 7.13 (Hölder10) — Es sei N ⊳ G ein Normalteiler. Es gibt genau eine Gruppenstruktur auf
G/N , bezüglich der die kanonische Projektion π : G → G/N ein Gruppenhomomorphismus ist.
G/N mit dieser Gruppenstruktur heißt Faktorgruppe zum Normalteiler N .
Beweis. Da π : G → G/N surjektiv ist, ist die Gruppenstruktur durch die Forderung
(7.11)
g1 N · g2 N = π(g1 ) · π(g2 ) = π(g1 g2 ) = g1 g2 N
eindeutig bestimmt. Definiert man umgekehrt die Verknüpfung auf die angegebene Weise, so ist
zunächst zu zeigen, daß · wohldefiniert ist. In der Tat, falls g1 N = g1′ N und g2 N = g2′ N , so gibt es
n1 , n2 ∈ N mit g1′ = g1 n1 und g2′ = g2 n2 . Daraus folgt
(7.12)
g1′ g2′ = g1 n1 g2 n2 = g1 g2 (g2−1 n1 g2 )n2 .
Weil N ein Normalteiler ist, gilt (g2−1 n1 g2 )n2 ∈ N , was zu zeigen war. Jetzt folgt leicht, daß · eine
Gruppenstruktur und π ein Homomorphismus ist.
Satz 7.14 (Homomorphiesatz) — Es sei ϕ : G → G′ ein Gruppenhomomorphismus. Dann induziert
ϕ einen Isomorphismus G/ker(ϕ) → im(ϕ).
Beweis. Indem wir G′ durch ϕ(G) ersetzen, können wir ohne Einschränkung annehmen, daß ϕ surjektiv ist. Es sei N = ker(ϕ). Nun folgt: ϕ(g1 ) = ϕ(g2 ) genau dann, wenn g1−1 g2 ∈ N , d.h. wenn
g1 N = g2 N . Deshalb ist ϕ̄ : G/N → G′ , g1 N 7→ ϕ(g1 ), wohldefiniert, ein Gruppenhomomorphismus und bijektiv.
9Joseph-Louis Lagrange, italienischer Mathematiker, b25. Januar 1736 Turin, d10. April 1813 Paris.
10Otto Ludwig Hölder, b22. Dezember 1859 in Stuttgart, d29. August 1937 in Leipzig.
54
Satz 7.15 (Universelle Eigenschaft der Faktorgruppe) — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und π : G → G/N die kanonische Projektion. Ein Gruppenhomomorphismus ϕ : G → G′
faktorisiert genau dann über G/N , d.h. es gibt einen Homomorphismus ϕ̄ : G/N → G′ mit
ϕ = ϕ̄ ◦ π, wenn N ⊂ ker(ϕ).
Beweis. Wenn ϕ̄ existiert, so gilt ϕ(N ) = ϕ̄(π(N )) = ϕ̄(ē) = e′ , d.h. N ⊂ ker(ϕ). Wir nehmen
umgekehrt an, die Bedingung N ⊂ ker(ϕ) sei erfüllt. Dann gilt für zwei Repräsentanten g1 , g2
derselben Nebenklasse g1 N = g2 N ∈ G/N , daß g1−1 g2 ∈ N , also ϕ(g1 )−1 ϕ(g2 ) = e′ oder
ϕ(g1 ) = ϕ(g2 ). Das zeigt, daß ϕ̄(g1 N ) := ϕ(g1 ) wohldefiniert ist. Es folgt dann sofort, daß ϕ̄ ein
Gruppenhomomorphismus ist, und nach Konstruktion gilt ϕ̄ ◦ π = ϕ.
7.3. Konjugationsklassen, Automorphismen, semidirekte Produkte.
Es sei im Folgenden G eine multiplikativ geschriebene Gruppe mit Neutralelement e.
Definition und Satz 7.16. — Zwei Elemente a, b ∈ G heißen konjugiert, wenn es ein g ∈ G mit
b = gag −1 gibt. Konjugiert zu sein, ist eine Äquivalenzrelation. Die zugehörigen Äquivalenzklassen
heißen Konjugationsklassen.
Beweis. Es bezeichne a ∼ b die Relation: Es gibt ein g mit b = gag −1 . Die Relation ∼ ist reflexiv,
denn a = eae−1 für alle a ∈ G, und symmetrisch, denn aus b = gag −1 folgt a = g −1 b(g −1 )−1 . Sie
ist auch transitiv: Aus b = gag −1 und c = hbh−1 folgt c = h(gag −1 )h−1 = (hg)a(hg)−1 .
Lemma 7.17 — Eine Untergruppe H ⊂ G ist genau dann ein Normalteiler, wenn H mit jedem
Element auch dessen gesamte Konjugationsklasse enthält.
Die Komposition zweiter Gruppenisomorphismen G → H und H → K ist wieder ein Isomorphismus. Insbesondere ist die Komposition zweiter Automorphismen von G wieder ein Automorphismus.
Definition 7.18. — Die Menge Aut(G) aller Automorphismen der Gruppe G ist eine Gruppe unter
der gewöhnlichen Verknüpfung von Abbildungen und heißt Automorphismengruppe von G.
Satz und Definition 7.19 — Es sei G eine Gruppe.
(1) Für jedes g ∈ G ist die Abbildung cg : G → G, a 7→ gag −1 , ein Gruppenisomorphismus,
ein sogenannter innerer Automorphismus von G. Ein Automorphismus, der kein innerer
Automorphismus ist, heißt äußerer Automorphismus.
(2) Für alle g, h ∈ G gilt cg ◦ ch = cgh . Deshalb ist die Abbildung c : G → Aut(G) ein
Gruppenhomomorphismus.
(3) Es gilt ker(cg ) = Z(G). Das Bild Im(cg ) = {cg | g ∈ G} =: Int(G) ist die Untergruppe
der inneren Automorphismen.
(4) Für jeden Automorphismus Φ : G → G gilt Φ ◦ cg ◦ Φ−1 = cΦ(g) . Deshalb ist Int(G)
ein Normalteiler in Aut(G). Die Faktorgruppe Aut(G)/Int(G) =: Out(G) heißt äußere
Automorphismengruppe.
Die Sequenz
(7.13)
i
c
p
1 −→ Z(G) −→ G −→ Aut(G) −→ Out(G) −→ 1
wo i die Inklusion und p die kanonische Projektion bezeichnen, ist exakt.
Beweis. Wegen cg (ab) = g(ab)g −1 = gag −1 gbg −1 = cg (a)cg (b) ist cg : G → G ein Gruppenhomomorphismus. Wegen cg ch (a) = g(hah−1 )g = (gh)a(gh)−1 cgh (a) gilt cg ◦ch = cgh . Insbesondere ist cg ◦ cg−1 = cgg−1 = ce = idG . Deshalb ist cg−1 invers zu cg und somit cg eine Bijektion,
also ein Automorphismus. Es gilt cg = eAut(G) = idg genau dann, wenn a = cg (a) = gag −1
55
für alle a ∈ G, d.h. wenn ga = ag für alle a ∈ G. Das ist gleichbedeutend damit, daß a im Zentrum von G liegt. Wendet man einen Automorphismus Φ auf eine cg (x) = gxg −1 an, erhält man
(Φ ◦ cg )(x) = Φ(gxg −1 ) = Φ(g)Φ(x)Φ(g −1 ) = Φ(g)Φ(x)Φ(g)−1 = (cΦ(g) ◦ Φ)(x). Das zeigt
Φ ◦ cg = cΦ(g) ◦ Φ oder Φ ◦ cg ◦ Φ−1 = cΦ(g) . Das die angegebene Sequenz exakt ist, bedeutet
genau, daß Z(G) der Kern von c ist, und daß das Bild von c der Kern der Projektion auf Out(G) ist,
was einfach definitionsgemäß so ist.
Beispiele 7.20. — 1. Wenn G abelsch ist, gilt Z(G) = G, und jeder innere Automorphismus ist
trivial.
2. Die Kleinsche Vierergruppe V4 ∼
= Z/2 × Z/2 besteht aus dem Neutralelement und drei weiteren
Elementen a, b, c, für die die Relationen
(7.14)
a2 = b2 = c2 = e,
ab = c,
bc = a,
ca = b
gelten. Jede Bijektion Φ : G → G, die e in sich abbildet und die übrigen Elemente permutiert, ist
ein Automorphismus. Deshalb gilt:
Aut(V4 ) ∼
= Out(V4 ) ∼
= S3 .
(7.15)
Satz 7.21 — Jeder Automorphismus der zyklischen Gruppe Z/n hat die Form φk (a) = ka für eine
Einheit k ∈ (Z/n)× . Die Abbildung
(7.16)
Ψ : (Z/n)× −→ Aut(Z/n),
k 7→ (a 7→ ka),
ist ein Gruppenisomorphismus.
Beweis. Für jedes k ∈ Z/n ist die Abbildung φk sicher ein Gruppenhomomorphismus von Z/n
in sich. Für zwei Elemente k, ℓ gilt weiter φkl = φk φℓ . Bezeichnet ℓ speziell das Inverse zu einer
Einheit k, so gilt φk φℓ = φ1 = id. Deshalb ist φℓ eine zu φk inverse Abbildung. Damit ist einerseits
gezeigt, daß, wenn k eine Einheit ist, φk eine Bijektion und damit ein Isomorphismus von Z/n ist.
Und andererseits ist die Abbildung (Z/n)× → Aut(Z/n), k 7→ ck , ein Gruppenhomomorphismus.
Es sei nun Φ ein beliebiger Automorphismus von Z/n und k := Φ(1). Für jede natürliche Zahl
m gilt nun Φ(m) = Φ(1̄ + . . . + 1̄) = Φ(1̄) + . . . + Φ(1̄) = m1̄ = mk. Ist d > 0 ein ggT von
k und n, so gilt Φk (n/d) = n(k/d) = 0, d.h. n/d ist ein Element im Kern von Φk und deshalb
kongruent zu 0. Das ist nur möglich, wenn d = 1, d.h. wenn k eine Einheit in Z/n ist. Deshalb ist Ψ
surjektiv. Schließlich ist Ψ offensichtlich injektiv, denn Ψ(k̄)(1̄) = φk (1̄) = k̄ 6= id(1̄).
Für eine beliebige Familie {Gi }i∈I ist das kartesische Produkt
Y
Gi
(7.17)
i∈I
mit komponentenweise definierter Verknüpfung
(7.18)
(gi )i∈I ◦ (hi )i∈I := (gi ◦ hi )i∈I
wieder eine Gruppe, das sogenannte direkte Produkt der Gruppen Gi . Im Falle einer endlichen Indexmenge I = {i1 , . . . , is } schreibt man Gi1 × . . . × Gis .
Es seien nun N und H zwei Gruppen und G = N × H. Die Abbildungen
(7.19)
i : N → G, n 7→ (n, eH ),
und j : H → G, h 7→ (eG , h),
sind injektive Gruppenhomomorphismen. Wenn man N und H auf diese Weise mit ihren Bildern in
G identifiziert, werden sie zu Untergruppen in G mit der Eigenschaft, daß jedes n ∈ N mit jedem
h ∈ H kommutiert, auch wenn N und H selbst nicht abelsch sind.
56
Diese Konstruktion kann wie folgt variiert werden: Wir fixieren einen Gruppenhomomorphismus
α : H → Aut(N ) und definieren auf N × H wie folgt eine Verknüpfung:
(7.20)
(n, h) ◦ (n′ , h′ ) := (nα(h)(n′ ), hh′ ).
Lemma 7.22 — Die Verknüpfung ◦ definiert eine Gruppenstruktur auf N × H.
Beweis. 1. Das Element e = (eN , eH ) ist ein Neutralelement, denn
(7.21)
(n, h) ◦ (eN , eH ) = (nα(h)(eN ), heH ) = (neN , heH ) = (n, h)
weil jeder Automorphismus α(h) ∈ Aut(N ) das Neutralelement in sich abbildet, und
(7.22)
(eN , eH )(n, h) = (eN α(eH )(n), eH h) = (eN n, eH h) = (n, h),
weil α(eH ) = eAut(N ) = idN .
2. Die Verknüpfung ist assoziativ, denn
(n, h) ◦ ((n′ , h′ ) ◦ (n′′ , h′′ ))
=
(n, h) ◦ (n′ α(h′ )(n′′ ), h′ h′′ )
=
(nα(h)(n′ α(h′ )(n′′ )), h(h′ h′′ )
=
(nα(h)(n′ )(α(h) ◦ α(h′ ))(n′′ ), (hh′ )h′′ )
=
((nα(h)(n′ ))α(hh′ )(n′′ ), (hh′ )h′′ )
=
(nα(h)(n′ ), hh′ ) ◦ (n′′ , h′′ )
=
((n, h) ◦ (n′ , h′ )) ◦ (n′′ , h′′ ).
3. (n, h) besitzt ein Inverses, nämlich (α(h)−1 (n−1 ), h−1 ).
Definition 7.23. — Die Menge N × H mit der so definierten Verknüpfung heißt ein semidirektes
Produkt von N und H und wird mit N ⋊α H bezeichnet.
Man beachte, daß die Gruppenstruktur von der Wahl von α abhängt. Es gibt also unter Umständen
viele verschiedene semidirekte Produkte von N und H.
Satz 7.24 — Es sei G = N ⋊α H das semidirekte Produkt von N und H zum Homomorphismus α : H → Aut(N ). Die Abbildung i : N → N ⋊α H, n 7→ (n, eH ), ist ein injektiver
Gruppenhomomorphismus, dessen Bild ein Normalteiler ist. Die Abbildung j : H → N ×α H,
j
p
h 7→ (eN , h), ist ein injektiver Gruppenhomomorphismus. Die Komposition H −→ G −→ G/i(N )
ist ein Isomorphismus.
Beweis. Daß i und j injektive Homomorphismen sind, ist klar. Ebenso ist π : G → H, (n, h) 7→
h, ein surjektiver Homomorphismus mit π ◦ j = idH und ker(π) = i(N ). Deshalb ist N ein
Normalteiler, und nach dem Homomorphiesatz induziert π einen Isomorphismus G/i(N ) → H. Wenn man N und H mit ihren Bildern in N ×α H vermöge i bzw. j identifiziert, kann man für
n ∈ N und h ∈ H schreiben: hnh−1 = α(h)(n).
7.4. Kommutatoruntergruppen.
Es sei G eine Gruppe. Der Kommutator zweier Elemente a, b ∈ G ist
(7.23)
[a, b] := aba−1 b−1 .
Die Kommutatoruntergruppe von G ist die von allen Kommutatoren erzeugte Untergruppe. Übliche
Bezeichnungen sind [G, G] oder G′ , wobei wir die Bezeichnung G′ hier meiden, weil diese Notation
auch häufig schlicht zur Indizierung einer Reihe G, G′ , G′′ , . . . von Gruppen verwendet wird.
Satz 7.25 — [G, G] ist ein Normalteiler von G. Die Faktorgruppe Gab := G/[G, G] ist abelsch.
57
Beweis. Die erste Aussage folgt aus der einfachen Relation g[a, b]g −1 = [gag −1 , gbg −1 ] für alle
a, b, g ∈ G. Die zweite Aussage ergibt sich aus ab = [a, b]ba, also ab = ba mod[G, G].
Definition 7.26. — Die Gruppe Gab := G/[G, G] heißt die Abelisierung von G. Eine Gruppe G
heißt perfekt, wenn G = [G, G].
Satz 7.27 (Universelle Eigenschaft der Abelisierung) — Es sei G eine Gruppe und π : G → Gab
die kanonische Projektion auf die Abelisierung. Zu jedem Gruppenhomomorphismus ϕ : G → A in
eine abelsche Gruppe A gibt es genau einen Gruppenhomomorphismus ϕ̄ : Gab → A mit ϕ = ϕ̄◦π.
Beweis. Weil A abelsch ist, gilt für jeden Kommutator [g, h] ∈ G die Beziehung ϕ([g, h]) =
ϕ(g)ϕ(h)ϕ(g)−1 ϕ(h) = ϕ(g)ϕ(g)−1 ϕ(h)ϕ(h)−1 = e. Deshalb liegt [G, G] im Kern von ϕ, und
nach der universellen Eigenschaft der Faktorgruppe gibt es genau einen Gruppenhomomorphismus
ϕ̄ : G/[G, G] → A mit ϕ̄ ◦ π = ϕ.
Beispiel 7.28. — Weil das Bild des Signaturhomomorphismus sgn : Sn → {±1} abelsch ist, gilt
[Sn , Sn ] ⊂ ker(sgn) = An . Andererseits hat man [(12), (23)] = (12)(23)(12)(23) = (123)2 =
(132) ∈ [Sn , Sn ]. Weil An von 3-Zykeln erzeugt wird, hat man also auch die umgekehrte Inklusion
An ⊂ [Sn , Sn ]. Zusammengefaßt gilt also [Sn , Sn ] = An für alle n ≥ 2.
7.5. Endliche abelsche Gruppen.
Definition 7.29. — Es sei G eine Gruppe.
(7.24)
ex(G) := sup{ord(g) | g ∈ G} ∈ N ∪ {∞}
heißt Exponent von G.
Satz 7.30 — Es sei G eine abelsche Gruppe. Dann gilt ord(g)| ex(G) für alle g ∈ G.
Beweis. Falls ex(G) = ∞, ist nichts zu zeigen. Andernfalls sei x ∈ G ein Element mit ord(x) =
ex(G) =: n. Jedes andere Element hat dann ebenfalls endliche Ordnung. Angenommen, es gibt ein
a ∈ G mit ord(a)6 | n. Dann gibt es eine Primzahl p, die die Ordnung von a häufiger teilt als die
Ordnung von x. Es sei pℓ die maximale p-Potenz, die ord(a) teilt, und pk die maximale p-Potenz, die
ℓ
k
in n aufgeht. Das Element a′ := aord(a)/p hat genau die Ordnung pℓ und das Element x′ := xp
hat genau die zu p prime Ordnung n′ = n/pk .
Wir betrachten das Element z = a′ x′ und setzen m = ord(z). Aus e = z m = bm xm
folgt a′m = x′−m ∈ ha′ i ∩ hx′ i. Deshalb gilt einerseits ord(a′m )|ord(a′ ) = pℓ und andererseits ord(a′m )|ord(x′ ) = n′ . Weil pℓ und n′ teilerfremd sind, ist ord(a′m ) = 1 und somit a′m = e = x′−m . Daraus folgt pℓ |m und n′ |m, also auch pℓ−k n = pℓ n′ |m. Damit ist
ord(z) > n = ord(x), im Widerspruch zur Definition des Exponenten von G.
Satz 7.31 (Hauptsatz über endliche abelsche Gruppen) — Jede endliche abelsche Gruppe G besitzt
eine Zerlegung
(7.25)
G = Z/d1 × . . . × Z/ds
mit natürlichen Zahlen di > 1, die der Bedingung d1 |d2 | . . . |ds genügen.
Beweis. Es sei x ∈ G ein Element mit ord(x) = ex(G) =: d. Falls hxi = G sind wir fertig.
Andernfalls ist die zyklische Gruppe hxi ein echter Normalteiler in G. Es bezeichne ϕ : G → G′ :=
G/hxi die Projektion auf die Faktorgruppe. Weil G′ eine kleinere Ordnung als G hat, können wir
durch Induktion über die Gruppenordnung annehmen, daß der Satz für G′ schon bewiesen ist und
wir eine Zerlegung
(7.26)
G′ ∼
= Z/d1 × . . . × Z/ds−1
58
haben. Es seien y1 , . . . , ys+r′ ∈ G′ Erzeuger der zyklischen Faktoren. Wir wählen weiter Urbilder
zi ∈ G mit ϕ(zi ) = yi und setzen ni = ord(zi ). Weil hzi i ։ hyi i, gilt di |ni . Das Element zidi
liegt im Kern von ϕ und läßt sich deshalb in der Form zidi = xmi mit 0 ≤ mi < d schreiben. Aus
e = zini = (zidi )ni /di = xmi ni /di folgt d|mi ndii . und somit ndi di |mi . Aber ni teilt d. Deshalb ist
d/ni eine ganzen Zahl und somit di ein Teiler von mi . Setze xi := zi x−mi /di . Dann gilt einerseits
ϕ(xi ) = yi , also di |ord(xi ) und andererseits xdi i = zidi x−mi = e. Demnach haben die Elemente
xi genau die Ordnung di . Wir finden so einen Gruppenhomomorphismus
(7.27)
a
Z/d1 × . . . × Z/ds−1 × Z/d −→ G, (a1 , . . . , as1 , a) 7→ xa1 1 · . . . · xs1s−1 · xa ,
der nach Konstruktion surjektiv ist. Weil beide Gruppen die gleiche Ordung haben, ist die Abbildung
ein Isomorphismus von Gruppen.
Man kann jeden Faktor Z/di nach dem chinesischen Restklassensatz weiter in ein Produkt aus
zyklischen Gruppen von Primpotenzordnung zerlegen. Damit erhält man insgesamt eine Zerlegung
(7.28)
m
m
G∼
= Z/p1 1 × . . . × Z/ps s
mit nicht notwendig verschiedenen Primzahlen p1 , . . . , ps und Exponenten m1 , . . . , ms ∈ N.
7.6. Aufgaben.
Aufgabe 7.32. — Das Zentrum Z(G) einer Gruppe G ist ein Normalteiler.
Q
Aufgabe 7.33. — Es sei {Gi }i∈I eine Familie von Gruppen, G = i∈I Gi das mengentheoretische
kartesische Produkt und πi : G → Gi , g = (gj )j∈I 7→ gi , die Projektion auf den i-ten Faktor. Man
zeige:
(1) Auf G wird für g = (gi ) und h = (hi ) durch (g · h)i := gi hi eine Gruppenstruktur
definiert.
(2) Die Projektionen πi : G → Gi sind Gruppenhomomorphismen.
(3) (Universelle Eigenschaft) Ist H eine beliebige Gruppe mit einer Familie von Gruppenhomomorphismen {ψi : H → Gi }i∈I , so gibt es genau einen Gruppenhomomorphismus
ψ : H → G mit der Eigenschaft πi ◦ h = hi für alle i ∈ I.
Die Gruppe G heißt das direkte Produkt der Gruppen {Gi }i∈I .
Aufgabe 7.34. — Es sei G eine Gruppe mit Normalteilern N1 , N2 . Man zeige: N1 ∩ N2 ist ein
Normalteiler in G. Wenn N1 ∩ N2 = {e}, so gilt nm = mn für alle n ∈ N1 und m ∈ N2 .
Aufgabe 7.35. — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und H < G eine Untergruppe.
Man zeige:
(1) Die Menge N H := {nh | n ∈ N, h ∈ H} ist eine Untergruppe in G.
(2) N ist ein Normalteiler in N H, und N ∩ H ist ein Normalteiler in H.
(3) Die Abbildung ϕ : N H/N → H/(N ∩H), [nh] 7→ [h], ist wohldefiniert. Dabei bezeichnet
[−] die Restklasse modulo N bzw. modulo H ∩ H.
(4) ϕ ist ein Isomorphismus.
Aufgabe 7.36. — Es seien N ⊂ H ⊂ G Normalteiler von G. Man zeige:
(1) H/N ist ein Normalteiler in G/N .
(2) Die Projektion G → G/N induziert einen Isomorphismus G/H → (G/N )/(H/N ).
Aufgabe 7.37. — Es sei C = hxi eine zyklische Gruppe der Ordnung n. Man zeige:
(1) Ist H ⊂ G eine nichttriviale Untergruppe und a ∈ N minimal mit der Eigenschaft xa ∈ H,
so gilt a|n, und ist eine von xa erzeugte zyklische Gruppe der Ordnung n/a.
(2) Zu jedem Teiler d|n gibt es genau eine zyklische Untergruppe Hd < G der Ordnung d. Alle
Untergruppen von G haben diese Form, und es gilt Hd < Hd′ genau dann, wenn d|d′ .
59
Aufgabe 7.38. — Es sei n ∈ N. Die Diedergruppe Dn der Ordnung 2n ist die Untergruppe der
Gruppe O(2) der orthogonalen Matrizen vom Rang 2, die von einer Drehung d in der euklidischen
0
Ebene den Winkel 2π/n und der Spiegelung s = ( −1
0 1 ) an der x-Achse erzeugt wird. Man zeige:
(1)
(2)
(3)
(4)
ord(d) = n und ord(s) = 2. Es gilt sds = d−1 und dsd−1 = sd−2 .
Jedes Element in G hat die Form dm oder dm s für m = 0, . . . , n − 1.
Die von d erzeugte zyklische Untergruppe Cn ⊂ Dn ist ein Normalteiler.
Man bestimme alle Untergruppen und Normalteiler von Dn .
[Hinweis: ist H ⊂ Dn eine Untergruppe, so ist H ∩ Cn eine Untergruppe in Cn , und H ist
entweder gleich H ∩ Cn oder wird von H ∩ C und einer weiteren Spiegelung dm s erzeugt.]
60
§8. Auflösbare Gruppen
8.1. Gruppenwirkungen.
Definition 8.1. — Eine Linkswirkung der Gruppe G auf einer Menge X ist eine Abbildung
s : G × X → X mit der Eigenschaft s(e, x) = x und s(g, s(h, x)) = s(gh, x) für alle g, h ∈ G,
x ∈ X. Eine G-Menge ist eine Menge X mit einer G-Wirkung. Wenn die Wirkung aus dem Kontext
klar ist, schreibt man kürzer gx := s(g, x). Eine Abbildung α : X → Y von G-Mengen heißt
G-äquivariant, wenn α(gx) = gα(x) für alle x ∈ X und g ∈ G.
Die Bedingung an die Wirkung liest sich in der verkürzten Notation wie die übliche Assoziativitätsbedingung: ex = x, g(hx) = (gh)x für e, g, h ∈ G und x ∈ X. Man muß aber immer daran
denken, daß g, h und x aus ganz verschiedenen Mengen stammen.
Analog definiert man eine Wirkung von rechts als eine Abbildung t : X × G → X mit
t(t(x, g), h)) = t(x, gh) und t(x, e) = x. Man kann auf die folgende Weise stets eine Rechtswirkung t in eine Linkswirkung s umwandeln und umgekehrt:
(8.1)
s(g, x) := t(x, g −1 ).
Im Folgenden betrachten wir deshalb der Einfachheit halber nur Linkswirkungen. Alle Begriffe übertragen sich in analoger Weise auf Rechtswirkungen.
Definition 8.2. — Es sei X eine G-Menge. Die Bahn (oder der Orbit) von x ∈ X ist die Menge
Ox = Gx := {gx |g ∈ G}. Die Standgruppe (oder Isotropie- oder Stabilisatorgruppe) von x ∈ X
ist die Untergruppe Gx := StabG (x) := {g ∈ G | gx = x}. Der Bahnenraum ist die Menge aller
Bahnen und wird für eine Linkswirkung mit G\X und für eine Rechtswirkung mit X/G bezeichnet.
Die kanonische Projektion π : X → G\X bildet jedes x ∈ X auf seine Bahn ab. Eine Wirkung
heißt transitiv, wenn alle Elemente von X in einer Bahn liegen. Die Wirkung ist frei, wenn alle
Standgruppen trivial sind. Schließlich ist x ∈ X ein Fixpunkt, wenn Gx = {x}, oder anders gesagt,
wenn Gx = G. Die Menge aller Fixpunkte wird mit X G bezeichnet.
Das Symbol G\X kann mit der mengentheoretischen Subtraktion G \ X (’ohne’) verwechselt
werden. Deshalb und aus ästhetischen Gründen schreibt man auch bei Linkswirkungen häufig X/G
für den Bahnenraum und verwendet die andere Schreibweise nur dann, wenn gleichzeitig Links- und
Rechtswirkungen betrachtet und unterschieden werden müssen.
Beispiel 8.3. — Die Gruppe G = SO(2) wirkt auf der Einheitssphäre S 2 ⊂ R3 durch Verdrehung
der ersten beiden Koordinaten:
x ax+by (8.2)
( ac db ) , y
7→ cx+dy .
z
z
0
Es gibt zwei Fixpunkte: die beiden Pole ± 0 . Die Bahnen dieser Wirkung sind genau die Pole
1
und die Breitenkreise. Die Standgruppe von y ∈ S 2 ist die volle Gruppe SO(2), wenn y ein Pol ist,
und sonst die triviale Gruppe.
Beispiel 8.4. — Die Symmetrische Gruppe Sn wirkt auf der Menge [n] = {1, . . . , n} durch
(π, k) 7→ π(k). Die Wirkung ist sicher transitiv: Sind x, y ∈ [n] verschiedene Elemente, so bildet die Transposition τ = (x y) das Element x auf y ab, d.h. alle Elemente liegen in einer Bahn. Die
Standgruppe jedes Elements ist isomorph zur symmetrischen Gruppe Sn−1 .
Zwischen den Mächtigkeiten von X und seinen Bahnen und den Ordnungen von G und der
Standgruppen bestehen Relationen, die durch die Bahnengleichungen präzisiert werden:
Satz 8.5 (Bahnengleichungen) — Es sei G eine endliche Gruppe und G × X → X eine Gruppenwirkung.
61
P
(1) Es gilt |X| = B∈G\X |B|.
(2) Für jedes x ∈ X gilt |G| = |Gx | · |Gx| und |Gx| = [G : Gx ].
Beweis. Jedes Element von X liegt in genau einer Bahn, d.h. X ist die disjunkte Vereinigung aller
Bahnen. Durch Übergang zu Mächtigkeiten folgt die erste Aussage. Es sei nun x ∈ X beliebig. Wir
betrachten die Abbildung p : G → Gx, g 7→ gx. Nach Konstruktion ist p surjektiv. Es sei y ∈ Gx
beliebig und g0 ∈ p−1 (y). Dann gilt g ∈ p−1 (y) genau dann, wenn gx = g0 x, d.h. (g0 )−1 gx = x,
also (g0 )−1 g ∈ Gx oder g ∈ g0 Gx . Das bedeutet insbesondere, daß |p−1 (y)| = |Gx | für alle
P
y ∈ Gx. Es folgt |G| = y∈Gx |p−1 (y)| = |Gx| · |Gx |.
Beispiel 8.6. — Es sei H < G eine Untergruppe. Dann wirkt H durch Multiplikation von links
und von rechts auf G. Die Bahnen sind genau die Rechts- bzw. Linksnebenklassen. Man beachte
die Vertauschung von links und rechts: die Rechtsnebenklasse von H zu a ist die Menge Ha =
{ha | h ∈ H}. Die Wirkung ist frei. Die Bahnengleichung führt auf den Satz von Lagrange.
Lemma 8.7 — Es sei G × X → X eine Gruppenwirkung, x ∈ X und g ∈ G. Dann gilt
Ggx = gGx g −1 .
(8.3)
Beweis. h liegt genau dann in Ggx , wenn hgx = gx, d.h. wenn g −1 hgx = x. Das ist genau dann
der Fall, wenn g −1 hg ∈ Gx , oder äquivalent: wenn h ∈ gGx g −1 .
Beispiel 8.8. — Jede Gruppe G operiert auf sich selbst durch Konjugation:
(8.4)
c : G × G → G,
(g, h) 7→ ghg −1 .
Die Standgruppe eines Elements h ist die Untergruppe
(8.5)
ZG (h) := {g ∈ G | gh = hg}
aller Elemente, die mit h vertauschen, der sogenannte Zentralisator von h in G. Die Bahn von h ist
die Menge {ghg −1 | g ∈ G}, d.h. die Konjugationsklasse von h. Schließlich ist h ein Fixpunkt,
wenn h mit allen Gruppenelementen vertauscht. Anders gesagt: Die Fixpunktmenge dieser Wirkung
ist das Zentrum Z(G) der Gruppe.
8.2. p-Gruppen.
Definition 8.9. — Es sei p eine Primzahl. Eine endliche Gruppe G ist eine p-Gruppe, wenn |G| = pn
für ein n ∈ N.
Beispiel 8.10. — Es gibt fünf 2-Gruppen der Ordnung 8, die drei abelschen Gruppen Z/8, Z/4 ×
Z/2, Z/2×Z/2×Z/2 und die beiden nichtabelschen Gruppen D4 und Q8 . Dabei ist D4 die Diedergruppe der Ordnung 8, also die Symmetriegruppe eines Quadrats, und Q8 ist die Quaternionengruppe
Q8 = {±1, ±I, ±J, ±K} ⊂ M2 (C), wobei
0 1
0
, J = −1
K = IJ.
(8.6)
1 = ( 10 01 ) , I = 0i −i
0 ,
Die zentrale Beobachtung, die der Ausgangspunkt für viele Strukturaussagen über p-Gruppen ist,
ist das folgende einfache Lemma:
Lemma 8.11 — Es sei G eine p-Gruppe, die auf einer endlichen Menge X wirkt. Dann ist |X| ≡
|X G | mod p, wenn X G die Fixpunktemenge der Wirkung bezeichnet.
Beweis. Es seien Bi ⊂ X, i = 1, . . . , n, die Bahnen der G-Wirkung und Gi die Standgruppen von
ausgewählten Elementen bi ∈ Bi . Dann gelten die Bahnengleichungen
X
|Bi | und |Bi | = |G|/|Gi |.
(8.7)
|X| =
i
62
Auflösbare Gruppen
Fixpunkte entsprechen bijektiv den Bahnen der Länge 1. Für alle anderen Bahnen ist |Bi | ein nichttrivialer Teiler von |G|, also selbst durch p teilbar. Rechnet man modulo p, bleibt von der Bahnengleichung nur
X
(8.8)
|X| ≡
1 mod p
x∈X G
übrig. Das war zu zeigen.
Satz 8.12 — Es sei G eine p-Gruppe. Dann ist das Zentrum von G nicht trivial. Insbesondere gibt
es ein zentrales Element der Ordnung p.
Beweis. Wir wenden Lemma 8.11 auf die folgende Situation an: Die Gruppe G wirke auf sich durch
Konjugation. Ein Element g ∈ G ist genau dann ein Fixpunkt, wenn es mit allen Elementen in G
vertauscht, also im Zentrum liegt. Deshalb gilt |Z(G)| ≡ |G| ≡ 0 mod p. Da das Zentrum aber
mindestens das Neutralelement enthält, ist |Z(G)| ≥ p. Ein beliebiges nichttriviales x ∈ Z(G) hat
m−1
die Ordnung pm für ein m ≥ 1. Nun ist y = xp
ein zentrales Element der Ordnung p.
Satz 8.13 — Es sei G eine p-Gruppe. Dann gibt es eine Folge von Untergruppen
(8.9)
{e} = G0 < G1 < · · · < Gn = G
i
der Ordnung |Gi | = p mit der Eigenschaft, daß Gi für jedes i ein Normalteiler in G ist.
Beweis. Es sei x ∈ Z(G) ein Element der Ordnung p. Die von x erzeugte zyklische Untergruppe
G1 = hxi ist zentral und daher ein Normalteiler in G. Die Faktorgruppe G/G1 ist ebenfalls eine
p-Gruppe. Durch Induktion nach der Ordnung der Gruppe schließen wir auf die Existenz von Normalteilern 1 < G2 < . . . < Gn = G/G1 mit |Gk | = pk−1 . Es sei Gk das Urbild von Gk unter der
Projektion G → G/G1 . Als Urbilder von Normalteilern sind die Gk selbst Normalteiler, und ihre
Ordnung ist |Gk | = |G1 | · |Gk | = pk .
Definition 8.14. — Es sei G eine endliche Gruppe, p eine Primzahl und m die Multiplizität von p
in der Ordnung von G. Eine p-Untergruppe S ⊂ G mit |S| = pm heißt p-Sylowuntergruppe11.
Satz 8.15 (Sylow) — Es sei G eine endliche Gruppe und p eine Primzahl.
(1)
(2)
(3)
(4)
G besitzt p-Sylowuntergruppen.
Für die Anzahl sp der p-Sylowuntergruppen gilt sp | |G| und sp ≡ 1 mod p.
Jede p-Untergruppe von G liegt in einer p-Sylowuntergruppe.
Alle p-Sylowuntergruppen von G sind konjugiert.
Dieser wichtige Satz wurde von Sylow zuerst in der Arbeit Théorèmes sur les groupes de substitutions, Math. Annalen 5 (1872), S. 584-594, bewiesen. Der hier gegebene Beweis folgt späteren
Bearbeitungen. Wir variieren dazu den Beweisgedanken von Lemma 8.11:
Beweis. 1. Es sei |G| = n = pm u mit p6 | u. Wir betrachten die Menge X aller pm -elementigen Teilmengen von G. Die Gruppe G operiere auf X durch Linkstranslation, d.h. für Y = {y1 , . . . , ypm } ∈
X und g ∈ G ist gY = {gy1 , . . . , gypm }.
Es sei nun H := GY die Standgruppe von Y . Definitionsgemäß heißt das, daß H aus allen h ∈ G
mit hY = Y besteht. Insbesondere erhalten wir eine neue Gruppenwirkung H × Y → Y, (h, y) 7→
hy, die nicht mit der Wirkung von G auf X zu verwechseln ist. Offensichtlich ist die Wirkung von
H auf Y frei, denn H und Y sind Teilmengen von G, und Y zerfällt in eine disjunkte Vereinigung
von Rechtsnebenklassen von H. Aber das bedeutet insbesondere: Die Ordnung von H ist ein Teiler
11Peter Ludwig Mejdell Sylow, norwegischer Mathematiker, b12. Dezember 1832, d7. September 1918 in Christiana
63
′
der Mächtigkeit von Y , d.h. H ist eine p-Gruppe der Ordnung pm für ein m′ ≤ m. Und H ist genau
dann eine p-Sylowuntergruppe, wenn Y aus einer einzigen H-Bahn besteht, also die Form Y = Hy
hat.
Gehen wir wieder zur Wirkung von G auf X über, so bedeutet dies: Die Länge der Bahn von
′
Y ist |G|/|H| = upm−m , also genau dann nicht durch p teilbar, wenn Y = Hy für eine pSylowuntergruppe H. Es sei X0 ⊂ X die Menge aller Teilmengen der Form Y = Hy mit einer
p-Sylowuntergruppe H und y ∈ G. Aus der Bahnengleichung folgt:
(8.10)
|X| ≡ |X0 | mod p.
Nun gilt nach Lemma 8.16 die Gleichung
(8.11)
pm u
pm
|X0 | ≡ |X| =
!
≡ u 6≡ 0 mod p.
Da u teilerfremd zu p ist, ist X0 nicht leer, d.h. es gibt p-Sylowuntergruppen.
2. Weiter gibt es zu jeder p-Sylowuntergruppe H genau u = [G : H] verschiedene Nebenklassen
Hy in X0 . Andererseits ist H als Standgruppe der Nebenklasse Hy eindeutig bestimmt, d.h. ein
Elemente aus X0 gehört immer nur zu genau einer p-Sylowuntergruppe. Deshalb gilt |X0 | = usp .
Zusammen mit der Kongruenz 8.11 erhält man u ≡ |X| ≡ |X0 | = usp mod p, also sp ≡
1 mod p.
3. Es sei S < G eine p-Sylowuntergruppe und H < G eine beliebige p-Untergruppe. Wir wenden
Lemma 8.11 direkt auf die Wirkung von H auf der Menge G/S durch Linksmultiplikation an. Da
(8.12)
|G/S| = |G|/|S| = u 6≡ 0 mod p,
gibt es einen Fixpunkt yS ∈ G/S, d.h. eine Nebenklasse yS mit HyS = yS. Aber das bedeutet,
daß y −1 Hy ⊂ S bzw. H ⊂ ySy −1 . Demnach liegt H in der p-Sylowuntergruppe ySy −1 , was zu
zeigen war.
4. Dieses Argument liefert in dem Spezialfall, daß H selbst schon eine p-Sylowuntergruppe ist,
eine Inklusion H ⊂ ySy −1 . Da beide Gruppen p-Sylowuntergruppen sind, sind sie gleichmächtig.
Die Inklusionsbeziehung ist daher schon eine Gleichheit. Folglich sind je zwei p-Sylowuntergruppen
konjugiert.
5. Schließlich betrachten wir die Wirkung von G auf der Menge X1 der p-Sylowuntergruppen
durch Konjugation: (g, S) 7→ gSg −1 . Wir haben gerade gesehen, daß alle p-Sylowuntergruppen
konjugiert sind. Es gibt deshalb nur eine Bahn. Bezeichnet K die Standgruppe von S ∈ X1 , so folgt:
|G| = |K| · |X1 |, also ist sp = |X1 | ein Teiler von |G|.
Im Beweis haben wir die folgende Kongruenz benutzt: Für jede Primzahl p und jede zu p teilerfremde natürliche Zahl u gilt
!
upm
≡ u mod p.
(8.13)
pm
Tatsächlich gilt eine allgemeinere Aussage:
Lemma 8.16 — Es sei p eine Primzahl, u ∈ N und 0 ≤ k ≤ u. Dann gilt
!
!
upm
u
≡
mod p
(8.14)
k
kpm
für alle m ∈ N.
Beweis. Im Polynomring Fp [x, y] gilt (x + y)p = xp + y p . Induktiv folgt (x + y)p
und schließlich
(8.15)
(x + y)up
m
= (xp
m
m
+ y p )u .
m
m
= xp + y p
m
64
Auflösbare Gruppen
Indem man auf beiden Seiten nach der binomischen Formel expandiert und die Koeffizienten vergleicht, findet man die behauptete Formel.
8.3. Auflösbare Gruppen.
Definition 8.17. — Unter der derivierten Reihe einer Gruppe G versteht man die rekursiv definierte,
absteigende Kette von Untergruppen D0 (G) = G und Dn+1 (G) = [Dn (G), Dn (G)]. Eine Gruppe
heißt auflösbar, wenn Dn (G) = 1 für ein n ∈ N0 .
Konstruktionsgemäß ist Dn+1 (G) ein Normalteiler in Dn G. Außerdem sind die Faktorgruppen
D (G)/Dn (G) = Dn (G)ab abelsch. Wenn G endlich ist, ist G entweder auflösbar, oder es gibt ein
n, für das Dn (G) perfekt, aber nicht trivial ist.
n
Beispiel 8.18. — Für die symmetrische Gruppe S4 findet man als derivierte Reihe S4 ⊲A4 ⊲V4 ⊲1,
wobei A4 die alternierende Gruppe der geraden Permutationen bezeichnet und
(8.16)
V4 = {(1), (12)(34), (13)(24), (14)(23)}
die Kleinsche Vierergruppe. S4 ist also auflösbar. Die abelschen Faktorgruppen sind
(8.17)
S4 /A4 ∼
= Z/2,
A4 /V4 ∼
= Z/4,
V4 /1 ∼
= Z/2 × Z/2.
In diesem Beispiel sind alle Gruppen der derivierten Reihe tatsächlich Normalteiler der Ausgangsgruppe S4 .
Beispiel 8.19. — Alle abelschen Gruppen sind auflösbar.
Satz 8.20 — 1. Jede Untergruppe einer auflösbaren Gruppe ist auflösbar.
2. Ist N ⊂ G ein Normalteiler, so ist G genau dann auflösbar, wenn N und G/N auflösbar sind.
Beweis. Für jede Untergruppe H ⊂ G gilt Dn (H) ⊂ Dn (G). Ähnlich erhält man aus der Surjektion
G → G/N surjektive Homomorphismen Dn (G) → Dn (G/N ) für alle n. Wenn Dn (G) für ein n
trivial wird, gilt dasselbe für Dn (H) und Dn (G/N ). Es sei umgekehrt N ein Normalteiler mit der
Eigenschaft, daß N und G/N auflösbar sind. Es gibt dann ein n mit Dn (G/N ) = 1. Demnach liegt
Dn (G) im Kern der Abbildung G → G/N , also in N . Bildet man erneut iterierte Kommutatoren, so
gilt Dn+m (G) ⊂ Dm (N ). Weil Dm (N ) für große m trivial wird, gilt dasselbe für Dn+m (G). Als Anwendung der Sylowsätze können wir von vielen Gruppen die Auflösbarkeit aus der Faktorisierung ihrer Gruppenordnung schließen.
Satz 8.21 — Alle p-Gruppen sind auflösbar.
Beweis. Nach Satz Satz 8.13 besitzt jede Gruppe G der Ordnung pn , p prim, einen Normalteiler
G′ ⊂ G der Ordnung pn−1 . Die Faktorgruppe G/G′ = Z/p ist abelsch, also auflösbar, und wir
können durch Induktion über die Gruppenordnung annehmen, daß auch G′ auflösbar ist. Damit ist
auch G auflösbar.
Satz 8.22 — Es seien p < q Primzahlen. Dann ist jede Gruppe der Ordnung pq auflösbar.
Beweis. Es sei G eine Gruppe der Ordnung pq. Die Anzahl s der q-Sylowgruppen in G ist ein Teiler
von p und kongruent 1 modulo q. Weil p < q, läßt das nur die Möglichkeit s = 1. Deshalb gibt es
genau eine q-Sylowuntergruppe U , und die ist ein Normalteiler. Weil U und G/U zyklische Gruppen
der Ordnung q bzw. p sind, sind sie auflösbar. Folglich ist auch G auflösbar.
Satz 8.23 — Es seien p < q < r Primzahlen. Dann ist jede Gruppe der Ordnung pqr auflösbar.
65
Beweis. Es sei G eine Gruppe der Ordnung pqr. Wenn G für eine der Primzahlen genau eine Sylowuntergruppe hat, ist diese ein Normalteiler, und die zugehörige Faktorgruppe ist auflösbar, weil
ihre Ordnung ein Produkt aus zwei verschiedenen Primzahlen ist. Dann ist auch G auflösbar.
Andernfalls gibt es mindestens q + 1 q-Sylowuntergruppen und genau pq r-Sylowuntergruppen.
Es gibt dann mindestens (q + 1)(q − 1) Elemente der Ordnung q in G und genau pq(r − 1) Elemente der Ordnung r in G, weil zwei verschiedene Sylowuntergruppen (zur selben Primzahl) nur
das neutrale Element gemeinsam haben. Also enthält G mindestens pq(r − 1) + (q 2 − 1) + 1 ≥
pqr + (q − p)q > |G| Elemente, ein offensichtlicher Widerspruch.
Wir zitieren ohne Beweis zwei berühmte Sätze aus der Gruppentheorie:
Satz 8.24 (Burnside 1906) — Jede Gruppe der Ordnung pn q m mit Primzahlen p und q ist auflösbar.
William Burnside: On Groups of Order pα q β . Proc. London Math. Soc˙(1904), 388 - 392.
Satz 8.25 (Feit - Thompson 1963) — Jede Gruppe von ungerader Ordnung ist auflösbar.
Walter Feit, John G. Walter: Solvability of groups of odd order. Pacific J. Math. 13 (1963), 775 - 1029.
8.4. Kompositionsreihen.
Definition 8.26. — Eine Gruppe G heißt einfach, wenn G nicht trivial ist, und wenn 1 und G die
einzigen Normalteiler in G sind.
Satz 8.27 — Für jede Primzahl p ist Z/p eine einfache Gruppe.
Bemerkung 8.28. — Die endlichen einfachen Gruppen sind vollständig klassifiziert. Es gibt, wie
wir gesehen haben,
• Die zyklischen Gruppen Z/p, p prim.
• Die alternierenden Gruppen An , n ≥ 5.
Darüberhinaus gibt es 16 Serien von Gruppen vom sogenannten Lie-Typ. Schließlich gibt es noch 26
endliche einfache Gruppen, die nicht in Serien auftreten und deshalb sporadische Gruppen genannt
werden. Die größte unter den sporadischen Gruppen heißt Monstergruppe M . Sie wurde von Fischer
und Griess 1973 vorausgesagt und 1982 von Griess konstruiert. Sie hat
|M |
=
246 · 320 · 59 · 76 · 112 · 133 · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71
=
808017424794512875886459904961710757005754368000000000
Elemente. Es gibt merkwürdige Beziehungen zwischen der Monstergruppe und gewissen Funktionen, die in der Theorie der Modulformen auftauchen. Diese Beziehungen erschienen bei ihrem ersten
Auftreten so verrückt, daß sie seither unter dem Schlagwort Mondschein (moonshine) bekannt sind.
Für die Klärung vieler damit verbundener Fragen erhielt Borcherds 1998 die Fields-Medaille.
Definition 8.29. — Es sei G eine Gruppe. Eine Folge von Untergruppen
(8.18)
G = G0 ⊃ G1 ⊃ G2 ⊃ . . . ⊃ Gn = 1
ist eine Normalreihe, wenn für alle i = 0, . . . , n − 1 die Gruppe Gi+1 ein Normalteiler in Gi ist.
Eine Normalreihe ist eine Kompositionsreihe, wenn alle Faktorgruppen Gi /Gi+1 einfach sind.
Satz 8.30 — Es sei G eine endliche Gruppe. Jede Normalreihe läßt sich Hinzunahme weiterer Gruppen zu einer Kompositionsreihe verfeinern.
Beweis. Es sei G = G0 ⊃ G1 ⊃ . . . ⊃ Gn = 1 eine Normalreihe. Falls alle Faktoren Gi /Gi+1
einfach sind, ist nichts zu zeigen. Andernfalls gibt es einen Index i und einen Normalteiler 1 (
N ( Gi /Gi+1 . Es bezeichne π : Gi → Gi /Gi+1 die natürliche Projektion. Das Urbild G′ :=
66
Auflösbare Gruppen
π −1 (N ) ist eine Untergruppe in Gi mit Gi+1 ⊂ G′ ⊂ Gi . Weil N ein Normalteiler in Gi /Gi+1
ist, ist G′ ein Normalteiler in Gi , und weil 1 ein Normalteiler in N ist, ist Gi+1 ein Normalteiler
in N . Dieser Vorgang läßt sich wiederholen, solange wenigstens eine Faktorgruppe der gegebenen
Normalreihe nicht einfach ist. Da die Länge einer Normalreihe bei einer endlichen Gruppe durch die
Gruppenordnung und eigentlich sogar durch log2 (|G|) beschränkt ist, muß dieses Verfahren nach
endlich vielen Schritten mit dem Erreichen einer Kompositionsreihe abbrechen.
Folgerung 8.31 — Die folgenden Aussagen über eine endliche Gruppe G sind äquivalent:
(1) G ist auflösbar.
(2) G besitzt eine Normalreihe mit abelschen Faktoren.
(3) G besitzt eine Kompositionsreihe, deren Faktoren zyklisch von Primzahlordnung sind.
Satz 8.32 (Jordan-Hölder) — Es sei G ein endliche Gruppe. Die Faktorgruppen einer Kompositionsreihe von G hängen bis auf Isomorphie und Reihenfolge nicht von der Wahl der Faktorgruppe
ab.
Beweis. Wir können induktiv annehmen, daß die Behauptung ür alle Gruppen kleinerer Ordnung als
|G| schon gezeigt ist. Es seien nun
(8.19)
G = G′0 ⊲ G′1 ⊲ . . . ⊲ G′m = 1.
und
G = G0 ⊲ G1 ⊲ . . . ⊲ Gn = 1
zwei Kompositionsreihen, möglicherweise von verschiedener Länge. Die Menge N = G′1 ∩ G1
ist als Durchschnitt zweier Normalteiler selbst ein Normalteiler von G. Das liefert das folgende
kommutative Diagramm mit exakten Zeilen und Spalten:
(8.20)
1
−→
1
−→
1
−→
1
x

G1 /N
x

−→
N
x

−→
G1
x

1
x

−→
G/G′1
x

−→
G′1
x

−→
−→
G
x

1
1
1
x

B
x

−→
1
−→
1
G′1 /N
x

−→
1
G/G1
x

1
mit B := (G/G′1 )/(G/N ) = G/(G′1 G1 ) = (G/G1 )/(G′1 /N ). Weil nach Voraussetzung G/G′1
eine einfache Gruppe ist, ist entweder B oder G1 /N trivial. Aber G1 /N kann nur trivial sein, wenn
G1 = G1 ∩ G′1 , d.h. wenn G1 ⊂ G′1 . In diesem Falle ist G′1 /G1 eine echte Untergruppe der einfachen Gruppe G/G1 und deshalb trivial. Das bedeutet: G1 = G′1 . Die beiden Kompositionsreihen
haben also denselben Anfang, und Induktion liefert die Behauptung.
Im anderen Fall ist B trivial, also G1 /N ∼
= G/G′1 und G′1 /N ∼
= G/G1 . Wir wählen eine
Kompositionsreihe N = N0 ⊲ N1 ⊲ . . . ⊲ Nℓ = 1 und erhalten so zwei weitere Kompositionsreihen
für G:
(8.21)
und
G ⊲ G 1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1
G ⊲ G′1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1.
Die Faktorgruppen für die neuen Reihen sind:
(8.22)
′
G/G1 , G1 /N ∼
= G/G1 , N/N1 , . . .
bzw.
G/G′1 , G′1 /N ∼
= G/G1 , N/N1 , . . . .
Bis auf die Reihenfolge und Isomorphie sind die Faktorgruppenreihen gleich. Es genügt also, die
beiden Reihen
(8.23)
G ⊲ G1 ⊲ G2 ⊲ . . . ⊲ 1
und
G ⊲ G 1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1
67
bzw.
(8.24)
G ⊲ G′1 ⊲ G′2 ⊲ . . . ⊲ 1
und
G ⊲ G′1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1
zu vergleichen. Der Unterschied zwischen den Reihen beginnt aber jeweils erst bei G1 bzw. bei G′1 .
Die Behauptung folgt also durch Induktion über die Gruppenordnung.
Camille Jordan zeigte zunächst, daß die Folge der Indizes [Gi : Gi+1 ], i = 0, . . . , n − 1, einer
Kompositionsreihe bis auf die Reihenfolge unabhängig von der Wahl der Kompositionsreihe ist. Er
nannte diese Indizes die Faktoren der Gruppe G. Nachdem Otto Hölder später den Begriff der Faktorgruppe gebildet und deren Eigenschaften studiert hatte, konnte er die hier diskutierte Verschärfung
des Satzes von Jordan beweisen.
8.5. Aufgaben zur Gruppentheorie.
Aufgabe 8.33. — Es sei q = ps eine Primzahlpotenz und Fq der Körper mit q Elementen. Die
Gruppe GLn (Fq ) der invertierbaren n × n-Matrizen mit Koeffizienten in Fq operiert durch Linksmultiplikation auf dem Vektorraum Fn
q . Man zeige:
n
(1) Fn
q besteht aus zwei Bahnen: {0} und Fq \ {0}.
(2) Die Standgruppe des ersten Standardeinheitsvektors ist
(
)
!
1 u
n−1
(8.25)
H=
.
A ∈ GLn−1 (Fq ), u ∈ Fq
0 A
(3) Man leite aus der Bahnengleichung und den Aussagen (1) und (2) eine rekursive Beziehung
für die Gruppenordnungen von GLn−1 (Fq ) und GLn (Fq ) her.
n Q
k
(4) | GLn (Fq )| = q ( 2 ) n
k=1 (q − 1).
Aufgabe 8.34. — Es sei G eine Gruppe und S ⊂ G eine Teilmenge und X die Menge aller Untergruppen von G, die S enthalten. Zeigen Sie:
(1) X ist nicht leer.
T
(2) hSi := H∈X H ist ein Element in X.
hSi heißt die von S erzeugte Untergruppe von G, und G heißt von S erzeugt, wenn G = hSi.
Aufgabe 8.35. — Es sei G eine Gruppe und S ⊂ G eine Teilmenge. Es sei H die Menge aller
Produkt s1 · · · sn mit n ∈ N0 und si ∈ S oder s−1
∈ S. Zeigen Sie, daß H = hSi.
i
0
Aufgabe 8.36. — Es sei n ∈ N gegeben. Es bezeichne s = 10 −1
∈ O(2) die Spiegelung an der
− sin(2π/n)
∈
O(2)
die
Drehung
um
den
Winkel 2π/n.
x-Achse und d = cos(2π/n)
sin(2π/n) cos(2π/n)
(1) Die Untergruppe Cn := hdi in der orthogonalen Gruppe O(2) ist zyklisch mit Ordnung n,
d.h. Cn ∼
= Z/n.
(2) Die Untergruppe Dn := hs, di heißt Diedergruppe. Man zeige, daß |Dn | = 2n.
(3) Man bestimme alle Konjugationsklassen von Dn . (Vorsicht: Unterscheide die Fälle n gerade
und n ungerade.)
(4) Man bestimme alle Untergruppen und Normalteiler in Dn .
Es sei H < G eine Untergruppe. Das Verhältnis [G : H] := |G/H| = |G|/|H| wird als Index
von H in G bezeichnet.
Aufgabe 8.37. — Jede Untergruppe H < G vom Index [G : H] = 2 ist ein Normalteiler.
Aufgabe 8.38. — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und H < G eine Untergruppe.
(1) N ∩ H ist ein Normalteiler in H.
(2) Die Menge N H = {nh | n ∈ N, h ∈ H} ist eine Untergruppe in G.
(3) N ist ein Normalteiler in N H.
68
Auflösbare Gruppen
(4) Die Abbildung N H → N H/N hat den Kern N ∩ H.
(5) Die Abbildung H/(N ∩ H) → N H/N , h mod (N ∩ h) 7→ h mod N , ist ein Isomorphismus (Erster Isomorphiesatz).
(6) Ist auch H ein Normalteiler, so ist N ∩ H ein Normalteiler in G.
Aufgabe 8.39. — Es sei m : G × X → X eine Linkswirkung. Dann ist q(x, g) := m(g −1 , x) eine
Rechtwirkung von G auf X.
Aufgabe 8.40. — Es sei G × X → X eine Gruppenwirkung. Liegen x und y in derselben Bahn,
so sind ihre Standgruppen Gx , Gy < G konjugierte Untergruppen. Wie hängen Ggy und Gy zusammen?
Aufgabe 8.41. — Es sei p eine Partition von n. Man bestimme die Mächtigkeit der Konjugationsklasse aller Permutationen vom Zykeltpy p.
Aufgabe 8.42. — Es sei G eine Gruppe und g ∈ G. Der Zentralisator von g in G ist die Menge
ZG (g) = {h ∈ G | hg = gh}. Man zeige:
(1) ZG (g) ist eine Untergruppe von G.
(2) ZG (x) ist die Standgruppe von x bezüglich der Wirkung G × G → G, (g, x) 7→ gxg −1 .
(3) Es sei speziell G = Sn und π ∈ Sn ein Permutation. Man drücke die Ordnung von ZSn (π)
durch den Zykeltyp von π aus.
Aufgabe 8.43. — Es seien N und H Gruppen und α : H → Aut(N ) ein Gruppenhomomorphismus. Das semidirekte Produkt N ⋊α H ist die Menge N × H mit der folgenden Gruppenstruktur:
(8.26)
(n, h) · (n′ , h′ ) := (nα(h)(n′ ), hh′ ).
Zeigen Sie: 1. Die angegebene Verküpfung definiert tatsächlich eine Gruppenstruktur.
2. Die Abbildungen N → N ⋊α H, n 7→ (n, e), und H → N ⋊α H, h 7→ (e, h), sind injektive
Gruppenhomomorphismen.
3. Identifiziert man N und H mit ihren Bildern in N ⋊ H, so gilt: N ist ein Normalteiler in N ⋊ H,
und die Inklusion von H induziert einen Isomorphismus H ∼
= (N ⋊ H)/N .
4. Für n ∈ N und h ∈ H gilt: hnh−1 = α(h)(n).
∼ Z/6 oder S3 je
5. Es sei α : Z/2 → Aut(Z/3) ein Homomophismus. Dann gilt Z/3 ⋊α Z/2 =
nachdem, ob α die triviale Abbildung ist oder nicht.
Aufgabe 8.44. — Es seien s0 , s1 : R → R die Punktspiegelungen an den Punkten 0 bzw. 1. Zeigen
Sie: Die von s0 und s1 erzeugte Gruppe G ist isomorph zu Z ⋊α Z/2, wobei α : Z/2 → Aut(Z)
den eindeutigen Gruppenisomorphismus bezeichne
Aufgabe 8.45. — Es sei V ein K-Vektorraum. Die Gruppe GL(V ) der K-linearen Automorphismen
von V ist eine Untergruppe in der Gruppe Aut(V ) der Automorphismen von V als abelsche Gruppe.
Es sei α : GL(V ) → Aut(V ) die Inklusionsabbildung. Die Gruppe Aff(V ) := V ⋊α GL(V ) heißt
affine Gruppe von V . Man zeige, daß Aff(V )×V → V , ((b, A), v) 7→ Av+b, eine Gruppenwirkung
von Aff(V ) auf V ist.
Aufgabe 8.46. — Es sei K ein Körper und G ⊂ GLn (K) die Untergruppe der oberen Dreiecksmatrizen. Zeigen Sie, daß G auflösbar ist.
Aufgabe 8.47. — 1. Für alle n ≥ 2 gilt [Sn , Sn ] = An .
2. A2 = {(1)}, A3 ∼
= Z/3, also insbesondere [A3 , A3 ] = {(1)}.
3. [A4 , A4 ] = V4 := {(12)(34), (13)(24), (14)(23)}, und [V4 , V4 ] = {(1)}.
4. Für n ≥ 5 ist [An , An ] = An . [Ohne Rückgriff auf die in der Vorlesung bewiesene Einfachheit
von An .]
69
Es sei K ein Körper. GLn (K) bezeichnet die Gruppe der invertierbaren n×n-Matrizen, SLn (K)
die Untergruppe der Matrizen mit Determinante 1, und Zn die Untergruppe der Vielfachen der Einheitsmatrix. Man sieht leicht, daß Zn ein Normalteiler ist. Wir definieren
PSLn (K) := SLn (K)/(Zn ∩ SLn (K))
und PGLn (K) := GLn (K)/Zn .
Aufgabe 8.48. — Es sei Fq ein12 endlicher Körper mit q Elementen. Bestimmen Sie die Ordnungen
der endlichen Gruppen GLn (Fq ), SLn (Fq ), PGLn (Fq ) and PSLn (Fq ).
Aufgabe 8.49. — Es sei K ein Körper und n ∈ N.
1. Falls (K, n) 6= (F2 , 2), gilt [GLn (K), GLn (K)] = SLn (K).
2. Falls (K, n) 6= (F2 , 2), (F2 , 3), gilt [SLn (K), SLn (K)] = SLn (K)
[Elementarmatrizen Eij (λ) mit Eij (λ)mn = δmn + λδim δjn betrachten.]
3. Was geschieht in den Ausnahmefällen?
Aufgabe 8.50. — Wir betrachten in GL2 (C) die Untergruppe Q8 , die von den Matrizen
0
(8.27)
I := 0i −i
und J := ( 01 −1
0 )
erzeugt wird. Zeigen Sie, daß Q8 eine endliche Gruppe der Ordnung 8 ist. Q8 heißt Quaternionengruppe. Bestimmen Sie alle Untergruppen und Normalteiler in Q8 .
Aufgabe 8.51. — Es gibt bis auf Isomorphie genau fünf Gruppen der Ordnung 8, nämlich
(8.28)
Z/2 × Z/2 × Z/2, D4 , Q8 .
0
Dabei ist D4 die Diedergruppe, die von der Spiegelung 10 −1
und der Drehung ( 01 −1
0 ) erzeugt
wird, und Q8 ist die Quaternionengruppe. Zu welcher dieser Gruppen ist die Gruppe
n 1 ∗ ∗ o
0 1 ∗
(8.29)
N=
⊂ GL3 (F2 )
Z/8,
Z/4 × Z/2,
0 0 1
isomorph?
Aufgabe 8.52. — Es sei G eine endliche Gruppe mit |G| = pq mit Primzahlen p > q. Zeigen Sie:
(1) Es gibt genau eine p-Sylowuntergruppe N .
(2) Ist H eine q-Sylowuntergruppe, so ist G isomorph zu einem semidirekten Produkt N ⋊α H.
(3) Wenn q kein Teiler von p − 1 ist, ist G zyklisch.
Aufgabe 8.53. — Zeigen Sie:
(1) Es sei G eine Gruppe mit Zentrum Z. Wenn G/Z zyklisch ist, so ist G abelsch.
(2) Es sei p eine Primzahl. Jede Gruppe der Ordnung p2 ist abelsch. Wie viele Gruppen der
Ordnung p2 gibt es?
(3) Sei p eine Primzahl. Zeigen Sie: In einer nichtabelschen Gruppe der Ordnung p3 hat das
Zentrum die Ordnung p.
Wir wiederholen in den folgenden Aufgaben einige Ergebnisse aus der Vorlesung Elementare
Algebra und Zahlentheorie. Es sei G eine abelsche Gruppe. Die Zahl
e(G) := sup{ord(g) | g ∈ G} ∈ N ∪ {∞} heißt Exponent von G.
Aufgabe 8.54. — Es sei G eine Gruppe mit kommutierenden Elementen a und b von endlicher
Ordnung m = ord(a) bzw. n = ord(b). Man zeige:
(1) Sind m und n teilerfremd, so gibt es k, ℓ ∈ Z mit (ab)k = a und (ab)ℓ = b, und das
Element ab hat die Ordnung mn.
(2) Es gibt ein Element c ∈ ha, bi < G mit ord(c) = kgV(m, n).
12Wir werden im Laufe der Vorlesung sehen, daß es bis auf Isomorphie genau einen endlichen Körper mit q Elementen gibt,
wenn q eine Primzahlpotenz ist.
70
Auflösbare Gruppen
Aufgabe 8.55. — Es sei G eine endliche abelsche Gruppe. Dann gilt ord(g)|e(G) für alle g ∈ G,
und e(G) teilt die Gruppenordnung. [Hinweis: Aufgabe 8.54.]
Aufgabe 8.56. — Es sei K ein Körper und G < K × eine endliche Untergruppe der Einheitengruppe. Dann ist G zyklisch. Insbesondere ist für jeden endlichen Körper F die Einheitengruppe F×
zyklisch. [Hinweis: Man zeige, daß alle g ∈ G Nullstellen des Polynoms X e(G) − 1 ∈ K[X] sind.]
Die Bestimmung der Einheitengruppe (Z/n)× für eine beliebige natürliche Zahl zerfällt in zwei
Q
i
Teile. Zunächst zerlegt man n = i pm
in seine Primfaktoren. Nach dem Chinesischen Restklasi
sensatz gilt dann zunächst
Y
i
(8.30)
Z/n ∼
Z/pm
=
i
i
und damit auch
(8.31)
(Z/n)× ∼
=
Y
i ×
(Z/pm
i ) .
i
Es bleibt das Problem, die Struktur von (Z/n)× für den Fall einer Primzahlpotenz n = pm zu
bestimmen. Das geschieht in den folgenden Aufgaben.
Aufgabe 8.57. — Es sei p eine ungerade Primzahl. Für alle m ≥ 0 gilt:
(8.32)
(1 + p)p
m
Für alle m ≥ 0 gilt
(8.33)
(1 + 22 )2
m
≡ 1 + pm+1 ≡ pm+2 .
≡ 1 + 2m+2 ≡ 2m+3 .
Aufgabe 8.58. — Es sei p eine ungerade Primzahl und m ≥ 1. Es sei U der Kern des Homomorphismus ϕ : (Z/pm )× → (Z/p)× .
(1) U ist eine p-Gruppe.
(2) U wird von 1 + p erzeugt.
(3) (Z/pm )× ist zyklisch der Ordnung (p − 1)pm−1 .
Aufgabe 8.59. — Es sei m ≥ 2 und U der Kern des Homomorphismus ϕ : (Z/2m )× → (Z/4)× .
(1) U ist eine 2-Gruppe.
(2) U wird von 5 erzeugt.
(3) (Z/2m )× ∼
= Z/2 × Z/2m−2 , wobei die Faktoren von −1 und 5 erzeugt werden.
Algebra I im Sommersemester 2008
71
§9. Die symmetrische Gruppe
Definition 9.1. — Die symmetrische Gruppe Sn vom Grad n ∈ N ist die Menge der Bijektionen der
Menge [n] = {1, . . . , n} in sich mit der Komposition als Verknüpfung. Insbesondere ist |Sn | = n!.
Permutationen sind also Abbildungen. In einer Verknüpfung σ ◦ π wird nach den üblichen Konventionen für Abbildungen die Permutation π zuerst ausgeführt, danach die Permutation σ. Definitionsgemäß ist S1 die triviale Gruppe. S2 besteht aus zwei Elementen und ist somit isomorph zu
Z/2.
9.1. Partitionen.
Eine Partition von n ∈ N ist eine Zerlegung n = λ1 + λ2 + . . . + λs in natürliche Zahlen
λ1 , . . . , λs . Dabei kommt es auf die Reihenfolge nicht an. Üblicherweise ordnet man die Partition
fallend und schreibt
λ = [λ1 , . . . , λs ]
mit λ1 ≥ . . . ≥ λs > 0.
Die Zahl 4 besitzt zum Beispiel die folgenden fünf Partitionen:
[4],
[3, 1],
[2, 2],
[2, 1, 1],
[1, 1, 1, 1].
Bezeichnet p(n) die Anzahl der Partitionen von n, und vereinbart man noch, daß p(0) = 1, weil 0
nur die leere Partition [] besitzt, so kann man die erzeugende Funktion
p(t) =
∞
X
n=0
p(n)tn = 1 + t + 2t2 + 3t3 + 5t4 + 11t5 + . . . ∈ Z[[t]]
wie folgt als ein unendliches Produkt schreiben:
∞
X
p(n)tn =
n=0
∞
Y
m=1
1
.
1 − tm
9.2. Zykelzerlegung und Konjugationsklassen.
Für jede Folge (n1 , . . . , nk ) von k ≥ 1 paarweise verschiedenen Zahlen aus [n] bezeichnet
(n1 . . . nk ) ∈ Sn die Permutation mit der Eigenschaft
n 1 7→ n 2 , n 2 7→ n 3 , . . . , n k 7→ n 1
und
i 7→ i
für alle i 6∈ {n1 , . . . , nk }.
Permutationen dieser Form heißen k-Zykel oder Zykel der Länge k. Zykel der Länge 2 heißen
Transpositionen. Es ist dann klar, daß (n1 . . . nk ) = (nk n1 . . . nk−1 ) und daß (n1 n2 . . . nk )−1 =
(nk nk−1 . . . n1 ). Zwei Zykel (n1 . . . nk ) und (m1 . . . mℓ ) sind disjunkt oder elementfremd, falls
die Mengen {n1 , . . . , nk } und {m1 , . . . , mℓ } disjunkt sind. Schließlich bezeichnen wir gelegentlich
die Identität auf [n] mit dem 1-Zykel (1) = (2) = . . . = (n).
Es sei eine Permutation π ∈ Sn gegeben. Die von π erzeugte zyklische Gruppe hπi operiert
auf der Menge [n], und unter dieser Wirkung zerfällt [n] in Bahnen B1 , . . . , Bs . Diese seien so
numeriert, daß |B1 | ≥ |B2 | ≥ . . .. Es gilt [B1 | + . . . + |Bs | = n. Die Partition Z(π) =
[|B1 |, |B2 |, . . . , |Bs |] von n heiße der Zykeltyp der Permutation π. Zum Beispiel ist der Zykeltyp von (145)(27) ∈ S8 die Partition [3, 2, 1, 1, 1]. Man sieht leicht, daß umgekehrt jede Partition
von n wirklich als Zykeltyp einer Partition vorkommt.
Satz 9.2 — Jede Permutation π ∈ Sn läßt sich als Produkt von elementfremden Zykeln schreiben,
und diese Produktdarstellung ist eindeutig bis auf die Reihenfolge der Faktoren.
Beweis. Jede Bahn B von π der Länge ℓ ≥ 2 bestimmt einen eindeutigen ℓ-Zykel ζ wie folgt: Es sei
x ∈ B beliebig gewählt. Wir setzen ζ = (x π(x) π 2 (x) . . . π ℓ−1 (x)). Definiert man auf diese Weise
zu jeder Bahn Bi der Länge ℓi ≥ 2 einen Zykel ζi , so sind alle Zykel ζ1 , ζ2 ,. . . paarweise disjunkt
und es gilt π = ζ1 ζ2 . . .. Nur im Falle π = id[n] gibt es überhaupt keine Bahnen der Länge ≥ 2,
72
und π ist das leere Produkt. Auf diese Weise läßt sich jede Permutation als Produkt von disjunkten
Zykeln schreiben. Die Eindeutigkeit ist klar.
Lemma 9.3 — Für Zykel (a1 . . . as ) und (as . . . am ) mit paarweise verschiedenen a1 ,. . . ,am , gilt
(a1 . . . as )(as . . . am ) = (a1 . . . as . . . am ).
Insbesondere besitzt jeder Zykel (b1 . . . bk ) eine Zerlegung in Transpositionen:
(b1 . . . bk ) = (b1 b2 )(b2 b3 ) . . . (bk−1 bk ),
und allgemein ist jede Permutation ein Produkt von Transpositionen.
Beweis. Man verifiziert die erste Aussage direkt, die zweite Aussage erhält man durch wiederholte
Anwendung der ersten Aussage auf das angegebene Produkt von Transpositionen.
Satz 9.4 (Coxetersystem) — Die Transpositionen (12), (23), . . . , (n − 1 n) erzeugen Sn .
Beweis. Es sei si = (i i + 1). Man verfiziert für k < m:
sk sk+1 . . . sm−1 sm sm−1 . . . sk+1 sk = (km).
Aus den Transpositionen s1 , . . . , sn−1 erhält man auf diese Weise alle Transpositionen, und diese
erzeugen Sn .
Satz 9.5 — Für jede Permutation π und jeden k-Zykel (n1 . . . nk ) in Sn gilt
π · (n1 . . . nk ) · π −1 = (π(n1 ) . . . π(nk )).
Zwei Permutationen π, π ′ ∈ Sn sind genau dann konjugiert, wenn sie denselbe Zykeltyp haben.
Insbesondere ist die Abbildung
{Konjugationsklassen von Sn } ↔ {Partitionen von n}, π 7→ Zykeltyp von π,
eine Bijektion.
Beweis. Die erste Aussage ergibt sich durch eine einfache Rechnung. Es folgt unmittelbar, daß
πσπ −1 und σ denselben Zykeltyp haben. Sind umgekehrt σ und σ ′ Permutationen vom selben Zykeltyp, so kann man die Elemente in [n] so benennen, daß
σ = (a1 . . . aℓ1 )(aℓ1 +1 . . . aℓs ) · · · (aℓs−1 +1 . . . aℓs )
und
σ ′ = (b1 . . . bℓ1 )(bℓ1 +1 . . . bℓ2 ) · · · (bℓs−1 +1 . . . bℓs ),
wobei auch die Fixpunkte von σ bzw. von σ ′ in Form von 1-Zykeln aufgenommen sind, so daß
{1, . . . , n} = {a1 , . . . , aℓs } = {b1 , . . . , bℓs }. Bezeichnet nun π die Permutation mit π : ai 7→ bi
für i = 1, . . . , n, so gilt πσπ −1 = σ ′ . Demnach liegen π und π ′ in derselben Konjugationsklasse.
Es sei λ = [λ1 , λ2 , . . . , λt ] eine Partition von n, d.h. λ1 ≥ . . . ≥ λt > 0 und n = λ1 + . . . + λt .
Es bezeichne mλ (i) := {j | λj = i} die Vielfachheit, mit der i in der Partition λ vorkommt. Wir
schreiben dann auch
λ = (1mλ (1) 2mλ (2) · · · ).
Zum Beispiel ist [4, 2, 2, 1, 1, 1] = (13 22 41 ) eine Partition von 11.
Satz 9.6 — Es sei λ = (1m1 2m2 · · · ) eine Partition von n. Dann ist die Mächtigkeit der Konjugationsklasse Cλ aller Permutationen in Sn vom Zykeltyp λ gleich
|Cλ | = Q
n!
.
m
m
i! i i
i
73
n!
Beweis. Es gibt insgesamt a!b!···z!
Möglichkeiten, aus einer n-elementigen Menge in dieser Reihenfolge erst a, dann b, etc. und schließlich z Elemente ohne Rücksicht auf ihre Anordnung auszuwähQ
len. Wenn dabei mi -mal jeweils i Elemente auszuwählen sind, ist die Anzahl n!/ i (i!)mi . Wenn
es dabei auf die Reihenfolge zwischen den i-elementigen Mengen nicht ankommt, ist die Anzahl der
Q
Möglichkeiten n!/ i mi !(i!)mi . Schließlich ist die Anzahl der i-Zykel, die dieselbe i-elementige
Menge permutieren, genau (i − 1)!. Daraus folgt die Behauptung.
9.3. Der Signaturhomomorphismus und die alternierende Gruppe.
Wir diskutieren, zwei Methoden den Signaturhomomorphismus
sgn : Sn → {±1}
zu beschreiben, die natürlich zum selben Ergebnis führen.
Erste Methode:
Satz 9.7 — Für jede Permutation π ∈ Sn nimmt das Produkt
Y π(i) − π(j)
sgn(π) :=
i−j
i<j
den Wert 1 oder −1 an. Die Abbildung
sgn : Sn → {±1}
ist ein Gruppenhomomorphismus. Für einen Zykel ζ der Länge ℓ gilt
sgn(ζ) = (−1)ℓ−1 .
Beweis. Weil der Quotient (π(i) − π(j))/(i − j) nicht von der Reihenfolge der Elemente i und j
abhängt, kann man das Produkt auch über die Menge U aller zweielementigen Teilmengen {i, j}
von [n] ausführen, statt über die Menge der Paare (i, j) mit i < j. Weil π eine Bijektion ist, kommen
in dem Produkt
Y π(i) − π(j)
i−j
{i,j}∈U
bis auf Vorzeichen dieselben Faktoren vor. Deshalb hat das Produkt den absoluten Wert 1. Sind π
und σ Permutationen, so gilt
Y π(σ(i)) − π(σ(j))
Y π(σ(i)) − π(σ(j)) Y σ(i) − σ(j)
=
i−j
σ(i) − σ(j)
i−j
{i,j}
{i,j}
{i,j}
Im ersten Faktor der rechten Seite können wir nun umindizieren: Wenn {i, j} einmal durch T läuft,
so gilt dasselbe für {k, ℓ} := {π(i), π(j)}. Deshalb gilt:
Y π(σ(i)) − π(σ(j))
Y π(k) − π(ℓ) Y σ(i) − σ(j)
=
i−j
k−ℓ
i−j
{i,j}∈U
{k,ℓ}∈U
{i,j}∈U
Das zeigt sgn(π ◦ σ) = sgn(π)sgn(σ). Somit ist sgn ein Gruppenhomomorphismus.
Speziell für die Transposition (12) haben alle Faktoren (τ (i)−τ (j))/(i−j) positives Vorzeichen
bis auf den Faktor zum Paar {i, j} = {1, 2}. Deshalb gilt sgn((12)) = −1. Weil sgn ein Gruppenhomomorphismus ist, nimmt sgn auch auf allen zu (12) konjugierten Permutationen, d.h. auf allen
Transpositionen den Wert −1 an. Schließlich ist jeder ℓ-Zykel ein Produkt aus ℓ − 1 Transpositionen.
Daraus ergibt sich die letzte Aussage.
Zweite Methode: Wir definieren direkt für eine Permutation π, in deren Zerlegung in elementfremde
Zykel genau s Zykel vorkommen, alle 1-Zykel mitgezählt, den Wert
sgn(π) := (−1)n−s .
74
Bei einem ℓ-Zykel ζ müssen also alle n − ℓ 1-Zykel mitgezählt werden, so daß man auf
sgn(ζ) = (−1)n−(1+n−ℓ) = (−1)ℓ−1
kommt. Es bleibt aber zu zeigen, daß sgn ein Gruppenhomomorphismus ist. Dazu betrachten wir die
Wirkung einer Transposition (1k) auf einem Zykel (12 . . . m) mit k ≤ m:
(1k) · (12 . . . m) = (12 . . . k − 1)(k . . . m).
Eine erneute Multiplikation mit derselben Transposition gibt
(1k) · (12 . . . k − 1)(k . . . m) = (12 . . . m).
Durch die Multiplikation mit einer Transposition (ij) auf einer Permutation π wird also die Anzahl
der Zykel in der Zykelzerlegung um 1 erhöht bzw. um eins vermindert je nachdem, ob die beiden
Elemente i und j zum selben Zykel von π gehören oder nicht. Aber in beiden Fällen ändert sich die
Parität modulo 2 um 1. Deshalb gilt
sgn(τ · π) = −sgn(π).
Induktiv folgt für ein σ, daß sich als Produkt von ℓ Transpositionen schreiben läßt:
sgn(σ · π) = (−1)ℓ sgn(π).
Und indem man dies auf π = id anwendet:
sgn(σ) = (−1)ℓ .
Jetzt ist die Homomorphieeigenschaft von sgn offenkundig: Sind π und σ Produkte von k bzw. ℓ
Transpositionen, so ist πσ ein Produkt von k + ℓ Transpositionen, und man erhält:
sgn(πσ) = (−1)k+ℓ = sgn(π)sgn(σ).
Definition 9.8. — Der Kern An := ker(sgn) ⊂ Sn ist ein Normalteiler vom Index 2, die sogenannte alternierende Gruppe. Die Elemente in An heißen gerade Permutationen, alle übrigen ungerade
Permutationen.
Transpositionen sind ungerade. Eine Permutationen ist genau dann gerade bzw. ungerade, wenn
sie sich als Produkt einer geraden bzw. ungeraden Anzahl von Transpositionen schreiben läßt.
Satz 9.9 — An wird von der Menge der 3-Zykel erzeugt.
Beweis. Weil alle 3-Zykel gerade sind, ist klar, daß die von diesen erzeugte Untergruppe in An
liegt. Umgekehrt ist eine Permutation π genau dann gerade, wenn sie sich als Produkt einer geraden
Anzahl von Transpositionen schreiben läßt, etwa π = τ1 τ2 · · · τ2m = (τ1 τ2 ) · · · (τ2m−1 τ2m ). Es
genügt deshalb zu zeigen, daß sich Produkte τ τ ′ von zwei Transpositionen mit 3-Zykeln schreiben
lassen. Falls τ = τ ′ , ist dies trivial. Wenn τ und τ ′ ein Element gemeinsam haben, etwa τ = (ij)
und τ ′ = (jk), hat man τ τ ′ = (ijk). Wenn schließlich τ und τ ′ elementfremd sind, etwa τ = (ij)
und τ ′ = (kℓ′ ), gilt τ τ ′ = (ij)(jk)(jk)(kℓ) = (ijk)(jkℓ).
Satz 9.10 — Es gilt [Sn , Sn ] = An . Außerdem ist An ist die einzige Untergruppe in Sn vom Index
2.
75
Beweis. Weil An von der Menge der 3-Zykel erzeugt wird, genügt es zu zeigen, daß jeder 3-Zykel
als Kommutator geschrieben werden kann. In der Tat gilt nun [(12), (23)] = (12)(23)(12)(23) =
(123)(123) = (132).
Ist H ⊂ Sn eine Untergruppe vom Index 2, so ist H ein Normalteiler mit abelscher Faktorgruppe
Sn /H ∼
= Z/2. Deshalb muß der Kommutator [Sn , Sn ] = An in H liegen. Weil beide Untergruppen
denselben Index haben, sind sie gleich.
9.4. Die Gruppe S3 . Die Diedergruppe D3 , d.h. die Gruppe der Symmetrien eines ebenen gleichseitigen Dreiecks mit den Ecken p1 , p2 , p3 permutiert die drei Ecken des Dreiecks. Man erhält
so einen Gruppenhomomorphismus D3 → S3 , und diese Abbildung ist ein Isomorphismus, weil
jede Symmetrie, die die Ecken einzeln festläßt, auch die Identität auf der ganze Ebene sein muß.
Unter diesem Isomorphismus wird die Untergruppe der Drehungen auf die alternierende Gruppe
A3 = h(123)i abgebildet.
9.5. Die Gruppe S4 .
Die derivierte Reihe der Gruppe S4 ist
S4 ⊲ A4 ⊲ V4 ⊲ 1,
wobei
V4 = [A4 , A4 ] = {(1), (12)(34), (13)(24), (14)(23)}
die sogenannte Kleinsche Vierergruppe bezeichnet. Die drei nichttrivialen Elemente von V4 haben
die Ordnung 2, und das Produkt von zwei verschiedenen Elementen der Ordnung 2 ist stets das übrig
gebliebene dritte Element. Es gilt V4 ∼
= Z/2 × Z/2. Um einen Isomorphismus hinzuschreiben, muß
man allerdings die Symmetrie zwischen den Elementen (12)(34), (13)(24) und (14)(23) brechen
und zwei davon als Erzeuger auswählen. Weil V4 mit jedem Element auch dessen konjugierte enthält,
ist V4 nicht nur in A4 , sondern auch in S4 ein Normalteiler. Für die Faktorgruppe gilt
S4 /V4 ∼
= S3 .
Daß S4 einen nichttrivialen Homomorphismus π : S4 → S3 in eine symmetrische Gruppe von
kleinerem Grad > 2 zuläßt, ist eine Besonderheit der Zahl 4.
Abstrakt kombinatorisch stellt sich dieser Zusammenhang so dar: Es gibt drei Möglichkeiten, die
Mengen A = {a1 , a2 , a3 , a4 } in zwei Teilmengen mit je 2 Elementen zu zerlegen:
m1 = {{1, 2}, {3, 4}},
m2 = {{1, 3}, {2, 4}},
m3 = {{1, 4}, {2, 3}}.
Werden die Elemente der Menge A auf irgendeine Weise vertauscht, so werden auch die Elemente der Menge M = {m1 , m2 , m3 } M1 untereinander vertauscht. Dies definiert einen surjektiven
Homomorphismus S4 ∼
= S3 .
= Sym(A) → Sym(M ) ∼
Diese kombinatorische Situation wird wie folgt geometrisch realisiert: Bezeichnen P1 , P2 , P3
und P4 vier Punkte in der Ebene in allgemeiner Lage, so schneiden sich die sechs Geraden durch je
zwei Punkte in drei weiteren Punkten Q1 , Q2 und Q3 . Jede Permutation der vier Punkte Pi führt zu
einer Permutation der drei Punkte Qj .
Q1
P2
P4
Q3
P1
P3
Q2
76
Der Homomorphismus S4 → S3 läßt sich auch mit den Symmetrien eines Würfels realisieren.
Es bezeichne W einen Würfel im R3 mit Mittelpunkt im Koordinatenursprung. Die Untergruppe
SO(W ) ⊂ SO(3) aller Drehungen, die den Würfel in sich abbilden, hat die Ordnung 24: Die
Gruppe operiert transitiv auf den 8 Ecken, und die Standgruppe einer Ecke besteht aus den drei
Drehungen um die Achse durch diese Ecke mit den Drehwinkeln 0, 2π/3 und 4π/3. Nach den
Bahnengleichungen ist die Ordnung von SO(W ) also 8 · 3 = 24. Die Gruppe SO(W ) permutiert
zum einen die vier Diagonalen durch die acht Ecken des Würfels, was auf einen Homomorphismus
ψ : SO(W ) → S4 führt. Eine Drehung, die alle vier Diagonalen in sich abbildet, muß die Identität sein. Deshalb ist ψ injektiv, und weil die beiden Gruppen dieselbe Mächtigkeit haben, sogar ein
Isomorphismus. Färbt man die Ecken des Würfels abwechseln weiß und schwarz ein, werden zwei
Tetraeder T ′ und T ′′ mit weißen bzw. schwarzen Ecken definiert. Unter ψ entspricht die Untergruppe SO(T ′ ) = SO(T ′ ) ⊂ SO(W ) genau der Gruppe A4 . Andererseits permutiert SO(W ) auch
die drei Achsen durch die sechs Flächenmittelpunkte, und dies führt auf einen Homomorphismus
SO(W ) → S3 . Durch Zusammensetzung mit ψ −1 erhält man wieder den alten Homomorphismus
S4 → S3 .
9.6. Einfachheit der alternierenden Gruppen An , n ≥ 5.
Eine Gruppe G heißt einfach, wenn G nicht trivial ist und wenn G und die triviale Untergruppe
die einzigen Normalteiler in G sind.
Satz 9.11 — Die Gruppen An sind für n ≥ 5 einfach.
Beweis. Es sei n ≥ 5 und N ⊂ An ein nichttrivialer Normalteiler. Weil An von den 3-Zykeln
erzeugt wird, genügt es zu zeigen, daß N alle 3-Zykel enthält. Wenigstens einer der folgenden Fälle
muß eintreten:
1. Fall: N enthält einen 3-Zykel, ohne Einschränkung π = (123). Ist nun (ijk) irgendein anderer
3-Zykel, so gibt es eine Permutation σ ∈ Sn mit σ(123)σ −1 = (ijk). Aber auch σ ′ = σ(45) hat die
Eigenschaft σ ′ (123)σ ′−1 = (ijk). Weil σ und σ ′ verschiedenes Vorzeichen haben, liegt entweder
σ oder σ ′ in An . Damit ist (ijk) in An zu (123) konjugiert und liegt in N . Deshalb enthält N alle
3-Zykel und ist gleich An .
2. Fall: N enthält eine Permutation π, deren Zykelzerlegung einen Zykel der Länge ≥ 4 enthält,
etwa π = (1234 · · · ) · . . .. Mit π liegt dann auch
(123)π(123)−1 π −1 = (123)(1234 · · · )(132)(· · · 4321) = (124)
in N . Weiter mit Fall 1.
3. Fall: N enthält eine Permutation π, deren Zykelzerlegung einen 3-Zykel und einen weiteren
Zykel der Länge ≥ 2 enthält, etwa π = (123)(45 · · · ) · . . .. Mit π enthält N auch
(124)π(124)−1 π −1 = (124)(123)(45)(142)(45)(132) = (12534).
Weiter mit Fall 2.
4. Fall: N enthält eine Permutation π, deren Zykelzerlegung wenigstens drei 2-Zykel enthält,
etwa π = (12)(34)(56) · . . .. Mit π enthält N dann auch
(135)π(135)−1 π −1 = (135)(12)(34)(56)(153)(56)(34)(12) = (135)(264).
Weiter mit Fall 3.
5. Fall: N enthält eine Permutation π, deren Zykelzerlegung genau zwei Faktoren der Länge 2
enthält, etwa π = (12)(34). Mit π enthält N dann auch
(125)π(125)−1 π −1 = (125)(12)(34)(152)(34)(12) = (152).
Weiter mit Fall 1.
77
Folgerung 9.12 — Für n ≥ 5 ist An perfekt, d.h. [An , An ] = An .
Beweis. Die Kommutatoruntergruppe ist ein Normalteiler und deshalb entweder trivial oder gleich
An . Da An nicht abelsch ist, ist die erste Möglichkeit ausgeschlossen.
Folgerung 9.13 — Es sei n ≥ 1. Die einzigen Normalteiler von Sn sind die triviale Gruppe, An
und Sn .
Beweis. Ist N ein Normalteiler von Sn , so ist N ∩ An ein Normalteiler in An . Falls N ∩ An =
An , hat man N = An oder N = Sn . Falls N ∩ An = 1, hat N die Ordnung ≤ 2. Aber alle
Konjugationsklassen von Elementen der Ordnung 2 bestehen aus mehr als einem Element. Deshalb
muß N trivial sein.
9.7. (*) Zur Kombinatorik der Zahlen 5 und 6.
Wenn m < n, kann man die Gruppe Sm in natürlicher Weise als eine Untergruppe der Gruppe
Sn auffassen, nämlich als die Gruppe derjenigen Permutationen der Menge [n] = {1, . . . , n}, die
die Elementen m + 1, . . . , n fest lassen. Diese Standardeinbettung sei mit i : Sm → Sn bezeichnet.
Durch Konjugation πi(Sm )π −1 ⊂ Sn erhält man andere zu Sm isomorphe Untergruppen, die aber
kombinatorisch ähnlich gebaut sind: Statt der Elemente {m + 1, . . . , n} lassen sie die Elemente
{π(m + 1), . . . , π(n)} fest. Für das Paar (m, n) = (5, 6) tritt die Besonderheit ein, daß es eine
Einbettung j : S5 → S6 gibt, für die die Untergruppe j(S5 ) nicht zur Untergruppe i(S5 ) konjugiert
ist. Das kann man auf verschiedene Weise sehen:
1. Methode: Die Anzahl der 5-Sylowuntergruppen von S5 ist ein Teiler von 5!/5 = 24 und
kongruent zu 1 modulo 5, was nur die Möglichkeiten 1 und 6 läßt. Der erste Fall ist ausgeschlossen,
weil S5 sonst einen Normalteiler der Ordnung 5 hätte. Es gibt also genau sechs 5-Sylowgruppen
U1 ,. . . ,U6 . Die Gruppe S5 operiert auf der Menge X := {U1 , . . . , U6 } durch Konjugation, und diese
Wirkung ist nach der Theorie der Sylowgruppen transitiv. Dies definiert einen Homomorphismus
∼ S6 . Weil die Wirkung transitiv ist, hat der Kern mindestens den Index 6 in
j : S5 → Sym(X) =
S5 . Aber die einzigen Normalteiler in S5 sind die triviale Gruppe, A5 und S5 mit den Indizes 60,
2 und 1. Also ist der Kern die triviale Untergruppe, d.h. j ist injektiv. Alle zu i(S5 ) konjugierten
Untergruppen lassen ein Element fest, während j(S5 ) transitiv operiert. Deshalb kann j(S5 ) nicht
zu i(S5 ) isomorph sein.
Um diesen Gedankengang weiter auszubeuten, betrachten wir irgendeine Gruppe H ⊂ S6 der
Ordnung |H| = 120. Dann ist [S6 : H] = 6, und die Menge der Nebenklassen S6 /j(S5 ) hat genau
sechs Elemente, auf denen S6 durch Multiplikation von links transitiv operiert. Man erhält einen
Homomorphismus
∼ S6 .
Ψ : S6 → Sym(S6 /H) =
Der Kern dieses Homomorphismus hat mindestens den Index 6 in S6 , und der einzige Normalteiler
mit dieser Eigenschaft ist die triviale Gruppe. Deshalb ist Ψ injektiv und aus Mächtigkeitsgründen
ein Isomorphismus. Man erhält also einen Automorphismus Ψ : S6 → S6 , der die Standgruppe
der Nebenklasse H, also die Untergruppe H selbst, auf die Untergruppe derjenigen Bijektionen von
S6 /H abbildet, die die Nebenklasse H fest lassen. Unter dem Isomorphismus Sym(S6 /H) ∼
= S6
ist das eine Untergruppe, die zu i(S5 ) konjugiert ist! Das zeigt:
Satz 9.14 — Zu jeder Untergruppe H ⊂ S6 vom Index [S6 : H] = 6 gibt es einen Automorphismus
Ψ : S6 → S6 , der H isomorph auf i(S5 ) abbildet.
Speziell für j(S5 ) bedeutet dies, daß der Automorphismus Ψ : S6 → S6 , der j(S5 ) auf i(S5 )
schickt, kein innerer Automorphismus sein kann. Wir schließen:
Satz 9.15 — S6 hat äußere Automorphismen.
78
Nach einem Satz von Hölder ist S6 die einzige symmetrische Gruppe mit dieser Eigenschaft!
Dieselbe Methode erlaubt auch einen durchsichtigen geometrischen Beweis des Satzes:
Satz 9.16 — PGL2 (F5 ) ∼
= S5 und PSL2 (F5 ) ∼
= A5 .
Dabei bezeichnet GL2 (F5 ) die Gruppe der invertierbaren 2 × 2-Matrizen mit Werten in dem
endlichen Körper F5 mit 5 Elementen und SL2 (F5 ) die Untergruppe der Matrizen mit Determinante 1. Diese Gruppen haben die Ordnung 480 bzw. 120. Das Zentrum beider Gruppen besteht aus
Vielfachen der Einheitsmatrix:
∗
Z(GL2 (F5 )) = {λI2 | λ 6= 0} ∼
= F5
und
Z(SL2 (F5 )) = {λI2 | λ2 = 1} = {±1}.
Die Faktorgruppen
PGL2 (F5 ) = GL2 (F5 )/F∗5
⊃
PSL2 (F5 ) = SL2 (F5 )/{±1}
heißen die projektive lineare bzw. projektive spezielle lineare Gruppe vom Grad 2 über dem Körper
F5 . Die Ordnungen sind | PGL2 (F5 )| = 120 und | PSL2 (F5 )| = 60.
Beweis. Der projektive Raum
P1 (F5 ) := (F25 \ {0})/v ∼ λv
hat sechs Elemente: x = [x : 1], x ∈ F5 , und ∞ = [1 : 0]. Die Gruppe PGL2 (F5 ) operiert
darauf durch Multiplikation von links, [A] · [v] := [Av], und zwar transitiv. Dies definiert einen
Homomorphismus j : PGL2 (F5 ) → Sym(P1 (F5 )) ∼
= S6 . Wenn [A] im Kern liegt, muß A alle Ursprungsgeraden in der Ebene F25 in sich abbilden. Das geht nur, wenn A ein Vielfaches der
Einheitsmatrix ist, also [A] das Neutralelement in der Faktorgruppe PGL2 (F5 ). Anders gesagt: j ist
injektiv. Deshalb ist j(PGL2 (F5 )) eine Untergruppe vom Index 6 in S6 . Es gibt also einen Automorphismus Ψ : S6 → S6 , der j(PGL2 (F5 )) isomorph auf i(S5 ) abbildet. Dabei geht die Untergruppe
PSL2 (F5 ) isomorph auf eine Untergruppe von S5 vom Index 2, also A5 .
Eine Variation derselben Argumente zeigt auch:
Satz 9.17 — Eine Gruppe der Ordnung 60 ist entweder isomorph zu A5 oder auflösbar.
Beweis. Es sei G eine Gruppe der Ordnung 60. Dann hat G entweder eine oder sechs verschiedene
5-Sylowgruppen. Im ersten Fall ist die 5-Sylowgruppe U ⊂ G ein auflösbarer Normalteiler mit
einer Faktorgruppe G/U der Ordnung 12, die somit ebenfalls auflösbar ist. In diesem Fall ist auch
G auflösbar.
Im zweiten Fall operiert G transitiv auf der Menge X = {U1 , . . . , U6 } der 5-Sylowgruppen,
und man erhält einen nichttrivialen Homomorphismus ϕ : G → Sym(X) ∼
= S6 . Weil G nach
Voraussetzung einfach ist, ist die Abbildung injektiv. Und weil die Komposition sgn ◦ ϕ : G → Z/2
keinen von 1 und G verschiedenen Kern haben kann, liegt ϕ(G) in A6 . Folglich ist G isomorph zu
einer Untergruppe vom Index 6 in A6 .
Die Wirkung von A6 auf der Menge der Nebenklassen A6 /ϕ(G) definiert einen Homomorphismus ψ : A6 → S6 , der aus denselben Gründen wie im vorigen Absatz injektiv mit Bild in A6 sein
muß. Also ist ψ : A6 → A6 ein Automorphismus, der ϕ(G) isomorph auf A5 abbildet.
2. Methode: Wir konstruieren einen äußeren Automorphismus Ψ : S6 → S6 kombinatorisch.
Die Gruppe S6 hat 15 Transpositionen: (12), (13), . . . , (56). Aus diesen Transpositionen lassen
sich auf 15 verschiedene Weisen Tripel von paarweise elementfremden Transpositionen auswählen:
(12)(34)(56), (12)(35)(46), (12)(36)(45), (13)(24)(56), . . . ,
79
Und aus diesen Permutationen lassen sich auf genau sechs verschiedene Weisen Quintupel zusammenstellen, die zusammengenommen, alle 15 Transpositionen erhalten:
A = (12)(34)(56), (13)(25)(46), (14)(26)(35), (15)(24)(36), (16)(23)(45)
B = (12)(34)(56), (13)(26)(45), (14)(25)(36), (15)(23)(46), (16)(24)(35)
C = (12)(35)(46), (13)(24)(56), (14)(25)(36), (15)(26)(34), (16)(23)(45)
D = (12)(35)(46), (13)(26)(45), (14)(23)(56), (15)(24)(36), (16)(25)(34)
E = (12)(36)(45), (13)(24)(56), (14)(26)(35), (15)(23)(46), (16)(25)(34)
F = (12)(36)(45), (13)(25)(46), (14)(23)(56), (15)(26)(34), (16)(24)(35)
Tatsächlich macht man sich leicht klar, daß sich jedes Tripel auf zwei Weisen zu einem Quintupel
vervollständigen läßt, und daraus erhält man für die Anzahl der Quintupel die Formel 15 · 2/5 = 6,
ohne alle Quintupel hinschreiben zu müssen. Es seien A, B, C, D, E, F diese sechs Quintupel. Jede
Permutation der Ziffern 1, 2, 3, 4, 5, 6 führt zu einer Permutation der Buchstaben A, B, C, D, E, F .
Man erhält so einen Gruppenisomorphismus
Φ : Sym({1, 2, 3, 4, 5, 6}) −→ Sym({A, B, C, D, E, F }).
Jede willkürliche Numerierung der Menge {A, B, C, D, E, F }, d.h. jede Wahl einer Bijektion
{A, B, C, D, E, F } → {1, 2, 3, 4, 5, 6}
macht aus Φ einen Automorphismus Ψ ∈ Aut(Sym({1, 2, 3, 4, 5, 6})) = Aut(S6 ). Dieser Automorphismus Ψ kann kein innerer Automorphismus sein. Das sieht man so: Die Transposition (12)
ist Teil von genau drei Tripeln, und jedes dieser Tripel gehört zu genau zwei verschiedenen Quintupeln. Unter der Permutation (12) werden die drei Tripel auf sich selbst abgebildet, aber die zugehörigen Quintupel jeweils vertauscht. Deshalb wird unter dem Isomorphismus Φ die Transposition
(12) vom Zykeltyp [2, 1, 1, 1, 1] auf eine Permutation vom Zykeltyp [2, 2, 2] abgebildet, nämlich
(12) 7→ (AB)(CD)(EF ). Deshalb kann Ψ kein innerer Automorphismus sein.
3. Methode: Man kan die außergewöhnliche Einbettung j : A5 → A6 geometrisch am Dodekaeder
realisieren. In ein Dodekaeder kann man auf fünf verschiedene Weisen einen Würfel so einbeschreiben, daß die Würfelecken eine Teilmenge der Dodekaederecken sind. Jede der zwölf Kanten eines
Würfels bildet jeweils eine Diagonale einer Seitenfläche des Dodekaeders.
80
Die Gruppe I ⊂ SO(3) der orientierungserhaltenden Symmetrien eines Dodekaeders hat die Ordnung 60: Die Gruppe operiert transitiv auf den 20 Ecken, und die Standgruppe einer Ecke besteht
aus den drei Drehungen um die Achse durch die Ecke mit den Winkeln 0, 2π/3 und 4π/3. Diese
Gruppe muß die eingebetteten Würfel untereinander permutieren. Man erhält so einen Homomorphismus a : I → S5 . Eine Drehung, die alle Würfel festläßt, muß auch alle Achsen in sich abbilden
und ist deshalb ein Vielfaches der Identität. Weil die Abbildung orientierungserhaltend ist, ist es die
Identität, d.h. der Homomorphismus ρ ist injektiv. Das Bild ist eine Untergruppe vom Index 2 in S5
und deshalb gleich der alternierenden Gruppe A5 .
Andererseits gibt es genau 6 Achsen durch die Flächenmittelpunkte der begrenzenden Fünfecke,
und diese werden von der Gruppe I transitiv permutiert. Man erhält einen zusammengesetzten Homomorphismus
a−1
j : A5 −−−→ I −→ S6 .
Die Abbildung ist nicht trivial und damit sogar injektiv, weil A5 einfach ist. Und weil die Einschränkung des Signaturhomomorphismus sgn : S6 → {±1} trivial sein muß, liegt das Bild in A6 ⊂ S6 .
Schließlich ist j nicht die Standardeinbettung, weil die Wirkung von I auf den sechs Flächenmittelpunktsachsen transitiv ist.
81
§10. (*) Lineare Gruppen
10.1. Matrizengruppen.
Es sei K ein beliebiger Körper. Die invertierbaren n × n-Matrizen mit Koeffizienten in K bilden
die sogenannte allgemeine lineare Gruppe GLn (K). Die Determinante ist ein surjektiver Homomorphismus
det : GLn (K) → K × .
Ihr Kern ist die spezielle lineare Gruppe SLn (K) der Matrizen mit Determinante 1. In der SLn (K)
liegen unter anderem die Elementarmatrizen Eij (λ) mit den Einträgen (Eij (λ))ab = δab + λδai δbj .
Dabei sind i, j verschiedene Indizes und λ ∈ K ein beliebiger Skalar.
Lemma 10.1 — SLn (K) wird als Gruppe von Elementarmatrizen erzeugt.
Beweis. Die Multiplikation einer Matrix A von links bzw. rechts mit einer Elementarmatrix entspricht einer elementaren Zeilen- bzw. Spaltentransformation. Bekanntlich läßt sich jede Matrix A
durch wiederholte Zeilen- und Spaltentransformationen auf Diagonalgestalt bringen. Es genügt also
zu zeigen, daß sich jede Diagonalmatrix als Produkt von Elementarmatrizen schreiben läßt. Nun gilt
1
1

a
 a
b

c
a−1
d
..
.
=

1
ab
1
1
..
.


(ab)−1
1
..
.


abc
(abc)−1
..
×
.

···
Deshalb kann man sich auf den Fall von 2 × 2-Matrizen zurückziehen. Für a ∈ K gilt
!
!
!
!
!
a
0
1 −1
1
0
1 a
1
0
=
0 a−1
0
1
1 − a−1 1
0 1
a−2 − a−1 1
Satz 10.2 — Von den Ausnahmefällen SL2 (F2 ) und SL2 (F3 ) abgesehen, sind alle Gruppen SLn (K)
für n ≥ 2 und beliebige Körper K perfekt.
Beweis. Weil SLn (K) von Elementarmatrizen erzeugt wird, genügt es zu zeigen, daß sich jede Elementarmatrix Eij (λ) als Kommutator schreiben läßt. Falls n ≥ 3, kann man k verschieden von i
und j wählen. Dann gilt [Eik (λ), Ekj (1)] = Eij (λ).
Im Falle n = 2 gilt die Identität:
!
!#
"
!
1 (a2 − 1)b
a
0
1 b
.
=
,
0
1
0 a−1
0 1
Wenn der Körper mehr als 3 Elemente enthält, kann man immer ein a 6= −1, 0, 1 finden. Dann sind
sowohl a wie a2 − 1 invertierbar, und mit der Wahl b = λ/(a2 − 1) hat man eine Darstellung von
E12 (λ) als Kommutator gefunden. Die Matrix E21 (λ) erhält man analog.
Demnach ist SLn (K) perfekt bis auf die möglichen Ausnahmen n = 2 und |K| ≤ 3.
Auf der Menge K n \ {0}, n ≥ 1, wird durch
v ∼ v′
:⇔
v ′ = λv für ein λ ∈ K ×
eine Äquivalenzrelation definiert. Die Menge der Äquivalenzklassen
Pn−1 (K) := K n \ {0}/ ∼
heißt der n − 1-dimensionale projektive Raum über dem Körper K. Punkte in Pn−1 entsprechen
wahlweise Äquivalenzklassen in K n \ {0} oder eindimensionale Untervektorräume in K n , nämlich
die von den Äquivalenzklassen aufgespannten Geraden.
82
Lineare Gruppen
Die Gruppen GLn (K) und SLn (K) operieren auf Pn−1 (K) durch Linksmultiplikation: Für zwei
nichttriviale Vektoren v, v ′ ∈ K n gilt v ∼ v ′ ⇔ Av ∼ Av ′ . Deshalb ist die Wirkung
GLn (K) × Pn−1 (K) → Pn−1 (K),
(A, [v]) 7→ [Av],
wohldefiniert.
Lemma 10.3 — Eine Matrix A ∈ GLn (K) wirkt auf Pn−1 (K) genau dann trivial, wenn A ein
Vielfaches der Einheitsmatrix ist.
Beweis. Die Wirkung ist genau dann trivial, wenn A jede Gerade in K n in sich abbildet. Bezüglich
der Standardbasis e1 , . . . , en hat A also Diagonalgestalt, etwa A = diag(a1 , . . . , an ). Damit auch
e1 + . . . + en ein Eigenvektor ist, müssen alle Eigenwerte a1 , . . . , an untereinander gleich sein. Die Gruppe Z := {λIn | λ ∈ K × } ist genau das Zentrum von GLn (K) und deshalb ein
Normalteiler. Als Gruppe ist Z isomorph zur Einheitengruppe K × . Weil die Elemente des Zentrums
trivial auf dem projektiven Raum operieren, steigt die Wirkung von GLn (K) auf Pn−1 (K) zu einer
Wirkung der Faktorgruppe
PGLn (K) := GLn (K)/Z
ab. Der Durchschnitt
Z0 = Z ∩ SLn (K) = {λIn | λn = 1}
ist isomorph zur Gruppe µn (K) = {λ ∈ K | λn = 1} der n-ten Einheitswurzeln in K. Analog
steigt die Wirkung von SLn (K) zu einer Wirkung der Faktorgruppe
PSLn (K) := SLn (K)/Z0
ab. Die Gruppen PGLn (K) und PSLn (K) heißen die allgemeine bzw. spezielle projektive lineare
Gruppe über K. Alle diese Gruppen lassen sich in dem folgenden kommutativen Diagramm mit
exakten Zeilen und Spalten anordnen:
1
−→
1
−→
1
−→
1

y
µn (K)

y
−→
PSLn (K)

y
−→
−→
SLn (K)

y
1
wobei K ×n = {an | a ∈ K × }.
Im Folgenden soll die Wirkung
1

y
a7→an
K×

y
−−−−→
PGLn (K)

y
−
−−−
→
GLn (K)

y
1

y
K ×n

y
det
−
−−−
→
det
1
K × /K ×

y
PGLn (K) × Pn−1 (K) −→ Pn−1 (K)
oder in äquivalenter Formulierung der Gruppenhomomorphismus
ρ : PGLn (K) → Sym(Pn−1 (K))
untersucht werden.
K×

y
1
n
−→
1
−→
1
−→
1
83
10.2. Transitive und imprimitive Wirkungen.
Definition 10.4. — Es sie G × X → X eine Gruppenwirkung.
(1) Die Wirkung heißt transitiv, wenn es zu beliebigen x, y ∈ X ein Gruppenelement g ∈ G
mit gx = y gibt.
(2) Die Wirkung heißt k-fach transitiv, wenn zu beliebigen k-Tupeln von paarweise verschiedenen Punkten x1 , . . . , xk ∈ X und y1 , . . . , yk ∈ X ein Gruppenelement g ∈ G mit
gx1 = y1 ,. . . , gxk = yk gibt.
(3) Eine transitive Wirkung heißt imprimitiv, wenn es eine disjunkte Zerlegung
X = B1 ∪ B2 ∪ . . .
in echte, mehrelementige Teilmengen von X gibt, die von allen g ∈ G erhalten wird, d.h.
wenn g(Bi ) = Bj für jedes i und geeignetes j. Die Mengen B1 , B2 , . . . heißen Imprimitivitätsgebiete. Eine transitive Wirkung, die nicht imprimitiv ist, heißt primitiv.
Satz 10.5 — Es sei n ≥ 2. Die Wirkung von PSLn (K) auf Pn−1 (K) ist zweifach transitiv.
Beweis. Es seien x1 , x2 und y1 , y2 zwei Paare verschiedener Punkte auf Pn−1 (K), die von Vektoren
v1 , v2 bzw. w1 , w2 in K n repräsentiert werden. Daß x1 und x2 verschieden sind bedeutet, daß v1
und v2 linear unabhängig sind. Sie lassen sich deshalb zu einer Basis v1 , . . . , vn erweitert. Ebenso
gibt es eine Erweiterung von w1 und w2 zu einer Basis w1 , . . . , wn von K n . Es bezeichne A die
eindeutig bestimmte Matrix mit Avi = wi für i = 1, . . . , n. Indem man wn nötigenfalls um einen
Skalar abändert, kann man erreichen, daß det(A) = 1. Dann ist [A] ∈ PSLn (K) mit [A]xi = yi
für i = 1, 2.
Satz 10.6 — Die Wirkung von PGL2 (K) auf P1 (K) ist dreifach transitiv.
Beweis. Es seien x1 , x2 , x3 und y1 , y2 , y3 zwei Tripel von paarweise verschiedenen Punkten auf
P1 (K). Es seien Vektoren v1 , v2 , v3 und w1 , w2 , w3 gewählt, die diese Punkte repräsentieren. Weil
x1 6= x2 , sind v1 und v2 linear unabhängig und eine Basis von K 2 . Schreibt man v3 = αv1 + βv2 ,
so ist α 6= 0, weil x3 6= x2 , und analog β 6= 0, weil x3 6= x1 . Indem man gegebenenfalls v1 und
v2 durch αv1 und βv2 ersetzt, kann man ohne Einschränkung erreichen, daß v1 + v2 = v3 . Analog
verfährt man mit den Vektoren w1 , w2 und w3 = w1 + w2 . Die eindeutig bestimmte Matrix A mit
Av1 = w1 und Av2 = w2 hat dann auch die Eigenschaft Av3 = w3 . Es folgt [A]xi = yi für
i = 1, 2, 3.
Es sei G × X → X eine transitive Wirkung von X, d.h. die Menge X besteht aus einer einzigen
Bahn unter G. Dagegen zerfällt X für eine Untergruppe H ⊂ G möglicherweise in mehrere Bahnen
Hx, x ∈ R ⊂ X. Spezielle für den Fall eines Normalteilers N passiert das Folgende: Wir betrachten
eine N -Bahn N x und den Effekt einer zusätzlichen Wirkung durch ein g ∈ G. Es gilt gN x =
gN g −1 (gx) = N (gx). Das Element g bildet also die Bahn N x wieder auf eine Bahn N (gx) ab.
Die zweite Bahn stimmt entweder mit der ersten überein oder zu dieser disjunkt. Läßt man g durch
die ganze Gruppe G laufen, erhält man wegen der Transitivität der G-Wirkung auf X eine Zerlegung
von X in gleichgroße disjunkte G-Bahnen:
Satz 10.7 — Es sei G × X → X eine transitive Gruppenwirkung und N ⊳ G ein Normalteiler.
(1) Die Menge X zerfällt in gleich große N -Bahnen, die unter der Wirkung von G permutiert
werden.
(2) Wenn G zweifach transitiv operiert, so ist die Wirkung von N auf X entweder trivial oder
ebenfalls transitiv.
84
Lineare Gruppen
Beweis. Es bleibt die zweite Aussage zu beweisen. Wir nehmen an, die Wirkung von G auf X sei
zweifach transitiv, und die Wirkung von N sei weder trivial noch transitiv. Dann gibt es wenigstens
zwei verschiedene N -Bahnen B und B ′ in X, die jeweils aus mehr als einem Element bestehen,
etwa B = {x, y, . . .} und B ′ = {x′ , y ′ , . . .}. Weil die Wirkung von G zweifach transitiv ist, gibt
es ein g ∈ G mit gx = x und gy = y ′ . Dann ist gB weder zu B disjunkt, noch stimmt es mit B
überein. Widerspruch.
10.3. Endliche lineare Gruppen.
Im Folgenden betrachten wir speziell die im ersten Abschnitt eingeführten linearen Gruppen für
den Fall eines endlichen Körpers Fq mit q Elementen. Dann sind alle linearen und projektiven linearen Gruppen endlich. Wir besimmten zunächst ihre Ordnungen:
n
Satz 10.8 — | GLn (Fq )| = q ( 2 )
Qn
i=1 (q
i
n
− 1) und | SLn (Fq )| = q ( 2 )
Qn
i=2 (q
i
− 1).
Beweis. Die Gruppe GLn (Fq ) operiert durch Multiplikation von links transitiv auf der Menge der
n
von 0 verschiedenen Vektoren im Vektorraum Fn
q . Die Anzahl dieser Vektoren ist demnach q − 1.
Die Standgruppe des ersten Standardbasisvektors ist
)
!
(
1 u n−1
H=
u ∈ Fq , A ∈ GLn−1 (Fq ) .
0 A
Das führt auf die rekursive Beziehung:
| GLn (Fq )| = (q n − 1)|H| = (q n − 1)q n−1 | GLn−1 (Fq )|.
Daraus folgt die erste Behauptung durch Induktion. Die zweite folgt aus der ersten, weil das Bild der
Determinante die Ordnung |F×
q | = q − 1 hat.
Weil die Einheitengruppe von Fq zyklisch von der Ordnung q − 1 ist, ist die Gruppe µn (Fq ) der
n-ten Einheitswurzeln isomorph zur Untergruppe in Z/(q − 1) aller Elemente a mod (q − 1) mit
na ≡ 0. Deren Anzahl ist ggT(q − 1, n). Mit anderen Worten:
Folgerung 10.9 — Es gilt |µn (Fq )| = ggT(q − 1, n) und
| PSLn (Fq )| =
n
n
Y
q( 2 )
(q i − 1).
ggT(q − 1, n) i=2
Der n − 1-dimensionale projektive Raum hat
|Pn−1 (K)| =
|K n \ {0}|
qn − 1
=
= q n−1 + . . . + q + 1
q−1
|F×
q |
Elemente. Insbesondere definiert die Wirkung von PGLn (Fq ) einen injektiven Gruppenhomomorphismus
qn − 1
.
ρ : PGLn (Fq ) → Sm , m =
q−1
PGL2 (F2 ) Die Gruppen PGL2 (F2 ), GL2 (F2 ), PSL2 (F2 ) und SL2 (F2 ) sind alle gleich und
haben die Mächtigkeit 6. Man hat einen injektiven Gruppenhomomorphismus ρ : PGL2 (F2 ) → Sm ,
2
−1
= 3. Das zeigt:
m = 22−1
PSL2 (F2 ) ∼
= S3 .
Insbesondere ist PSL2 (F2 ) auflösbar.
PGL2 (F3 ) Es gilt | GL2 (F3 )| = 48, und | PGL2 (F3 ) = 24. Aus der Injektivität des Homomor-
phismus ρ : PGL2 (F3 ) → Sm , m =
32 −1
3−1
= 4, folgt:
PGL2 (F3 ) ∼
= S4
Insbesondere ist PSL2 (F3 ) auflösbar.
und
PSL2 (F3 ) ∼
= A4 .
PGL2 (F4 )
Man hat | GL2 (F4 )| = 180 und | PGL2 (F4 ) = 60. Die Wirkung auf P1 (F4 ) de-
finiert eine injektiven Homorphismus ρ : PGL2 (F4 ) → Sm , m =
Isomorphismus
PSL2 (F4 ) = PGL2 (F4 ) ∼
= A5 .
PGL2 (F5 )
85
42 −1
4−1
= 5, und somit einen
Es gilt | GL2 (F5 )| = 480 und PGL2 (F5 ) = 120. Der injektive Homomorphis2
−1
mus ρ : PGL2 (F5 ) → Sm , m = 55−1
= 6, definiert also Einbettungen PGL2 (F5 ) → S6 und
PSL2 (F5 ) → A6 vom Index 6. Wie in Abschnitt 9.7 ausgeführt folgt hieraus schon:
PGL2 (F5 ) ∼
= S5
und
PSL2 (F5 ) ∼
= A5 .
Insbesondere hat man den merkwürdigen Umstand:
Satz 10.10 — PSL2 (F4 ) ∼
= PSL2 (F5 ) ∼
= A5 .
Satz 10.11 — Für alle (n, q) 6= (2, 2), (2, 3) sind die Gruppen PSLn (Fq ) einfach.
Beweis. Wenn (n, q) 6= (2, 2), (2, 3), ist die Gruppe G = SLn (Fq ) nach Satz 10.2 perfekt und
operiert nach Satz 10.5 zweifach transitiv auf Pn−1 (Fq ). Insbesondere ist die Wirkung primitiv. Angenommen, G ist nicht einfach. Es sei dann N ⊳ G ein maximaler nichttrivialer echter Normalteiler.
Weil N nichttrivial und die Wirkung von G auf Pn−1 (Fq ) effektiv ist, haben die N -Bahnen eine
Länge n ≥ 2. Nach Satz 10.7 muß N ebenfalls transitiv auf Pn−1 (Fq ) operieren. Betrachte die
Untergruppe
#)
("
∗
∗
< G,
H=
0
∗
nämlich die Standgruppe der vom ersten Standardbasisvektor e1 aufgespannten Gerade. Weil N
transitiv wirkt, hat man
G = N H.
Die Gruppe
U=
("
1
0
∗
In−1
#)
ist eine normale Untergruppe in H. Deshalb ist N U ein Normalteiler in G = N H. Weil U alle
Elementarmatrizen der Gestalt E1j (λ) enthält, erzeugen die konjugierten Untergruppen gU g −1 , g ∈
G, zusammen die Gruppe G. Deshalb kann U keine Untergruppe von N sein, so daß N ( N U . Nach
Voraussetzung war N aber ein maximaler echter Normalteiler von G, so daß N U = G gelten muß.
Wir berechnen die Kommutatoruntergruppe von G aus der Darstellung G = N U . Weil G perfekt,
N normal und U abelsch ist, hat man:
G = [G, G] = [N U, N U ] ⊂ N [U, U ] = N,
Widerspruch.
Die nächstgrößeren Gruppen nach PSL2 (F4 ) und PSL2 (F5 ) sind die Gruppen PSL2 (F7 ) und
PSL3 (F2 ). Nach den obigen Regeln findet man leicht
| PSL2 (F7 )| = | PSL3 (F2 )| = 3 · 7 · 8 = 168.
Es ist klar, daß eine Gruppe der Ordnung 168 nicht zu einer alternierenden Gruppe isomorph sein
kann. Im Übrigen gilt:
Satz 10.12 — Es gibt bis auf Isomorphie nur eine einfache Gruppe der Ordnung 168. Insbesondere
gilt
PSL2 (F7 ) ∼
= PSL3 (F2 ).
86
Lineare Gruppen
§11. Körpererweiterungen
11.1. Charakteristik und Grad.
Wir kennen drei prinzipielle Methoden, um aus Ringen Körper zu konstruieren:
(1) Ist A ein kommutativer Ring und m ein maximales Ideal, dann ist der Restklassenring A/m
ein Körper, der Restklassenkörper von m. Aus Z gewinnt man so für jede Primzahl p den
endlichen Körper Fp = Z/p.
(2) Ist A ein Integritätsbereich, so ist der totale Quotientenring Q(A) ein Körper, der Quotientenkörper von A. Das verallgemeinert den Übergang von den ganzen Zahlen Z zum Körper
Q = Q(Z) der rationalen Zahlen.
(3) Es sei K ein Körper. Dann ist K[X] ein Integritätsbereich. Sein Quotientenkörper ist der
Funktionenkörper
f (X) F (X) :=
f, g ∈ K[X], g 6= 0 .
g(X)
Analog kann man mit einer beliebigen Anzahl von Unbestimmten verfahren.
Eine der wichtigsten Invarianten eines Körpers ist seine Charakteristik: Es sei K ein Körper und 1K
das Einselement. Für jedes n ∈ N bezeichne nK die n-fache Summe von 1K mit sich. Die Abbildung
N → K, n → nK , setzt sich zu einem Ringhomomorphismus Φ : Z → K fort. Der Kern von Φ ist
notwendigerweise ein Primideal. Die Charakteristik char(K) ist die Zahl 0 oder die Primzahl p je
nachdem, ob ker(Φ) = (0) oder ker(Φ) = (p). Es gibt also zwei fundamental verschiedene Fälle:
(1) char(K) = 0. Dieser Fall tritt genau dann ein, wenn nK 6= 0 für alle n ∈ N. Der Ring
Z wird durch Φ auf eindeutige Weise in K eingebettet. Jedes Element 6= 0 in Z ist in K
invertierbar. Deshalb setzt sich die Abbildung Φ zu einem kanonischen injektiven Homomorphismus Q → K des Quotientenkörpers fort.
Φ
Z
u
u
u
u
/K
u:
Φ̃
Q(Z) = Q
(2) char(K) = (p) für eine Primzahl p. Dabei ist p die kleinste natürliche Zahl n mit nK = 0.
Nach der universellen Eigenschaft des Restklassenrings induziert Z → K einen kanonischen injektiven Homomorphismus Fp = Z/(p) → K.
(p)
/Z

Φ

/K
?
Φ̄
Fp
Ein Unterkörper in einem Körper K ist eine Teilmenge k ⊂ K, die unter Addition und Multiplikation abgeschlossen und mit diesen ererbten Verknüpfungen ein Körper ist. Der Durchschnitt aller
Unterkörper in einem gegebenen Körper ist selbst ein Unterkörper, und zwar der kleinstmögliche. Er
heißt der Primkörper von K. Offenbar ist der Primkörper eines Körpers auf kanonische Weise zu Q
oder Fp isomorph je nachdem, ob char(K) = 0 oder p.
Körper der Charakteristik p > 0 unterscheiden sich in zahlreichen Punkten von Körpern der Charakteristik 0. Alle endlichen Körper haben positive Charakteristik. Ein Beispiel für einen unendlichen
Körper von positiver Charakteristik ist der Körper Fp (X) der rationalen Funktionen über Fp .
Die Binomialkoeffizienten kp sind für 0 < k < p durch p teilbar. Deshalb gilt in den Körpern
der Charakteristik p > 0 die Rechenregel
(11.1)
(a1 + . . . + an )p = ap1 + . . . + apn .
87
Daraus ergibt sich der Satz:
Satz 11.1 — Es sei p eine Primzahl und K ein Körper der Charakteristik p. Die Abbildung
F : K → K,
a 7→ ap ,
ist ein injektiver Ringhomomorphismus, der sogenannte Frobeniushomomorphismus.
Definition 11.2. — Es sei K ein Körper. Eine K-Algebra ist ein Ring R zusammen mit einer
Verknüpfung K × R → R, so daß R mit der Ringaddition und dieser skalaren Verknüpfung ein
K-Vektorraum ist und die Ringmultiplikation R × R → R eine K-bilineare Abbildung ist.
Wenn R ein Einselement besitzt, also insbesondere wenn R ein kommutativer Ring ist, definiert
jede K-Algebrenstruktur einen Ringhomomorphismus K → R, λ 7→ λ1R , und umgekehrt definiert
jeder solche Ringhomomorphismus auf R die Struktur einer K-Algebra. K-Algebren lassen sich mit
Mitteln der linearen Algebra untersuchen.
Definition 11.3. — Es sei K ein Körper. Ein Homomorphismus K → L in einen Körper L heißt
Körpererweiterung von K. Die Dimension von L als K-Vektorraum heißt Grad der Erweiterung und
wird mit [L : K] := dimK (L) notiert. Eine Erweiterung K → L heißt endlich, wenn [L : K] < ∞.
Da jede Körpererweiterung notwendigerweise injektiv ist, identifizieren wir K häufig mit seinem
Bild und betrachten K als einen Unterkörper von L, wenn es ohne Gefahr von Mißverständnissen
möglich ist. Man spricht auch von einer Einbettung des Körpers K in den Körper L. Wenn man den
Homomorphismus K → L nicht betonen will, schreibt man L/K für die Erweiterung.
√
Beispiele 11.4. — 1. Der Körper K = Q( 3 2) besitzt drei verschiedene Einbettungen in C. Zu√
nächst hat man mit der Abkürzung α = 3 2 die Darstellung
(11.2)
K = {a + bα + cα2 | a, b, c ∈ Q}.
Um K in C einzubetten, muß α auf eine komplexe Zahl abgebildet werden, deren dritte Potenz 2 ist.
Dazu gibt es genau drei Möglichkeiten: α, αρ und αρ2 mit ρ = exp(2πi/3). Die Wahl von α liefert
einfach die Standardinklusion ϕ1 = id : K → C, die beiden anderen Wahlen liefern Einbettungen
ϕ2 , ϕ3 : K → C, deren Bilder nicht einmal in R landen.
√
2. Etwas anders ist die Situation im folgenden Fall: Der Körper Q( 2) besitzt zwei verschiedene
√
√
√
√
Einbettungen in C, nämlich ϕ1 (a + b 2) = a + b 2 und ϕ2 (a + b 2) = a − b 2. In diesem
Falle sind die Bilder der beiden Abbildungen gleich, aber die Abbildungen selbst sind verschieden.
√
√
3. Die Erweiterungen Q( 3 2)/Q und Q( 2)/Q sind endlich vom Grad 3 bzw. 2. Ähnlich ist
[C : R] = 2. Die Erweiterung R/Q hat unendlichen Grad.
Satz 11.5 — Es seien K → L → M Körpererweiterungen. Dann gilt
(11.3)
[M : K] = [M : L] · [L : K].
Beweis. Es sei {xi }i∈I eine K-Basis von L und {yj }j∈J eine L-Basis von M . Wir betrachten die
Familie B := {xi yj }(i,j)∈I×J . Es genügt zu zeigen, daß B eine Basis ist, denn |I × J| = |I| · |J|.
P
Zunächst läßt sich jedes m ∈ M als Linearkombination m =
j ℓj yj schreiben, wobei fast
P
alle ℓj ∈ L verschwinden. Weiter läßt sich jedes ℓj 6= 0 als Linearkombination ℓj =
i aij xi
P
schreiben. Insgesamt sind nur endlich viele aij 6= 0. Nun gilt m = (i,j) aij xi yj . Folglich ist B
ein Erzeugersystem.
P
P P
Ist andererseits 0 = (i,j) aij xi yj = j
i aij xi yj , so folgt aus der linearen UnabhängigP
keit der yj zunächst, daß i aij xi = 0 für alle j, und dann aus der linearen Unabhängigkeit der xi ,
daß aij = 0 für alle (i, j). Folglich ist B eine Basis.
Für den Satz und den Beweis ist es unerheblich, ob die Mengen I und J endlich sind oder nicht.
88
Satz 11.6 — Es sei K ein Körper, A eine kommutative nullteilerfreie K-Algebra mit dimK (A) <
∞. Dann ist A ein Körper.
Beweis. Der Beweis ist sehr leicht. Wir führen bei der Gelegenheit Bezeichnungen ein, die wir auch
später gebrauchen können. Für jedes a ∈ A ist die Linksmultiplikation
ℓa : A → A,
x 7→ ax,
eine K-lineare Abbildung. Die Nullteilerfreiheit von A impliziert, daß ℓa injektiv ist, wenn a 6= 0.
Da dimK (A) < ∞, ist jeder injektive Endomorphismus des K-Vektorraums A auch surjektiv. Es
gibt also insbesondere zu jedem a ∈ A \ {0} ein b ∈ A mit ab = ℓa (b) = 1.
Es sei K → L eine Körpererweiterung und S ⊂ L eine Menge. Es gibt Unterkörper von L, die
das Bild von K und S enthalten, zum Beispiel L selbst. Der Durchschnitt aller dieser Unterkörper
hat dieselbe Eigenschaft und ist der kleinste Unterkörper mit dieser Eigenschaft. Er wird mit K(S)
bezeichnet und heißt der von S über K erzeugt Unterkörper von L. Er läßt sich auch folgendermaßen
beschreiben:
K(S) :=
p(s1 , . . . , sn ) n ∈ N0 , p, q ∈ K[X1 , . . . , Xn ], s1 , . . . , sn ∈ S, q(s) 6= 0.
q(s1 , . . . , sn )
Falls S = {a1 , . . . , aℓ } schreiben wir kurz K(a1 , . . . , aℓ ) statt K({a1 , . . . , aℓ }).
Definition 11.7. — Es sei L/K eine Körpererweiterung.
(1) Eine Menge S ⊂ L erzeugt die Erweiterung L/K, wenn L = K(S).
(2) Der Körper L heißt endlich erzeugt über K, wenn es eine endliche Menge S ⊂ L mit
L = K(S) gibt.
(3) Eine Erweiterung L/K heißt einfach, wenn es ein Element a ∈ L mit L = K(a) gibt.
Es ist klar, daß jede endliche Körpererweiterung auch endlich erzeugt ist, denn jede Basis ist erst
recht ein Erzeugendensystem. Umgekehrt wird der Funktionenkörper K(X) als Körpererweiterung
von K allein von X erzeugt, d.h. K(X)/K ist eine einfache Erweiterung, aber [K(X) : K] = ∞.
Man beachte auch, daß es zu jedem a ∈ K(S) eine endliche Teilmenge Sa ⊂ S mit a ∈ K(Sa )
gibt, weil sich jedes a als Quotient von zwei Polynomen mitEinträgen aus S ausdrücken läßt, die
aber jeweils nur von endlich vielen Elementen aus S abhängen können.
11.2. Algebraische Erweiterungen.
Es sei i : K → L eine Körpererweiterung und a ∈ L. Wegen der universellen Eigenschaft
des Polynomrings gibt es genau einen Ringhomomorphismus ψ : K[X] → L mit ψ|K = i und
ψ(X) = a. Wir schreiben kurz ψ(f ) =: f (a). Das Bild von ψ ist ein Unterring von L und wird
mit K[a] bezeichnet. Weil jeder Unterring eines Körper nullteilerfrei ist, ist der Kern von ψ ein
Primideal. Deshalb bestehen zwei Möglichkeiten:
(1) ker(ψ) = (f ) mit einem eindeutig bestimmten normierten irreduziblen Polynom f . Wegen
der universellen Eigenschaft des Restklassenrings faktorisiert ψ über eine Einbettung ψ :
K[X]/(f ) → L. Es folgt, daß K[X]/(f ) ∼
= K(a) und [K(a) : K] = [K[X]/(f ) :
K] = grad(f ) =: n. Es gilt dann schon K[a] = K(a). Wir nennen a in diesem Falle
algebraisch vom Grad n über K. Das Polynom f ist das eindeutig bestimmte normierte
Polynom kleinsten Grades mit f (a) = 0. Es heißt das Minimalpolynom von a über K und
wird mit minpola/K := f bezeichnet.
(f )
ψ
/
w; L
w
w
ww
wwψ
w
ww
/ K[X]
K[X]/(f )
89
(2) ker(ψ) = (0). In diesem Falle wird K[X] durch ψ in L eingebettet, und setzt sich gemäß
der universellen Eigenschaft der Lokalisierung zu einer Einbettung des Körpers der rationalen Funktionen fort: Φ : K(X) → L. Es folgt, daß K[X] ∼
= K[a] und K(X) ∼
= K(a).
Insbesondere ist [K(a) : K] = ∞. Wir nennen a in diesem Falle transzendent über K.
ψ
/
=L
{{
{
{{
{{
{
{
K[X]
K(X)
Definition 11.8. — Es sei L/K eine Körpererweiterung und a ∈ L algebraisch über K. Ein Element
b ∈ L ist konjugiert zu a, wenn b Nullstelle des Minimalpolynoms von a ist.
Die Definition erweitert den Begriff der komplex konjugierten Zahl: In der Erweiterung C/R ist
jedes z ∈ C algebraisch über R, und zwar vom Grad 1 oder 2 je nachdem ob z reell ist oder nicht.
Die zu z konjugierten Zahlen sind z selbst und z, die im üblichen Sinne konjugierte komplexe Zahl.
√
√
Beispiel 11.9. — Die komplexe Zahl a = 5 − 2 ist algebraisch über Q: Da 5 = a + 2, folgt
√
√
√
5 = a2 + 4a + 4. Alternativ kann man 5 aus a = 5 − 2 und a2 = 9 − 4 5 eliminieren:
√
1
(11.4)
5 = a + 2 = (9 − a2 ).
4
Auch so ergibt sich a2 + 4a − 1 = 0. Das Polynoms x2 + 4x − 1 ist irreduzibel in Q[x], weil es keine
Nullstellen in Q besitzt: Jede Nullstelle müßte schon ganzzahlig sein und außerdem ein Teiler des
konstanten Terms. Die einzigen Teiler sind ±1, und diese sind keine Nullstellen. Also ist x2 + 4x − 1
√
das Minimalpolynom von a. Die zu a konjugierte Nullstelle ist − 5 − 2 = −a − 4 ∈ Q(a).
√
Beispiel 11.10. — Es sei a = 3 2 ∈ R. Dann ist b = a2 + a algebraisch über Q: Wir finden
b2 = (a2 + a)2 = a4 + 2a3 + a2 = a2 + 2a + 4 und b3 = a6 + 3a5 + 3a4 + a3 = 6a2 + 6a + 6.
Durch Elimination von a2 und a aus diesen Gleichungen findet man b3 − 6b − 6 = 0. Nach dem
Eisensteinkriterium ist x3 − 6x − 6 ∈ Q[X] irreduzibel und daher das Minimalpolynom von b. Die
zu b konjugierten Elemente in C sind ρa2 + ρ2 a und ρ2 a2 + ρa, wobei ρ = exp(2πi/3), wie man
durch Ausmultiplizieren verifiziert:
(11.5)
(X − a2 − a)(X − ρa2 − ρa)(X − ρ2 a2 − ρa) = . . . = X 3 − 6X − 6.
Beachte: a3 = 2, ρ2 + ρ + 1 = 0. Die zu b konjugierten Zahlen sind nicht reell und liegen sicher
nicht in Q(b).
Beispiel 11.11. — Um das reguläre Siebeneck in den Einheitskreis zeichnen zu können, bräuchte
man eine Strecke der Länge u = cos(α), α = 2π/7. Aus dem Additionstheorem für den Kosinus
folgt für beliebige a, b ∈ R:
(11.6)
cos(a + b) + cos(a − b) = 2 cos(a) · cos(b).
Daraus ergibt sich:
(11.7)
cos(2α) = 2u2 − 1,
cos(3α) = 2u(2u2 − 1) − u = 4u3 − 3u
und
(11.8)
cos(4α) = 2(2u2 − 1)2 − 1 = 8u4 − 8u2 + 1.
Da cos(3α) = cos(4α) für diese spezielle Wahl von α, liefert der Vergleich die Identität
(11.9)
8u4 − 8u + 1 = 4u3 − 3u
90
oder
(11.10)
8u4 − 4u3 − 8u2 + 3u + 1 = 0.
Das Polynom 8x4 − 4x3 − 8x2 + 3x + 1 ist aber nicht irreduzibel, es hat die Nullstelle 1. Division
durch x − 1 liefert das kubische Polynom:
(11.11)
8x3 + 4x2 − 4x − 1 ∈ Q[x].
Es liegt nahe, die Substitution z = 2u = eiα + e−iα vorzunehmen. z ist dann Nullstelle des
Polynoms f = x3 + x2 − 2x − 1. Da ±1 keine Nullstellen von f sind, ist f irreduzibel. Also
ist z algebraisch über Q mit Minimalpolynom f . Die zu z = 2 cos(α) konjugierten Elemente sind
2 cos(2α) = z 2 − 2 und 2 cos(3α) = z 3 − 3z und liegen, wie die Formeln zeigen, in Q(z).
Man kann dasselbe Polynom f auch wie folgt herleiten: Es sei ζ = exp(2πi/7). Dann genügt ζ
der Gleichung
(11.12)
ζ 6 + ζ 5 + ζ 4 + ζ 3 + ζ 2 + ζ + 1 = 0.
Außerdem ist z = ζ + ζ −1 . Wir teilen (11.12) durch ζ 3 und entwickeln nach Potenzen von z:
ζ 3 + ζ 2 + ζ + 1 + ζ −1 + ζ −2 + ζ −3
=
=
=
z 3 + ζ 2 + ζ −2 − 2ζ − 2ζ −1 + 1
z 3 + z 2 − 2ζ − 2ζ −1 − 1
z 3 + z 2 − 2z − 1.
Definition 11.12. — Eine Körpererweiterung K → L heißt algebraisch, wenn jedes a ∈ L algebraisch über K ist, und andernfalls transzendent.
Satz 11.13 — Die folgenden Aussagen über eine Körpererweiterung L/K sind äquivalent:
(1) L/K ist endlich.
(2) L/K ist algebraisch und endlich erzeugt.
(3) L/K ist erzeugt von endlich vielen algebraischen Elementen.
Beweis. 1 ⇒ 2: Es sei L/K endlich vom Grad n. Jede Vektorraumbasis ist ein Erzeugersystem.
Deshalb ist L/K sicher endlich erzeugt. Für jedes a ∈ L sind die Elemente 1, a, . . . , an linear
abhängig über K. Es gelte etwa f0 + f1 a + . . . + fn an = 0. Dann ist a Nullstelle des Polynoms
P
f = k fk X k und deshalb algebraisch.
2 ⇒ 3: Trivial.
3 ⇒ 1: Es seien s1 , . . . , sn ∈ L Elemente, die algebraisch über K sind und L erzeugen. Wir zeigen
durch Induktion über n, daß der Körper Ki = K(s1 , . . . , si ) endlich über K ist. Für i = 1 ist dies
klar. Angenommen, i > 1 und [Ki−1 : K] < ∞. Nach Annahme ist si algebraisch über K, also
erst recht über Ki−1 . Es folgt mit dem Gradsatz: [Ki : K] = [Ki : Ki−1 ] · [Ki−1 : K] < ∞. Mit
L = Kn hat man die Behauptung.
Satz 11.14 — Die folgenden Aussagen über eine Erweiterung L/K sind äquivalent:
(1) L ist algebraisch über K.
(2) L wird von Elementen erzeugt, die algebraisch über K sind.
(3) Jede endliche Menge S ⊂ L liegt in einem Zwischenkörper M von endlichem Grad über
K.
Beweis. 1 ⇒ 2: Trivial.
2 ⇒ 3: Es sei T ein Erzeugendensystem von L über K aus algebraischen Elementen und S ⊂ L eine
endliche Teilmenge. Zu jedem Element s ∈ S gibt es eine endliche Menge Ts ⊂ T mit s ∈ K(Ts ).
Es sei T ′ die Vereinigung aller Ts . Dann ist M = K(T ′ ) ein von endlich vielen algebraischen
Elementen erzeugter Zwischenkörper und nach Satz 11.13 algebraisch über K von endlichem Grad.
91
3 ⇒ 1: Jedes Element a ∈ L liegt in einem Zwischenkörper von endlichem Grad über K und ist
deshalb nach Satz 11.13 algebraisch über K.
Eine unmittelbare Folgerung des Satzes ist die folgende: Ist L/K eine Körpererweiterung, so ist
die Menge aller Elemente in L, die algebraisch über K sind, ein Zwischenkörper.
Definition 11.15. — 1. Es sei L/K eine Körpererweiterung. Der Zwischenkörper aller Elemente in
L, die algebraisch über K sind, heißt algebraischer Abschluß von K in L.
2. Der algebraische Abschluß von Q in C wird mit Q bezeichnet und heißt der Körper der algebraischen Zahlen.
Satz 11.16 — Es sei L/K eine algebraische und M/L eine beliebige Körpererweiterung. Ein Element a ∈ M ist genau dann algebraisch über L, wenn a algebraisch über K ist.
Beweis. Wenn a algebraisch über K ist, ist es trivialerweise auch algebraisch über L. Es sei also
umgekehrt a algebraisch über L und f = X n + fn−1 X n−1 + . . . + f0 das Minimalpolynom. Dann
ist der von den Koeffizienten von f erzeugte Zwischenkörper L′ := K(f0 , . . . , fn−1 ) ⊂ L nach
Satz 11.13 endlich über K, und nach Konstruktion ist a algebraisch über L′ . Daher ist [L′ (a) : K] =
[L′ (a) : L′ ][L′ : K] < ∞ und somit a algebraisch über K.
Man kann diesen Satz auch so ausdrücken, daß die Eigenschaft, eine algebraische Erweiterung
zu sein, transitiv ist:
Folgerung 11.17 — Sind M/L/K Körpererweiterungen, so ist M/K genau dann algebraisch,
wenn M/L und L/K algebraisch sind.
11.3. Nullstellen und algebraisch abgeschlossene Körper. Im letzten Abschnitt sind wir analytisch vorgegangen: Die Körpererweiterung K → L war gegeben, und zu einem algebraischen Element a ∈ L haben wir das zugehörige Minimalpolynom betrachtet. In diesem Abschnitt gehen wir
den umgekehrten synthetischen Weg: Wir starten mit einem Körper K und einem irreduziblen Polynom f ∈ K[X] und konstruieren eine Erweiterung K → L, in der f eine Nullstelle besitzt. Indem
wir diesen Weg zu Ende gegen, können wir zu jedem Körper K eine algebraisch abgeschlossene
Erweiterung K konstruieren.
Es sei i : K → L eine Körpererweiterung. Diese Abbildung erweitert sich zu einer Inklusion
von Polynomringen i′ : K[X] → L[X] durch i′ |K = i und i′ (X) = X. Solange keine Gefahr
von Mehrdeutigkeiten besteht, schreiben wir wieder f statt i′ (f ) für Polynome f ∈ K[X]. Ein
Polynom f ∈ K[X] kann in L Nullstellen bekommen oder über L in Faktoren zerfallen, die es über
K noch nicht gab. Zum Beispiel ist X 4 + 1 ∈ Q[X] irreduzibel, besitzt aber über R bzw. C die
Faktorisierungen
X4 + 1
=
=
(X 2 +
√
2X + 1)(X 2 −
3
√
2X + 1)
5
(X − ε)(X − ε )(X − ε )(X − ε7 )
mit der primitiven 8-ten Einheitswurzel ε = exp(2πi/8).
Satz 11.18 (Kronecker) — Es sei K ein Körper und f ∈ K[X] ein irreduzibles normiertes Polynom
vom Grad n. Dann ist M := K[X]/(f ) eine Körpererweiterung von K vom Grad n. Die Restklasse
X ∈ M von X ist eine Nullstelle von f .
Beweis. Weil f ein irreduzibles Polynom ist, ist das von f erzeugte Hauptideal (f ) ein maximales
Ideal und deshalb K[X]/(f ) ein Körper. Daß f (X) ≡ 0 mod (f ), kann man auch so lesen, daß für
die Restklasse X := X mod (f ) gilt: f (X̄) = 0.
92
Man beachte, daß man — mit den Bezeichnungen des Satzes — zu jedem Element 0 6= ḡ =
n−1
g0 +g1 X +. . .+gn−1 X
∈ M mit dem euklidischen Algorithmus ein Inverses explizit berechnen
kann: Da f irreduzibel ist, sind f und g = g0 + g1 X + . . . + gn−1 X n−1 in K[X] teilerfremd.
Man bestimmt dann mit dem euklidischen Algorithmus Polynome α und β mit 1 = αf + βg. Die
Restklasse von β in M ist ein Inverses zu ḡ.
Folgerung 11.19 — Es seien K ein Körper und f1 , . . . , fn ∈ K[X] \ {0} Polynome. Dann gibt es
eine Körpererweiterung L/K derart, daß alle fi über L in Linearfaktoren zerfallen.
Beweis. Man kann sich sofort auf den Fall n = 1 zurückziehen, indem man die Polynome durch
ihr Produkt ersetzt. Es sei also f ein nichttriviales Polynom. Wir argumentieren mit Induktion über
den Grad von f . Falls f den Grad 0 oder 1 hat, kann man L = K wählen. Andernfalls sei g|f ein
irreduzibler normierter Faktor. Der Satz 11.18 garantiert die Existenz einer Erweiterung K → M
und eines Elements β1 ∈ M mit g(β1 ) = 0. Es sei h := f /(X − β1 ) ∈ M [X]. Da grad(h) <
grad(f ), folgt induktiv die Existenz einer Erweiterung M → L derart, daß h in L[X] in Linearfaktoren zerfällt: h = c(X − β2 ) · · · (X − βℓ ) mit βi ∈ M und c ∈ K. Damit hat man auch
f = c(X − β1 ) · · · (X − βℓ ).
Definition 11.20. — Ein Körper K heißt algebraisch abgeschlossen, wenn die folgenden äquivalenten Bedingungen erfüllt sind:
(1) Jedes nichtkonstante Polynome f ∈ K[X] besitzt eine Nullstelle in K.
(2) Jedes nichtkonstante Polynom f ∈ K[X] zerfällt in ein Produkt aus Linearfaktoren.
(3) Jedes irreduzible Polynom f ∈ K[X] hat Grad 1.
Der Beweis der Äquivalenz der Bedingungen ist einfach.
Satz 11.21 (Fundamentalsatz der Algebra) — C ist algebraisch abgeschlossen.
Da der Körper C als Erweiterung von R definiert ist und die Konstruktion von R analytische
Elemente enthält, nämlich die Vervollständigung von Q bezüglich des Betrages, kommt man nicht
ganz ohne analytische Hilfsaussagen aus. Man kann sie im Kern auf das folgende Lemma reduzieren:
Lemma 11.22 — Jedes Polynom in R[X] von ungeradem Grad hat in R eine Nullstelle. Für jede
positive reelle Zahl a hat X 2 − a eine positive Nullstelle in R.
Beweis. Zwischenwertsatz.
Aus der zweiten Aussage des Lemmas ergibt sich zunächst:
Lemma 11.23 — Jedes quadratische Polynom in C[X] hat in C eine Nullstelle.
Beweis. Durch quadratische Ergänzung führt man das Problem auf die Aussage zurück, daß jede
komplexe Zahl eine komplexe Quadratwurzel besitzt. Ist nun a + bi 6= 0 vorgegeben, so führt der
Ansatz (x + iy)2 = (a + bi) auf die Gleichungen
p
(11.13)
x2 + y 2 = a2 + b2 , x 2 − y 2 = a
mit den Lösungen
(11.14)
r p
1
x=±
a + a2 + b2 ,
2
r p
1
y=±
−a + a2 + b2 .
2
Dabei sind die Vorzeichen so zu wählen, daß 2xy = b.
Beweis des Hauptsatzes der Algebra. Es genügt zu zeigen, daß jedes nichtkonstante reelle Polynom
in C eine Nullstelle besitzt. Denn ist f ein beliebiges komplexes Polynom, so ist g = f f reell, und
ist α eine Nullstelle von g, so ist entweder α oder α eine Nullstelle von f .
93
Es sei nun ein normiertes Polynom f ∈ R[X] vom Grad n vorgelegt. Wir schreiben n = 2m u
mit einer ungeraden Zahl u und einem Exponenten m ∈ N0 . Wir führen den Beweis durch Induktion
über m. Der Induktionsanfang m = 0 ist gerade der Fall eines Polynoms von ungeradem Grad n = u
und wird durch den Zwischenwertsatz erledigt.
′
Es sei also m ≥ 1 und die Behauptung für alle Polynome vom Grad 2m u′ mit m′ < m schon
gezeigt. Wir wählen eine algebraische Erweiterung R ⊂ C ⊂ L so, daß f über L in Linearfaktoren
Q
zerfällt, f = n
i=1 (X −xi ). Wir betrachten für einen noch näher zu bestimmenden Parameter t ∈ R
und für jedes Paar von Indizes 1 ≤ i < j ≤ n die Elemente cij = xi + xj + txi xj , sowie das
Polynom
Y
(X − cij ).
(11.15)
Ft :=
i<j
Offensichtlich ist Ft symmetrisch unter Permutation der xi . Die Koeffizienten von Ft lassen sich
nach dem Hauptsatz über symmetrische Polynome polynomiell durch t und die Koeffizienten von f
ausdrücken, sind also insbesondere reell. Das Polynom Ft ∈ R[X] hat den Grad
!
n
(11.16)
deg(Ft ) =
= 2m−1 u(2m u − 1) = 2m−1 u′ mit ungeradem u′ .
2
Nach Induktionsannahme ist eine der Nullstellen cij von Ft komplex, d.h. es gibt ein von der Wahl
von t abhängiges Paar (i(t), j(t)) mit u(t) := xi(t) + xj(t) + txi(t) xj(t) ∈ C. Da es mehr reelle Zahlen als Paare (i, j) gibt, gibt es zwei verschiedene reelle Parameter s, t mit (i(s), j(s)) =
(i(t), j(t)) =: (i, j). Wir haben also erreicht, daß
(11.17)
(xi + xj ) + sxi xj = u(s) ∈ C,
(xi + xj ) + txi xj = u(t) ∈ C.
Dieses lineare Gleichungssystem für xi + xj und xi xj hat eine eindeutige Lösung, weil die Determinante gleich t − s 6= 0 ist. Deshalb gilt
(11.18)
xi + xj ,
xi xj ∈ C.
Damit sind xi und xj die beiden Lösungen einer quadratischen Gleichung mit komplexen Koeffizienten. Wir wissen, daß diese quadratische Gleichung komplexe Lösungen besitzt.
Definition 11.24. — Es sei K ein Körper und F ⊂ K[X] eine Menge von nichttrivialen Polynomen.
Eine Erweiterung L/K heißt Zerfällungskörper von F , wenn
(1) jedes Polynom f ∈ F über L in Linearfaktoren zerfällt und
(2) L von den Nullstellen der Polynome in F erzeugt wird.
Nach Folgerung 11.19 gibt es für jede endliche Menge von Polynomen einen Zerfällungskörper.
Wir wollen dieselbe Aussage für beliebige Mengen zeigen:
Satz 11.25 (Existenz von Zerfällungskörpern) — Für jede Menge F ⊂ K[X] von nichttrivialen
Polynomen gibt es einen Zerfällungskörper.
Beweis. Wir geben uns die Menge F = {f (i) }i∈I von Polynomen vom Grad ni = deg(f (i) ) vor.
Ohne Einschränkung kann man davon ausgehen, daß alle Polynome normiert sind. Wir schreiben
dann
(i)
(i)
.
f (i) = X ni + f1 X ni −1 + . . . + fni −1 X + fn(i)
i
Wir führen für jedes Polynom f (i) Unbestimmte Xi1 , . . . , Xini ein und betrachten den von allen
diesen Unbestimmten erzeugten Polynomring
R = K[{Xij }i∈I,j=1,...,ni ].
Es sei
(i)
gij := σj (Xi1 , . . . , Xini ) − fj ,
i ∈ I, j = 1, . . . , ni ,
94
wo σj das j-te elementarsymmetrische Polynom bezeichnet, und
a = ({gij }i∈I,j=1,...,ni ) ⊂ R
das von allen gij erzeugte Ideal. Über dem Faktorring R/a sind die Restklassen der gij = 0, und
gemäß den Formeln von Viète hat man in (R/a)[X] die Faktorisierungen
(X − Xi1 ) · · · (X − Xini ) = f (i) (X).
Diese Aussage wäre trivial, wenn R/a der Nullring wäre. Wir zeigen daher zunächst: a ( R.
Andernfalls hätte man 1 ∈ a, d.h. es gäbe eine endliche Menge I0 ⊂ I und gewisse λij ∈ R mit
(11.19)
1=
ni
XX
λij gij
i∈I0 j=1
Nach Folgerung 11.19 gibt es einen Erweiterungskörper a : K → M mit der Eigenschaft, daß alle
f (i) , i ∈ I0 , in M [X] in Linearfaktoren zerfallen, etwa
f (i) = (X − µi1 ) · · · (X − µini ),
µij ∈ M.
Nach der universellen Eigenschaft des Polynomrings gibt es genau einen Ringhomomorphismus
Φ : R → M mit den Eigenschaften Φ|K = a und Φ(Xij ) = µij für i ∈ I0 und Φ(Xij ) = 0
für i ∈ I \ I0 . Weil f (i) für i ∈ I0 in M [X] in Linearfaktoren mit den Nullstellen µij faktorisiert,
verschwinden die Bilder aller gij , i ∈ I0 , unter Φ. Angewendet auf die Identität 11.19 liefert Φ
deshalb den Widerspruch
X
1=
Φ(λij )Φ(gij ) = 0.
i∈I0
Somit ist gezeigt, daß a ⊂ R ein echtes Ideal ist.
Mit transfiniter Induktion sieht man nun, daß es ein maximales Ideal m ⊂ R mit a ⊂ m gibt. Über
dem Restklassenkörper K ′ := R/m zerfallen alle f (i) , i ∈ I, in Linearfaktoren, deren Nullstellen
die Restklassen der Unbestimmten Xij sind. Weil K ′ von diesen Restklassen als Erweiterung von
K erzeugt wird, ist K ′ ein Zerfällungskörper der Menge F .
Definition 11.26. — Eine Erweiterung K → K ist ein algebraischer Abschluß von K, wenn K
algebraisch abgeschlossen und algebraisch über K ist.
Zum Beispiel ist C algebraisch abgeschlossen, aber nicht der algebraische Abschluß von Q.
Wendet man Satz 11.25 auf die Menge aller normierten Polynome in K[X] an, erhält man die
Existenz eines algebraischen Abschlusses:
Satz 11.27 — Jeder Körper K besitzt einen algebraischen Abschluß.
11.4. Fortsetzungen von Einbettungen.
Zu jeder Körpererweiterung ψ : K → L gehört ein injektiver Ringhomomorphismus
ψ : K[X] → L[X]
mit
ψ : f = fn X n + . . . + f1 X + f0
7→
ψ(f ) = ψ(fn )X n + . . . + ψ(f1 )X + ψ(f0 ).
Verschiedene Einbettungen ψ : K → L derselben Körper K und L geben notwendigerweise auch
verschiedene Abbildungen der Polynomringe. Solange aber keine Mißverständnisse zu erwarten
sind, schreiben wir weiter f statt ψ(f ), so als wäre ψ einfach eine Inklusion, um die Bezeichnungen
lesbar zu halten.
95
Definition 11.28. — Es seien i : K → K ′ und ψ : K → L Körpererweiterungen. Eine Fortsetzung
von ψ auf K ′ ist ein Ringhomomorphismus ψ ′ : K ′ → L mit ψ ′ ◦ i = ψ. Jede solche Fortsetzung ist
K-linear. Umgekehrt ist jeder K-lineare Homomorphismus von Ringen K ′ → L eine Fortsetzung
von ψ.
′
ψ
KO ′ _ _ _/> L
i
K
}
}}
}}ψ
}
}}
Satz 11.29 — Es sei K(a)/K eine einfache algebraische Erweiterung mit Minimalpolynom f =
minpola/K . Jede Fortsetzung einer gegebenen Einbettung ψ : K → L auf K(a) bildet a auf
eine Nullstelle von ψ(f ) in L ab. Umgekehrt gibt es zu jeder Nullstelle β von ψ(f ) in L genau
eine Fortsetzung ψ ′ : K(a) → L mit ψ ′ (a) = β. Insbesondere ist die Anzahl der verschiedenen
Fortsetzungen von ψ genau die Anzahl der verschiedenen Nullstellen von f in L.
Beweis. Da f (a) = 0, ist zunächst klar, daß jede Fortsetzung ψ ′ : K(a) → L das Element a auf
eine Nullstelle von ψ(f ) in L abbilden muß: 0 = ψ ′ (f (a)) = ψ(f )(ψ(a)). Und da K(a) von a
erzeugt ist, liegt ψ ′ durch den Wert auf a fest.
Es sei nun umgekehrt eine Nullstelle β ∈ L von ψ(f ) vorgegeben. Es ist K(a) = K[X]/(f ).
Wegen der universellen Eigenschaft des Polynomrings gibt es genau einen Homomorphismus
ψ̃ : K[X] → L mit X 7→ β, der die Erweiterung ψ : K → L fortsetzt. Dabei geht f auf
ψ̃(f (X)) = ψ(f )(ψ̃(X)) = ψ(f )(β) = 0. Insbesondere faktorisiert ψ̃ nach der universellen Eigenschaft des Restklassenrings über einen Homomorphismus ψ ′ : K(a) = K[X]/(f ) → L.
Satz 11.30 (Existenz von Fortsetzungen) — Es sei L/K eine algebraische Erweiterung. Dann läßt
sich jede Einbettung j : K → M in einen algebraisch abgeschlossenen Körper M zu einer Einbettung i : L → M fortsetzen.
Beweis. Wir betrachten die Menge X = {(L′ , i′ )} aller Paare aus einem Zwischenkörper L′ , K ⊂
L′ ⊂ L, und einer Einbettung i′ : L′ → M mit i′ |K = j. Dann enthält X wenigstens das Element
(K, j) und ist deshalb nicht leer. Die Menge X ist halbgeordnet durch die Relation
(11.20)
(L′ , i′ ) ≤ (L′′ , i′′ ) :⇔ L′ ⊂ L′′ und i′′ |L′ = i′ .
S
Ist nun Y ⊂ X eine Kette, so setzen wir LY := L′ ∈Y L′ und definieren iY : LY → M durch
iY |L′ := i′ . Dann liegt das Paar (LY , iY ) wieder in X und ist nach Konstruktion eine obere Schranke von Y . Mit anderen Worten: (X, ≤) ist induktiv geordnet. Nach dem Zornschen Lemma existiert
in X ein maximales Element (L0 , i0 ).
Angenommen, die Inklusion L0 ⊂ L ist echt. Jedes Element a ∈ L \ L0 ist algebraisch über K,
also erst recht über L0 . Das Minimalpolynom g von a über L0 besitzt in M eine Nullstelle, weil M
algebraisch abgeschlossen ist. Folglich gibt es eine Fortsetzung i′0 : L0 (a) → M von i0 . Das Paar
(L0 (a), i′0 ) widerspräche der Maximalität von (L0 , i0 ). Daher gilt in der Tat L0 = L, und i := i0
ist eine Fortsetzung von j, wie verlangt.
Satz 11.31 (Eindeutigkeit des Zerfällungskörpers) — Es seien i1 : K → L1 und i2 : K → L2 zwei
Zerfällungskörper einer Menge F von nichttrivialen Polynomen in K[X].
(1) Es gibt einen K-linearen Ringhomomorphismus a : L1 → L2 .
(2) Ist L2 ⊂ M irgendeine Körpererweiterung und a : L1 → M ein K-linearer Ringhomomorphismus, so gilt a(L1 ) = L2
Insbesondere sind alle Zerfällungskörper von F isomorph.
96
Beweis. Es gibt immer eine K-lineare Einbettung von L1 in einen algebraischen Abschluß von L2 .
Deshalb ist die erste Behauptung des Satzes eine Konsequenz der zweiten, und es genügt, diese zu
zeigen:
Es sei f ∈ F und es seien α1 , . . . , αn die Nullstellen von f in L1 und β1 , . . . , βn die Nullstellen
von f in L2 und damit in M . Deshalb gilt:
(X − a(α1 )) · · · (X − a(αn )) = i2 (f )(X) = (X − β1 ) · · · (X − βn ).
Bis auf die Reihenfolge stimmten die Bilder a(αi ) mit den βi überein. Weil L1 von den Nullstellen
aller Polynome aus F erzeugt wird, folgt daraus zum Einen, daß a(L1 ) in L2 liegt, und weil L2
von den Nullstellen der Polynome von F erzeugt wird und diese im Bild von a liegen, folgt zum
Anderen, daß a(L1 ) = L2 .
Weil der algebraische Abschluß eines Körpers als Zerfällungskörper beschrieben werden kann,
erhält aus dem vorigen Satz sofort:
Satz 11.32 (Eindeutigkeit des algebraischen Abschlusses) — Es seien K → K ′ und K → K ′′ algebraische Abschlüsse. Dann gibt es eine K-lineare Einbettung K ′ → K ′′ , und jede solche Einbettung
ist ein Isomorphismus.
11.5. Endliche Körper.
Satz 11.33 — Es sei p eine Primzahl, K ein Körper der Charakteristik p, und F : K → K der
Frobeniushomomorphismus. Falls K endlich oder algebraisch abgeschlossen ist, ist F surjektiv.
Beweis. In jedem Falle ist F injektiv. Injektive Abbildungen einer endlichen Menge in sich selbst
sind stets auch surjektiv. Das erledigt die Behauptung für endliche Körper. Falls K algebraisch abgeschlossen ist, hat die Gleichung X p − a = 0 für jedes a ∈ K eine Lösung, etwa β ∈ K. Es folgt
F (β) = β = a. Also ist F auch in diesem Falle surjektiv.
Satz 11.34 — Es sei p eine Primzahl und Fp ein algebraischer Abschluß von Fp .
(1) Für jedes ℓ ∈ N gibt es in Fp genau einen Unterkörper mit pℓ Elementen. Dieser wird mit
Fpℓ bezeichnet.
(2) Ist K ein endlicher Körper der Charakteristik p und vom Grad ℓ über seinem Primkörper,
∼ Fp ℓ .
so gilt K =
Beweis. Die Frobeniusabbildung F : x 7→ xp ist ein Automorphismus von Fp . Dasselbe gilt dann
für die ℓ-te Potenz F ℓ . Die Menge
ℓ
Fpℓ := {u ∈ Fp | u = F p (u) = up }
der Fixpunkte von F ℓ ist ein Unterkörper von Fp . Nun besteht Fpℓ genau aus den Elementen u mit der
ℓ
ℓ
Eigenschaft up = u, also den Nullstellen des Polynoms f = X p −X. Wegen f ′ = −1 hat f keine
mehrfachen Nullstellen. Da K aber algebraisch abgeschlossen ist und f deshalb in Linearfaktoren
zerfällt, hat f genau pℓ verschiedene Nullstellen. Folglich hat Fpℓ genau pℓ Elemente.
Es sei nun K irgendein endlicher Körper der Charakteristik p und vom Grad ℓ über seinem Primkörper Fp . Nach Satz 11.30 gibt es eine Einbettung ψ : K → Fp . Die Einheitengruppe K × hat die
ℓ
Ordnung pℓ − 1. Für jedes Element x ∈ K × gilt deshalb xp −1 = 1. Insbesondere gilt für jedes
ℓ
Element x ∈ K die Gleichung xp = x. Aber das bedeutet ψ(K) ⊂ Fpℓ . Da die beiden Körper
gleich viele Elemente enthalten, ist ψ : K → Fpℓ ein Isomorphismus.
Folgerung 11.35 — Es sei p eine Primzahl. Zu jeder natürlichen Zahlen n gibt es genau einen
Zwischenkörper Fp ⊂ Fpℓ ⊂ Fp . Dabei gilt
Fp m ⊂ Fp n
⇔
m|n.
97
Beweis. Jede endliche Erweiterung eines endlichen Körpers mit q = pm Elementen vom Grad ℓ
enthält q ℓ = pmℓ Elemente. Das zeigt die Notwendigkeit der Teilbarkeitsrelation. Die Umkehrung
folgt aus der Charakterisierung von Fpn als Fixpunktmenge von F n .
Wir haben schon früher einen Beweis des folgenden Satzes gesehen. Der Beweis hier unterscheidet sich nur in einer Nuance von dem früheren:
Satz 11.36 — Es sei K ein Körper. Jede endliche Untergruppe G ⊂ K × ist zyklisch.
Beweis. G ist abelsch. Wir wissen, daß in endlichen abelschen Gruppen die Ordnung jedes Elements
ein Teiler des Exponenten ex(G) = max{ord(g) | g ∈ G} ist (Satz 7.30). Für die Gruppe G heißt
das, daß alle Gruppenelemente von G Nullstellen des Polynoms X ex(G) −1 sind. Dieses Polynom hat
höchstens ex(G) Nullstellen, d.h. |G| ≤ ex(G). Da trivialerweise auch die umgekehrte Ungleichung
besteht, gilt sogar Gleichheit. Folglich gibt es ein g ∈ G mit ord(g) = |G|, und dieses g erzeugt
G.
Folgerung 11.37 — Ist K ein endlicher Körper, |K| = pℓ , so ist K × zyklisch von der Ordnung
pℓ − 1. Insbesondere gibt es ein Element θ ∈ K mit der Eigenschaft, daß K = Fp (θ). Das Minimalℓ
polynom von θ ist ein Teiler des Polynoms xp −1 − 1 und zerfällt über K in paarweise verschiedene
Linearfaktoren.
Genauer ist θ eine Nullstelle des (pℓ−1 − 1)-ten Kreisteilungspolynoms Φpℓ−1 −1 (cf. Abschnitt
§13). Dieses Polynom ist irreduzibel über Z, zerfällt aber im allgemeinen über Fp .
Beispiel 11.38. — Wir betrachten die Erweiterung F5 ⊂ F25 . Über Z hat man eine Faktorisierung
Q
X 24 − 1 = n|24 Φn mit irreduziblen Faktoren.
Φ1 = X − 1,
Φ3 = X 2 + X + 1,
Φ2 = X + 1,
Φ6 = X 2 − X + 1,
Φ4 = X 2 + 1,
Φ12 = X 4 − X 2 + 1,
Φ8 = X 4 + 1,
Φ24 = X 8 − X 4 + 1.
Ein Element α in F×
25 hat die Ordnung m genau dann, wenn α eine Nullstelle von Φm ist. Die Elemente der Ordnungen 1, 2 und 4 liegen schon in F×
5 . Die entsprechenden zyklotomischen Polynome
zerfallen über F5 in Linearfaktoren:
Φ1 ≡ X + 4,
Φ2 ≡ X + 1,
Φ4 ≡ (X + 2)(X + 3).
Die übrigen zyklotomischen Polynome Φm , m|24, zerfallen über F5 in quadratische Polynome:
Φ3 ≡ X 2 + X + 1
Φ6 ≡ X 2 + 4X + 1
und
Φ24
≡
≡
≡
Φ8 ≡ (X 2 + 2)(X 2 + 3)
Φ12 ≡ (X 2 + 2X + 4)(X 2 + 3X + 4)
X 8 + 4X 4 + 1
(X 4 + 2X 2 + 4)(X 4 + 3X 2 + 4)
(X 2 + 3X + 3)(X 2 + 2X + 3)(X 2 + X + 2)(X 2 + 4X + 2) mod 5.
Die Nullstellen der Polynome Φ3 , Φ6 , Φ12 und Φ24 erzeugen alle den Körper F25 als Erweiterung
von F5 , aber nur die acht Nullstellen von Φ24 erzeugen F×
25 als Gruppe.
98
§12. Galoistheorie
12.1. Separabilität.
Definition 12.1. — Es sei K ein Körper. f ∈ K[X] heißt separabel, wenn f in jeder Erweiterung
von K nur einfache Nullstellen hat, und andernfalls inseparabel.
Es sei L/K eine Körpererweiterung, in der das nichtkonstante Polynom f ∈ K[X] eine Nullstelle α besitzt. Nach dem Kriterium von Hudde ist α genau dann eine mehrfache Nullstelle, wenn
f ′ (α) = 0. In diesem Falle haben f und f ′ in L[X] einen nichtkonstanten Faktor gemeinsamen.
Aber der größte gemeinsame Teiler läßt sich mit dem euklidischen Algorithmus bereits in K[X]
berechnen. Damit erhält man das Kriterium:
Lemma 12.2 — Ein Polynom f ∈ K[X] \ {0} ist genau dann separabel, wenn der größte gemeinsame Teiler von f und f ′ konstant ist.
Satz 12.3 — Es sei f ∈ K[X] ein normiertes irreduzibles Polynom vom Grad n > 0.
(1) Wenn char(K) = 0, ist f separabel.
e
(2) Wenn char(K) = p > 0, so sei e ∈ N0 maximal mit der Eigenschaft, daß f (X) = g(X p )
für ein Polynom g. Dann ist g normiert, irreduzibel und separabel, und f ist genau dann
separabel, wenn e = 0.
Beweis. Es sei f ein normiertes irreduzibles Polynom von positivem Grad. Wenn f und f ′ in einer Erweiterung von K eine gemeinsame Nullstelle haben, müssen sie schon in K[X] einen nicht
konstanten gemeinsamen Teiler haben. Da grad(f ′ ) < grad(f ) und da f irreduzibel, ist dies nur
möglich, wenn f ′ = 0. In Charakteristik 0 ist dies ausgeschlossen, weil f nicht konstant ist.
Es sei also p = char(K) > 0. Mit dem Ansatz
f = X n + fn−1 X n−1 + . . . + f1 X + f0
(12.1)
folgt aus der Annahme
(12.2)
0 = f ′ = nX n−1 + (n − 1)fn−1 X n−2 + . . . + f1 ,
daß p|k für alle k mit fk 6= 0. Mit m := n/p hat man daher
(12.3)
f = (X p )m + f(m−1)p (X p )m−1 + . . . + fp X p + f0 .
Das bedeutet: f (X) = h(X p ) für ein geeignetes Polynom h. Es ist klar, daß h irreduzibel und
normiert ist. Ist h nicht separabel, hat man h(X) = k(X p ) mit geeignetem Polynom k und so2
mit f (X) = k(X p ). Iteriert man das Argument, so kommt man nach endlich vielen Schritten zu
e
f (X) = g(X p ) mit separablem g ∈ K[X].
Beispiele 12.4. — 1. Es sei p eine Primzahl. Wir betrachten über dem Körper Fp (t) das Polynom
f = X p − t. Nach dem Eisensteinkriterium ist f irreduzibel, denn t ist ein Primelement im faktoriellen Ring Fp [t]. Offensichtlich ist f inseparabel.
2. Das Polynom ist X 7 − 3 ∈ F7 [X] ist nicht einmal irreduzibel: Da 37 ≡ 3 mod 7, gilt
X 7 − 3 = X 7 − 37 = (X − 3)7 .
Definition 12.5. — Es sei L/K eine algebraische Körpererweiterung.
(1) a ∈ L ist separabel über K, wenn das Minimalpolynom von a über K separabel ist, und
andernfalls inseparabel. a ist rein inseparabel, wenn es neben a selbst in keiner Erweiterung
von K ein anderes zu a konjugiertes Element gibt.
(2) L ist separabel über K, wenn alle Elemente von L separabel über K sind, und andernfalls
inseparabel. L ist rein inseparabel über K, wenn alle Elemente von L rein inseparabel über
K sind.
99
Die Definition bringt es sich mit sich, daß ein Element a ∈ K zugleich separabel und rein
inseparabel über K ist, denn das Minimalpolynom X − a hat genau eine Nullstelle. Das klingt auf
den ersten Blick etwas unangenehm, vermeidet aber Fallunterscheidungen in den Formulierungen
späterer Sätze.
Ein Element a ist offenbar genau dann inseparabel über K, wenn das Minimalpolynom die Form
e
e
xp − ap hat.
Definition 12.6. — Ein Körper K heißt vollkommen oder perfekt, wenn jedes normierte irreduzible
Polynom über K separabel ist, oder dazu äquivalent, wenn jede algebraische Erweiterung von K
separabel ist.
Satz 12.7 (Kriterien für Vollkommenheit) —
(1) Körper der Charakteristik 0 sind vollkommen.
(2) Ein Körper K der Charakteristik p > 0 ist genau dann vollkommen, wenn die Frobeniusabbildung F : K → K, x 7→ xp , surjektiv ist, d.h. wenn jedes Element α ∈ K eine p-te
Wurzel in K besitzt.
Insbesondere sind endliche Körper und algebraisch abgeschlossene Körper vollkommen.
Beweis. Die erste Aussage ist trivial. Zur zweiten: Wenn F nicht surjektiv ist und a ∈ K \ K p ,
K p := F (K), dann ist X p − a ein inseparables irreduzibles Polynom. Es sei umgekehrt F surjektiv.
Angenommen, f ist ein inseparables irreduzibles Polynom. Es gibt dann ein Polynom g = gm X m +
1/p
. . . + g1 X + g0 mit f (X) = g(X p ). Es sei hi := F −1 (gi ) = gi . Mit h = X m + . . . + h1 X + h0
folgt: f (X) = g(X p ) = h(X)p , im Widerspruch zur Irreduzibilität von f .
Satz 12.8 — Es sei K ein endlicher Körper der Charakteristik p. Dann gilt K = Fp (a) mit einem
separablen Element a.
Beweis. Nach Satz 11.36 ist die Einheitengruppe eines endlichen Körpers zyklisch: Bezeichnet ℓ :=
[K : Fp ] den Grad der Erweiterung, so gilt K × ∼
= Z/(pℓ −1). Ist a ein Gruppenerzeuger, so hat man
ℓ
K = {0} ∪ {ai | i = 1, . . . , pℓ − 1}. Außerdem ist a Nullstelle des Polynoms f := X p − X. Da
f ′ = −1, hat f keine mehrfache Nullstellen und somit das Minimalpolynom von a, das ein Teiler
von f ist, auch nicht.
Satz 12.9 (Satz vom primitiven Element) — Es sei L = K(a1 , a2 , . . . , an )/K eine algebraische
Erweiterung mit separablen Elementen a1 ,. . . , an−1 . Dann ist L/K eine einfache Erweiterung, d.h.
es gibt ein Element c ∈ L mit L = K(c). Sind alle Elemente a1 ,. . . ,an separabel, so kann auch c
separabel gewählt werden.
Beweis. Wenn K endlich ist, ist auch L endlich und wird von jedem Erzeuger θ der zyklischen
Einheitengruppe L× erzeugt. Wir können deshalb im Folgenden ohne Einschränkung annehmen, daß
K unendlich viele Elemente hat. Außerdem genügt es, den Fall n = 2 zu betrachten, der allgemeine
Fall folgt induktiv.
Wir betrachten also eine algebraische Erweiterung L = K(a, b)/K und nehmen an, daß a separabel ist. Es sei M eine Erweiterung von L, in der die Minimalpolynome f von a bzw. g von b in
Linearfaktoren zerfallen. Wir bezeichnen mit a1 = a, a2 , . . . , an und b1 = b, b2 , . . . , bℓ die paarweise verschiedenen Nullstellen von f bzw. g und betrachten für ein noch näher zu bestimmendes
t ∈ K × das Element c := at + b ∈ L. Dann haben die Polynome f (X) und g(c − tX) die gemeinsame Nullstelle a. Die weiteren Nullstellen von f (X) sind a2 , . . . , an , die weiteren Nullstellen von
g(c − tX) die Elemente a + (b − bj )/t. Wir wählen jetzt t so, daß (ai − a)t 6= b − bj für alle i > 1
und alle j. Dies ist möglich, weil |K| = ∞ und weil durch diese Bedingung nur endlich viele Werte
von t ausgeschlossen sind.
100
Galoistheorie
Nun ist der größte gemeinsame Teiler von f (X) und g(c−tX) in K(c)[X] genau X −a. Deshalb
läßt sich X − a als Linearkombination von f (X) und g(c − tX) mit Koeffizienten in K(c)[X]
schreiben. Insbesondere liegt a in K(c), und damit auch b = c − at. Das zeigt: K(a, b) ⊂ K(c).
Die umgekehrte Inklusion ist trivial.
Wir nehmen jetzt an, sowohl a als auch b seien separabel. Dann kann man t auch noch so wählen,
daß (ai − ai′ )t 6= bj − bj ′ falls i 6= i′ oder j 6= j ′ . Dann sind alle Elemente cij = ai + tbj paarweise
verschieden. Das Polynom
YY
(X − cij )
(12.4)
h(X) =
i
j
ist symmetrisch unter Permutation der ai untereinander und der bj untereinander. Nach dem Hauptsatz über symmetrische Polynome lassen sich die Koeffizienten von h polynomiell durch die Koeffizienten von f und g ausdrücken und liegen deshalb in K. Deshalb ist das Minimalpolynom von c
ein Teiler von h. Nach Konstruktion sind die Nullstellen von h paarweise verschieden. Deshalb ist
das Minimalpolynom von c separabel.
Definition 12.10. — Es sei L/K eine endliche Erweiterung und K → K ein algebraischer Abschluß. Weil alle algebraischen Abschlüsse von K isomorph sind, hängt die Anzahl der Fortsetzungen L → K nicht von der Wahl von K ab. Diese Zahl heißt der Separabilitätsgrad von L/K und
wird mit [L : K]s bezeichnet.
Satz 12.11 — Es sei L = K(α)/K eine einfache algebraische Erweiterung.
(1) Wenn char(K) = 0, ist [L : K] = [L : K]s .
(2) Wenn char(K) = p > 0, so ist [L : K] = pe [L : K]s , wobei e ∈ N0 maximal mit der
e
Eigenschaft ist, daß das Minimalpolynom von α die Form g(X p ) hat.
Beweis. Es sei f das Minimalpolynom von α über K und n = [L : K] = grad(f ). Wenn α
separabel ist, hat das Minimalpolynom n verschiedene Nullstellen in K. Deshalb gilt in diesem Falle
[L : K]s = n. Wenn α nicht separabel ist, hat K positive Charakteristik p. Mit e und g wie im
e
e
Satz gilt also f (X) = g(X p ), und g ist das Minimalpolynom von αp . Mit m = grad(g) gilt
e
n = mpe , und da g separabel ist, gibt es m verschiedene Fortsetzungen ϕi : K(αp ) → K. Das
e
e
e
Minimalpolynom von α über K(αp ) ist X p − αp . Es hat in K genau eine Nullstelle. Deshalb
setzt sich jedes ϕi eindeutig auf K(α) fort. Darum ist [L : K]s = m = n/pe .
Satz 12.12 — Es seien M/L/K endliche Erweiterungen. Dann gilt
(12.5)
[M : K]s = [M : L]s [L : K]s .
Beweis. Es sei ein algebraischer Abschluß K → K gewählt. Es bezeichne FM/K die Menge der
Fortsetzungen auf M und FL/K die Menge der Fortsetzungen auf L. Die Einschränkung ψ 7→ ψ|L
definiert eine Abbildung E : FM/K → FL/K . Da sich jede Fortsetzung auf L zu einer Fortsetzung auf M fortsetzen läßt, ist E surjektiv. Es sei sei nun eine Fortsetzung ϕ : L → K fixiert.
Alle Elemente in K sind algebraisch über K, also erst recht über L, und da K algebraisch abgeschlossen ist, ist K auch ein algebraischer Abschluß von L. Nach Definition gibt es genau [M : L]s
verschiedene Fortsetzungen von ϕ auf M . Mit anderen Worten: |E −1 (ϕ)| = [M : L]s . Es folgt:
P
[M : K]s = |FM/K | = ϕ∈FL/K [M : L]s = [M : L]s [L : K]s .
Satz 12.13 — Für jede endliche Erweiterung L/K ist [L : K]s ein Teiler von [L : K]. Die folgenden Aussagen sind äquivalent:
(1) [L : K]s = [L : K].
(2) L/K ist separabel.
(3) L wird von separablen Elementen erzeugt.
101
(4) L = K(a) für ein separables Element a.
Beweis. Wir wählen a ∈ L\K und betrachten die Erweiterungen K → K(a) → L. Nach den Sätzen
12.11 und 12.12 und durch Induktion über den Grad ergibt sich zunächst die Teilbarkeitsrelation
(12.6)
[L : K]s = [L : K(a)]s [K(a) : K]s | [L : K(a)][K(a) : K] = [L : K]
und damit die erste Behauptung.
1 ⇒ 2: Wenn die äußeren Terme gleich sind, so muß auch [K(a) : K]s = [K(a) : K] gelten, d.h. a
ist separabel. Die Implikation 2 ⇒ 3 ist trivial.
3 ⇒ 4: Es seien a1 , . . . an separable Elemente mit L = K(a1 , . . . , an ). Gemäß dem Satz vom
primitiven Element 12.9 gibt es ein separables a ∈ L mit L = K(a).
4 ⇒ 1: Ist schließlich L = K(a) für ein separables Element, so gilt [L : K]s = [L : K] nach Satz
12.11.
Satz 12.14 — Es seien M/L/K algebraische Erweiterungen.
(1) L/K ist genau dann separabel, wenn L als K-Erweiterung von separablen Elementen erzeugt wird.
(2) M/K ist genau dann separabel, wenn L/K und M/L separabel sind.
Beweis. Es sei S ⊂ L ein Erzeugendensystem aus separablen Elementen und a ∈ L ein beliebiges
Element. Dann gibt es eine endliche Teilmenge S ′ ⊂ S mit a ∈ K(S ′ ) ⊂ L. Nach Konstruktion
ist [K(S ′ ) : K] < ∞, und nach Satz 12.13 folgt, daß alle Elemente in K(S ′ ) separabel über K
sind.
Satz 12.15 — Es sei L/K eine algebraische Körpererweiterung. Die folgenden Aussagen sind äquivalent:
(1)
(2)
(3)
(4)
Jedes über K separable Element von L liegt in K.
L/K ist rein inseparabel.
L wird als Erweiterung von K von rein inseparablen Elementen erzeugt.
[L : K]s = 1.
Beweis. Falls K = L, ist der Satz aus trivialen Gründen richtig. Wir nehmen also an, daß [L : K] >
1. Zunächst gilt 1 ⇒ 2: Es sei a ∈ L \ K mit Minimalpolynom f . Nach Annahme ist a inseparabel
über K. Deshalb ist p = char(K) > 0 und es gibt ein e > 0 und ein separables Polynom g mit
e
e
f (X) = g(X p ). Nun ist ap separabel über K und liegt deshalb schon selbst in K, d.h. g ist linear
und somit a rein inseparabel.
Die Implikation 2 ⇒ 3 ist trivial.
3 ⇒ 4: Es sei L = K(S) mit einer Menge S von rein inseparablen Elementen. Sind f1 , f2 : L → K
verschiedene Einbettungen, so muß es ein α ∈ S mit f1 (α) 6= f2 (α) geben. Aber f1 (α) und f2 (α)
sind Nullstellen des Minimalpolynoms von α in K, also gleich. Widerspruch.
4 ⇒ 1: Es sei a ∈ L über K separabel. Da sich jede Einbettung K(a) → K auf L fortsetzen läßt,
hat man [L : K]s ≥ [K(a) : K] > 1, im Widerspruch zur Annahme.
Satz 12.16 — Es sei L/K eine algebraische Erweiterung. Dann gibt es genau einen Zwischenkörper
M ⊂ L mit der Eigenschaft, daß M/K separabel und L/M rein inseparabel ist.
Beweis. Es sei M ⊂ L die Menge aller über K separablen Elemente. Nach Satz 12.14 besteht K(M )
nur aus separablen Elementen, ist also gleich M . Es sei nun a ∈ L\M mit Minimalpolynom f (X) =
e
e
g(X p ) und separablem g. Dann ist b := ap separabel über M und deshalb nach Satz 12.14 auch
e
separabel über K. Nach Konstruktion liegt b schon in M , und f hat die Form f (X) = X p − b. Das
zeigt, daß a rein inseparabel über M ist.
102
Galoistheorie
Definition 12.17. — Der Zwischenkörper M im vorstehenden Satz heißt die separable Hülle von
K in L. Die separable Hülle von K in einem algebraischen Abschluß K heißt separabler Abschluß
von K und wird mit K s bezeichnet. In der üblichen Weise zeigt man, daß der separable Abschluß
bis auf (nicht eindeutigen) Isomorphismus eindeutig ist.
12.2. Normale Erweiterungen und Zerfällungskörper.
(1) L/K ist normal, wenn jedes irreduzible Polynom f ∈ K[X], das in L wenigstens eine
Nullstelle besitzt, über L vollständig in Linearfaktoren zerfällt.
(2) L/K ist Zerfällungskörper einer Menge F ⊂ K[X] von Polynomen, wenn jedes f ∈ F
über L vollständig in Linearfaktoren zerfällt und wenn L von den Nullstellen der Polynome
f ∈ F erzeugt wird.
Satz 12.19 (Normalitätskriterium) — Die folgenden Aussagen über eine algebraische Erweiterung
L/K sind äquivalent:
(1) L/K ist normal.
(2) L/K ist Zerfällungskörper einer Menge F ⊂ K[X].
(3) Jede K-lineare Einbettung σ : L → L in einen algebraischen Abschluß L von L bildet L
in sich ab.
In diesem Falle ist jede Abbildung σ : L → L wie in Aussage 3 ein Isomorphismus.
Beweis. 1 ⇒ 2. Es sei S ⊂ L ein Erzeugendensystem von L/K und F die Menge der Minimalpolynome der Elemente aus S. Dann hat jedes Polynom aus F nach Konstruktion eine Nullstelle in L
und zerfällt nach Annahme über L vollständig in Linearfaktoren. Außerdem sind die Nullstellen der
Polynome f ∈ F ein Erzeugendensystem. Nach Definition ist L/K ein Zerfällungskörper von F .
2 ⇒ 3. Es sei ein algebraischer Abschluß j : L → L gewählt und σ : L → L eine K-lineare
Fortsetzung:
j4 L
j j ?
j j
j
j
j j
j j
L `@
L
@@
~>
~
@@
~
@@
~~
~~
σ
K
Dann bildet σ jede Nullstelle eines Polynoms f in eine ebensolche Nullstelle ab. Alle diese Nullstellen liegen in L. Deshalb liegen die Bilder aller Nullstellen aller f ∈ F wieder in L. Da L außerdem
von diesen Nullstellen erzeugt wird, gilt σ(L) ⊂ L.
3 ⇒ 1: Es sei a ∈ L und b ∈ L eine Nullstelle des Minimalpolynoms von a. Dann gibt es eine Klineare Einbettung ψ : K(a) → L mit ψ(a) = b. Wir setzen diese zu einer Einbettung σ : L → L
fort. Nach Annahme gilt σ(L) ⊂ L, also erst recht b = σ(a) ∈ L. Das zeigt, daß L normal ist.
Die Schlußbehauptung folgt aus dem Eindeutigkeitssatz 11.31 für Zerfällungskörper.
Satz 12.20 (Normale Hülle) — Es sei L/K eine algebraische Erweiterung. Dann gibt es eine algebraische Erweiterung N/L mit der Eigenschaft, daß N/K normal ist und daß N der kleinste
Zwischenkörper von L/L mit dieser Eigenschaft ist. Wenn L/K eine endliche Erweiterung ist, so
ist auch N/K endlich. N/L heißt normale Hülle von L/K.
Beweis. Es sei L → L ein algebraischer Abschluß, S ⊂ L ein Erzeugendensystem von L/K und
F = {minpolα/K | α ∈ S} ⊂ K[X]. Es sei N ⊂ L der von allen Nullstellen der Polynome f ∈ F
erzeugte Körper. Dann ist N normal über K und enthält L und ist der kleinste Unterkörper in L
103
mit diesen beiden Eigenschaften. Wenn L/K eine endliche Erweiterung ist, kann S endlich gewählt
werden. Es folgt |F | < ∞ und [N : K] < ∞.
Wie üblich zeigt man, daß die normale Hülle N/L einer algebraischen Erweiterung L/K bis auf
(nicht eindeutigen) L-linearen Isomorphismus eindeutig ist.
Beispiel 12.21. — Ist ein Polynom f ∈ K[X] vorgegeben, läßt sich der Grad des Zerfällungskörpers nur durch eine Einzeluntersuchung angeben, wie die beiden folgenden Beispiele zeigen. Wir
betrachten die ähnlich aussehenden Polynome f = X 6 − 3 und g = X 6 + 3 in Q[X]. Nach dem
Eisensteinkriterium sind beide irreduzibel.
√
1. Es sei L = Q(α) mit α = 6 3. In L[X] zerfällt f in vier Faktoren:
(12.7)
X 6 − 3 = (X − α)(X + α)(X 2 + αX + α2 )(X 2 − αX + α2 ).
Die beiden quadratischen Faktoren können über L nicht weiter zerfallen, weil die Gleichung f = 0
die Lösungen αρk , k = 0, . . . , 5 mit ρ = exp(2πi/6) hat, von denen nur α und −α = αρ3 reell
sind. Adjungiert man an L eine Nullstelle β von X 2 − αX + α2 , etwa M := L(β), so zerfällt dieses
quadratische Polynom in die Faktoren (X − β)(X − α + β), aber auch das andere zerfällt und man
erhält insgesamt die Zerlegung
(12.8)
X 6 − 3 = (X − α)(X + α)(X − β)(X + β)(X − α + β)(X + α − β)
über M . Es gilt [M : Q] = [M : L][L : Q] = 2 · 6 = 12.
2. Völlig anders ist die Situation im Falle von g: Ist γ ∈ C eine Nullstelle von g, so gilt für
ω := (γ 3 + 1)/2, daß ω 6= −1, aber
1
1 9
(γ + 3γ 6 + 3γ 3 + 1) = (−3γ 3 + 3 · (−3) + 3γ 3 + 1) = −1.
8
8
Deshalb ist ω ∈ Q(γ) eine primitive sechste Einheitswurzel, und g hat in Q(γ) sechs Nullstellen:
(12.9)
ω3 =
−γ + γ 4
γ4 + γ
γ − γ4
γ4 + γ
, γω 2 =
, γω 3 = −γ, γω 4 = −
, γω 5 =
.
2
2
2
2
Deshalb ist Q(γ) schon der Zerfällungskörper von g, und [Q(γ) : Q] = 6.
(12.10) γ, γω =
12.3. Galoiserweiterungen.
Definition 12.22. — Es sei L ein Körper. Die Menge der Automorphismen σ : L → L bildet mit
der Komposition als Verknüpfung die Automorphismengruppe Aut(L). Es sei außerdem i : K → L
eine Körpererweiterung. σ : L → L ist ein relativer Automorphismus der Erweiterung L/K, wenn
σ ◦ i = i. Die relativen Automorphismen bilden eine Untergruppe Aut(L/K) < Aut(L).
Ist G ⊂ Aut(L) irgendeine Teilmenge der Automorphismengruppe eines Körpers L, so ist die
Fixpunktmenge
LG = {x ∈ L | σ(x) = x für alle σ ∈ G}
ein Unterkörper von L, wie man sich leicht klar macht.
Warnung: Falls L/K inseparabel ist, muß eine K-lineare Einbettung σ : L → L kein Isomorphismus sein. Man denke an den Frobenius.
Es sei nun i : K → L eine endliche Erweiterung. Ein relative Automorphismus σ ∈ Aut(L/K)
ist eine Fortsetzung von i.
_ _ _ _σ _ _ _/ L
L `@
>
@@
@@
@@
~
~~
~
~
~~
K
Nach Satz 12.13 über die Anzahl von Fortsetzungen gilt
|Aut(L/K)| ≤ [L : K]s ≤ [L : K].
104
Galoistheorie
Definition 12.23. — Eine endliche Erweiterung L/K ist eine Galoiserweiterung13, wenn
|Aut(L/K)| = [L : K].
In diesem Falle nennt man Gal(L/K) := Aut(L/K) die Galoisgruppe der Erweiterung.
√
Beispiele 12.24. — 1. Es gibt zwei Automorphismen von Q( 3)/Q, nämlich die Identität id und
√
√
√
√
σ : 3 7→ − 3. Also ist Q( 3)/Q eine Galoiserweiterung mit Galoisgruppe Gal(Q( 3)/Q) ∼
=
Z/2.
2. C/R ist eine Galoiserweiterung: Die Galoisgruppe Gal(C/R) ist isomorph zu Z/2 und wird von
der komplexen Konjugation z 7→ z erzeugt.
√
3. Die Erweiterung Q( 3 2)/Q ist keine Galoiserweiterung. Es gibt drei Q-lineare Einbettungen
√
√
Q( 3 2) → C. Dabei wird α = 3 2 der Reihe nach auf α, ρα und ρ2 α mit ρ = exp(2πi/3) abge√
bildet. Aber die beiden letzten Zahlen liegen nicht in Q( 3 2)/Q und liefern keine Automorphismen
dieses Körpers.
Satz 12.25 — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G. Dann gilt
K = LG .
Beweis. Nach Definition gilt sicher K ⊂ M := LG und G ⊂ Aut(L/M ). Es folgt:
|G| ≤ [L : M ] ≤ [L : K] = |G|.
Also besteht überall Gleichheit. Insbesondere ist [L : M ] = [L : K] und M = K.
Satz 12.26 (Dirichlet) — Es seien σ1 , . . . , σn : Γ → M × paarweise verschiedene Gruppenhomomorphismen von einer Gruppe Γ in die Einheitengruppe eines Körpers M . Dann sind σ1 , . . . , σn
linear unabhängige Elemente im M -Vektorraum Abb(Γ, M ) aller Abbildungen von Γ nach M . Mit
anderen Worten: Sind µ1 , . . . , µn ∈ M mit der Eigenschaft, daß
(12.11)
µ1 σ1 (x) + . . . + µn σn (x) = 0
für alle x ∈ Γ, dann gilt µ1 = . . . = µn = 0.
Beweis. Es sei k minimal gewählt mit der Eigenschaft, daß (nach eventuell notwendigem Umnumerieren) die Homomorphismen σ1 , . . . , σk linear abhängig sind. Da alle σi 6= 0 sind, ist k ≥ 2. Es
P
gibt nun µ1 , . . . , µk ∈ M × mit ki=1 µi σi (x) = 0 für alle x ∈ Γ. Da σ1 6= σ2 , gibt es ein y ∈ Γ
mit σ1 (y) 6= σ2 (y). Nun bestehen die Relationen
(12.12)
0=
k
X
µi σi (yx) =
(12.13)
σi (y)µi σi (x).
i=1
i=1
Durch Subtraktion der Relation
k
X
0 = σ1 (y)
k
X
µi σi (x)
i=1
erhält man
(12.14)
0=
X
i≥2
(σ1 (y) − σi (y))µi σi (x)
für alle x ∈ K.
Da σ1 (y)−σ2 (y) 6= 0 ist dies eine nichttriviale Relation zwischen den Homomorphismen σ2 . . . , σk ,
im Widerspruch zur Minimalität von k.
Im Folgenden wollen wir den Satz von Dirichlet auf eine Folge von paarweise verschiedenen
Körperhomomorphismen σ1 , . . . , σn : K → M anwenden: Die Einschränkungen der σi auf die
13Évariste Galois b25. Oktober 1811 d31. Mai 1832
105
Einheitengruppe K × sind Gruppenhomomorphismen. Deshalb ist das Lemma anwendbar und zeigt,
daß die σi linear unabhängig sind.
Es sei L ein Körper und G ⊂ Aut(L) eine endliche Untergruppe. Für jedes x ∈ L ist
X
σ(x)
S(x) :=
σ∈G
invariant unter der Gruppe G und liegt im Unterkörper LG , denn für g ∈ G folgt nach Umindizierung:
X
X
h(x) = S(x).
(gσ)(x) =
g(S(x)) =
σ∈G
h∈G
Diese Abbildung S : L → LG heißt Spurabbildung.
Lemma 12.27 — Es sei L ein Körper und G < Aut(L) eine endliche Untergruppe. Die Spurabbildung S : L → LG ist LG –linear und nicht die Nullabbildung.
Beweis. Zur LG -Linearität: Für λ ∈ LG und x ∈ L gilt
X
X
X
σ(x) = λS(x),
σ(λ)σ(x) = σ(λ)
σ(λx) =
S(λx) =
σ∈G
σ∈G
σ∈G
weil σ(λ) = λ.
Falls L die Charakteristik 0 hat, folgt die Aussage S 6= 0 aus der einfachen Beobachtung, daß
S(1) = |G| =
6 0. Allgemeiner folgt die Behauptung für beliebige Charakteristik unmittelbar aus
dem Satz von Dirichlet, denn als Linearkombination von Charakteren kann die Einschränkung von
S auf L× nicht identisch verschwinden.
Satz 12.28 — Es sei L ein Körper und G < Aut(L) eine endliche Untergruppe. Dann ist L/LG
eine Galoiserweiterung vom Grad |G| mit Gal(L/LG ) = G.
Beweis. Es sei G = {σ1 , . . . , σn } und K = LG . Schließlich sei eine Folge von K-linear unabhängigen Elementen x1 , . . . , xm ∈ L gegeben. Nach Konstruktion ist G ⊂ Aut(L/K), also
n = |G| ≤ |Aut(L/K)| ≤ [L : K]. Angenommen, n < m.
Die Matrix (σi−1 (xj )) ∈ Ln×m hat weniger Zeilen als Spalten. Deshalb gibt es einen nichttrivialen Vektor y = (y1 , . . . , ym )t ∈ Lm mit
(12.15)
m
X
σi−1 (xj )yj = 0,
für alle i = 1, . . . , n.
j=1
Nach eventuellem Umnumerieren kann man annehmen, daß y1 6= 0. Wir wissen, daß die SpurabbilP
dung S = i σi nicht identisch verschwindet. Es gibt also ein u ∈ L mit S(u) 6= 0. Indem wir
nötigenfalls alle yj durch yj yu1 ersetzen, können wir erreichen, daß neben den Gleichungen (12.15)
zusätzlich S(y1 ) 6= 0 gilt. Wir wenden auf die i-te Gleichung in (12.15) den Automorphismus σi an
und summieren über alle i = 1, . . . , n auf:
(12.16)
m
X
xj S(yj ) = 0.
j=1
Die Koeffizienten S(yj ) liegen alle in K. Weil S(y1 ) 6= 0, beschreibt (12.16) eine K-lineare Abhängigkeit zwischen den Elementen x1 , . . . , xm , im Widerspruch zur Wahl der xj . Das zeigt n ≥ m.
Daraus folgt, daß [L : K] ≤ n = |G|. Die umgekehrte Ungleichung gilt sowieso. Deshalb ist
L/K eine endliche Galoiserweiterung.
Lemma 12.29 — Es sei L/K eine Galoiserweiterung mit Galoisgruppe G = Gal(L/K). Ist
{a1 , . . . , am } die G-Bahn eines Elements a ∈ L, dann ist
(12.17)
minpola/K = (X − a1 ) · . . . · (X − am )
∈ K[X].
106
Galoistheorie
Insbesondere ist a separabel.
Beweis. Es sei f das Minimalpolynom von a relativ K und g = (X − a1 ) · . . . · (X − am ).
Zu jedem Element ai in der G-Bahn von a gibt es nach Definition des Bahnbegriffs ein σ ∈ G
mit σ(a) = ai . Es folgt 0 = σ(f (a)) = f (σ(a)) = f (ai ). Demnach sind alle Bahnelemente
Nullstellen von f , mit anderen Worten: g|f . Umgekehrt sind die Koeffizienten von g genau die elementarsymmetrischen Polynome der ai und deshalb invariant unter allen Permutationen der ai . Sie
sind insbesondere invariant unter den Elementen der Galoisgruppe und liegen deshalb im Fixkörper
K = LG . Aus g ∈ K[X] und g(a) = 0 folgt nach Definition des Minimalpolynoms die umgekehrte
Teilbarkeitsrelation f |g. Da beide Polynome normiert sind, sind sie gleich.
Satz 12.30 — Die folgenden Aussagen über eine endliche Körpererweiterung sind äquivalent:
(1)
(2)
(3)
(4)
L/K ist eine Galoiserweiterung.
L/K ist separabel und normal.
L ist Zerfällungskörper eines irreduziblen separablen Polynoms aus K[X].
L ist Zerfällungskörper eines separablen Polynoms aus K[X].
Beweis. 1 ⇒ 2: Es sei a ∈ L ein beliebiges Element. Nach Lemma 12.29 zerfällt das Minimalpolynom minpola/K über L in Linearfaktoren mit paarweise verschiedenen Nullstellen. Das zeigt, daß
L separabel und normal über K ist.
2 ⇒ 3: Nach dem Satz vom primitiven Element existiert ein separables Element a ∈ L mit
L = K(a). Das Minimalpolynom von a ist irreduzibel und separabel. Wegen der Normalität von
L/K zerfällt es über L vollständig in Linearfaktoren. Nach Wahl von a wird L von a und a fortiori
von den Nullstellen von minpola/K erzeugt und ist deshalb der Zerfällungskörper von f .
3 ⇒ 4: Trivial.
4 ⇒ 1: Es sei L der Zerfällungskörper eines separablen Polynoms f ∈ K[X]. Dann ist L normal
und wird von separablen Elementen erzeugt. Wir wählen einen algebraischen Abschluß L → L. Es
sei G die Menge der K-linearen Einbettungen L → L. Da L/K separabel ist, ist |G| = [L : K]s =
[L : K]. Für jedes a ∈ L und jedes σ ∈ G ist σ(a) eine Nullstelle des Minimalpolynoms von a und
liegt wegen der Normalität von f schon in L. Das bedeutet σ(L) ⊂ L, und aus Gradgründen muß
sogar Gleichheit bestehen. Demnach ist jedes σ ∈ G ein relativer Automorphismus von L/K. Da
|G| = [L : K], ist L/K eine Galoiserweiterung.
√
√
Beispiel 12.31. — Es sei L = Q(a, b) mit a = 2, b = 3 ∈ C. Als Zerfällungskörper des
separablen Polynoms (X 2 − 3)(X 2 − 2) ist Q(a, b) eine Galoiserweiterung von Q vom Grad 4.
Jeder Automorphismus σ von Q(a, b) ist eindeutig durch die Wirkung auf a und b bestimmt. Es gibt
deshalb genau die vier Möglichkeiten:
(12.18)
σ0
σ1
σ2
σ3
:
:
:
:
a 7→ a,
a 7→ −a,
a 7→ a,
a 7→ −a,
b 7→ b
b 7→ b
b 7→ −b
b 7→ −b
Die Elemente σ1 , σ2 und σ3 haben die Ordnung 2. Deshalb ist Gal(Q(a, b)/Q)) ∼
= Z/2 × Z/2.
Beispiel 12.32. — Es sei K = Fp (t) und L = Fp (u). Die Abbildung K → L, t 7→ up , ist eine
Körpererweiterung vom Grad p. Das Minimalpolynom von u über K ist X p − t ∈ K[X]. Über L
zerfällt X p − t in Linearfaktoren:
(12.19)
X p − t = X p − up = (X − u)p .
Die Erweiterung ist normal, aber nicht separabel. Tatsächlich ist die relative Automorphismengruppe
Aut(L/K) trivial, denn jeder relative Automorphismus von L/K ist bestimmt durch das Bild von
107
u. Aber da u nur auf Nullstellen von X p − t abgebildet werden kann und u die einzige Nullstelle ist,
ist die Identität der einzige relative Automorphismus.
Satz 12.33 (Hauptsatz der Galoistheorie) — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G = Gal(L/K).
(1) Für jede Untergruppe H < G ist K ⊂ LH ⊂ L ein Zwischenkörper.
(2) Für jeden Zwischenkörper K ⊂ M ⊂ L ist L/M eine endliche Galoiserweiterung, und
Gal(L/M ) ist eine Untergruppe in Gal(L/K).
(3) Die Zuordnungen Φ : H 7→ LH und Ψ : M 7→ Gal(L/M ) definieren zueinander inverse
Bijektionen zwischen den Mengen
{H | H ist eine Untergruppe von Gal(L/K)}
und
{M | M ist ein Zwischenkörper von L/K}.
Die Abbildungen Φ und Ψ sind inklusionsumkehrend, d.h.
H ⊂ H′
⇔
′
LH ⊃ LH .
(4) Ein Zwischenkörper M ist genau dann eine Galoiserweiterung von K, wenn Gal(L/M )
ein Normalteiler von Gal(L/K) ist. In diesem Falle ist die Folge von Gruppenhomomorphismen
i
r
1 −→ Gal(L/M ) −→ Gal(L/K) −→ Gal(M/K) −→ 1
exakt. Dabei bezeichnet i die Inklusion und r : Gal(L/K) → Gal(M/K) die Einschränkungsabbildung σ 7→ σ|M . Mit anderen Worten: Gal(M/K) ∼
= Gal(L/K)/Gal(L/M ).
Beweis. 1. Die erste Aussage ist klar.
Zu 2: Es sei M ein Zwischenkörper. Für jedes a ∈ L ist minpola/M ein Teiler von minpola/K
in M [X]. Da minpola/K in L[X] vollständig in Linearfaktoren zerfällt, die paarweise verschieden sind, gilt dasselbe für minpola/M . Insbesondere ist L normal und separabel über M , also eine
Galoiserweiterung. Jeder relative Automorphismus von L/M fixiert M , also erst recht K. Deshalb
besteht eine Inklusion von Gruppen Gal(L/M ) ⊂ Gal(L/K).
Zu 3. Es sei zunächst H ⊂ Gal(L/K) eine Untergruppe. Dann ist M := LH ein Zwischenkörper,
und nach Satz 12.28 ist L/M eine Galoiserweiterung mit Gal(L/M ) = H. Das zeigt Ψ ◦ Φ = idG .
Es sei nun umgekehrt M ein Zwischenkörper und H = Gal(L/M ) < Gal(L/K). Dann gilt
M = LH nach Satz 12.25. Das zeigt Φ ◦ Φ = idZ . Daß Φ und Ψ inklusionsumkehrend sind,
ist klar.
Zu 4. Es sei M ein Zwischenkörper, der normal über K ist. Als Zwischenkörper einer separablen Erweiterung ist M auch separabel über K. Nach dem Normalitätskriterium 12.19 bildet jedes
σ ∈ Gal(L/K) den Körper M in sich ab. Dies definiert einen Homomorphismus
(12.20)
r : Gal(L/K) → Gal(M/K),
σ 7→ σ|M .
Dieser ist surjektiv: Denn jeder Automorphismus σ0 ∈ Gal(M/K) setzt sich zu einer Einbettung σ :
L → L in einen algebraischen Abschluß von L fort, und da L/K normal ist, gilt σ(L) = L. Somit
ist σ ∈ Gal(L/K) und r(σ) = σ0 . Weiter besteht der Kern von r aus allen Automorphismen von
L/K, die M festlassen, d.h. Gal(L/M ). Deshalb ist Gal(L/M ) ein Normalteiler mit Faktorgruppe
Gal(M/K) = Gal(L/K)/Gal(L/M ).
Es sei umgekehrt Gal(L/M ) ein Normalteiler in Gal(L/K). Um zu zeigen, daß M/K normal
ist, betrachten wir eine beliebige K-lineare Einbettung ψ0 : M → L von M in einen algebraischen
Abschluß von L und wählen eine Fortsetzung ψ : L → L. Da L normal ist, gilt ψ(L) = L und
108
Galoistheorie
ψ ∈ Gal(L/K). Für ein beliebiges σ ∈ Gal(L/M ) gilt nun wegen der Normalteilerannahme, daß
ψ −1 σψ ∈ Gal(L/M ). Deshalb gilt für jedes x ∈ M :
σ(ψ(x)) = ψ((ψ −1 σψ)(x)) = ψ(x),
(12.21)
also ψ(x) ∈ LGal(L/M ) = M . Das zeigt ψ(M ) ⊂ M . Mit dem Normalitätskriterium 12.19 folgt
die Behauptung.
√
Beispiel 12.34. — Es seien ρ = exp(2πi/3), α = 3 2 und L = Q(α, ρ). Da ρ keine reelle Zahl
ist, liegt ρ sicher nicht im Körper Q(α). Da ρ2 + ρ + 1 = 0, ist L/Q(α) eine Erweiterung vom
Grad 2 und [L : Q] = [L : Q(α)][Q(α) : Q] = 6. Tatsächlich ist L/Q eine Galoiserweiterung,
denn L ist der Zerfällungskörper des Polynoms X 3 − 2. Jeder Automorphismus L → L muß α in
α, αρ oder αρ2 abbilden und ρ in ρ oder −ρ. Damit sind alle sechs Möglichkeiten charakterisiert.
Die Abbildungen
(12.22)
σ : α 7→ αρ,
ρ 7→ ρ,
und τ : α 7→ α,
2
ρ 7→ −ρ.
3
erzeugen die Galoisgruppe. Es gelten die Relationen τ = id, σ = id, τ στ = σ −1 . Man sieht,
daß G := Gal(L/Q) ∼
= S3 . Es ergibt sich das folgende Schema von Untergruppen und zugehörigen
Zwischenkörpern:
Q(α, ρ)
l {id}2
kkukuu 555
llxlxx 22
k
l
k
l
k
l
55
22
kkk uu
lll xxxx
55
kkkk uuuu
22
k
lll
k
l
x
k
l
k
55
l
22
2)
Q(α)
Q(αρ)
hτ i
hστ i
Q(αρ
hσ 2 τ i
55
22
66
EE
44
HH
55
HH
EE
2
6
4
H
6
2
55
44
EE
HH
66
2
EE
H
2
5
HH
66
EE 444
H
H
6
EE 4
Q(ρ)
hσi
HH
EE 44
HH 666
EE 4
vv
xx
HH 6
v
x
v
HH 66
EE 44
x
vv
HH 6
EE4 xxx
H vvv
x
G
Q
√ √
Beispiel 12.35. — Wir wissen, daß die Galoisgruppe Gal(Q( 2, 3)/Q) isomorph zu Z/2 × Z/2
ist und von den Automorphismen
√ √
√
√
√ √
√
√
σ2 : 2 7→ 2, 3 7→ − 3
(12.23)
σ1 : 2 7→ − 2, 3 7→ 3,
erzeugt wird. Die Korrespondenz zwischen Untergruppen und Zwischenkörpern sieht dann so aus:
√ √
{id}
Q( 2, 3)
K
hσ1 i
t
tt
tt
t
t
tt
JJ
JJ
JJ
JJ
J
KKK
KKK
KKK
hσ2 i
hσ1 σ2 i
ss
sss
s
s
sss
Z/2 × Z/2
KKK
s
KKK
sss
s
KKK
s
s
s
K
s
s
√
√
√
Q( 2)
Q( 6)
Q( 3)
LLL
r
r
LLL
rrr
LLL
r
r
LL rrrr
Q
Beispiel 12.36. — Es sei ζ = exp(2πi/5) ∈ C. Die Galoisgruppe Gal(Q(ζ)/Q) hat die Ordnung
4. Jeder Automorphismus muß ζ auf eine Potenz ζ k abbilden, d.h. die Galoisgruppe Gal(Q(ζ)/Q)
besteht aus den vier Automorphismen
(12.24)
i
σ i : ζ 7→ ζ 2 ,
i = 0, 1, 2, 3 mod 4,
die den Regeln σi σj = σi+j genügen:
(12.25)
j
i
j
σi (σj (ζ)) = σi (ζ 2 ) = (ζ 2 )2 = ζ 2
i
·2j
= ζ2
i+j
.
109
Deshalb ist Gal(Q(ζ)/Q) zyklisch, erzeugt von σ1 , und es gibt nur eine Untergruppe, die von σ12 :
ζ 7→ ζ 4 = ζ −1 erzeugt wird. Der zugehörige Zwischenkörper wird von u = ζ + ζ −1 = 2 cos( 2π
)
5
erzeugt:
{id}
Q(ζ)
hσ12 i
Q(ζ + ζ −1 )
hσ1 i ∼
= Z/4
Q
Beispiel 12.37. — Es sei p eine Primzahl. Für jedes n ∈ N ist Fpn der Zerfällungskörper des
n
separablen Polynoms X p − X ∈ F[X] und deshalb eine Galoiserweiterung von Fp . Der Frobeniushomomorphismus
F : Fp n → F p n , a 7 → a p ,
ist ein Automorphismus, der alle Elemente aus Fp festläßt. Wir haben früher gesehen, daß Fpℓ ⊂ F
genau aus den Elementen besteht, die von F ℓ festgelassen werden. Deshalb ist die Ordnung von
F ∈ Gal(Fpn /Fp ) genau n. Weil |Gal(Fpn /Fp )| = [Fpn : Fp ] = n, folgt:
Die Erweiterung Fpn /Fp ist eine Galoiserweiterung vom Grad n. Die Galoisgruppe Gal(Fpn /Fp )
ist zyklisch und wird vom Frobeniushomomorphismus erzeugt.
√
Beispiel 12.38. — Es sei zur Abkürzung α = 4 3 gesetzt. Das Polynom f = X 4 − 3 ∈ Q[X] ist
nach dem Eisensteinkriterium irreduzibel. Seine Nullstellen sind α, iα, i2 α = −α und i3 α = −iα.
Der Zerfällungskörper von f ist Q(α, i) vom Grad 8 über Q. Die Galoisgruppe Gal(Q(α, i)/Q)
enthält sicher die folgenden Automorphismen: Erstens die komplexe Konjugation
σ : α 7→ α,
i 7→ −i,
und zweitens die Abbildung
deren Vielfachen durch
δ : α 7→ iα,
δ2 :
3
δ :
4
δ :
i 7→ i,
α 7→ −α,
α 7→ −iα,
α 7→ α,
i 7→ i,
i 7→ i,
i 7→ i,
charakterisiert sind. Außerdem hat man σδσ : α 7→ α 7→ iα 7→ −iα und i 7→ −i 7→ −i 7→ i.
Demnach genügen σ und δ den Relationen
σ 2 = id,
δ 4 = id,
σδσ = δ −1 ,
und erzeugen zusammen eine zur Diedergruppe D4 isomorphe Gruppe
hσ, δi = {id, δ, δ 2 , δ 3 , σ, σδ, σδ 2 , σδ 3 }.
Da die Galoisgruppe genau die Ordnung 8 hat, gilt
Gal(Q(α, i)/Q) = hσ, δi ∼
= D4 .
Die Diedergruppe hat drei Untergruppen der Ordnung 4, die als Untergruppen vom Index 2 alle
Normalteiler sind, nämlich
hσ, δ 2 i ∼
= Z/2 × Z/2,
hσδ, δ 2 i ∼
= Z/2 × Z/2,
hδi ∼
= Z/4.
Wenn σ in der geometrischen Interpretation der Spiegelung an der x-Achse entspricht und δ der
Drehung um den Winkel π/2, so wird die Gruppe hσ, δ 2 i durch die Spiegelungen an den Achsen
110
Galoistheorie
erzeugt, hσδ, δ 2 i durch die Spiegelungen an den Diagonalen, und hδi ist die zyklische Gruppe der
Drehungen:
Untergruppen der Ordnung zwei werden von den vier Spiegelungen σδ k , k = 0, . . . , 3 und der
Punktspiegelung δ 2 = −id erzeugt. Nur die Punktspiegelung erzeugt einen Normalteiler, während
die beiden Spiegelungen an den Achsen und die beiden Spiegelungen an den Diagonalen jeweils
zueinander konjugiert sind. Man erhält also das folgende Diagramm von Untergruppen der Galoisgruppe, wobei Linien Inklusionsbeziehungen bedeuten:
hhhm 1 WRRWRWRWRWWWW
hmhmhmhmmm
RRR WWWWW
h
h
h
RRR WWWW
hh m
RRR
W
hhhhmmmmm
h
h
h
RRR WWWWWWWW
h
m
h
h
m
h
m
h
W
h
h
hσδi
hσi
hσδ 2 i
hδ 2 i QQ
hσδ 3 i
m
EE
Q
m
Q
m
v
QQQ
EE
vv
mmm
QQQ
EE
vv
mmm
v
Q
m
EE
Q
v
m
QQ
vv
mmm
hδi
hσ, δ 2 i Q
hσδ, δ 2 i
QQQ
mmm
QQQ
mmm
QQQ
m
m
QQQ
mm
mmm
hσ, δi = Gal(Q(α, i)/Q)
Die zugehörigen Zwischenkörper findet man so: Invariant unter δ ist sicher i. Invariant unter δ 2 neben
√
√
i auch noch α2 = 3. Invariant unter hσ, δ 2 i ist dann nur noch 3. Durch σδ werden die beiden
√
2
Erzeuer i und 3 von Q(α, i)hδ i wie folgt abgebildet:
α2 7→ (iα)2 7→ −α2 , i 7→ i 7→ −i.
√
Invariant ist deshalb das Element iα2 = i 3. Jetzt fehlen nur noch die Invarianten unter den Spiegelungen. σ läßt offensichtlich α fest, ebenso σδ 2 das Element iα. Sowohl α wie iα haben das
Minimalpolynom X 4 − 3. Die beiden übrigen Spiegelungen sind etwas interessanter: Unter σδ geht
α auf −iα. Folglich ist α − iα = α(1 − i) invariant. Entsprechend findet man, daß α(1 + i) invariant
unter σδ 3 ist. Diese beiden Elemente haben das Minimalpolynom X 4 + 12. Insgesamt hat man das
folgende Diagramm von Zwischenkörpern, bei analoger Anordnung:
Q(α, i) VV
MMMVVVVV
jjjtt
j
j
MMM VVVVVV
j
t
j
t
j
VVVV
jj ttt
MMM
j
j
VVVV
j
j
M
V
tt
jjjj
√
Q(α(i − 1))
Q(α)
Q(iα)
Q(α(i + 1))
Q(i, 3)
GG
LLL
p
u
p
GG
u
p
L
LLL
GG
pp
uu
p
u
p
GG
u
LLL
G
uu
ppp
√ u
√ p
Q( 3)
Q(i)
JJ
JJ
JJ
JJ
JJ
Q
Q(i 3)
q
qqq
q
q
qqq
qqq
Von den fünf Zwischenkörpern der zweiten Zeile, die Grad 4 über Q haben, ist nur der mittlere,
√
Q(i, 3), der zum Normalteiler hδ 2 i gehört, eine Galoiserweiterung über Q, die vier anderen nicht.
Man sieht an diesem Beispiel auch gut, daß die Begriffe Galoissch oder normal im Gegensatz zu den Begriffen separabel, endlich oder algebraisch nicht transitiv sind: Die Erweiterungen
111
√
√
Q(α)/Q( 3) und Q( 3)/Q sind Galoiserweiterungen, dagegen die zusammengesetzte Erweiterung Q(α)/Q nicht.
Bemerkung 12.39. — In jeder algebraischen Erweiterung K ⊂ L gibt es einen eindeutig bestimmten Zwischenkörper M , die separable Hülle von K in L, mit der Eigenschaft, daß M/K separabel
und L/M rein inseparabel ist. Wenn L/K endlich und normal ist, kann man diese Reihenfolge auch
umkehren: Wir betrachten die Gruppe Aut(L/K) der relativen Automorphismen. Da L/K normal
ist, gilt |Aut(L/K)| = [L : K]s . Es sei F := LAut(L/K) . Dann ist L/F eine endliche Galoiserweiterung vom Grad [L : K]s . Aus dem Multiplikationssatz für den Separabilitätsgrad ergibt sich
[L : K]s = [L : F ]s [F : K]s , also [F : K]s = 1. Damit ist F/K rein inseparabel.
Ich schließe den Abschnitt mit einem Satz, der zusammen mit einem späteren Satz 18.13 über die
Automorphismengruppe Aut(C) etwas Kurioses enthält. Beweis zur Übung.
Satz 12.40 — Aut(R) = {id}.
Beweis. Hinweis: Zeige, daß für jeden Automorphismus σ ∈ Aut(R) gilt: a > 0 ⇒ σ(a) > 0.
Dazu muß man die Eigenschaft, positiv zu sein, algebraisch charakterisieren.
112
Galoistheorie
§13. Kreisteilungskörper
Für einen kommutativen Ring R bezeichnet R× die Gruppe der multiplikativen Einheiten. Bekanntlich bilden die Zahlen a, 0 < a < n, die zu n teilerfremd sind, ein Repräsentantensystem für
(Z/n)× . Ihre Anzahl ist die Eulersche Phi-Funktion: ϕ(n) = |(Z/n)× |. Gemäß dem chinesischen
a
Restklassensatz gibt es für jede natürliche Zahl n mit der Primfaktorzerlegung n = pa1 1 · . . . · pℓ ℓ
einen Ringisomorphismus
ℓ
Y
Z/pai i .
Z/n ∼
=
i=1
Durch Übergang zu den Einheiten entsteht daraus ein Gruppenisomorphismus
ℓ
Y
(Z/n)× ∼
=
und das bedeutet für die Gruppenordnungen:
ϕ(n) =
(Z/pai i )× ,
i=1
ℓ
Y
ϕ(pai i ).
i=1
Andererseits sieht man direkt, daß die Anzahl der zu einer Primzahl p teilerfremden natürlichen
Zahlen < pa durch pa−1 (p − 1) gegeben ist. Zusammengefaßt ergibt sich die bekannte Formel
ℓ
Y pi − 1
ϕ(n)
.
=
n
pi
i=1
Es sei nun
n 2πik o
µn = e n k = 0, . . . , n − 1 ⊂ C∗
die Gruppe der n-ten Einheitswurzeln. Eine Einheitswurzel ζ ∈ µn ist primitiv, wenn ζ die Ordnung
n hat, also keine d-te Einheitswurzel für einen echten Teiler d von n ist. In analytischer Schreibweise
sind die primitiven n-ten Einheitswurzeln durch die Ausdrücke exp(2πik/n) mit zu n teilerfremden k gegeben. Mit anderen Worten: Unter dem Gruppenisomorphismus Z/n 7→ µn , k 7→ ζ k ,
mit ζ = exp(2πi/n) gehen die zu n teilerfremden Restklassen bijektiv auf die primitiven n-ten
Einheitswurzeln.
Definition 13.1. — Das Polynom
(13.1)
Φn (X) :=
Y
ζ∈µ′n
(X − ζ),
wo ζ durch die Menge µ′n ⊂ µn der primitiven n-ten Einheitswurzeln läuft, heißt n-tes Kreisteilungspolynom.
Die ersten Kreisteilungspolynome sind
Φ1
=
X −1
Φ2
=
X +1
Φ3
=
X2 + X + 1
Φ4
=
X2 + 1
Φ5
=
X4 + X3 + X2 + X + 1
Φ6
=
X2 − X + 1
Nach Definition gilt deg(Φn ) = ϕ(n). Da jede n-te Einheitwurzel eine primitive d-te Einheitswurzel
für genau einen Teiler d von n ist, bestehen die Beziehungen
X
Y
ϕ(d).
Φd
und
n=
(13.2)
Xn − 1 =
d|n
d|n
113
Mit der Möbiusfunktion µ und den Möbiusschen Umkehrformeln erhält man aus (13.2) die Beziehungen
X
µ(n/d)d
(13.3)
ϕn =
d|n
und
(13.4)
Φn (X) =
Y
d|n
(X d − 1)(−1)
µ(n/d)
.
Nach Konstruktion ist Φn ein Polynom mit komplexen Koeffizienten. Tatsächlich gilt:
Satz 13.2 — Für alle n ∈ N ist Φn ∈ Z[X].
Beweis. Wir können induktiv annehmen, daß für alle echten Teiler d von n das Polynom Φd ganzzahlig und normiert ist. Es gilt nun
(13.5)
Φn = Q
Xn − 1
.
d|n, d<n Φd
Der Nenner ist ein ganzzahliges normiertes Polynom. Deshalb kann man Polynomdivision nicht nur
in C[X], sondern auch in Z[X] ausführen. Das Ergebnis hängt nicht von einer möglichen Erweiterung des Koeffizientenrings ab, ist also über Z und C gleich. In C[X] geht die Division auf, also auch
in Z[X]. Daher ist Φn ganzzahlig und normiert.
Satz 13.3 (Gauß) — Die Kreisteilungspolynome Φn sind für alle n ∈ N in Z[X] irreduzibel.
Beweis. Es sei ζ eine Wurzel von Φn und f ihr Minimalpolynom über Q. Wir schreiben Φn = f g
mit g ∈ Q[X]. Nach dem Lemma von Gauß sind f und g ganzzahlig. Es sei p eine zu n teilerfremde
Primzahl. Dann ist ζ p ebenfalls eine primitive n-te Einheitswurzel und wegen der Zerlegung von Φn
eine Nullstelle entweder von f oder von g. Angenommen, g(ζ p ) = 0. Dann haben f (X) und g(X p )
einen gemeinsamen (normierten) Faktor h(X) ∈ Z[X]. Wir reduzieren modulo p und erhalten in
Fp [X] die Beziehungen
h̄(X)|ḡ(X p ) = ḡ(X)p , h̄(X)|f¯(X).
Ein irreduzibler Faktor von h̄ teilt somit sowohl f¯ als auch ḡ. Er teilt deshalb Φn und X n − 1
n−1
zweimal, obwohl X n − 1 sicher keine mehrfache Nullstellen hat, weil die Ableitung nX
in
p
keiner Nullstelle verschwindet: Widerspruch. Daher ist ζ eine Nullstelle von f .
Eine beliebige primitive n-te Einheitswurzel hat die Form ζ m mit zu n teilerfremden Exponenten
m. Zerlegt man m = p1 · · · pℓ in ein Produkt von Primzahlen, so zeigt das vorstehende Argument,
daß
ζ,
ζ p1 ,
(ζ p1 )p2 = ζ p1 p2 ,
...,
ζ p1 ···pℓ = ζ m
Nullstellen von f sind. Demnach ist jede Nullstelle von Φn auch eine Nullstelle von f . Das zeigt
Φn = f .
Bei der Definition von Φn haben wir Einheitswurzeln in C verwendet. Aber da die Φn ganzzzahlige Koeffizienten haben und die Zerlegung
Y
Xn − 1 =
Φd
d|n
in Z[X] besteht, sind die Kreisteilungspolynome und diese Zerlegung über jedem Körper K definiert.
Natürlich bleiben die Kreisteilungspolynome dabei nicht unbedingt irreduzibel, sondern können je
nach Körper auf sehr verschiedene Weise zerfallen. Ein Element x ∈ K × ist eine n-te Einheitswurzel, wenn xn = 1, und eine primitive Einheitswurzel, wenn ord(x) = n in K × . Wir bezeichnen die
Gruppe der n-ten Einheitswurzeln in K mit
(13.6)
µn (K) := {ζ ∈ K | ζ n = 1}
114
Das Polynom X n − 1 ist genau dann separabel über K, wenn die Charakteristik von K kein Teiler
von n ist. Falls char(K) = p > 0 und n = pe m mit p 6 |m, gilt
e
X n − 1 = (X m − 1)p .
Jede n-te Einheitswurzel ist deshalb schon eine m-te Einheitswurzel. Primitive n-te Einheitswurzeln
gibt es also nur im separablen Fall.
Lemma 13.4 — Es sei p eine Primzahl, die m nicht teilt. Dann gilt
ϕ(p
Φp e m ≡ Φ m
e
)
mod p
für alle e ∈ N.
Beweis. Übung: Induktion über die Teiler von pe m.
Satz 13.5 — Es sei K ein Körper, n eine natürliche Zahl und ζ ∈ K eine primitive n-te Einheitswurzel. Die Erweiterung K(ζ)/K ist eine Galoiserweiterung. Jedes σ ∈ Gal(K(ζ)/K) bestimmt
ein eindeutiges Element φ(σ) ∈ (Z/n)× mit der Eigenschaft σ(ζ) = ζ φ(σ) . Die Abbildung
φ : Gal(K(ζ)/K) → (Z/n)×
ist ein injektiver Gruppenhomomorphismus. Insbesondere ist Gal(K(ζ)/K) abelsch. φ ist genau
dann ein Isomorphismus, wenn Φn ∈ K[X] irreduzibel ist.
Beweis. Nach Adjunktion von ζ zerfällt X n − 1 in n paarweise verschiedene Linearfaktoren:
X n − 1 = (X − 1)(X − ζ)(X − ζ 2 ) · · · (X − ζ n−1 ).
Insbesondere ist K(ζ) der Zerfällungskörper von X n − 1 und separabel über K. Die Voraussetzungen des Satzes sind also nur erfüllt, wenn p6 | n. Von den n Einheitswurzeln sind diejenigen, die
nicht primitiv sind, Nullstellen von Φd für einen echten Teiler d von n. Deshalb ist ζ Nullstelle
des Polynoms Φn , d.h. das Minimalpolynom von ζ ist Teiler von Φn in K[X]. Jeder Automorphismus σ ∈ Gal(K(ζ)/K) bildet ζ in eine primitive Einheitswurzel ab. Es gibt also genau ein
φ(σ) ∈ (Z/n)× mit σ(ζ) = ζ φ(σ) . Da ζ die Erweiterung erzeugt, ist σ durch φ(σ) eindeutig
bestimmt. Deshalb ist φ eine injektive Abbildung. Für zwei Automorphismen σ und τ gilt:
τ (σ(ζ)) = τ (ζ φ(σ) ) = (τ (ζ))φ(σ) = (ζ φ(τ ) )φ(σ) = ζ φ(τ )φ(σ) .
Andererseits hat man
τ (σ(ζ)) = (τ ◦ σ)(ζ) = ζ φ(τ ◦σ) .
Der Vergleich zeigt φ(τ )φ(σ) = φ(τ ◦ σ). Damit ist φ ein Homomorphismus, wie behauptet. Die
letzte Aussage ist klar.
Definition 13.6. — Eine Galoiserweiterung heißt abelsch, wenn ihre Galoisgruppe abelsch ist.
Historisch ist die Begriffsbildung umgekehrt: Nils Abel hat Körpererweiterungen untersucht, deren relative Automorphismen kommutieren. Deshalb sprach man von Abelschen Erweiterungen.
Heinrich Weber hat dann das Adjektiv ’abelsch’ von der engeren Verwendung für Galoisgruppen
von Abelscher Erweiterungen auf beliebige kommutierende Gruppen vorgenommen.
Das Kreisteilungspolynom Φn ∈ K[X] kann aus verschiedenen Gründen nicht irreduzibel sein:
1. Es kann sein, daß K eine m-te Einheitswurzel für ein m|n enthält. Wir betrachten das Beispiel
n = 9, m = 3 und K = Q(ρ), wo ρ = exp(2πi/3) eine dritte Einheitswurzel ist. Bezeichnet ζ
eine primitive neunte Einheitswurzel, so hat ζ das Minimalpolynom X 3 − ρ oder X 3 − ρ2 , und Φ9
faktorisiert wie folgt:
Φ9 = X 6 + X 3 + 1 = (X 3 − ρ)(X 3 − ρ2 ).
115
2. Das Minimalpolynom kann aber auch dann in kleinere Polynome zerfallen, wenn keine n-te
√
Einheitswurzel in K liegt. Das zeigt das Beispiel n = 5 und K = Q( 5): Es sei ζ ∈ C eine
primitive n-te Einheitswurzel und η := ζ + ζ −1 . Aus der Gleichung
ζ4 + ζ3 + ζ2 + ζ + 1 = 0
gewinnt man
0 = ζ 2 + ζ + 1 + ζ −1 + ζ −2 = η 2 + η − 1.
√
√
Damit ist η = (−1 + 5)/2 oder (−1 − 5)/2 je nachdem, mit welcher Einheitswurzel ζ man
√
anfängt. In jedem Falle zerfällt Φ5 über Q( 5) wie folgt:
X4 + X3 + X2 + X + 1
=
=
=
(X − ζ)(X − ζ 4 )(X − ζ 2 )(X − ζ 3 )
(X 2 − ηX + 1)(X 2 − (−1 − η)X + 1)
√
√
1− 5
1+ 5
X2 +
X +1
X2 +
X +1 .
2
2
Beispiel 13.7. — Es sei ζ ∈ C eine primitive 7. Einheitswurzel. Die Erweiterung Q(ζ)/Q ist eine
Galoiserweiterung mit zyklischer Galoisgruppe
Z/6
k
∼
=
−−→
7→
(Z/7)×
3k , j
∼
=
−−→
7→
Gal(Q(ζ)/Q)
(σj : ζ 7→ ζ j )
Es gibt zwei Untergruppen der Ordnung 2 bzw. 3 in Gal(Q(ζ)/Q), die von σ6 bzw. σ2 erzeugt
werden. Wir betrachten die zugehörigen Zwischenkörper:
Es sei H1 = {σ1 , σ6 } und K1 = Q(ζ)H1 . Das Element u = ζ + ζ 6 = 2 cos(2π/7) ist invariant
unter H1 . Eine Gleichung für u findet man leicht aus
0 = ζ 3 + ζ 2 + ζ + 1 + ζ −1 + ζ −2 + ζ −3 = u3 + u2 − 2u − 1.
Dann ist K1 = Q(u) = Q(cos(2π/7)). Die Galoisgruppe von K1 /Q ist zyklisch von der Ordnung
3 und wird erzeugt von dem Element
u = ζ + ζ −1 7→ ζ 2 + ζ −2 = u2 − 2.
Das regelmäßige Siebeneck mit dem Graphen des Polynoms 8x3 + 4x2 − 4x − 1:
Nur zur Untergruppe H2 = {σ1 , σ2 , σ4 } und dem zugehörigen Zwischenkörper K2 = Q(ζ)H2 . Das
Element v = ζ + ζ 2 + ζ 4 ist invariant unter H2 . Es genügt der Gleichung
v 2 = ζ 2 + ζ 4 + ζ + 2(ζ 1+2 + ζ 2+4 + ζ 4+1 ) = −v − 2.
116
√
Insbesondere gilt (2v + 1)2 = −7. Das zeigt: K2 = Q(v) = Q( −7).
Die Zwischenkörper von Q(ζ)/Q sind somit:
Q(ζ)
v
vv
vv
v
v
vv
√
Q( −7)
II
II
II
II
II
LLL
LLL
LLL
L
Q(cos(2π/7))
Q
rr
rr
rr
r
rr
rr
Wir betrachten speziell den Fall der Erweiterung Q(ζ)/Q, wo ζ eine primitive p-te Einheitswurzel
für eine Primzahl p ist. Satz 13.5 gibt uns einen Isomorphismus
(Z/p)× −→ G := Gal(Q(ζ)/Q),
k 7→ (ζ 7→ ζ k ).
Andererseits ist die Einheitengruppe (Z/p)× zyklisch. Nach Wahl einer Primitivwurzel w modulo p
erhält man einen Isomorphismus
Z/(p − 1) −→ (Z/p)× ,
i 7→ w i .
Das erlaubt es, die Elemente der Galoisgruppe wie folgt zu numerieren:
i
σi := (ζ 7→ ζ w ),
i ∈ Z/(p − 1).
Mit dieser Bezeichnung gilt dann σi σj = σi+j . Die Untergruppen der Galoisgruppe G stehen in
Bijektion zu den Teilern f |p − 1. Bezeichnet e = (p − 1)/f den komplementären Teiler, so ist
Gf := hσf i = {σ0 , σf , . . . , σ(e−1)f }
eine Untergruppe der Ordnung e und vom Index f . Der zugehörige Zwischenkörper
Q ⊂ Lf := Q(ζ)Gf ⊂ Q(ζ)
hat Grad f über Q. Wir setzen noch
i
ζi := σi (ζ) = ζ w .
Es gilt dann
σj (ζi ) = σj (σi (ζ)) = σi+j (ζ) = ζj+i .
Daraus bilden wir die sogenannten Gaußschen Perioden
uf i = ζi + ζi+f + . . . + ζi+(e−1)f
für i = 0, . . . , f − 1.
Lemma 13.8 — 1. Die Elemente uf,0 ,. . . , uf,f −1 bilden eine Q-Basis von Lf .
2. Lf = Q(uf,i ) für jedes i = 0, . . . , f − 1.
Beweis. Ad 1: Die Elemente 1, ζ, . . . , ζ p−2 bilden eine Q-Basis von Q(ζ), deshalb auch die Elemente ζ, ζ 2 , . . . ,ζ p−1 . Die Elemente ζ0 , ζ1 , . . . , ζp−2 unterscheiden sich von diesen nur durch die
Anordnung, bilden also auch eine Q-Basis von Q(ζ). Für ein beliebiges a ∈ Q(ζ) gibt es deshalb
eine eindeutige Darstellung
p−2
X
a=
ai ζi
i=0
mit ai ∈ Q, und
σf (a) =
p−2
X
117
ai ζi+f .
i=0
Das Element a liegt genau dann in Lf , wenn σf (a) = a, was wiederum genau dann der Fall ist,
wenn ai = ai+f (Indizes modulo p − 2). Deshalb kann man a in der folgenden Form umschreiben:
a = a0 (ζ0 + ζf + ζ2f + . . .) + a1 (ζ1 + ζ1+f + . . .) + . . . = a0 uf,0 + a1 uf,1 + . . . + af −1 uf,f −1 .
Das zeigt, daß die Perioden uf,0 ,. . . , uf,f −1 ein Erzeugersystem von Lf als Q-Vektorraum bilden,
und weil dimQ Lf = f , bilden sie auch eine Basis.
Ad 2: Die Galoisgruppe Gal(Lf /Q) = G/Gf = hσ1 i/hσf i wird von ϕ := σ1 |Lf erzeugt. Man
sieht sofort:
ϕ(uf,j ) = uf,j+1 .
Die Perioden uf,0 , . . . , uf,f −1 haben also dasselbe Minimalpolynom vom Grad f . Insbesondere hat
jede dieser Perioden den Grad f und erzeugt allein den Körper Lf als Erweiterung von Q.
Wir setzen zur Abkürzung uf := uf,0 = ζ0 + ζf + . . . + ζ(e−1)f . Aus dem gerade Bewiesenen
folgt:
Lf = Q(uf ),
′
und wenn f |f , so gilt Lf ′ = Q(uf ′ ) ⊂ Lf = Q(uf ) und uf hat Grad f /f ′ über Lf ′ .
Es sei speziell p eine Primzahl der Form p = 2k − 1. Dann sind alle Teiler von p − 1 von der
Form 2ℓ , 1 ≤ ℓ ≤ k, und man erhält eine Kette von Zwischenkörpern
Q = L1 ⊂ L2 ⊂ . . . ⊂ L2k = Q(ζ),
und in jedem Schritt genügt u2ℓ+1 einer quadratischen Gleichung mit Koeffizienten in L2ℓ .
Satz 13.9 (Gauß – Die Konstruktion des regulären 17-Ecks) — Es gilt
cos
1
2π
=
17
16
−1 +
√
17 +
q
√
34 − 2 17 +
r
√
√
68 + 12 17 − (6 + 2 17)
q
√
34 − 2 17
!
Beweis. 3 ist eine Primitivwurzel modulo 17. Um das einzusehen, genügt es nachzurechnen, daß
38 6≡ 1 mod 17, und in der Tat ist
38 ≡ (81)2 ≡ (−4)2 ≡ −1.
Deshalb gilt
0
ζ0 = ζ 3 = ζ,
1
ζ1 = ζ 3 = ζ 3 ,
2
ζ2 = ζ 3 = ζ −8 ,
3
ζ3 = ζ 3 = ζ −7 , . . .
Dann lauten die Perioden:
u2
=
ζ + ζ −8 + ζ −4 + ζ −2 + ζ −1 + ζ 8 + ζ 4 + ζ 2
u4
=
ζ + ζ −4 + ζ −1 + ζ 4
u8
=
ζ + ζ −1
u16
=
ζ
Diese genügen den folgenden quadratischen Gleichungen, wie man durch Rechnung verifiziert:
u22 + u2 − 4 = 0
u24 − u2 u4 − 1 = 0
2
u8 − u4 u8 + 21 (u4 − 1)(u2 + 1) − 1 = 0
u216 − u8 u16 + 1 = 0
118
Wenn man diese quadratischen Gleichungen auflöst, muß man vier Vorzeichenwahlen treffen, erhält
also wie erwartet 16 verschiedene Einheitswurzeln. Für den gesuchten Kosinus kommt man mit u8 /2
aus. Über die richtigen Vorzeichenwahlen kann man numerisch entscheiden. Man findet:
√ 1
u2 =
−1 + 17
2
q
√
√
1
u4 =
−1 + 17 + 34 − 2 17
4
und schließlich
1
u8 =
8
−1 +
√
17 +
q
√
34 − 2 17 +
r
√
√
68 + 12 17 − (6 + 2 17)
q
√
34 − 2 17
!
Aufgabe zu Kreisteilungspolynomen.
Aufgabe 13.10. — Programmieren Sie die Berechnung des n-ten Kreisteilungspolynoms a) rekursiv
aus der Formel (13.5) und b) direkt aus der Formel (13.4). Zum Vergleich: Die Kreisteilungspolynome sind in Mupad unter polylib::cyclotomic aufrufbar.
Aufgabe 13.11. — Wir verwenden die in Aufgabe 13.10 berechnete Tabelle für einige heuristische Überlegungen: Untersuchen Sie die Tabelle auf Regelmäßigkeiten, Stellen Sie Vermutungen
an, Versuchen Sie diese zu beweisen. [z.B. Welcher Zusammenhang besteht zwischen Φn und Φ2n ,
zwischen Φp und Φpℓ , p prim, etc. Die Tabelle zeigt, daß für n ≤ 100 in Φn nur die Koeffizienten
−1, 0, 1 vorkommen, warum? Was kann man allgemein erwarten? Beweis?]
119
§14. Konstruktionen mit Zirkel und Lineal
In diesem Abschnitt betrachten wir verschiedene Konstruktionsprobleme der klassischen Geometrie, die mit Zirkel und Lineal ausgeführt werden sollen. Die berühmtesten Konstruktionsprobleme
sind die folgenden.
(1) Die Quadratur des Kreises. Gegeben ein Kreis mit Mittelpunkt p und Radius r. Man
konstruiere ein Quadrat mit gleichem Flächeninhalt. Wenn man durch Wahl einer Einheitsstrecke den Maßstab festlegt, ist das Problem dazu äquivalent, eine Strecke der Länge
√
π zu konstruieren.
(2) Die Dreiteilung des Winkels. Man konstruiere zu einem gegebenen Winkel α den Winkel
α/3. Die Aufgabe ist für gewisse spezielle Winkel, wie α = π/2, leicht, es geht aber um
einen allgemeinen Winkel.
(3) Das delische Problem: Die Verdopplung des Würfels. Man konstruiere zu einer gegebenen Strecke a eine Strecke b so, daß das Volumen eines Würfels der Kantenlänge b das
Doppelte des Volumens eines Würfels der Kantenlänge a ist, d.h. b3 = 2a3 . Bei gewählter
√
Einheitsstrecke ist das Problem dazu äquivalent, eine Strecke der Länge 3 2 zu konstruieren.
Die ersten drei Aufgaben sind unlösbar. Der Unmöglichkeitsbeweis wird dadurch erbracht, daß man
die Aufgaben algebraisiert und mit Körpertheorie zeigt, daß die entsprechenden algebraischen Probleme nicht lösbar sind. Für die Dreiteilung des Winkels und die Verdopplung des Würfels genügen dazu einfache Aussagen über Körpererweiterungen. Die Unmöglichkeit der Kreisquadratur ist
sprichwörtlich. Der Beweis benötigt allerdings den Satz von Lindemann, daß π eine transzendente
Zahl ist.
Diesen klassischen Problemen fügen wir das folgende hinzu:
(4) Regelmäßige n-Ecke. Für welche natürlichen Zahlen n kann man ein reguläres n-Eck konstruieren?
Es war spätestens den Pythagoräern bekannt, daß man das Dreieck, das Viereck, das Fünfeck und das
Fünfzehneck sowie alle regulären n-Ecke, die daraus durch wiederholte Verdopplung der Eckenzahl
hervorgehen, konstruieren kann. In arabischen Quellen findet man eine Archimedes zugeschriebene
Konstruktion des regelmäßigen Siebenecks durch eine sogenannte Neusis. Daß man auch mit Zirkel
und Lineal etwas weiter kommt, war eine überraschende Entdeckung von Gauß.
Man beachte, daß die negativen Antworten für die oben genannten Probleme nur bei Beschränkung der gewählten Mittel Zirkel und Lineal Geltung haben. Läßt man andere Hilfsmittel, Maschinen
oder Methoden zu, gibt es sehr wohl Lösungen.
Wir präzisieren den Begriff der Konstruktion mit Zirkel und Lineal wie folgt: In der euklidischen
Ebene E sei eine Menge S mit mindestens zwei Punkten gegeben. Ein Punkt, eine Gerade bzw. ein
Kreis sind S-konstruierbar (oder kurz: konstruierbar, wenn der Zusammenhang klar ist), wenn sie in
endlich vielen Schritten auf die folgende Weise entstehen:
(1) Alle Punkte in S sind konstruierbar.
(2) Jede Gerade durch zwei verschiedene konstruierbare Punkte ist konstruierbar.
(3) Jeder Kreis mit konstruierbarem Mittelpunkt und durch einen anderen konstruierbaren Punkt
ist konstruierbar.
(4) Jeder Schnittpunkt zweier konstruierbarer Geraden, einer konstruierbaren Geraden und eines konstruierbaren Kreises bzw. zweier konstruierbarer Kreise ist konstruierbar.
Um Fragen der Konstruierbarkeit zu algebraisieren, gehen wir wie folgt vor: Wir zeichnen zwei
Punkte P0 , P1 ∈ S aus und betrachten den Abstand |P0 P1 | als Längenmaßeinheit. Es gibt dann
genau eine längentreue und orientierungserhaltende Identifizierung E → C mit P0 7→ 0 und P1 7→
120
1. In diesem Sinne betrachten wir von nun an S als eine Teilmenge von C, die die Punkte 0 und 1
enthält, und sprechen von (aus S) konstruierbaren komplexen Zahlen.
Es seien p1 und p2 verschiedene komplexe Zahlen. Eine komplexe Zahl z 6= p1 , p2 liegt auf der
reellen Geraden durch p1 und p2 , wenn das Verhältnis (z − p1 )/(z − p2 ) reell ist, d.h. wenn
z − p1
z − p1
=
.
z − p2
z − p2
Multiplikation mit dem Hauptnenner und Kürzen aller doppelt vorkommenden Terme führt auf die
folgende komplexe Form der Geradengleichung:
(14.1)
(p1 − p2 )z + (p2 − p1 )z = p1 p2 − p1 p2 .
Ist m ∈ C und r ∈ R>0 , so liegt z genau dann auf dem Kreis mit Mittelpunkt m durch den Punkt q,
wenn
(14.2)
(z − m)(z − m) = (q − m)(q − m).
Die Berechnung der Schnittpunkte in den elementaren Konstruktionsschritten führt demnach auf die
folgenden Gleichungssysteme:
(1) Der Schnittpunkt zweier Geraden durch Punkte p1 , p2 bzw. q1 , q2 ist eine Lösung des linearen Gleichungssystems:
(p1 − p2 )z + (p2 − p1 )z
=
p1 p2 − p1 p2
(q 1 − q 2 )z + (q2 − q1 )z
=
q 1 q 2 − q1 q 2 .
Insbesondere liegt z in dem Körper Q(S ∪ S), wenn p1 , p2 , q1 , q2 ∈ S.
(2) Jeder Schnittpunkt der Geraden durch Punkte p1 , p2 mit dem Kreis um m durch q ist eine
Lösung des Gleichungssystems
(p1 − p2 )z + (p2 − p1 )z
=
p1 p2 − p1 p2
(z − m)(z − m)
=
(q − m)(q − m).
Eliminiert man aus der zweiten Gleichung z bzw. z mit Hilfe der ersten Gleichung, so
bleibt eine quadratische Gleichung für z bzw. z mit Koeffizienten in Q(S ∪ S) übrig, wenn
p1 , p2 , m, q ∈ S.
(3) Jeder Schnittpunkt der beiden Kreise um m1 durch q1 bzw. um m2 durch q2 ist eine Lösung
des Gleichungssystems
(z − m1 )(z − m1 )
=
(q1 − m1 )(q 1 − m1 )
(z − m2 )(z − m2 )
=
(q2 − m2 )(q 2 − m2 ).
Ersetzt man eine der beiden Gleichungen durch ihre Differenz
z(m1 − m2 ) + z(m1 − m2 ) = |q2 − m2 |2 − |q1 − m1 |2 + |m2 |2 − |m1 |2 ,
so ist dieser Fall auf den vorigen zurückgeführt.
Satz 14.1 — Es sei S ⊂ C eine Menge von Punkten mit 0, 1 ∈ S. Ein Punkt z ∈ C ist genau
dann in endlich vielen Schritten aus S konstruierbar, wenn es eine Folge von Körpererweiterungen
K0 = Q(S ∪ S) ⊂ K1 ⊂ . . . ⊂ Kn mit den folgenden Eigenschaften gibt: [Ki+1 : Ki ] = 2 für
i = 0, . . . , n − 1, und z ∈ Kn .
Beweis. Es sei zunächst z aus S konstruierbar. Dazu seien ℓ Schritte nötig, bei denen in elementaren
Konstruktionsschritten der Reihe nach die Zahlen z1 , z2 ,. . . , zℓ = z konstruiert werden. Wir setzen
Sk := S ∪ {z1 , . . . , zk } und Lk := Q(Sk ∪ S k ) für k = 0, . . . , ℓ. Wir haben oben gesehen, daß
121
zk jeweils entweder in Lk−1 oder in einer quadratischen Erweiterung davon liegt. Dasselbe gilt dann
auch für z k . Wir erhalten eine Folge von Körpererweiterungen
L0 ⊂ . . . ⊂ Lk−1 ⊂ Lk−1 (zk ) ⊂ Lk = Lk−1 (zk , z k ) ⊂ . . . ⊂ Lℓ .
Der Körpergrad ist in jedem Schritt 1 oder 2, und nach Konstruktion ist z ∈ Lℓ . Das beweist die
erste Richtung.
Für die umgekehrte Richtung halten wir zunächst fest: Durch Kombination von elementaren Konstruktionsschritten sind auch die folgenden Konstruktionen immer ausführbar:
(1) Die Konstruktion der Parallelen zu einer konstruierten Geraden g durch einen konstruierten
Punkt P .
(2) Die Konstruktion des Kreises um einen konstruierbaren Punkt m mit Radius |Q1 Q2 |, wobei
Q1 und Q2 konstruierte Punkte sind.
Damit ist für je zwei konstruierbare Zahlen a und b auch ihre Summe und Differenz konstruierbar.
a+b
a
b
0
Die Konstruktion des Produktes oder Quotienten zweier Zahlen führt auf das Teilproblem, zwei
Winkel zu addieren oder zu subtrahieren, und das Teilproblem, zwei Streckenlängen zu multiplizieren oder zu dividieren. Das erste Problem ist leicht, das zweite Problem wird durch die Strahlensätze
gelöst:
ab
b
a
0
a
1
b
0
1
b/a
Schließlich kann man leicht jeden konstruierten Punkt P an einer konstruierten Geraden g spiegeln:
P
g
122
Insbesondere kann man zu jedem konstruierbaren Punkt z auch den komplex konjugierten Punkt z
konstruieren. Damit ist gezeigt:
Ist T ⊂ C eine Menge von Punkten, die aus S konstruierbar ist, so sind alle Punkte im Körper
Q(T ∪ T ) konstruierbar. Um die fehlende Richtung des Satzes zu beweisen, genügt es, die folgende
Behauptung zu beweisen: Genügt z ∈ C einer quadratischen Gleichung, deren Koeffizienten konstruierbar sind, so gilt dies auch für z. Offensichtlich genügt es weiter zu zeigen: Ist a konstruierbar,
so auch die beiden Quadratwurzeln aus a. Dazu wiederum genügt es, den von a mit der positiven
reellen Achse gebildeten Winkel zu halbieren, und die Quadratwurzel aus |a| zu ziehen. Letzteres
kann man zum Beispiel mit dem Höhensatz erreichen:
p
|a|
1
|a|
Damit ist alles gezeigt.
Satz 14.2 — Die Würfelverdopplung ist nicht mit Zirkel und Lineal ausführbar.
√
Beweis. In algebraischer Übersetzung lautet das Problem, die Zahl z = 3 2 zu konstruieren. Dazu
müßte es nach Satz 14.1 eine Körpererweiterung L/Q mit z ∈ L und [L : Q] = 2m , m ∈ N
geben. Das ist wegen [Q(z) : Q] = 3 und der Multiplikativität des Grads bei Körpererweiterungen
unmöglich. Deshalb ist die Konstruktion nicht ausführbar.
Satz 14.3 — Die Winkeldreiteilung ist für einen allgemeinen Winkel nicht mit Zirkel und Lineal
ausführbar.
Beweis. Es sei der Winkel α gegeben und u = 2 cos(α). Einen Winkel β mit α = 3β zu konstruieren, ist äquivalent dazu, die reelle Zahl x = 2 cos(β) aus u zu konstruieren. Nun gilt nach den
Formeln von de Moivre:
cos(α) + sin(α)i = (cos(β) + i sin(β))3
und somit
cos(α) = cos(β)3 − 3 cos(β) sin(β)2 = 4 cos(β)3 − 3 cos(β).
Deshalb erfüllt x die kubischen Gleichung
x3 − 3x − u = 0.
Es genügt, einen einzigen Winkel anzugeben, für den die Dreiteilung nicht möglich ist. Wir wählen
dazu α = π/3, also u = 1. Das Polynom f = X 3 − X − 1 ist irreduzibel. Deshalb ist [Q(x) : Q] =
3, und x kann nicht in einer Erweiterung L/Q liegen, deren Grad eine Potenz von 2 ist. Nach Satz
14.1 kann x nicht mit Zirkel und Lineal gelöst werden.
Satz 14.4 — Die Quadratur des Kreises ist nicht mit Zirkel und Lineal möglich.
√
Beweis. In algebraischer Übersetzung besteht das Problem darin, eine Strecke der Länge π zu konstruieren. Nun hat Ferdinand von Lindemann gezeigt, daß π eine transzendente Zahl ist (Folgerung
123
√
18.7). Deshalb ist auch π nicht algebraisch und erst recht nicht konstruierbar. Die Hauptschwierigkeit liegt hier natürlich im Satz von Lindemann.
Satz 14.5 — Es sei S ⊂ C eine Menge von Punkten mit 0, 1 ∈ S. Ein Punkt z ist genau dann aus S
konstruierbar, wenn z algebraisch über K = Q(S ∪S) ist und wenn der Grad des Zerfällungskörpers
von z über K eine Potenz von 2 ist.
Beweis. Es sei zunächst L/K der Zerfällungskörper eines über K algebraischen Elements z und
[L : K] = 2m . Dann ist die Galoisgruppe G := Gal(L/K) eine 2-Gruppe, und es gibt eine
Filtrierung von G durch Normalteiler
Gn = {id} ⊂ Gn−1 ⊂ . . . ⊂ G0 = G
mit der Eigenschaft gibt, daß |Gi |/|Gi+1 | = 2. Dem entspricht eine Folge von Zwischenkörpern
K = K0 ⊂ K1 ⊂ . . . ⊂ Kn = L,
Kν = LG ν
mit [Ki : Ki−1 ] = 2. Nach Satz 14.1 ist z mit Zirkel und Lineal aus S konstruierbar.
Zur Umkehrung: Es sei z aus S konstruierbar. Dann gibt es nach Satz 14.1 eine Folge von Körpererweiterungen
K = K0 ⊂ K1 ⊂ . . . ⊂ Kℓ
mit [Ki : Ki−1 ] = 2 und z ∈ Kℓ . Wir setzen L0 = K0 und konstruieren induktiv eine Folge von
K = L 0 ⊂ L 1 ⊂ . . . ⊂ Lℓ
mit den folgenden Eigenschaften:
(1) Ki ⊂ Li .
(2) Li ist normal über K.
(3) [Li+1 : Li ] ist eine Potenz von 2.
Es sei k ein Index mit 0 ≤ k < ℓ und Lk mit den verlangten Eigenschaften schon konstruiert. Es
gibt nun ein a ∈ Kk+1 mit Kk+1 = Kk (a), und dieses a ist eine Nullstelle eines quadratischen
Polynoms f ∈ Kk [X]. Es seien weiter a = a1 , . . . , am ∈ C die Nullstellen von minpola/K . Wir
setzen Lk+1 := Lk (a1 , . . . , am ). Dann gilt nach Konstruktion sicher Lk ⊂ Lk+1 und Kk+1 ⊂
Lk+1 , und Lk+1 /K ist normal. Zu jedem ai gibt es einen Automorphismus σi ∈ Gal(Lk+1 /K)
mit σi (a) = ai . Der Automorphismus σi transformiert f ∈ Kk [X] ⊂ Lk [X] in ein Polynom
fi ∈ Lk [X], weil Lk normal ist. Aus f (a) = 0 folgt fi (ai ) = 0. Insbesondere ist ai quadratisch
über Lk , also erst recht höchstens quadratisch über Lk (a1 , . . . , ai−1 ). Die Körpererweiterungen
Lk ⊂ Lk (a1 ) ⊂ . . . ⊂ Lk (a1 , a2 , . . . , am ) = Lk+1
haben also jeweils den Grad 1 oder 2. Damit ist die Induktion abgeschlossen.
Insgesamt erhalten wir so eine normale Erweiterung Lℓ /K von 2-Potenzgrad mit z ∈ Lℓ . Dann
enthält Lℓ einen Zerfällungskörper von z über K, und dessen Grad über K ist notwendigerweise
ebenfalls eine Potenz von 2.
Lemma 14.6 — Eine Zahl der Form 2n + 1 ist höchstens dann eine Primzahl, wenn n = 2k für ein
k ∈ N0 .
Beweis. Angenommen, n = mq mit einer ungeraden Zahl q, 1 < q ≤ n. Dann gilt
2n + 1 = (2m + 1) (2m )q−1 − (2m )q−2 + . . . − 2m + 1 .
Wenn also 2n + 1 eine Primzahl sein soll, darf n keinen nichttrivialen ungeraden Faktor enthalten.
k
Definition 14.7. — Zahlen der Form Fk = 22 + 1 heißen Fermatzahlen.
124
Die ersten Fermatzahlen sind wirklich Primzahlen:
F0 = 3,
F1 = 5,
F2 = 17,
F3 = 257,
F4 = 65537.
32
Aber schon die nächste Fermatzahl faktorisiert (Euler): 2 + 1 = 641 · 6700417. Es sind keine
weiteren Fermatzahlen bekannt, die Primzahlen sind. Die Faktorisierung von Fermatzahlen ist ein
beliebter Test für die Qualität von neuen Faktorisierungsalgorithmen. Den jeweils aktuellen Stand
der Bemühungen findet man wohl am schnellsten durch eine Suche im Internet.
Satz 14.8 (Gauß) — Ein reguläres n-Eck ist genau dann mit Zirkel und Lineal konstruierbar, wenn
n die Form
n = 2 m p1 · · · pℓ
hat, wobei m, ℓ ∈ N0 und p1 ,. . . ,pℓ paarweise verschiedene Fermat-Primzahlen sind.
ν
Beweis. Es sei n = 2m pν11 · · · pℓ ℓ die Primfaktorzerlegung von n. Der Zerfällungskörper des Kreisteilungspolynoms Φn hat den Grad
ν −1
ϕ(n) = 2m−1 p1ν1 −1 · · · pℓ ℓ
(p1 − 1) · · · (pℓ − 1).
Nach Satz 14.5 ist das reguläre n-Eck genau dann mit Zirkel und Lineal konstruierbar, wenn ϕ(n)
eine Zweierpotenz ist. Dies ist genau dann der Fall, wenn jede ungerade Primzahl p = p1 , . . . , pℓ
höchstens mit Vielfachheit 1 vorkommt und wenn in diesem Falle p − 1 eine Potenz von 2, also p
eine Fermat-Primzahl ist.
Was die tatsächliche Konstruktion angeht, so genügt es offensichtlich, für jede Fermat-Primzahl
p eine Konstruktion des regulären p-Ecks anzugeben. Wie das geht, haben wir schon gesehen (siehe
Satz 13.9). Für zusammengesetzte Zahlen n ergibt sich die Konstruktion dann leicht.
Algebra I im Wintesemester 2015
125
§15. Auflösbarkeit von Gleichungen
15.1. Spur und Norm. Es sei L/K eine endliche Körpererweiterung und a ∈ L. Die Linksmultiplikation
ℓa : L → L,
x 7→ ax
ist eine K-lineare Abbildung. Das charakteristische Polynom von a ist
charpola/L/K (X) := det(XidL − ℓa ).
Lemma 15.1 — Es seien K ⊂ L ⊂ M Körpererweiterungen und a ∈ L.
(1) charpola/K(a)/K = minpola/K .
[M :L]
(2) charpola/M/K = charpola/L/K .
(3) charpola/L/K =
[L:K(a)]
minpola/K
.
Beweis. Zu 1: Das Minimalpolynom minpola/K ist ein Teiler des charakteristischen Polynoms
charpola/K(a)/K . Da beide denselben Grad [K(a) : K] haben und normiert sind, sind sie gleich.
Zu 2: Es sei x1 , . . . , xn eine K-Basis von L und y1 , . . . , ym eine L-Basis von M . Es sei B die
Matrix zu ℓa bezüglich der Basis x1 , . . . , xn . Dann ist
x 1 y 1 , . . . , x n y1 , x 1 y2 , . . . , x n y m
eine K-Basis von M , und zu ℓa : M → M gehört bezüglich dieser Basis die Matrix


B


B




..


.


B
mit m = [L : M ] Blockmatrizen entlang der Hauptdiagonalen. Aus der Multiplikativität des charakteristischen Polynoms für Blockmatrizen folgt charpola/M/K = charpolm
a/L/K , wie behauptet.
Zu 3: Die Behauptung ist eine Konsequenz aus 1. und 2.
Definition 15.2. — Es sei L/K eine endliche Körpererweiterung. Die Abbildungen
SpL/K : L → K,
a 7→ SpL/K (a) := tr(ℓa )
und
NmL/K : L → K,
a 7→ NmL/K (a) := det(ℓa )
heißen Spur und Norm von L/K.
Nach Definition gilt
charpola/L/K (X) = X n − SpL/K (a)X n−1 + . . . + (−1)n NmL/K (a),
mit n = [L : K], d.h. bis auf Vorzeichen sind Spur und Norm genau der n − 1-te und der 0-te
Koeffizient des charakteristischen Polynoms. Aus Lemma 15.1 ergeben sich leicht eine Reihe von
Eigenschaften von Spur und Norm:
Lemma 15.3 — Es sei L/K eine endliche Körpererweiterung. Für alle a, b ∈ L gilt
SpL/K (a + b)
NmL/K (ab)
=
=
SpL/K (a) + SpL/K (b),
NmL/K (a) · NmL/K (b).
Insbesondere ist NmL/K : L∗ → K ∗ ein Gruppenhomomorphismus. Für a ∈ K gilt außerdem
SpL/K (a) = [L : K] · a
und
NmL/K (a) = a[L:K] .
126
Beweis. Die erste Behauptung folgt sofort aus der Additivität der Spur bzw. der Multiplikativität der
Determinante von Matrizen. Die zweite Aussage ergibt sich daraus, daß ℓa für a ∈ K bezüglich
jeder K-Basis von L die Matrix aI[L:K] hat.
Lemma 15.4 — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G. Es sei ferner
a ∈ L und {a1 , . . . , an } die G-Bahn von a. Dann gilt:
n
Y
minpola/K =
i=1
und
charpola/K/L =
Y
(X − ai )
σ∈G
(X − σ(a)).
Bezeichnet H die Standgruppe von a, so ist K(a) = LH und H = Gal(L/K(a)).
Beweis. Die Gruppe G permutiert die Elemente der Bahn B := {a1 , . . . , an }. Deshalb sind die
Koeffizienten des Polynoms f := (X − a1 ) · . . . · (X − an ) invariant unter G und liegen in LG = K.
Insbesondere ist das Minimalpolynom von a ein Teiler von f . Umgekehrt ist klar, daß f ein Teiler
des Minimalpolynoms ist. Da beide normiert sind, sind sie gleich.
Weiter ist klar, daß K(a) ⊂ LH . Andererseits ist nach der Bahnengleichung
[K(a) : K] = deg(minpola/K ) = |B| = |G|/|H| = [L : K]/[L : LH ] = [LH : K].
Das impliziert K(a) = LH und H = Gal(L/K(a)). Wir betrachten die Abbildung π : G →
B, σ 7→ σ(a). Dann ist π −1 (ai ) = σi H. Insbesondere kommt jedes ai in der endlichen Folge
(σ(a))σ∈G genau |H| mal vor. D.h.
Y
σ∈G
(X − σ(a)) =
n
Y
i=1
(X − ai )
|H|
[L:K(a)]
= minpola/K
= charpola/L/K .
15.2. Zyklische Erweiterungen.
Definition 15.5. — Eine endliche Galoiserweiterung L/K heißt zyklisch, wenn die Galoisgruppe
Gal(L/K) eine zyklische Gruppe ist.
Der merkwürdige Name des folgenden berühmten Satzes rührt daher, daß er als ‘Satz 90’ in
Hilberts Zahlbericht für die Deutsche Mathematiker-Vereinigung erscheint.
David Hilbert: Die Theorie der algebraischen Zahlkörper. Jahresbericht der Deutschen Mathematiker-Vereinigung 4 (1897),
p. 175 – 546.
Satz 15.6 (Hilbert 90) — Es sei L/K eine zyklische Galoiserweiterung und σ ein Erzeuger der
Galoisgruppe. Die folgenden Aussagen sind für ein a ∈ L äquivalent:
NmL/K (a) = 1
⇔
a=
b
für ein b ∈ L× .
σ(b)
Beweis. Es sei n = [L : K]. Da die Galoisgruppe zyklisch ist, gilt NmL/K (a) =
a = b/σ(b) für ein b ∈ L× , so hat man
NmL/K (a) =
Qn−1
i=0
σ i (a). Falls
σ(b)
σ n−1 (b)
b
b
· 2
· ... ·
= n
= 1.
σ(b) σ (b)
σ n (b)
σ (b)
Zur Umkehrung: Es sei a mit NmL/K (a) = 1 gegeben. Wegen der linearen Unabhängigkeit von
id, σ, . . . , σ n−1 ist die Abbildung u : L → L mit
u(x) = x + aσ(x) + aσ(a)σ 2 (x) + . . . + aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (x)
127
nicht die Nullabbildung. Wir wählen y ∈ L mit b := u(y) 6= 0. Dann gilt:
aσ(b)
=
aσ(u(y))
=
aσ(y) + aσ(aσ(y)) + . . . + aσ(aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (y))
=
aσ(y) + aσ(a)σ 2 (y) + . . . + aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (y)
+ NmL/K (a)σ n (y)
=
b,
weil σ n (y) = y und NmL/K (a) = 1 nach Voraussetzung. Damit ist a = b/σ(b) wie verlangt.
Satz 15.7 (Die reine Gleichung) — Es sei n ∈ N und K ein Körper, der eine primitive n-te Einheitswurzel ζ enthält.
(1) Ist L/K eine zyklische Erweiterung vom Grad n, dann ist L = K(a) für ein Element a mit
einem Minimalpolynom der Form X n − c ∈ K[X].
(2) Ist umgekehrt a ∈ K eine Nullstelle eines Polynoms X n − c ∈ K[X], so ist minpola/K =
X d − b für einen Teiler d von n, K(a)/K ist eine zyklische Erweiterung vom Grad d, und
die Abbildung
Z/d −→ Gal(K(a)/K),
k 7→ (a 7→ ζ kn/d a)
ist ein Gruppenisomorphismus. Ferner zerfällt X n − c zerfällt über K(a) in Linearfaktoren
Q
d
di
und über K wie folgt: X n − c = n/d
i=1 (X − ζ b).
Beweis. 1. Es gilt NmL/K (ζ) = ζ [L:K] = ζ n = 1. Insbesondere gibt es nach Satz 90 von Hilbert
ein a ∈ L mit ζσ(a) = a. Es folgt induktiv:
σ k (a) = aζ −k
für k = 0, . . . , n − 1. Diese Werte sind paarweise verschieden, weil ζ eine primitive n-te Einheitswurzel ist. Insbesondere ist
(X − a) · (X − aζ −1 ) · . . . · (X − aζ n−1 ) = X n − an
das Minimalpolynom von a. Mit c = an ∈ K folgt die Behauptung.
Zu 2. Ist a eine Nullstelle von X n − c in einem algebraischen Abschluß von K, so sind alle anderen
von der Form aζ k , k = 0, . . . , n−1. Insbesondere ist K(a) der Zerfällungskörper von X n −c. Es sei
d := [K(a) : K]. Für jedes σ ∈ Gal(K(a)/K) gibt es genau ein ϕ(σ) ∈ Z/n mit σ(a) = aζ ϕ(σ) .
Dies definiert eine injektive Abbildung
ϕ : Gal(K(a)/K) → Z/n.
Außerdem gilt
ζ ϕ(τ σ) a = τ (σ(a)) = τ (ζ ϕ(σ) a) = ζ ϕ(σ) τ (a) = ζ ϕ(σ) ζ ϕ(τ ) a = ζ ϕ(σ)+ϕ(τ ) a.
Der Vergleich zeigt, daß ϕ(τ σ) = ϕ(σ) + ϕ(τ ), mit anderen Worten, ϕ ist ein Gruppenhomomorphismus. Notwendigerweise ist das Bild von ϕ die zu Z/d isomorphe Untergruppe, die von der
Restklasse n/d erzeugt wird. Deshalb wird die Galoisgruppe von der Abbildung a 7→ aζ n/d erzeugt.
Bezeichnet ξ := ζ n/d diese primitive d-te Einheitswurzel, so ist das Minimalpolynom von a durch
(X − a)(X − ξa) · · · (X − ξ d−1 a) = X d − ad =: X d − b
gegeben. Schließlich gilt:
Xn − c =
n−1
Y
i=0
n/d−1 d−1
(X − ζ i a) =
Y Y
j=0
i=0
n/d−1
(X − ξ i ζ j a) =
Y
j=0
(X d − (ζ j a)d ).
128
Satz 15.8 (Hilbert 90, additive Variante) — Es sei L/K eine zyklische Galoiserweiterung und σ ein
Erzeuger der Galoisgruppe. Die folgenden Aussagen sind für ein a ∈ L äquivalent:
SpL/K (a) = 0
⇔
a = b − σ(b) für ein b ∈ L.
Beweis. Die Richtung ⇐ ist wieder einfach. Für die umgekehrte Richtung sei a ∈ L mit SpL/K (a) =
0 vorgegeben. Wir wählen ein y ∈ L mit SpL/K (y) 6= 0 und bilden
c = aσ(y) + (a + σ(a))σ 2 (y) + . . . + (a + σ(a) + . . . + σ n−2 (a))σ n−1 (y).
Für dieses Element gilt
c − σ(c) = a σ(y) + σ 2 (y) + . . . + σ n−1 (y) − σ(a) + σ 2 (a) + . . . + σ n−1 (a) y.
Da SpL/K (a) = 0, ist der Koeffizient von y in c − σ(c) genau a. Deshalb hat man weiter
c − σ(c) = a(y + σ(y) + . . . + σ n−1 (y)) = a SpL/K (y).
Nach Wahl von y ist das Element SpL/K (y) ∈ K × . Mit b := c/ SpL/K (y) folgt die Behauptung.
In einem Körper der Charakteristik p hat das Polynom X p − X nach dem kleinen Fermatschen
Satze die p-Nullstellen 0, 1, . . . , (p − 1). Deshalb besteht die Faktorisierung
X p − X = X · (X − 1) · . . . · (X − (p − 1)).
Substitutiert man X durch X − a mit einem beliebigen Element a erhält man
X p − X − (ap − a) = (X − a)(X − a − 1) · . . . · (X − a − p + 1).
Diese kleine Rechnung wird im Beweis des folgenden Satzes benutzt:
Satz 15.9 (Artin14 – Schreier15) — Es sei K ein Körper der Charakteristik p > 0.
(1) Ist L/K eine zyklische Galoiserweiterung vom Grad p, dann ist L = K(a) für ein a mit
einem Minimalpolynom der Form X p − X − c ∈ K[X].
(2) Umgekehrt zerfällt jedes Polynom X p − X − c ∈ K[X] entweder schon in K vollständig
in Linearfaktoren oder ist irreduzibel. Ist im zweiten Falle a eine Nullstelle in einem algebraischen Abschluß, so ist K(a)/K eine zyklische Galoiserweiterung, und die Abbildung
Z/p → Gal(K(a)/K),
k 7→ (a 7→ a + k),
ist ein Gruppenisomorphismus.
Beweis. Es sei zunächst L/K zyklisch vom Grad p. Es gilt SpL/K (−1) = −p = 0. Deshalb gibt es
nach der additiven Variante des Satzes von Hilbert ein a ∈ L mit −1 = a−σ(a), oder σ(a) = a+1.
Dann kann a nicht in K liegen. Nach dem Gradsatz ist [K(a) : K] ein Teiler von [L : K] = p.
Deshalb ist K(a) = L. Das Minimalpolynom bestimmt sich so: Induktiv gilt σ k (a) = a + k für alle
k = 0, . . . , p − 1. Also ist
p−1
minpola/K
=
Y
k=0
=
(X − σ k (a))
(X − a)(X − a − 1) · · · (X − a − p + 1) = X p − X − (ap − a).
Das war zu zeigen.
Ist umgekehrt das Polynoms X p − X − c ∈ K[X] vorgegeben und a eine Nullstelle in einer
Erweiterung von K, so gilt für i = 0, . . . , p−1, daß (a+i)p −(a+i)−c = (ap −a−c)+(ip −i) = 0.
Enthält also eine Erweiterung von K eine Nullstelle, so enthält sie alle. Folglich zerfällt X p − X − c
in K(a)[X] vollständig in Linearfaktoren. Außerdem ist X p − X − c separabel. Für jedes Element
14Emil Artin, b3. März 1898 in Wien d20. Dezember 1962 in Hamburg.
15Otto Schreier, b3. März 1901 in Wien d2. Juni 1929 in Hamburg.
129
σ ∈ Gal(K(a)/K) gibt es ein eindeutiges ϕ(σ) ∈ Z/p mit σ(a) = a + ϕ(σ), und σ ist durch ϕ(σ)
eindeutig bestimmt. Deshalb ist
ϕ : Gal(K(a)/K) → Z/p
eine injektive Abbildung. Wegen
τ (σ(a)) = τ (a + ϕ(σ) = τ (a) + ϕ(σ) = a + ϕ(τ ) + ϕ(σ)
gilt ϕ(τ σ) = ϕ(τ ) + ϕ(σ), d.h. ϕ ist ein Gruppenhomomorphismus. Weil p prim ist, ist ϕ entweder
trivial oder ein Isomorphismus. Deshalb zerfällt X p − X − a entweder schon über K vollständig in
Linearfaktoren oder ist irreduzibel. Im zweiten Falle hat die Erweiterung den Grad p, und man hat
einen Isomorphismus
Z/p 7→ Gal(K(a)/K),
k 7→ (a 7→ k).
15.3. Auflösbare Gleichungen. Es sei K ein Körper und f ∈ K[X] ein separables Polynom vom
Grad n. Wir wollen in diesem Abschnitt die Frage betrachten, unter welchen Bedingungen sich die
Nullstellen von f durch Wurzelausdrücke in den Koeffizienten von f beschreiben lassen. Wir wollen
die folgende Sprechweise verwenden: Es sei L ein Zerfällungskörper von f . Wir bezeichnen die
Galoisgruppe Gal(L/K) kurz als Gruppe der Gleichung f = 0.
Definition 15.10. — Man nennt eine Galoiserweiterung L/K auflösbar, wenn die Galoisgruppe
Gal(L/K) auflösbar ist.
Definition 15.11. — Eine Erweiterung M/K ist eine Radikalerweiterung, wenn M/K eine zyklische Erweiterung vom Grad m ist, wobei m entweder die Charakteristik von K ist oder m zur
Charakteristik prim ist und K eine primitive m-te Einheitswurzel enthält.
Definition 15.12. — Es sei K ein Körper und f ∈ K[X] ein irreduzibles Polynom. f heißt durch
Radikale auflösbar, wenn es eine Kette von Körpererweiterungen K = K0 ⊂ K1 ⊂ . . . ⊂ Kn mit
den folgenden Eigenschaften gibt: Kn enthält eine Nullstelle von f und für jedes i = 1, . . . , n ist
Ki /Ki−1 eine Radikalerweiterung.
Satz 15.13 — Die folgenden Aussagen sind für ein irreduzibles Polynom f ∈ K[X] äquivalent:
(1) f ist durch Radikale auflösbar.
(2) Die Gruppe der Gleichung f = 0 ist auflösbar.
Beweis. 1 ⇒ 2: Es sei K = K0 ⊂ . . . ⊂ Kn eine Kette von Erweiterungen mit den Eigenschaften
der Definition 15.12. Wir konstruieren induktiv Körper Lk ⊂ K n , k = 0, . . . , n mit
(1) K0 = L0 und Ki ⊂ Li für alle i = 1, . . . , n.
(2) Li /K ist eine Galoiserweiterung.
(3) Gal(Li /Li−1 ) ist auflösbar.
Es sei 0 < i ≤ n gegeben und Li−1 bereits konstruiert. Wir betrachten das Kompositum Ki′ =
Ki Li−1 . Dann ist Ki′ /Li−1 eine Galoiserweiterung, und es gibt einen kanonischen Monomorphismus Gal(Ki′ /Li−1 ) → Gal(Ki /Ki−1 ). Insbesondere ist Gal(Ki′ /Li−1 ) zyklisch von einer Ordnung m, wobei entweder m = char(K) > 0 oder m prim zur Charakteristik ist und Ki−1 , also
auch Li−1 , eine primitive m-te Einheitswurzel enthält, d.h. Ki′ /Li−1 ist eine Radikalerweiterung.
Also ist L′ /Li−1 eine einfache Erweiterung, L′i = Li−1 (a), wobei das Minimalpolynom von a die
Form X m −X −c oder X m −c für ein c ∈ Li−1 hat. Die Erweiterung Li−1 /K ist nach Induktionsannahme normal. Es seien c = c1 , . . . , cℓ ∈ Li−1 die zu c konjugierten Elemente, ferner aj ∈ K n
130
eine Nullstelle des Polynoms X m − X − cj bzw. X m − cj für j = 1, . . . , ℓ. Die Erweiterungen
Li−1 (aj )/Li−1 sind zyklisch der Ordnung m. Wir betrachten die Erweiterungen
Li−1 ⊂ Li−1 (a1 ) ⊂ Li−1 (a1 , a2 ) ⊂ . . . ⊂ Li−1 (a1 , a2 , . . . , aℓ ) =: Li .
Dann ist Li /K normal, und jede Erweiterung Li−1 (a1 , . . . , aj )/Li−1 (a1 , . . . , aj−1 ) ist eine Galoiserweiterung, deren Galoisgruppe isomorph zu einer Untergruppe von Gal(Li−1 (aj )/Li−1 ) und
daher zyklisch ist. Für die Galoisgruppe Gal(Li /Li−1 ) heißt das, daß es eine Filtrierung durch Normalteiler gibt, deren Faktorgruppen zyklisch sind. Das bedeutet: Gal(Li /Li−1 ) ist auflösbar. Das
beendet den Induktionsschritt.
Insgesamt erhält man einen Körper Ln , der Kn und damit eine Wurzel von f enthält, der eine
Galoiserweiterung von K ist, und der eine Kette von Zwischenkörpern mit auflösbaren Galoisgruppen enthält. Demnach hat Gal(Ln /K) eine Filtrierung durch Normalteiler mit auflösbaren Faktorgruppen und ist damit selbst auflösbar. Der Zerfällungskörper F von f ist nach Konstruktion
ein Zwischenkörper von Ln /K, und die Galoisgruppe Gal(F/K) folglich eine Faktorgruppe von
Gal(Ln /K). Da Faktorgruppen von auflösbaren Gruppen wieder auflösbar sind, ist Gal(F/K) auflösbar. Das war zu zeigen.
2 ⇒ 1: Es sei F ein Zerfällungskörper von f und N die Ordnung der Galoisgruppe G =
Gal(F/K). Nach Annahme ist G auflösbar. Es seien q1 , . . . , qℓ alle Primzahlen ≤ N , die char(K)
nicht teilen, und zwar der Größe nach aufsteigend sortiert. Wir konstruieren rekursiv Körpererweiterungen K = K0 ⊂ K1 ⊂ . . . ⊂ Kℓ mit der Eigenschaft, daß Kj alle primitiven Einheitswurzeln
der Ordnungen q1 , . . . , qj enthält. Es sei dazu k > 0 und Kk−1 schon konstruiert und ζ eine primitive qk -te Einheitswurzel. Nach Wahl der qi ’s ist qk prim zur Charakteristik, falls diese endlich
ist. Die Galoisgruppe Gal(Kk−1 (ζ)/Kk−1 ) ist isomorph zu einer Untergruppe von Z/(qk − 1) und
daher abelsch und hat eine Ordnung, deren sämtliche Primfaktoren kleiner als qk sind. Es gibt daher
eine Filtrierung der Galoisgruppe durch Untergruppen mit zyklischen Faktoren derselben Primzahlordnungen und dazugehörig eine Kette von zyklischen Körpererweiterungen
Kk−1 = Kk−1,0 ⊂ Kk−1,1 ⊂ Kk−1,2 ⊂ . . . ⊂ Kk−1,s = Kk−1 (ζ) =: Kk ,
wobei der Körpergrad [Ki−1,t : Ki−1,t−1 ] an jeder Stelle entweder eine der Primzahlen q1 , . . . , qk−1
oder die Charakteristik von K ist. Insbesondere sind alle Erweiterungen Ki−1,t /Ki−1,t−1 Radikalerweiterungen. Nach Induktionsannahme enthält Ki−1 die qi -ten Einheitswurzeln für alle i ≤ k−1.
Es sei nun L das Kompositum von Kℓ und F in einem gemeinsamen algebraischen Abschluß.
Dann ist Gal(L/Kℓ ) eine Untergruppe von Gal(F/K) und nach Annahme auflösbar und hat eine
Ordnung ≤ N . Folglich gibt es eine Filtrierung von Gal(L/Kℓ ) durch Normalteiler mit zyklischen
Faktoren von Primzahlordnung ≤ N . Dazu gehört eine Kette von zyklischen Körpererweiterungen
Kℓ = Kℓ,0 ⊂ Kℓ,1 ⊂ Kℓ,2 ⊂ . . . ⊂ Kℓ,u = L,
wobei der Körpergrad [Kℓ,t : Kℓ,t−1 ] an jeder Stelle entweder eine der Primzahlen q1 , . . . , qℓ oder
die Charakteristik von K ist, d.h. alle Erweiterungen Kℓ−1,t /Kℓ−1,t−1 sind Radikalerweiterungen.
Nach Konstruktion hat f eine Nullstelle in L. Zusammengenommen heißt das, daß f eine Auflösung durch Radikale besitzt.
Es sei wieder allgemein K ein Körper, f ∈ K[X] ein separables Polynom. Es seien α1 , α2 ,
. . . , αn ∈ L die Nullstellen von f im Zerfällungskörper L von f . Jedes Element g ∈ Gal(L/K)
permutiert die Nullstellen, d.h. es gibt eine eindeutige Permutation g ∈ Sn mit der Eigenschaft, daß
g(αi ) = αg(i)
für alle i = 1, . . . , n.
131
Dies definiert einen Gruppenhomomorphismus
ϕ : Gal(L/K) → Sn ,
g 7→ g.
Da L von den Nullstellen von f erzeugt wird, ist jedes g ∈ G vollständig durch die Wirkung auf den
Nullstellen bestimmt. Insbesondere ist der Homomorphismus ϕ injektiv, und wir können Gal(L/K)
als Untergruppe von Sn auffassen. Allerdings hängt ϕ von der Numerierung der Nullstellen ab. Je
zwei Numerierungen
′
{α1 , . . . , αn } = {α1′ , . . . , αn
}
unterscheiden sich um eine Permutation π mit αi′ = απ(i) . Bezeichnet ϕ′ : Gal(L/K) → Sn die
Einbettung zur zweiten Numerierung, so gilt:
′
′
′ (g)(i) = g(αi ) = g(απ(i) ) = αϕ(g)(π(i)) ,
απ(ϕ′ (g)(i)) = αϕ
d.h.
ϕ′ (g) = π −1 ◦ ϕ(g) ◦ π.
Die Einbettungen zu verschiedenen Numerierungen sind also konjugiert.
Lemma 15.14 — Mit diesen Bezeichnungen gilt:
(1) Die Ordnung von Gal(L/K) ist ein Teiler von n!.
(2) Wenn f irreduzibel ist, operiert Gal(L/K) transitiv auf den Nullstellen von f . In diesem
Falle ist n ein Teiler von |Gal(L/K)|.
Beweis. Die erste Behauptung folgt einfach daraus, daß Gal(L/K) eine Untergruppe von Sn ist.
Es ist weiter klar, daß für ein irreduzibles Polynom alle Nullstellen von f in einer Bahn unter der
Galoisgruppe liegen. Die Teilbarkeitsrelation ist eine Konsequenz der Bahnengleichung: Die Länge
jeder Bahn ist ein Teiler der Gruppenordnung.
Folgerung 15.15 — Es sei f ∈ K[X] ein Polynom vom Grad ≤ 4. Dann ist die Gleichung f = 0
durch Radikale auflösbar.
Beweis. Die Gruppe der Gleichung f = 0 ist eine Untergruppe von S4 und deshalb auflösbar.
Beispiel 15.16. — Es sei L/Q der Zerfällungskörper des Polynoms f = X 5 − 4X − 2. Mit dem
Eisensteinkriterium folgt sofort, daß f irreduzibel ist. Als Funktion auf R hat f genau zwei Extremstellen, weil die Ableitung f ′ = 5X 4 − 4 zwei reelle Nullstellen hat. Nach dem Zwischenwertsatz
hat f deshalb genau drei reelle Nullstellen. Die beiden übrigen Nullstellen sind komplex konjugiert.
Die komplexe Konjugation ist daher ein Element der Galoisgruppe G = Gal(L/Q) und entspricht
unter der Einbettung G ⊂ S5 einer Transposition. Da 5 ein Teiler der Ordnung von G und eine Primzahl ist, enthält G ein Element der Ordnung 5. Unter der Einbettung G ⊂ S5 muß dieses Element
einem 5-Zykel entsprechen. Die Galoisgruppe G ist also eine Untergruppe von S5 , die einen 5-Zykel
und eine Transposition enthält. Man kann zeigen (Übung), daß G dann schon mit S5 übereinstimmen
muß. Insbesondere ist X 5 − 4X − 2 nicht durch Radikale auflösbar.
Beispiel 15.17. Es sei K ein Körper. Die symmetrische Gruppe Sn wirkt auf dem rationalen Funktionenkörper M := K(X1 , . . . , Xn ) durch Vertauschung der Unbestimmten. Die Erweiterung M/M Sn
ist eine Galoiserweiterung mit Galoisgruppe Sn . Dies ist einfach ein Spezialfall von Satz 12.28. Mit
Hilfe des Hauptsatzes über symmetrische Polynome können wir aber mehr sagen: Zunächst gibt es
einen Ringisomorphismus
K[Y1 , . . . , Yn ] −→ K[X1 , . . . , Xn ]Sn
132
der die Unbestimmte Yi mit dem i-ten elementarsymmetrischen Polynom in den Unbestimmten Xj
identifiziert. Dieser Isomorphismus induziert eine Abbildung der Funktionenkörper:
ψ
K(Y1 , . . . , Yn ) −−→ K(X1 , . . . , Xn )Sn ⊂ K(X1 , . . . , Xn ).
Wir wollen zeigen, daß ψ ein Isomorphismus ist. Dazu ist zu zeigen, daß jede symmetrische rationale Funktion f ∈ K(X1 , . . . , Xn ) sich als Quotient zweier symmetrischer Polynome p, q ∈
K[X1 , . . . , Xn ] schreiben läßt. Das ist leicht: Es sei f = p/q irgendeine Darstellung von f als
Quotient zweier Polynome p, q. Wir bilden
Q
p · σ∈Sn \{id} σ(q)
p
Q
f= =
.
q
σ∈Sn σ(q)
Q
Q
Der Nenner q̃ = σ∈Sn σ(q) ist invariant. Der Zähler p̃ = p · σ∈Sn \{id} σ(q) aber auch, denn er
läßt sich als Produkt der symmetrischen Funktionen f und q̃ schreiben.
Das zeigt, daß K(X1 , . . . , Xn )/K(Y1 , . . . , Yn ) eine Galoiserweiterung mit Galoisgruppe Sn
ist. Die Unbestimmten Xi sind Nullstellen der Gleichung
X n − Y1 X n + Y2 X n−2 + . . . + (−1)n Yn = 0.
Diese Gleichung läßt sich als die allgemeine Gleichung vom Grad n über dem Körper K auffassen.
Für n ≥ 5 ist die Galoisgruppe Sn nicht auflösbar. In diesem Sinne gibt es keine Lösungsformeln
für die Nullstellen, die sich durch Radikale in den Unbestimmten Yi ausdrücken lassen.
Trotzdem gibt es Gleichungen vom Grad n ≥ 5, die sich durch Radikale lösen lassen. Das
einfachste Beispiel liefern die 11.ten Einheitswurzeln: Das Minimalpolynom von cos(2π/11) hat
Grad 5, und der Zerfällungskörper ist zyklisch vom Grad 5. Die Auflösbarkeit wurde für dieses
Beispiel zuerst von Vandermonde beschrieben. Näheres dazu im Buch von Tignol, der die Formeln
von Vandermonde übernimmt. In einem unveröffentlichten Aufsatz geben Matthew Davis und Shiv
Gupta Korrekturen zu diesen Formeln, aber in der mir bekannte Fassung dieses Aufsatzes gibt es
zumindest Druckfehler. Die Geschichte der Gleichung fünften Grades ist eine Geschichte für sich. Es
gibt spezielle Literatur zur Frage, wie man entscheidet, ob eine vorgelegte Gleichung fünften Grades
auflösbar ist, und wie man die Auflösung in einem solchen Fall wirklich findet. Der Schlüssel dazu
ist eine gewisse sogenannte Resolvente sechsten Grades, die von Lagrange und Malfatti untersucht
wurde.
133
§16. Zur Galoisgruppe
16.1. Berechnung der Galoisgruppe.
In den vergangenen Vorlesungen haben wir stets spezielle Polynome oder zumindest spezielle
Typen von Polynomen betrachtet, und die Struktur der Galoisgruppe aus den gegebenen Besonderheiten erschlossen. Man kann sich fragen, wie man algorithmisch vorgehen kann, um die Gruppe
einer Gleichung f = 0 direkt aus den Ausgangsdaten zu berechnen.
Es sei dazu ein Körper K und ein separables normiertes Polynom f ∈ K[X] vom Grad n vorgegeben. Wir bezeichnen mit L einen Zerfällungskörper von f , erzeugt von den Nullstellen α1 , . . . , αn
von f und mit Galoisgruppe G = Gal(L/K). Die Numerierung der Wurzeln α1 , . . . , αn bestimmt
auch eine Einbettung ϕ : G → Sn , σ 7→ σ̄, mit der Eigenschaft
σ(αi ) = ασ̄(i) .
Die Einbettung hängt aber von der Anordnung der Nullstellen ab, und eine andere Numerierung führt
zu einer anderen Einbettung ϕ′ : G → Sn , die sich aber von ϕ nur durch Konjugation unterscheidet,
d.h. es gibt eine Permutation π ∈ Sn mit ϕ′ (g) = πϕ(g)π −1 für alle g ∈ G. Das Problem lautet
also: Wie bestimmt man ausgehend allein von f die Galoisgruppe als Untergruppe von Sn . Es ist
von vornherein klar, daß dies, wenn überhaupt, nur bis auf Konjugation möglich ist.
Wir folgen einem im Buch von van der Waerden beschriebenen Verfahren, daß im Kern auf Galois zurückgeht. Dazu betrachten wir die Funktionenkörper K(u1 , . . . , un ) und L(u1 , . . . , un ) mit
Unbestimmten u1 , . . . , un .
L(u1 , . . . , un )
tt
ttt
t
t
t
ttt
L KK
KKK
KKK
KKK
K
PPP
PPP
PPP
PPP
K(u1 , . . . , un )
K
mm
mmm
m
m
m
mmm
mmm
Zur Erinnerung: Der Funktionenkörper K(u1 , . . . , un ) ist der Quotientenkörper des Polynomrings
K[u1 , . . . , un ]. Die Wirkung der Galoisgruppe G auf L setzt sich zu einer Wirkung auf dem Funktionenkörper L(u1 , . . . , un ) fort, indem jedes g ∈ G die Unbestimmten u1 , . . . , un festläßt.
Lemma 16.1 — Es gilt L(u1 , . . . , un )G = K(u1 , . . . , un ). Insbesondere ist L(u1 , . . . , un ) eine
Galoiserweiterung von K(u1 , . . . , un ) mit Galoisgruppe G.
Weil LG = K, folgt sofort L[u1 , . . . , un ]G = K[u1 , . . . , un ]. Deswegen ist das Lemma eine
direkte Konsequenz aus dem folgenden:
Lemma 16.2 — Operiert eine endliche Gruppe G auf einem Integritätsbereich A durch Ringisomorphen, so gilt Q(AG ) = Q(A)G .
Hier bezeichnet wie früher Q(R) den Quotientenkörper eines Integritätsbereichs R.
Beweis. Es ist klar, daß der Quotient a/b zweier G-invarianter Elemente a, b ∈ A wieder G-invariant
ist. Das bedeutet: Q(AG ) ⊂ Q(A)G . Wir müssen die umgekehrte Inklusion zeigen. Dazu sei h =
Q
Q
a/b ∈ Q(A) ein Q-invarianter Quotient. Wir bilden c := g∈G g(b) und u := c/b = g6=id g(b),
so daß c ∈ AG und b̃ = bu. Es gilt
h=
a
au
au
=
=
.
b
bu
c
134
Zur Galoisgruppe
Dann ist einerseits au = ch als Produkt von a, u ∈ A wieder in A, andererseits als Produkt der
G-Invarianten c und h selbst G-invariant, d.h. au ∈ AG . Nun ist h ein Quotient von Elementen
au, c ∈ AG , und das bedeutet h ∈ Q(AG ).
Auf dem Körper L(u1 , . . . , un ) operieren nun zwei Gruppen: Zum Einen die Galoisgruppe G =
Gal(L/K): Ein g ∈ G wirkt nur auf den L-wertigen Koeffizienten einer rationalen Funktion in
L(u1 , . . . , un ) läßt aber die Unbestimmten fest. Zum Anderen die symmetrische Gruppe Sn : Eine
Permutation π ∈ Sn vertauscht die Unbestimmten u1 , . . . , un , läßt aber die Koeffizienten aus L fest.
Für ein Element g ∈ G und sein Bild ḡ ∈ Sn muß man also zwischen den Wirkungen von g und ḡ
unterscheiden!
Wir betrachen das spezielle Element
θ := u1 α1 + . . . + un αn =
n
X
i=1
ui αi ∈ L[u1 , . . . , un ],
wo α1 ,. . . , αn die Nullstellen von f sind. Man kann θ als eine universelle Linearkombination der
Nullstellen von f auffassen. Die Bilder von θ unter G sind offenbar paarweise verschieden. Deshalb
ist
Y
T :=
(X − g(θ)) ∈ K(u1 , . . . , un )[X]
g∈G
das Minimalpolynom von θ bezüglich K(u1 , . . . , un ), und θ ist ein primitives Elemente für die
Erweiterung L(u1 , . . . , un )/K(u1 , . . . , un . Aus der Konstruktion geht sogar genauer hervor, daß
T ∈ K[u1 , . . . , un ][X].
Wir halten ausdrücklich fest: T ist ein irreduzibles Element im faktoriellen Ring K[u1 , . . . , un ][X]
und normiert als Polynom in X.
Daneben bilden wir das Polynom
Y
F =
(X − π(θ))
∈ L(u1 , . . . , un )[X].
π∈Sn
Die Koeffizienten von F (als Polynom in X) sind Polynome in den ui und αi mit Koeffizienten in
K. Sie sind genauer symmetrische Polynome in α1 ,. . . , αn und lassen sich nach dem Hauptsatz über
symmetrische Polynome durch die Koeffizienten von f ausdrücken. Es folgt:
F ∈ K[u1 , . . . , un ][X].
F ist sogar symmetrisch in u1 , . . . , un und könnte durch die elementarsymmetrischen Polynome der
ui ausgedrückt werden, was aber nicht gebraucht wird.
Ich hatte oben darauf hingewiesen, daß für ein g ∈ G die Wirkungen von g und seinem Bild
ḡ ∈ Sn im allgemeinen völlig verschieden sind, in ihrer Wirkung auf θ hängen sie aber wie folgt
zusammen:
n
n
n
X
X
X
X
ui αg(i) =
ui g(αi ) =
g(θ) =
uj αj ) = g −1 (θ).
ug −1 (j) αj = g −1 (
i=1
i=1
j
j=1
Es seien nun π1 , . . . , πℓ ∈ Sn Vertreter für die Nebenklassen Sn /ϕ(G). Dann gilt:
F
=
Y
π∈Sn
=
ℓ
Y
j=1
(X − π(θ)) =
πj
Y
g∈G
(X − g
ℓ Y
Y
j=1 g∈G
−1
(θ))
!
(X − πj g(θ))
=
ℓ
Y
πj (T ).
j=1
Wir wissen, daß T irreduzibel in K[u1 , . . . , un ][X] ist. Dasselbe gilt dann auch für die Bilder πj (T ).
Damit erweist sich
F = T1 · · · Tℓ
135
mit Tj := πj (T ) als Primfaktorzerlegung von F im faktoriellen Ring K[u1 , . . . , un ]. Üblicherweise
ist eine solche Faktorzerlegung eindeutig nur bis auf die Reihenfolge und Einheiten. Weil im vorliegenden Falle die Tj als Polynome in X normiert sind, ist die Faktorzerlegung sogar eindeutig bis auf
die Reihenfolge der Faktoren.
Lemma 16.3 — 1. Die Permutationen π ∈ Sn vertauschen die irreduziblen Faktoren von F transitiv.
2. Es sei Gj := {g ∈ Sn | π(Tj ) = Tj } die Standgruppe von Tj . Es gilt g ∈ Gj genau dann, wenn
g einen Linearfaktor von Tj in einen Linearfaktor von Tj abbildet.
3. Es gilt Gj = πj ϕ(G)πj−1 .
Beweis. Die Bilder π(θ), π ∈ Sn , sind paarweise verschieden, weil die Elemente α1 , . . . , αn paarweise verschieden sind. Die Gruppe Sn operiert transitiv auf den Linearfaktoren (X − π(θ)) von
F . Da die Primfaktorzerlegung von F in A[u1 , . . . , un ][X] eindeutig ist, vertauscht π ∈ Sn die
Primfaktoren von F . Wegen der Transitivität auf den Linearfaktoren muß auch diese Wirkung auf
den Primfaktoren transitiv sein. Das beweist Aussage 1.
Haben insbesondere Tj und π(Tj ) auch nur einen einzigen Linearfaktor gemeinsam, so müssen
sie schon gleich sein. Das zeigt Aussage 2. Für jedes g ∈ G gilt
πj gπj−1 (Tj ) = πj (g(T )) = πj (g −1 (T )) = πj (T ) = Tj .
Das bedeutet, daß πj ϕ(G)πj−1 ⊂ Gj . Andererseits ist |G| = |Sn |/ℓ = |Gj | wegen der transitiven
Wirkung von Sn auf den Restklassen Sn /ϕ(G) bzw. den Faktoren von F . Aus der Inklusion der
Gruppen folgt wegen der Gleichmächtigkeit die behauptete Gleichheit Gj = πj ϕ(G)πj−1 .
Algorithmus: Es sind also die folgenden Schritte auszuführen. Man geht von Symbolen α1 ,. . . ,αn
aus, berechnet das Produkt h und ersetzt die elementarsymmetrischen Polynome in den αi durch die
Koeffizienten von f . Das ist ausführbar, ohne daß man die wirklichen Wurzeln kennt. Anschließend
wird h im Ring K[u1 , . . . , un , X] in irreduzible Faktoren zerlegt, wofür ein effektives Verfahren
für Rechnungen im Koeffizientenbereich K implementiert sein muß. Man wählt dann einen willkürlichen Faktor der Primfaktorzerlegung aus und bestimmt die Standgruppe. Die Komplexität des
Verfahrens wächst aber schnell mit der Ordnung n! von Sn , wenn n den Grad des untersuchten Polynoms bezeichnet. Selbst für kleine n kommt man kaum ohne den Computer aus, und für größere n
setzt auch dieser bald aus.
Beispiel 16.4. — Schon für kleine Grade ist die Ausführung des oben beschriebenen Verfahrens
kompliziert. Wir beschränken uns deshalb auf ein kubisches Polynom f = x3 + x2 − 2x − 1 ∈ Q[x].
Das ist das schon mehrfach verwendete Minimalpolynom von 2 cos(2πki/7), k ∈ Z.
Es seien α1 , α2 , α3 drei (symbolische) Wurzeln. Wir bilden θ = α1 u1 + α2 u2 + α3 u3 . Die sechs
Bilder unter der Wirkung der symmetrischen Gruppe S3 sind
θ1 = α 1 u 1 + α 2 u 2 + α 3 u 3 ,
θ2 = α 1 u1 + α 2 u3 + α 3 u2 ,
θ3 = α 1 u2 + α 2 u1 + α 3 u3 ,
θ4 = α 1 u 2 + α 2 u 3 + α 3 u 1 ,
θ5 = α 1 u 3 + α 2 u 1 + α 3 u 2 ,
θ6 = α 1 u3 + α 2 u2 + α 3 u1 .
Damit erhält man
F
=
=
(X − θ1 ) · . . . · (X − θs )
X 6 + F 1 X 5 + F2 X 4 + F3 X 3 + F4 X 2 + F5 X + F6
mit gewissen polynomiellen Ausdrücken Fk ∈ Q[α1 , α2 , α3 , u1 , u2 , u3 ], die symmetrisch sowohl in
den αi wie in den uj sind. Die symmetrischen Ausdrücke in den αi werden durch die Koeffizienten
von f ersetzt:
α1 + α2 + α3 = −1,
α1 α2 + α1 α3 + α2 α3 = −2,
α1 α2 α3 = 1.
136
Zur Galoisgruppe
Um das Ergebnis vernünftig hinschreiben zu können verwende ich auch für elementarsymmetrischen
Polynome der uj Abkürzungen:
u1 + u2 + u3 = s 1 ,
u 1 u2 + u1 u3 + u2 u3 = s 2 ,
u 1 u2 u3 = s 3 .
Damit schreiben sich die Koeffizienten von F so:
F1
=
2s1 ,
F2
=
−3s21 + 14s2 ,
F3
=
F4
=
F5
=
F6
=
−6s31 + 21s1 s2 − 7s3 ,
2s41 − 21s21 s2 + 49s22 − 7s1 s3 ,
4s51 − 28s31 s2 + 49s1 s22 + 14s21 s3 − 49s2 s3 ,
s61 − 7s41 s2 + 49s32 + 56s31 s3 − 245s1 s2 s3 + 343s23 .
Allerdings muß man F wirklich als Polynom in K[u1 , . . . , un ][X] auffassen und die si nur als
Abkürzungen lesen, sonst sieht man nicht, daß dieses Polynom zerfällt:
F = T+ · T−
mit kubischen Faktoren
T±
=
X 3 + s1 X 2 + (−2s21 + 7s2 )X + 12 (−2s31 + 7s1 s2 − 7s3 ± 7δ).
Die beiden Faktoren unterscheiden sich nur um das Vorzeichen vor
δ := (u1 − u2 )(u2 − u3 )(u3 − u2 ).
Nach unseren früheren Überlegungen zum Invariantenring der alternierenden Gruppe (vgl. Satz
4.10), werden beide Faktoren sicher von der zyklischen Gruppe A3 festgehalten, aber genauso sicher
von ungeraden Permutationen ausgetauscht. Die Galoisgruppe ist in diesem Falle also isomorph zur
zyklischen Gruppe A3 ⊂ S3 , was wir nach Wahl des Beispielpolynoms aber schon vorher wußten.
Es ist aber klar, daß die tatsächliche Rechnung sowohl bei der Invariantenbildung wie der Faktorisierung ohne Computerhilfe sehr sehr mühselig wäre.
Daß wir auf die beschriebene Weise zu einer Identifizierung der Galoisgruppe mit einer Untergruppe von Sn kommen, können wir dazu benutzen, um ganz verschiedene Körpererweiterungen
miteinander in Beziehung zu setzen. Den folgenden Satz findet man wieder im Buch von van der
Waerden, ich weiß aber nicht, wer der ursprüngliche Entdecker des Satzes ist.
Satz 16.5 — Es sei A ein faktorieller Ring mit Quotientenkörper K, ferner p ⊂ A ein Primideal,
Ā := A/p der Restklassenring und K̄ dessen Quotientenkörper. Es sei f ∈ A ein normiertes Polynom vom Grad n mit der Eigenschaft, daß sowohl f wie die Reduktion f¯ = f mod p ∈ Ā[X]
separabel sind. Es seien G und Ḡ die Galoisgruppen von f bzw. f¯. Dann ist G, aufgefaßt als Untergruppe von Sn , konjugiert zu einer Untergruppe von G ⊂ Sn .
Beweis. Wir konstruieren nach dem obigen Verfahren zu f das Polynom F ∈ K[u1 , . . . , un ][X],
seine Primfaktorzerlegung F = T1 · . . . · Tℓ und die Standgruppen Gj zu den Faktoren Tj . Gemäß
den besonderen Annahmen des Satzes hat f aber schon Koeffizienten im Ring A. Entsprechend dem
Hauptsatz über symmetrische Polynome kann man das obige Argument dahingehend verschärfen,
daß F dann auch ein Polynom in A[u1 , . . . , un ][X] ist. Wegen des Satzes von Gauß liegen auch die
irreduziblen Faktoren Tj von F schon in A[u1 , . . . , un ][X]. Konstruiert man nun in analoger Weise
zu f¯ ∈ A[X] ⊂ K[X] das Polynom F̄ ∈ K̄[u1 , . . . , un ][X], so ist aus der Konstruktion klar, daß
F̄ das Bild von F unter der Reduktionsabbildung
A[u1 , . . . , un ][X] → Ā[u1 , . . . , un ][X] → K̄[u1 , . . . , un ][X]
137
ist. Bezeichnen weiter T̄1 , . . . , T̄ℓ die Bilder der Faktoren T1 , . . . , Tℓ , so besteht im Polynomring
K̄[u1 , . . . , un ][X] die Zerlegung F̄ = T̄1 · . . . , ·T̄ℓ . Aber natürlich brauchen die Polynome T̄j nicht
irreduzibel zu sein, sondern können (und werden in der Regel) weiter zerfallen, etwa wie folgt:
T̄j = Tj1 · . . . · Tjsj ,
j = 1, . . . , ℓ.
Nun gilt für jede Permutation π ∈ Sn : Wenn π(T11 ) = T11 , dann bildet π einen Linearfaktor von
T11 , also insbesondere von F̄1 , auf einen Linearfaktor von T11 und damit von F̄1 ab. Aber wegen
Aussage 2 des Lemmas 16.3 heißt das, daß π(T1 ) = T1 . Kurzum: Die Standgruppe von T11 ist eine
Untergruppe der Standgruppe von T1 . Wegen Aussage 3 von Lemma 16.3 folgt die Behauptung des
Satzes.
16.2. Das inverse Galoisproblem.
Unter dem inversen Galoisproblem versteht man die Aufgabe zu einem vorgegebenem Körper K
und einer vorgegebenen Gruppe G eine Galoiserweiterung L/K mit Galoisgruppe Gal(L/K) ∼
=G
zu konstruieren.
Für die Aufgabenstellung wichtig ist dabei, daß man sich den Körper K vorgibt. Ohne diese Einschränkung ist die Aufgabe leicht: Ist G eine endliche Gruppe der Ordnung n, so definiert die Wirkung von G auf sich selbst durch Multiplikation von links nach Wahl einer Numerierung der Elemente von G eine Einbettung von G in die symmetrische Gruppe Sn . Vermöge dieser Einbettung operiert
dann G auf dem Funktionenkörper Q(u1 , . . . , un ) auf effektive Weise durch Permutation der Unbestimmten, und Q(u1 , . . . , un ) ist eine Galoiserweiterung des Invariantenkörpers Q(u1 , . . . , un )G
mit Galoisgruppe G.
Die folgenden Sätze lösen das inverse Galoisproblem für den Grundkörper Q und gewisse Gruppen. Shafaerevich hat gezeigt, daß jede auflösbare endliche Gruppe als Galoisgruppe einer Erweiterung von Q vorkommt. Für beliebige endliche Gruppen ist das Problem offen.
Im Beweis der Aussage, daß sich jede endliche abelsche Gruppe als Galoisgruppe einer Erweiterung von Q realisieren läßt, wird der folgende schöne und berühmte Satz von Dirichlet gebraucht:
Satz 16.6 (Dirichlet 1837) — Sind a und b teilerfremde natürliche Zahlen, so gibt es in der Folge
a + kn, k ∈ N0 , unendlich viele Primzahlen.
Peter Gustav Lejeune-Dirichlet: Beweis des Satzes, daß jede unbegrenzte arithmetische Progression, deren erstes Glied und
Differenz ganze Zahlen ohne gemeinschaftlichen Factor sind, unendlich viele Primzahlen enthält. Abhand. Akad. Wiss. Berlin 48
(1839).
Satz 16.7 — Zu jeder endlichen abelschen Gruppe G gibt es eine Galoiserweiterung L/Q mit Galoisgruppe Gal(L/Q) ∼
= G.
Beweis. Nach dem Hauptsatz über endliche abelsche Gruppen gibt es eine Zerlegung
G∼
= Z/n1 × . . . × Z/ns
in endliche zyklische Gruppen. Wir wählen Primzahlen pi mit pi ≡ 1 mod ni für i = 1, . . . , s,
und weil es nach dem Satz von Dirichlet davon jeweils unendlich viele gibt, kann man die p1 , . . . , ps
auch paarweise verschieden wählen. Es sei mi = (pi − 1)/ni . Es gibt dann Einbettungen
∼
=
ϕi : Z/mi −→ Z/(pi − 1) −−→ (Z/pi )×
mit Faktorgruppen (Z/pi )× /ϕ(Z/mi ) ∼
= (Z/(p − 1))/(Z/mi ) ∼
= Z/ni . Es sei P = p1 · . . . · ps
und ζ ∈ C eine primitive P -te Einheitswurzel. Dann ist Q(ζ) eine abelsche Galoiserweiterung mit
Galoisgruppe
×
×
×
Gal(Q(ζ)/Q) ∼
= (Z/p1 ) × . . . × (Z/ps ) .
= (Z/P ) ∼
138
Zur Galoisgruppe
Die Untergruppe H = ϕ1 (Z/m1 ) × . . . × ϕs (Z/ms ) der Galoisgruppe ist ein Normalteiler mit
Faktorgruppe ∼
= Z/n1 × . . . × Z/ns ∼
= G. Der Körper L = Q(ζ)H hat deshalb die verlangten
Eigenschaften.
Um den Beweisgang des folgenden Satzes nicht zu unterbrechen, erinnere ich vorweg daran,
daß jede endliche Körpererweiterung eines endlichen Körpers Fq bereits eine Galoiserweiterung ist,
und zwar mit zyklischer Galoisgruppe. Insbesondere hat der Zerfällungskörper eines irreduziblen
Polynoms f ∈ Fp [X] vom Grad n ebenfalls den Grad n.
Satz 16.8 (Hilbert) — Für jedes n ∈ N existiert ein irreduzibles normiertes Polynom f ∈ Z[X],
dessen Zerfällungskörper L/Q eine zu Sn isomorphe Galoisgruppe hat.
Beweis. Für n = 2 oder n = 3 leisten f = X 2 − 2 bzw. X 3 − 2 alles Gewünschte. Es sei also im
folgenden n ≥ 4.
1. Wähle ein irreduzibles Polynom f2 ∈ F2 [X] vom Grad n. Der Zerfällungskörper von f ist F2n .
Die Galoisgruppe G2 = Gal(F2n /F2 ) ist zyklisch von der Ordnung n und wird als Untergruppe in
Sn von einem n-Zykel erzeugt.
2. Wähle ein irreduzibles Polynom f3′ ∈ F3 [X] vom Grad n − 1. Setze f3 = X · f3′ . Der
Zerfällungskörper von f3 ist F3n−1 . Die Galoisgruppe G3 = Gal(F3n−1 /F3 ) ist zyklisch von der
Ordnung n − 1 und wird als Untergruppe von Sn von einem (n − 1)–Zykel erzeugt.
3. Das Polynom f5′ = X 2 + 2 ∈ F5 ist irreduzibel. Wähle weiter ein irreduzibles Polynom f5′′
vom Grad m = n − 2 bzw. m = n − 3 je nachdem, ob n ungerade oder gerade ist, und setze
f5 = f5′ ff′′ bzw. f5 = f5′ f5′′ X. Der Zerfällungskörper L von f hat den Grad 2m über F5 . Es
seien α1 , . . . , αm die Nullstellen von f5′′ und αm+1 udn αm+2 die beiden Nullstellen von f5′ . Es sei
g ∈ G5 = Gal(L/F5 ) ein Element, das αm+1 und αm+2 vertauscht. Die Einschränkung von g auf
K(α1 , . . . , αm ) hat eine ungerade Ordnung k. Dann wirkt g k auf α1 , . . . , αm trivial und vertauscht
αm+1 und αm+2 als Transposition. Das zeigt: Als Untergruppe in Sn enthält G5 eine Transposition.
4. Mit Hilfe des Chinesischen Restklassensatzes findet man ein normiertes Polynom f ∈ Z[X]
vom Grad n, das die simultanen Kongruenzen
f ≡ f2 mod 2,
f ≡ f3 mod 3,
f ≡ f5 mod 5
erfüllt. Da f2 irreduzibel ist, muß auch f irreduzibel sein. Die Galoisgruppe G von f enthält als
Untergruppe von Sn gemäß Satz 16.5 Gruppen, die zu G2 , G3 und G5 isomorph sind. Insbesondere enthält G einen n–Zykel, einen (n − 1)–Zykel und eine Transposition. Wir schließen mit dem
folgenden Lemma, daß G = Sn .
Lemma 16.9 — Es sei G ⊂ Sn eine Untergruppe, die einen n–Zykel, einen (n − 1)–Zykel und
eine Transposition enthält. Dann ist G = Sn .
Beweis. Ohne Einschränkung können wir annehmen, daß der (n − 1)–Zykel π = (12 . . . (n − 1))
und die Transpostion (ij) zu G gehören. Da G einen n–Zykel enthält, operiert G transitiv auf den
Elementen {1, . . . , n}. Wähle g ∈ G mit g(j) = n. Es sei k = g(i). Dann gilt G ∋ g(ij)g −1 =
(kn). Es folgt weiter G ∋ π ℓ−k (kn)π k−ℓ = (ℓn) für alle ℓ < n. Schließlich enthält G auch das
Element (hℓ) = (hn)(ℓn)(hn)−1 für alle h < ℓ < n. Damit enthält G alle Transpositionen. Da Sn
von den Transpositionen erzeugt wird, ist G = Sn .
Beispiel 16.10. — Wir illustrieren das Verfahren für n = 5:
5
Das Polynom X 2 −1 − 1 = X 31 − 1 ∈ F2 [X] zerfällt wie folgt in Linearfaktoren:
X 31 − 1
=
(X − 1)(X 5 + X 2 + 1)(X 5 + X 3 + 1)
·(X 5 + X 3 + X 2 + X + 1)(X 5 + X 4 + X 2 + X + 1)
·(X 5 + X 4 + X 3 + X + 1)(X 5 + X 4 + X 3 + X 2 + 1).
139
Wir wählen als irreduzibles Polynom
f2 = X 5 + X 2 + 1 ∈ F2 [X].
Von den 8 verschiedenen irreduziblen Faktoren vom Grad 4 des Polynoms
Φ80
=
=
Φ34 −1 = X 32 − X 24 + X 16 − X 8 − 1
(X 4 + X 3 − 1)(X 4 + X − 1)(X 4 − X 3 − 1)(X 4 − X − 1)
·(X 4 + X 3 + X 2 − X − 1)(X 4 − X 3 + X 2 + X − 1)
·(X 4 + X 3 − X 2 − X − 1)(X 4 − X 3 − X 2 + X − 1)
wählen wir X 4 − X − 1 und setzen
f3 = X 5 − X 2 − X ∈ F3 [X].
Schließlich sei (mit einer kleinen Abweichung vom Algorithmus des Beweises)
f5 = (X 2 + 2)X(X − 1)(X − 2) = X 5 + 2X 4 + 4X 3 + 4X 2 + 4X ∈ F5 [X].
Ein Polynom, das die simultane Kongruenz löst, ist
f = X 5 + 12X 4 − 6X 3 − X 2 + 14X + 15.
Nach dem Satz ist die Galoisgruppe von f isomorph zu S5 .
Satz 16.11 — Die Gruppe der Gleichung X 8 − 72X 6 + 180X 4 − 144X 2 + 36 = 0 über Q ist die
Quaternionengruppe Q8 .
Beweis. Es sei f (X) := X 8 − 72X 6 + 180X 4 − 144X 2 + 36. Ist α ∈ Q eine Nullstelle von f , so
auch −α. In der Zerlegung von f in irreduzible Faktoren muß daher jeder Faktor selbst ein Polynom
in X 2 sein, da f keine Lösungen in Q hat. Es genügt also, sich von der Irreduzibilität des Polynoms
g(X) := X 4 − 72X 3 + 180X 2 − 144X + 36
zu überzeugen. Das sieht man aus der folgenden expliziten Lösung der Gleichung g(X) = 0. Die
Substitution X = z + 18 führt auf das Polynom
h(z) = g(z + 18) = z 4 − 1764z 2 − 40320z − 259164.
Die Gleichung h(z) = 0 wird mit dem Ansatz
(16.1)
z 4 + 2dz 2 + d2 = (1764 + 2d)z 2 + 40320z + (259164 + d2 )
gelöst: Bezeichnet man die rechte Seite mit Az 2 + Bz + C, so läßt sie sich genau dann als Quadrat
√
√
einer Linearform ( Az + C) schreiben, wenn 4AC = B 2 . Dies führt in der gegeben Situation
auf die Bedingung
4(1764 + 2d)(259164 + d2 ) = 403202 ,
also die Gleichung
d3 + 882d2 + 259164d + 25369848 = 0
für d. Macht man hier die Substitution t = d + 882/3, so sieht man sofort, daß t = 0 eine Lösung
ist, und damit erhält man leicht die Zerlegung in Linearfaktoren
(d + 282)(d + 294)(d + 306) = 0.
Setzt man d = −306 in die Gleichung (16.1) ein, so erhält man:
√
z 2 − 306 = ±12 2(2z + 35)
oder umgeformt:
√
√
√
√
(z ∓ 12 2)2 = 594 ± 420 2 = 3(198 ± 140 2) = 3(10 ± 7 2)2 .
140
Zur Galoisgruppe
Das führt auf die vier folgenden Lösungen für g(x) = 0:
√
√
√
x1 = 18 + 12 2 + 10 3 + 7 6
√
√
√
x2 = 18 − 12 2 + 10 3 − 7 6
√
√
√
x3 = 18 + 12 2 − 10 3 − 7 6
√
√
√
x4 = 18 − 12 2 − 10 3 + 7 6
Offenbar ist der Zerfällungskörper von g(X) der Körper
√ √
M := Q(x1 ) = Q( 2, 3).
Dessen Galoisgruppe ist
√ √
¯ Ji
¯
Gal(M/Q) = Gal(Q( 2, 3)/Q) ∼
= Z/2 × Z/2 = hI,
mit Erzeugern
√ √
√
√
I¯ : 2 7→ − 2, 3 7→ 3,
√
√ √
√
J¯ : 2 7→ 2, 3 7→ − 3,
¯
und den Relationen I¯2 = 1, J¯2 = 1, I¯J¯ = J¯I.
Es sei jetzt α eine Wurzel der Gleichung T 2 − x1 = 0, und L = M (α). Die Galoisgruppe
Gal(L/M ) ∼
= Z/2 wird erzeugt von einer Involution ι : α 7→ −α. Wir zeigen zunächst, daß
das Polynom f über L in Linearfaktoren zerfällt. Dazu müssen wir Wurzeln αi der Gleichungen
T 2 − xi = 0 finden. Nun gilt:
(ααi )2 = α2 αi2 = x1 xi .
Für i = 2, 3, 4 findet man:
x1 x2
=
x1 x3
=
x1 x4
=
√
√
√
42 + 24 3 = [ 2(3 + 2 3)]2
√
√
√
18 + 12 2 = [ 3(2 + 2)]2
√
√
√
30 + 12 6 = [ 3(2 + 6)]2 .
Demnach sind die acht Wurzeln von f (X) gegeben durch:
√
√
√
√
√
√
2 3+ 6
2 3+3 2
3 2+2 6
, ±
, ±
.
±α, ±
α
α
α
¯ die
Es bleibt die Galoisgruppe zu bestimmen. Dazu seien I und J die Fortsetzungen von I¯ und J,
durch
√
√
√
√
3 2+2 6
2 3+ 6
I(α) =
bzw. J(α) =
α
α
charakterisiert sind. Man findet, daß I 2 und J 2 den Körper M festlassen und α auf −α abbilden. Insbesondere gilt I 2 = J 2 = ι, und I und J haben die Ordnung 4. Betrachte die beiden Kompositionen
IJ und JI. Man findet:
√ √
√
√
√
√
2 3+ 6
2 3− 6
√ α = −( 2 − 1)( 3 − 2)α
IJ(α) = I
= √
α
3 2+2 6
und
√ √
√
√
√
√
3 2+2 6
3 2−2 6
√ α = ( 2 − 1)( 3 − 2)α.
JI(α) = J
= √
α
2 3+ 6
Das zeigt IJ = ιJI. Da ι mit I und J vertauscht, lauten die vollen Relationen für die Automorphismen I, J und K := IJ:
I 2 = J 2 = K 2 = IJK = ι, ι2 = id.
Die von I und J erzeugte Gruppe ist daher die Quaternionengruppe Q8 , die wegen ihrer Mächtigkeit
bereits mit Gal(L/Q) übereinstimmen muß.
141
§17. (*) Normalbasen
Zu jeder Galoiserweiterung L/K vom Grad n gibt es nach dem Satz vom primitiven Element ein
α ∈ L mit L = K(α). Die Elemente
1, α, α2 , . . . , αn−1
bilden eine K-Basis von L. Unter Umständen läßt sich die Wirkung der Galoisgruppe in dieser Basis
nur auf verwickelte Weise ausdrücken. Schreibt man andererseits
Gal(L/K) = {σ1 = id, σ2 , . . . , σn },
und αi = σi (α) so werden die Elemente
α1 , α 2 , . . . , α n
von der Galoisgruppe nur permutiert, im allgemeinen bilden sie aber keine K-Basis, wie die einfachsten Beispiele zeigen: Zum Beispiel wird C als Erweiterung von R von i erzeugt. Aber das zu
i konjugierte Element ist −i, und i und −i sind offensichtlich R-linear abhängig. Im vorliegenden
Falle kann man zu α1 = 1 + i übergehen. Dann bilden α1 und das konjugierte Element α2 = 1 − i
eine R-Basis von C.
Definition 17.1. — Es sei L/K eine Galoiserweiterung. Eine K-Basis α1 , . . . , αn von L ist eine
Normalbasis, wenn die αi von der Galoisgruppe permutiert werden.
Lemma 17.2 — Die Elemente einer Normalbasis bilden eine einzige Bahn unter der Wirkung der
Galoisgruppe.
Beweis. Es sei {α1 , . . . , αn } = B1 ∪ . . . ∪ Bs die Zerlegung einer Normalbasis der GaloiserweiP
terung L/K in Bahnen unter der Galoisgruppe. Die Elemente bi := β∈Bi β, i = 1, . . . , s sind
konstruktionsgemäß invariant unter der Galoisgruppe und liegen deshalb in K. Andererseits sind sie
K-linear unabhängig, weil die Elemente α1 , . . . , αn eine K-Basis bilden. Das ist ein Widerspruch,
falls s ≥ 2. Es gibt deshalb nur eine Bahn.
Es gibt also zu jedem αj einer Normalbasis genau einen Automorphismus σj ∈ G = Gal(L/K)
mit αj = σj (α1 ). Insbesondere permutiert die Galoisgruppe G die Normalbasis auf dieselbe Weise
wie die Elemente von G selbst vermöge Linksmultiplikation. Deshalb gibt es einen G-äquivarianten
K-Vektorraumisomorphismus
L=
n
M
j=1
Kαj ∼
=
M
Kσ =: K[G]
σ∈G
von L auf den sogenannten Gruppenring von G mit Koeffizienten in K. In der Sprache der Darstellungstheorie ist L isomorph zur regulären Darstellung von G.
Satz 17.3 — Jede Galoiserweiterung hat eine Normalbasis.
Wir folgen einem Beweis von Artin. Wie im Beweis des Satzes vom primitiven Element unterscheidet man die Fälle, ob K endlich oder unendlich ist. Tatsächlich ist der erste Beweisteil allgemeiner auf zyklische Erweiterungen anwendbar, was alle endlichen Körper einschließt.
Erster Teil: Es sei L/K eine zyklische Erweiterung vom Grad n ≥ 2, deren Galoisgruppe von
σ erzeugt wird. Für jedes Polynom g(t) = g0 + g1 t + . . . + gm tm ∈ K[t] ist
g(σ) = g0 + g1 σ + . . . + gm σ m ∈ EndK (L)
ein K-linearer Endomorphismus von L. Für jedes Element u ∈ L ist die Menge
Iu := {g ∈ K[t] | g(σ)(u) = 0}
142
Normalbasen
ein Ideal in K[t], also ein Hauptideal Iu = (µu ) für ein gewisses Polynom µu . Weil σ n = idL ,
annulliert tn − 1 jedes u ∈ L, so daß man in jedem Falle die Beziehung µu (t)|tn − 1 hat.
Die Elemente u, σ(u), σ 2 (u), . . . , σ n−1 (u) bilden genau dann eine Normalbasis, wenn keine
K-Linearkombination verschwindet, d.h. wenn es kein Polynom g vom Grad < n mit g(σ)(u) = 0
gibt. Das ist gleichbedeutend damit, daß µu = tn − 1.
Wir betrachten die Primfaktorzerlegung
tn − 1 = p1 (t)ν1 · · · ps (t)νs
in K[t]. Weil tn − 1 in jedem Falle wenigstens den Faktor t − 1 abspaltet, haben alle normierten
n
Faktoren pi den Grad < n. Die maximalen echten Teiler von tn − 1 sind die Polynome di := t p−1
.
i
Ein Element u erzeugt also genau dann eine Normalbasis, wenn di (σ)(u) 6= 0 für alle i = 1, . . . , s.
n
ni −1
der größte gemeinsame Teiler von di und piνi −1 , und
Wir setzen noch gi := tpν−1
i . Dann ist pi
i
es gibt Bézout-Koeffizienten αi , βi ∈ K[t] mit
piνi −1 = αi di + βi pνi i .
(17.1)
Weil die Endomorphismen id, σ, . . . , σ n−1 nach dem Satz von Dirichlet sogar L-linear unabhängig
sind, verschwindet kein di (σ) identisch auf L. Es gibt also vi ∈ L mit di (σ)(vi ) 6= 0. Es sei
ui := gi (σ)(vi ) und u = u1 + . . . + us . Weil gi pνi i = tn − 1, gilt pνi i (σ)(ui ) = (σ n − 1)(vi ) = 0,
und weil pνi i ein Faktor aller dj für j 6= i ist, gilt dj (σ)(u) = dj (σ)(uj ).
ν −1
ν −1
Andererseits ist dj = pj j gj , so daß pj j (σ)(uj ) = dj (σ)(vj ) 6= 0. Somit folgt mit der
Identität (17.1), daß
ν −1
0 6= pj j
ν
(σ)(uj ) = αj (σ)dj (σ)(uj ) + βj (σ)pj j (σ)(uj ) = αj (σ)dj (σ)(uj ).
Insbesondere hat man
0 6= dj (σ)(uj ) = dj (σ)(u)
für alle j = 1, . . . , s.
Das zeigt, daß µu = tn − 1 und damit daß u, σ(u), . . . , σ n−1 (u) eine Normalbasis ist.
Zweiter Teil: Völlig verschieden verläuft der Beweis im Falle eines unendlichen Grundkörpers
K. Es sei wieder L/K eine Galoiserweiterung vom Grad n mit Galoisgruppe G = Gal(L/K), und
es sei ein primitives Element α ∈ L mit L = K(α) gewählt. Zu den zu α konjugierten Elementen
α1 = α, α2 , . . . , αn gibt es eindeutig bestimmte σi ∈ G mit σi (α) = αi . Es bezeichne f ∈ K[X]
das Minimalpolynom vom α bezüglich K. Wir bilden den Faktorring
R := L[X]/(f ).
Die Wirkung der Galoisgruppe auf L setzt sich zu einer Wirkung auf R fort, indem X auf sich
abgebildet wird und die Elemente der Galoisgruppe nur auf den Koeffizienten aus L operieren.
Tatsächlich ist R nur eine L-Algebra und ausdrücklich kein Körper, denn f zerfällt in L[X] in
Linearfaktoren und ist also alles andere als irreduzibel. Das Ideal (f ) ⊂ L[X] hat eine Faktorisierung
(f ) = (X − α1 ) · . . . · (X − αn )
mit paarweise koprimen Idealen (X − αi ), i = 1, . . . , n. Nach dem Chinesischen Restklassensatz
besteht also ein Ringisomorphismus
R = L[X]/(f ) ∼
=
n
Y
i=1
L[X]/(X − αi ) = F1 × . . . × Fn
∼ L. Der Isomorphismus kann wie folgt explizit gemacht
mit Körpern Fi := L[X]/(X − αi ) =
werden, was zu einer Identifizierung der Ringe Li ⊂ R führt.
Die Elemente 1, β, . . . , β n−1 , wo β ∈ R die Restklasse von X modulo (f ) bezeichnet, bilden
eine L-Basis von R.
143
Weil die α1 , . . . , αn ∈ L paarweise verschieden sind, ist jedes Polynom in L[X] vom Grad
< n eindeutig durch seine Werte auf den αi charakterisiert. Es bezeichne ϕj ∈ L[X] das eindeutig
bestimmte Polynom vom Grad < n mit der Eigenschaft ϕj (αi ) = δij . Mit den Lagrangeschen
Interpolationsformeln kann man ϕj wie folgt schreiben:
Y X − αi
1 Y
ϕj (X) =
= ′
(X − αi ).
αj − αi
f (αj )
i6=j
i6=j
Mit dieser Bezeichnung gilt für jedes Polynom g ∈ L[X] vom Grad < n die Relation
g(X) =
n
X
g(αj )ϕj (X)
j=1
und folglich
g(β) =
n
X
g(αj )ϕj (β).
j=1
Das zeigt: Die Elemente
ej := ϕj (β),
j = 1, . . . , n
bilden eine L-Basis von R.
Lemma 17.4 — Die Elemente e1 , . . . , en haben die folgenden Eigenschaften:
Alle ei sind Idempotente, d.h. e2i = ei für alle i = 1, . . . , n.
Die ei sind paarweise orthogonal, d.h. ei ej = 0 für alle i 6= j.
e1 + . . . + en = 1.
Die Galoisgruppe permutiert die e1 , . . . , en .
P
Beweis. Die Summe j ϕj (X) nimmt in allen αi den Wert 1 an, stimmt also mit der konstanten
Funktion 1 überein. Modulo (f ) erhält man: e1 + . . . + en = 1. Weiter teilt f jedes Produkt ϕi ϕj
für i 6= j, weil jeder Faktor von f in ϕi ϕj vorkommt. Modulo (f ) bedeutet das ei ej = 0 für i 6= j.
Es folgt ej = ej (e1 + . . . + en ) = e2j .
Schließlich ist σj (ϕ1 ) ein Polynom vom Grad n − 1 mit Koeffizienten in L mit der Eigenschaft
(1)
(2)
(3)
(4)
σj (ϕ1 )(σj (αk )) = σj (ϕ1 (αk )) = σj (δ1k ) = δ1k .
Das heißt, σj (ϕ1 ) hat den Wert 1 in σj (α1 ) = αj und den Wert 0 in allen anderen αm , m 6= j. Es
folgt σj (ϕ1 ) = ϕj und somit σj (e1 ) = ej . Folglich werden die Idempotenten e1 , . . . , en von der
Galoisgruppe permutiert und bilden in diesem Sinne eine Normalbasis von R als L-Vektorraum. Die Abbildung L → R, λ 7→ λej , ist injektiv. Das Bild Fj ist ein zu L isomorpher Körper, aber
kein Unterring von R im strengen Wortsinne, weil zwar Addition und Multiplikation in R und in Fj
übereinstimmen, aber R und Fj verschiedene Einselemente haben, nämlich 1 = e1 + . . . + en ∈ R
und ej ∈ Fj .
Neben L enthält R einen weiteren, zu L isomorphen Unterkörper M = K(β).
R II
II
uu
u
II
uu
II
u
u
II
u
u
M = K(β)
L = K(α)
II
II
II
II
I
K
uu
uu
uu
u
u
uu
Als K-Vektorraum hat R eine Basis aus den Elementen αi β j , i, j = 0, . . . , n − 1. Die Rollen
P
von α und β sind völlig symmetrisch. Aus der Identität g(β) =
j g(αj )ej gewinnt man durch
144
Normalbasen
Multiplikation mit ej die Beziehung g(β)ej = g(αj )ej . Wenn g nun alle Polynome vom Grad < n
mit Koeffizienten in K durchläuft, so erhält man
Fj = M ej = Lej .
Deshalb ist e1 , . . . , en auch eine Basis von R als M -Vektorraum. Nur der Vollständigkeit halber sei
vermerkt, daß man einen K-linearen Isomorphismus von L auf M durch
L −→ M,
λ 7→ λe1 + σ2 (λ)e2 + . . . + σn (λ)en ,
P
P
erhält. Elemente λ ∈ K gehen dabei auf i σi (λ)ei = λ i ei = λ, wie es sein muß.
Es sei nun u1 , . . . , un irgendeine Basis von L als K-Vektorraum und damit von R als M Vektorraum. Dann kann man die Polynom ϕi (X) wie folgt entwickeln:
ϕi (X) =
n
X
Φji (X)uj
j=1
mit Polynomen Φji ∈ K[X] vom Grad < n. Es sei Φ(X) := (Φij (X)) die Koeffizientenmatrix in
K[X]n×n . Die Auswertung in β ergibt:
ei =
n
X
Φji (β)uj .
j=1
Demnach ist Φ(β) ∈ M n×n die Übergangsmatrix für die beiden Basen u1 , . . . , un und e1 , . . . , en
von R als M -Vektorraum. Insbesondere ist det(Φ(β)) 6= 0. Dann kann aber auch das Polynom
∆(X) := det(Φ(X)) ∈ K[X]
nicht das triviale Polynom sein. An dieser Stelle kommt die Annahme ins Spiel, daß K unendlich
viele Elemente besitzt. Aus ihr folgt, daß es ein z ∈ K mit der Eigenschaft ∆(z) 6= 0 gibt. Nun muß
auch die Matrix Φ(z) ∈ K n×n invertierbar sein, und folglich bilden die Elemente
γj := ϕj (z),
j = 1, . . . , n,
eine K-Basis von L. Wir haben oben gesehen, daß σj (ϕ1 ) = ϕj . Daraus folgt durch Auswertung
in z auch σj (γ1 ) = γj . Demnach permutiert die Galoisgruppe die Basis γ1 , . . . , γn , und wir haben
eine Normalbasis gefunden.
Algebra im Wintersemester 2015
145
§18. Transzendenzfragen
18.1. Transzendente Zahlen.
Ein Element a ∈ L ist transzendent über dem Unterkörper K ⊂ L, wenn es kein nichtkonstantes Polynom f ∈ K[X] mit f (a) = 0 gibt. Eine komplexe Zahl a ist transzendent, wenn sie
transzendent über Q ist. Ein Abzählargument liefert:
Satz 18.1 (Cantor) — Der algebraische Abschluß Q von Q in C ist abzählbar. Insbesondere gibt es
überabzählbar viele transzendente Zahlen in C.
Beweis. Es gibt für festes n ∈ N nur abzählbare viele Polynome in Q[X] vom Grad n. Jedes von
diesen hat höchstes endlich viele Nullstellen in C. Der Körper Q ⊂ C aller über Q algebraischen
Zahlen ist also die abzählbare Vereinigung von abzählbaren Mengen und damit selbst abzählbar. Da
C überabzählbar ist, ist auch C \ Q überabzählbar.
Der Beweis zeigt eigentlich allgemeiner:
Folgerung 18.2 — Ist K endlich, so ist der algebraische Abschluß K abzählbar. Ist K unendlich,
so sind K und K gleichmächtig.
Streng genommen ist dieser Beweis von Cantor sogar konstruktiv: man kann die algebraischen
Zahlen explizit abzählen, und das Diagonalverfahren liefert eine transzendente Dezimalzahl.
Der folgende ältere Beweis ist in anderer Weise konstruktiv: Er beruht auf der Beobachtung, daß
sich nichtrationale algebraische Zahlen schlecht (!) durch rationale Zahlen approximieren lassen.
Satz 18.3 (Liouville) — Es sei a ∈ C eine algebraische Zahl vom Grad n ≥ 2 über Q. Dann gibt es
ε > 0 derart, daß für jede rationale Zahl p/q, q ∈ N, gilt
a − p ≥ ε .
(18.1)
q
qn
Beweis. Es sei f ∈ Q[X] das Minimalpolynom von a. Ferner sei P der Hauptnenner aller KoeffiP
(k)
(a)/k!|. Da f irreduzibel ist und keine
zienten von f , und schließlich sei C = 1 + P · n
k=1 |f
′
mehrfache Nullstelle besitzt, ist f (α) 6= 0, also C > 1. Es sei 0 < ε < 1/C.
Wir schließen dann wie folgt: Für jede rationale Zahl p/q ∈ Q ist einerseits f (p/q) eine rationale
Zahl, die nicht 0 sein kann. Da der Nenner von f (p/q) höchstens P q n ist, gilt
(18.2)
|f (p/q)| ≥
1
P qn
Andererseits folgt mit δ := a − p/q unter der Annahme |δ| < ε/q n < 1, daß
n
n
(k)
X
(a) k ε X |f (k) (a)|
εC
kf
(−1)
δ < n
<
.
(18.3) |f (p/q)| = |f (a − δ)| = f (a) +
k!
q
k!
P qn
k=1
k=1
Zusammengenommen hat man den Widerspruch
(18.4)
1
εC
1
≤ f (p/q) ≤
<
.
P qn
P qn
P qn
Mit diesem Satz findet man sofort viele transzendente Zahlen, zum Beispiel läßt sich die Zahl
(18.5)
α :=
∞
X
1
n!
2
n=0
viel zu gut approximieren. Das ist natürlich ein künstliches Beispiel. Interessanter ist die Tatsache,
daß e und π transzendente Zahlen sind. Wir führen den Beweis im folgenden Abschnitt.
146
Transzendenfragen
18.2. Die Transzendenz von e und π.
Lemma 18.4 — Für jede ganze Zahl n ≥ 0 gilt
R∞
0
z n e−z dz = n!
Beweis. Partielle Integration und vollständige Induktion.
Satz 18.5 (Hermite 1873) — e ist transzendent.
Beweis. Angenommen, e wäre algebraisch über Q vom Grad m. Dann gibt es rationale Zahlen
a0 , . . . , am mit
a0 e0 + a1 e1 + . . . + am em = 0.
Weil m minimal mit dieser Eigenschaft ist, ist a0 6= 0. Und indem man mit dem Hauptnenner
multipliziert, kann man ohne Einschränkung annehmen, daß alle Koeffizienten ak ganze Zahlen sind.
Wir setzen h(z) := (z − 1) · . . . · (z − m). Für ein später zu bestimmendes n ∈ N betrachten wir
Z ∞
0 = (a0 e0 + . . . + am em )
z n h(z)n+1 e−z dz
0
=
m
X
ak
k=0
Z
∞
z n h(z)n+1 ek−z dz
0
R∞ Rk R∞
Das k-te Integral zerlegt sich gemäß 0 = 0 + k . Führt man im zweiten Integral die Substitution
R∞
x = z − k durch, hat dieses Integral wieder die Form 0 . Das ergibt:
(18.6)
0=
m
X
a k Ik + Iε
k=0
mit
Ik =
und
Z
Iε =
∞
(x + k)n h(x + k)n+1 e−x dx
0
m
X
k=1
ak
Z
k
(zh(z))n (ze−z )dz.
0
Das letzte Integral schätzen wir grob ab: Wenn γ das Supremum von |zh(z)| auf dem Intervall [0, m]
bezeichnet und c′ das Supremum von |h(z)e−z |, so gilt
Iε | ≤ Cγ n ,
′P
c
mit der von n unabhängigen Konstanten C := m+1
k |ak |. In den Integralen Ik ist der In2
tegrand das Produkt eines ganzzahligen Polynoms mit e−z . Nach Lemma 18.4 sind diese Integrale
ganze Zahlen. Man kann aber Genaueres sagen: Für k > 0 hat h(z + k)n+1 bei 0 eine n + 1fache Nullstelle. Alle Monome in z n h(z)n+1 haben also einen Grad ≥ n + 1. Woraus folgt, daß
Ik = (n + 1)!Bk für eine ganze Zahl Bk , k = 1, . . . , m. Dagegen ist das Monom kleinsten Grades
im Integranden von I0 von der Form
h(0)n+1 z n 6= 0,
so daß
I0 = h(0)n+1 n! + (n + 1)!B0
für eine ganze Zahl B0 . Setzt man diese Werte in (18.6) und teilt durch n!, erhält man
a0 h(0)n+1 + (n + 1)
m
X
k=0
Bk = −
Iε
.
n!
Die Koeffizienten Bk hängen zwar von n ab, die linke Seite ist aber in jedem Falle eine ganze Zahl.
n
Dagegen ist die rechte Seite nach oben durch C γn! beschränkt und deshalb für hinreichend großes
147
n dem Betrage nach strikt kleiner als 1. Weil der Ausdruck eine ganze Zahl ist, muß er identisch
verschwinden. Es bleibt
a0 h(0)n+1 = −(n + 1)B(n)
für alle hinreichend großen n mit einer von n abhängigen ganzen Zahl B(n). Wählt man n als
ein hinreichend großes Vielfaches von a0 h(0), so ist die linke Seite der letzten Gleichung sicher
teilerfremd zu n + 1. Widerspruch.
Satz 18.6 — Es seien α1 , . . . , αn paarweise verschiedene algebraische Zahlen und A1 , . . . , An
beliebige nichtverschwindende algebraische Zahlen. Dann gilt
A1 eα1 + . . . + An eαn 6= 0.
Unmittelbare Konsequenzen davon sind:
Folgerung 18.7 (Lindemann 1882) — π ist transzendent.
Beweis. Wäre π algebraisch, so wäre auch πi algebraisch, und die Eulersche Identität 1 + eiπ = 0
stünde im Widerspruch zu Satz 18.6.
Lindemanns Beweis der Transzendenz von π ist eine Weiterentwicklung des Ansatzes von Hermite. Der Beweis von Satz 18.6, den ich im Folgenden gebe, stammt von Hilbert (1893, vgl. Ges.
Werke Bd. 1, Seite 1). Hilbert beweist in der Arbeit nur den obigen Satz von Hermite und direkt
die Folgerung 18.7 und überläßt dem Leser die Ausarbeitung des allgemeinen Falls zur Übung. Der
folgende Beweis ist die Bearbeitung dieser Übungsaufgabe.
Die Rolle des Polynoms h(z) = (z − 1) · · · (z − m) spielt im folgenden Beweis ein ganzzahliges
Polynom h(z), dessen Nullstellen aber irgendwelche algebraische komplexe Zahlen sein können. Die
Integrale werden also zu Wegintegralen mit holomorphen (= komplex differenzierbaren) Integranden.
Für die Argumente werden einige einfache Ergebnisse aus der Funktionentheorie benötigt, die wir
zunächst zusammenstellen:
Für Integrale von holomorphen Funktionen auf Gebieten in der komplexen Ebene genügt es im
Allgemeinen nicht, die Integrationsgrenzen anzugeben, sondern man muß einen Integrationsweg
festlegen. Ist γ : [a, b] → C ein stückweise stetig differenzierbarer Weg, so setzt man
Z
Z b
f (z)dz :=
f (γ(t))γ ′ (t)dt
γ
a
und führt das Integral so auf ein gewöhnliches Integral über dem Intervall [a, b] zurück. Im Beweis
schreiben wir gleichwohl zur besseren Lesbarkeit.
Z ∞
Z ∞
f (z)dz :=
f (α + t)dt
α
0
und
Z
α
f (z)dz :=
0
Z
1
f (αt)αdt
0
wo t über die reellen Intervalle [0, ∞) bzw. [0, 1] läuft. Ähnlich wie im Reellen läßt sich der Betrag
eines Integrals durch das Produkt aus der Länge des Integrationsweges und dem Supremum des
Integranden auf dem Bild des Weges abschätzen. Schließlich brauchen wir noch die Identität
Z ∞
Z α
Z ∞
Z α
Z ∞
p(z)e−z dz =
p(z)e−z dz +
p(z)e−z dz =
p(z)e−z dz +
p(x + α)e−x−α dx
0
0
α
0
0
für beliebige Polynome p ∈ C[z]. Das zweite Gleichheitszeichen ergibt sich aus einer einfachen
Substitution. Wir müssen das erste Gleichheitszeichen rechtfertigen. Dazu betrachten wir die TeilinR α+R−Re(α)
RR
tegrale α
und 0 für großes R > 0 und das Integral über den Weg ϕ : [0, 1] → C,
t 7→ R + t Im(α). Die Integrationswege sehen nun so aus:
148
Transzendenfragen
R + α − Re(α)
α
ϕ
0
R
Weil die hier betrachteten Integranden überall im Inneren des von den Wegen begrenzten Vierecks
komplex differenzierbar sind, ist nach dem Cauchyschen Integralsatz der Wert des Wegintegrals von
0 nach α + R − Re(α) unabhängig davon, ob man links oder rechts um das eingeschlossene Gebiet
herumläuft, d.h.
Z α Z R+α−Re(α) Z R Z
+
=
+
.
0
α
0
ϕ
Es genügt also zu zeigen, daß für R → ∞ das Integral über den Weg ϕ gegen 0 geht. Da die von
ϕ durchlaufene Wegstrecke unabhängig von R stets | Im(α)| ist und es für jedes Polynom p eine
Schranke der Form |p(z)| ≤ C|z|deg(p) gibt, hat man
Z
R→∞
p(z)e−z dz ≤ C(R + |α|)deg(p)+1 e−R −−
−−−→ 0.
ϕ
Nach diesen Vorbereitungen kommen wir zum Beweis von Satz 18.6. Wir nehmen also an, es
seien paarweise verschiedene αi ∈ Q, 1 ≤ i ≤ n, und beliebige Ai ∈ Q \ {0} mit der Eigenschaft
A1 eα1 + . . . + An eαn = 0.
(18.7)
gegeben. Notwendigerweise ist n ≥ 2.
Der Beweis besteht aus zwei Teilen: Im ersten Teil reduzieren wir den allgemeinen Fall auf die
Betrachtung des folgenden Spezialfalls
(18.8)
A0 e0 + A1 (eα11 + . . . + eα1ℓ1 ) + . . . + Am (eαm1 + . . . + eαmℓm ) = 0,
wobei Ai ganze Zahlen 6= 0 und für jedes j = 1, . . . , m die Exponenten αj1 , . . . , αjℓj die Nullstellen eines irreduziblen Polynoms gj ∈ Q[X] vom Grad ℓj sind. Diese Reduktion geschieht in vier
Schritten:
1. Schritt: Wir können ohne Einschränkung annehmen, daß in (18.7) alle Koeffizienten Ai ganze
Zahlen sind.
Andernfalls sei G die Galoisgruppe der normalen Hülle von Q(A1 , . . . , An ) ⊂ C über Q. Die
Exponenten β auf der rechten Seite der Identität
X
Y
B j e βj
(σ(A1 )eα1 + . . . + σ(An )eαn ) =
(18.9)
0=
σ∈G
j
P
haben die Form βj =
i mi αi mit ganzzahligen Koeffizienten mi mit
i mi = |G| und sind
daher algebraische Zahlen. Die Koeffizienten Bj sind invariant unter der Galoisgruppe G und deshalb
rationale Zahlen. Nach Multiplikation mit dem Hauptnenner werden sie ganzzahlig.
Allerdings werden nach dem Ausmultiplizieren Terme zusammengefaßt und könnten sich gegebenseitig auslöschen. Wir müssen also noch verifizieren, daß wenigstens ein Term eβj mit einem
Koeffizienten 6= 0 übrig bleibt. Das ist sicher dann der Fall, wenn βj nur auf eine Weise als Summe von Exponenten αi geschrieben werden kann. Denn dann ist der Koeffizient Bj ein Produkt der
zugehörigen Koeffizienten Ai und somit 6= 0. Dazu genügt das Lemma:
P
149
Lemma 18.8 — Es seien S1 , . . . , Sℓ ⊂ C nichtleere endliche Mengen. Dann gibt es in der Menge
S1 + . . . + Sn eine Zahl β, die sich nur auf eine Weise als Summe β = s1 + . . . + sn mit si ∈ Si
schreiben läßt. Falls |Sj | ≥ 2 für wenigstens einen Index, so gibt es wenigstens zwei verschiedene
β mit der verlangten Eigenschaft.
Beweis. Es sei T = S1 ∪ . . . ∪ Sn . Wir wählen x ∈ C so, daß x auf keinem Vektor y − y ′ 6= 0,
y, y ′ ∈ T , senkrecht steht. Dann gibt es in jeder Menge Si genau ein si derart, daß hsi , xi =
max{hs, xi | s ∈ Si }, und β+ := s1 + . . . + sn hat die verlangte Eigenschaft. Dasselbe Argument mit min statt max liefert ein Element β− , das von β+ verschieden ist, sobald eine Menge Sj
wenigstens zwei Elemente hat.
2. Schritt: Es bestehe also die Identität (18.7) mit ganzen Zahlen Aj . Es sei S die Menge der
Exponenten. Dann kann man ohne Einschränkung annehmen, daß S mit αj auch alle Konjugierten
von αj enthält, und zwar jeweils mit demselben ganzen Koeffizienten:
Diesmal bezeichne G die Galoisgruppe der normalen Hülle von Q(α1 , . . . , αn ) ⊂ C über Q.
Wir entwickeln wieder das folgende Produkt nach formalen Potenzen von e:
X
Y
B j e βj .
(18.10)
0=
A1 eσ(α1 ) + · · · + An eσ(αn ) =
j
σ∈G
Zunächst sieht man mit Hilfe des Lemmas, diesmal angewandt auf die Mengen σ(S), σ ∈ G, daß
die Summe auf der rechten Seite wenigstens zwei nichttriviale Summanden hat. Außerdem sind die
Exponenten algebraische Zahlen, die Menge der Exponenten ist abgeschlossen unter Konjugation,
und konjugierte Exponenten haben denselben Koeffizienten. Faßt man die Terme mit konjugierten
Exponenten zusammen, so erhält man eine Identität:
(18.11)
0 = B1 (eβ11 + . . . + eβ1ℓ1 ) + . . . + Bm (eβm1 + . . . + eβmℓm )
mit ganzen Zahlen Bj ∈ Z \ {0} und paarweise verschiedenen algebraischen Zahlen βji derart, daß
für jedes j die Zahlen βj1 , . . . , βjℓj die Nullstellen eines irreduziblen Polynoms gj ∈ Q[X] sind.
3. Schritt: Man kann ohnen Einschränkung annehmen, daß eine Identität der Form (18.8) besteht.
Dazu gehen wir von einer Identität der Form (18.11) aus und multiplizieren mit (e−β11 + . . . +
e−β1ℓ1 ). Man erhält nach erneutem Umsortieren eine Identität der Form (18.11) mit neuen Exponenten und neuen Koeffizienten, wobei diesmal aber insbesondere der Term ℓ1 B1 e0 vorkommt.
Das beendet den ersten Teil. Bevor wir zum zweiten Teil übergehen, will ich die Reduktionsschritte kurz an einem Beispiel illustrieren. Starten wir mit einem Ausdruck
√ 3 √ √7
2e + 5e ,
so erhält man im ersten Schritt
√
√
√
√ √
√ √ √
√ √
√ √
( 2e3 + 5e 7 )(− 2e3 + 5e 7 )( 2e3 − 5e 7 )(− 2e3 − 5e 7 )
4e12 − 20e6+2
=
√
7
+ 25e4
√
7
.
Im zweiten Schritt wird hieraus:
(4e12 − 20e6+2
=
√
7
+ 25e4
√
7
√
√
)(4e12 − 20e6−2 7 + 25e−4 7 )
√ √
√ √
−500 e6+2 7 + e6−2 7 + 100 e12+4 7 + e12−4 7
√ √
−80 e18+2 7 + e18−2 7 + 400e12 + 16e24 + 625e0 .
Der dritte Schritt ist hier unnötig, weil e0 mit Koeffizient 625 vorkommt.
Damit kommen wir zum zweiten, eigentlichen Teil des Beweises. Wir können von folgendem
Datum ausgehen: Es besteht eine Identität
(18.12)
0 = A0 e0 + A1 (eα11 + . . . + eα1ℓ1 ) + . . . + Am (eαm1 + . . . + eαmℓm )
150
Transzendenfragen
mit ganzen Zahlen Aj ∈ Z \ {0} und paarweise und von 0 verschiedenen algebraischen Exponenten
αjk . Dabei sind für jedes j die Exponenten αj1 , . . . , αjℓj die Nullstellen eines irreduziblen normierten Polynoms gj (X) ∈ Q[X] vom Grad ℓj . Es gibt dann zu jedem j = 1, . . . , m ein cj ∈ N
mit hj (X) := cj gj (X) ∈ Z[X]. Insbesondere sind für jedes j die symmetrischen Polynome in
cj αj1 , . . . , cj αjℓj ganze Zahlen. Setze
(18.13)
h=
m
Y
hj ,
c=
m
Y
cj ,
ℓ=
ℓj = deg(h).
j=1
j=1
j=1
m
X
Für später halten wir noch die Beobachtung fest: Ist p irgendein Polynom mit ganzzahligen KoeffiP ℓj
zienten, ist cdeg(p) i=1
p(αji ) eine ganze Zahl.
Wir wählen nun eine natürliche Zahl n ∈ N, die im Laufe des Beweises genauer spezifiziert wird,
multiplizieren die Identität (18.12) mit dem Integral
Z ∞
(18.14)
(cz)n (cℓ h(z))n+1 e−z dz,
0
und erhalten
0
=
A0
Z
∞
(cz)n (cℓ h(z))n+1 e−z dz +
0
m
X
j=1
Aj
ℓj Z
X
i=1
∞
(cz)n (cℓ h(z))n+1 eαji −z dz
0
R∞
R∞
Rα
Die Integrale des zweiten Summanden werden gemäß 0 = 0 ij + α zerlegt, was nach dem
ij
Cauchyschen Integralsatz möglich ist. Dabei ist im ersten Integral der Integrationsweg die Strecke
von 0 nach αij und im zweiten Integral der Weg t 7→ αij + t für t ∈ R≥0 . Substituieren wir im
zweiten Integral z − αji 7→ z. Dann hat man
(18.15)
0 = A 0 I0 + Iε +
m
X
A j Ij
j=1
wobei die einzelnen Terme für die folgenden Integrale stehen:
Z ∞
(18.16)
(cz)n (cℓ h(z))n+1 e−z dz,
I0 =
0
(18.17)
Iε
=
m
X
Aj
j=1
Ij
=
XZ
k=1
=
eαjk
k=1
ℓj
(18.18)
ℓj
X
∞
Z
αjk
(cz)n (cℓ h(z))n+1 e−z dz
0
(cz)n (cℓ h(z))n+1 eαjk −z dz
αjk
ℓj Z
X
k=1
∞
(cz + cαjk )n (cℓ h(z + αjk ))n+1 e−z dz.
0
Wir berechnen nun die einzelnen Integrale oder geben wenigstens eine Abschätzung. Dabei ist die
Identität
Z ∞
(18.19)
z N e−z dz = N !,
N ∈ N0
0
wesentlich, von deren Richtigkeit man sich durch partielle Integration und Induktion leicht überzeugt.
Wir beginnen mit dem Integral I0 : Das Polynom (cz)n (cℓ h(z))n+1 ist ganzzahlig, und der Term
kleinsten Grades ist cn+ℓ(n+1) h(0)n+1 z n . Alle anderen Terme sind ganzzahlig und durch z n+1
teilbar. Demnach hat I0 die Form
I0 = B(n + 1)! + cn(1+ℓ)+ℓ h(0)n+1 n!
151
für eine gewisse ganze Zahl B. Insbesondere ist I0 /n! ganzzahlig und
I0
≡ cn(ℓ+1)+ℓ h(0)n+1 mod n + 1.
n!
Das zweite Integral schätzen wir grob ab: Die Vereinigung K der Strecken [0, αjk ] ist eine kompakte Teilmenge in C. Deshalb sind die Funktionen c1+ℓ zh(z) und ch(z)eαij −z auf K dem Betrage
nach beschränkt, etwa durch γ > 0 für alle i, j. Somit gilt:
X
(18.20)
|Iǫ | ≤ γ n+1
|Aj |ℓj =: γ n+1 C ′ .
j
Es verbleiben die Integrale, die in den Summanden Ij eingehen: Für festes j und k = 1, . . . , ℓj
ist αjk eine Nullstelle von h(z). Deshalb hat
cℓ(n+1) (cz + cαjk )n h(z + αjk )n+1
bei z = 0 eine Nullstelle der Ordnung ≥ (n + 1) und die Koeffizienten bezüglich z sind ganzzahlige
Polynom in cαjk . [Genau an dieser Stelle wird der Faktor cℓ(n+1) gebraucht!]. Die Mittelung über
alle Nullstellen von hj ergibt deshalb
(18.21)
ℓj
X
k=1
(cz + cαjk )n (cℓ h(z + αjk ))n+1 ∈ z n+1 Z[z].
Nun liefert die Integration einen Wert Ij ∈ (n + 1)! Z. Insbesondere gilt
(18.22)
Ij /n! ≡ 0
mod (n + 1).
Zusammengefaßt hat man
(18.23)
1
1 X
Iǫ
A 0 I0 +
A j Ij = − ,
n!
n! j
n!
wo die linke Seite eine ganze Zahl kongruent zu A0 cn(ℓ+1)+ℓ h(0))n+1 modulo n + 1 ist, während
n+1
die rechte Seite dem Betrage nach durch C ′ γ n! beschränkt ist. Für hinreichend großes n ist die
rechte Seite dem Betrage nach < 1 und muß, weil sie auch ganzzahlig ist, identisch verschwinden.
Wählt man n zugleich als Vielfaches von A0 ch(0), so ist die linke Seite (18.23) nicht kongruent
0 modulo n + 1, weil n und n + 1 teilerfremd sind. Mit diesem Widerspruch ist Satz 18.6 bewiesen.
18.3. (*) Transzendenzbasen.
(1) Eine Teilmenge S ⊂ L heißt algebraisch unabhängig über K, wenn der kanonische Ringhomomorphismus Φ : K[{Xs }s∈S ] → L, Xs 7→ s, injektiv ist. In diesem Falle setzt sich
Φ zu einer kanonischen Einbettung Φ̃ : K({Xs }s∈S ) → L des Funktionenkörpers fort,
dessen Bild K(S) ist.
(2) Eine algebraisch unabhängige Teilmenge S ⊂ L ist eine Transzendenzbasis der Erweiterung L/K, wenn L algebraisch über K(S) ist.
(3) Die Erweiterung L/K heißt rein transzendent, wenn es ein algebraisch unabhängiges Erzeugendensystem S von L gibt.
Satz 18.10 (Steinitz) — 1. Jede Körpererweiterung L/K hat eine Transzendenzbasis.
2. Alle Transzendenzbasen einer Körpererweiterung haben dieselbe Mächtigkeit.
Beweis. 1. Wir nehmen zunächst allgemeiner an, S sei eine endliche, algebraisch unabhängige Teilmenge und L sei algebraisch über K(T ), und zeigen unter diesen Voraussetzungen, daß |S| ≤ |T |.
Offenbar können wir ohne Einschränkung annehmen, daß S nicht leer ist.
Angenommen, S0 = S ∩ T und s ∈ S \ S0 . Nach Voraussetzung ist s algebraisch über K(T ),
ist also Nullstelle eines nichtkonstanten Polynoms f ∈ K(T )[X]. Nach Multiplikation mit dem
152
Transzendenfragen
Hauptnenner kann man ohne Einschränkung annehmen, daß f ∈ K[T ][X]. Es gibt also endlich
viele Koeffizienten fnm , so daß
X
n
fn,m t1 n1 · · · tℓ ℓ sm
(18.24)
0=
n,m
mit t1 , . . . , tℓ ∈ T . Wir können annehmen, daß f so gewählt ist, daß ℓ minimal ist. Lägen alle ti
in S0 , wäre S0 ∪ {s} nicht algebraisch unabhängig, im Widerspruch zur Annahme über S. Ohne
Einschränkung ist tℓ kein Element von S0 . Bezeichnet d den Grad von f bezüglich tℓ , so ist der
Koeffizient von tdℓ nicht 0, sonst würde er der Minimalität von f widersprechen. Das zeigt, daß tℓ
algebraisch über K(T ′ ) ist, wobei T ′ := S0 ∪ {s} ∪ T \ {tℓ } ist. Jedes Element in L, das algebraisch
über K(T ) ist, ist daher auch algebraisch über K(T ′ ).
Die neue Menge T ′ hat dieselbe Mächtigkeit wie T , und S0′ = T ′ ∩ S = S0 ∪ {s}. In endlich
vielen Schritten kann man also T durch eine Menge T̃ gleicher Mächtigkeit ersetzen, die S enthält.
Insbesondere ist dann |T | ≥ |S|.
2. Es seien nun S und T zwei Transzendenzbasen. Jedes s ∈ S ist algebraisch über K(T ). Es gibt
dann aber auch schon eine endliche Teilmenge Ts ⊂ T derart, daß s algebraisch über K(Ts ) ist.
S
Insbesondere ist S algebraisch über K(TS ) mit TS := Ts . Andererseits ist T algebraisch über
K(S), also auch über K(TS ). Da T nach Voraussetzung algebraisch unabhängig ist, folgt T = TS .
Daraus schließen wir: Ist S endlich, so ist T = TS als Vereinigung von endlich vielen endlichen
Mengen ebenfalls endlich. Mit Schritt 1 folgt nun |S| ≤ |T | und |T | ≤ |S|, also Gleichheit. Ist umgekehrt S unendlich, so hat T = TS als Vereinigung einer von S parametrisierten Familie endlicher
Mengen höchstens die Mächtigkeit |S|. Aus der Symmetrie des Arguments folgt auch jetzt |S| = |T |.
3. Das beweist die Gleichmächtigkeit beliebiger Transzendenzbasen. Es bliebt zu zeigen, daß es
Transzendenzbasen gibt.
Dazu betrachten wir die Menge X ⊂ L aller algebraisch unabhängigen Teilmengen und die
durch Inklusion definierte Halbordnung auf X. Die Menge X ist nicht leer, denn X enthält die leere
S
Menge. Es sei weiter K eine Kette in X und T := S∈K S. Wäre T nicht algebraisch unabhängig,
so gäbe es eine endliche Teilmenge T ′ ⊂ T , die Nullstelle eines nichtkonstanten Polynoms wäre.
Jedes Element t′i ∈ T stammt aus einer Menge Si ∈ K. Da K eine Kette ist, gibt es eine Menge
S ∈ K mit Si ⊂ S für alle i, insbesondere also auch T ′ ⊂ S. Aber da S algebraisch unabhängig
ist, muß dies auch für T ′ gelten. Damit liegt T in K und ist eine obere Schranke von K. Nach dem
Zornschen Lemma gibt es ein maximales Element T in X. Es genügt zu zeigen, daß L algebraisch
über K(T ) ist. Andernfalls gibt es ein Element a ∈ L, das transzendent über K(T ) ist. Aber dann
ist T ∪ {a} algebraisch unabhängig, im Widerspruch zur Maximalität von T .
Definition 18.11. — Es sei K → L eine Körpererweiterung mit Transzendenzbasis S. Die Zahl
trdeg(L/K) := |S| heißt Transzendenzgrad von L über K.
Offenbar ist K → L genau dann algebraisch, wenn trdeg(L/K) = 0.
Satz 18.12 — Es seien K → M → L Körpererweiterungen. Dann gilt
(18.25)
trdeg(L/K) = trdeg(L/M ) + trdeg(M/K).
Beweis. Übung.
Aus der Eindeutigkeit der Mächtigkeit einer Transzendenzbasis für L/K folgt nicht, daß die
rein transzendenten Zwischenkörper, die von zwei Transzendenzbasen erzeugt werden, gleich sind.
Ein einfaches Beispiel bietet der Funktionenkörper K(X)/K. Sowohl {X} also auch {X 2 } sind
Transzendenbasen. Aber K(X 2 ) ⊂ K(X) ist ein echter Unterkörper.
153
Satz 18.13 — Aut(C) ist eine überabzählbare Gruppe.
Beweis. Es sei S ⊂ C eine Transzendenzbasis. Da C der algebraische Abschluß von Q(S) und
überabzählbar ist, muß auch S überabzählbar sein. Es sei π : S → S eine beliebige Bijektion
und ϕ : Q(S) → Q(S) der zugehörige Körperisomorphismus mit ϕ|S = π. Dann existiert ein
Isomorphismus ψ : C → C mit ψ|Q(S) = ϕ.

Vorlesungstext

Transcription

Documents pareils

Zum Fundamentalsatz der Algebra und zu Nullstellenschranken f¨ur

Beweismethoden

Blatt 9

Prof. Dr. Oleg Bogopolski Keine Abgabe. Besprechung: 17.10. um

Die Möbius- Transformation - mathematik

2011-12-16 - Käthe-Paulus

Nullstellen quadratischer Gleichungen

Faktorgruppen, Nebenklassen und Normalteiler - mathematik

Polynomfunktionen - Fundamentalsatz der Algebra

Musterbrief Adhäsionsantrag (ca.160kB)

Boolesche Polynome