Vorlesungstext
Transcription
Vorlesungstext
Vorlesungen über Algebra Mainz, Wintersemester 2015 Manfred Lehn 1 Korrekturstand: 25. Januar 2015 Algebra I im Wintersemester 2015 3 I NHALTSVERZEICHNIS §1. 1.1. 1.2. §2. 2.1. Polynomgleichungen Nullstellen Lösungsformeln Ringe Grundbegriffe 5 5 6 11 11 2.2. 2.3. 2.4. §3. 3.1. 3.2. 3.3. Ideale und Faktorringe Lokalisierung und Quotientenringe Aufgaben Polynomringe Polynomringe in einer Variablen Polynomringe in mehreren Variablen (*) Potenzreihenringe 12 14 15 17 17 19 20 3.4. §4. 4.1. 4.2. 4.3. 4.4. 4.5. Aufgaben Symmetrische Polynome Symmetrische Polynome in zwei Variablen Symmetrische Polynome in beliebig vielen Variablen Potenzsummen und Newtonsche Formeln Invarianten der alternierenden Gruppe Aufgaben zu symmetrischen Polynomen 21 22 22 24 27 29 30 §5. 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. Euklidische Ringe Allgemeine Teilbarkeitsbegriffe Euklidische Ringe Der euklidische Algorithmus Lineare Kongruenzen Einheiten in Z/n (*) Die Einheitengruppe von Z/pm 32 32 32 33 35 37 39 5.7. 5.8. 5.9. §6. 6.1. 6.2. 6.3. §7. (*) Minimale Euklidische Gradfunktionen √ (*) Der Ring Z[ 21 (1 + −19)] Aufgaben Faktorielle Ringe Primfaktorzerlegungen Der Satz von Gauß Irreduzibilitätskriterien Grundbegriffe der Gruppentheorie 41 42 44 45 45 47 49 51 7.1. 7.2. 7.3. 7.4. 7.5. 7.6. §8. Gruppen, Homomorphismen, Erzeuger Nebenklassen, Index, Faktorgruppen Konjugationsklassen, Automorphismen, semidirekte Produkte Kommutatoruntergruppen Endliche abelsche Gruppen Aufgaben Auflösbare Gruppen 51 52 54 56 57 58 60 8.1. 8.2. 8.3. 8.4. 8.5. §9. 9.1. Gruppenwirkungen p-Gruppen Auflösbare Gruppen Kompositionsreihen Aufgaben zur Gruppentheorie Die symmetrische Gruppe Partitionen 60 61 64 65 67 71 71 9.2. Zykelzerlegung und Konjugationsklassen 9.3. Der Signaturhomomorphismus und die alternierende Gruppe 9.4. Die Gruppe S3 71 73 75 4 9.5. Die Gruppe S4 9.6. Einfachheit der alternierenden Gruppen An , n ≥ 5 75 76 9.7. §10. 10.1. 10.2. 10.3. §11. 11.1. (*) Zur Kombinatorik der Zahlen 5 und 6. (*) Lineare Gruppen Matrizengruppen Transitive und imprimitive Wirkungen Endliche lineare Gruppen Körpererweiterungen Charakteristik und Grad 77 81 81 83 84 86 86 11.2. 11.3. 11.4. 11.5. §12. 12.1. 12.2. Algebraische Erweiterungen Nullstellen und algebraisch abgeschlossene Körper Fortsetzungen von Einbettungen Endliche Körper Galoistheorie Separabilität Normale Erweiterungen und Zerfällungskörper 88 91 94 96 98 98 102 12.3. §13. §14. §15. 15.1. 15.2. 15.3. Galoiserweiterungen Kreisteilungskörper Konstruktionen mit Zirkel und Lineal Auflösbarkeit von Gleichungen Spur und Norm Zyklische Erweiterungen Auflösbare Gleichungen 103 112 119 125 125 126 129 §16. 16.1. 16.2. §17. §18. 18.1. 18.2. Zur Galoisgruppe Berechnung der Galoisgruppe Das inverse Galoisproblem (*) Normalbasen Transzendenzfragen Transzendente Zahlen Die Transzendenz von e und π 133 133 137 141 145 145 146 18.3. (*) Transzendenzbasen 151 Algebra I im Wintersemester 2015 5 §1. Polynomgleichungen 1.1. Nullstellen. Der Ausgangspunkt für die Entwicklung der modernen Algebra war die Frage, wie man eine algebraische Gleichung der Form f0 xn + f1 xn−1 + . . . + fn−1 x + fn = 0 (1.1) löst. Dabei stammen die Koeffizienten f0 , . . . , fn der Gleichung aus einem Körper K, so daß man die linke Seite als ein Polynom f = f0 xn + . . . + fn ∈ K[x] auffassen und die Gleichung kürzer f (x) = 0 schreiben kann. Lösungen α ∈ K der Gleichungen heißen Nullstellen oder Wurzeln des Polynoms. Wenn der Leitkoeffizient f0 nicht 0 ist, spricht man von einer Gleichung vom Grad n und für kleine Werte n = 1, 2, 3 und 4 auch von linearen, quadratischen, kubischen und biquadratischen Gleichungen. Für jedes α ∈ K erhält man durch Polynomdivision eine Darstellung (1.2) f (x) = q(x)(x − α) + r, wobei der Rest r ein Polynom vom Grad < 1, also eine Konstante ist. Indem man auf beiden Seiten x = α setzt, erhält man (1.3) r = f (α). Statt der Polynomdivision kann man auch die Relation (1.4) xm − αm = (x − α)(xm−1 + αxm−2 + . . . + αm−1 ) verwenden und erhält so einen Ausdruck für den Quotienten. (1.5) q(x) = n X f (x) − f (α) fm (xm−1 + αxm−2 + . . . + αm−1 ). = (x − α) m=1 Wenn nun α eine Nullstelle von f (x) ist und damit der Restterm verschwindet, ergibt sich eine Faktorisierung (1.6) f (x) = (x − α)q(x). Jede weitere von α verschiedene Nullstelle muß dann eine Nullstelle von q sein, die sich in gleicher Weise ausfaktorisieren läßt. Auf diese Weise erhält man eine Zerlegung (1.7) f (x) = (x − α1 )m1 (x − α2 )m2 · . . . (x − αs )ms g(x) mit Nullstellen α1 , . . . , αs ∈ K, Vielfachheiten m1 , . . . , ms ∈ N und einem (möglicherweise konstanten) Polynom g(x), das keine Nullstellen in K hat. Insbesondere hat ein Polynom f vom Grad n höchstens n verschiedene Nullstellen. Die Zerlegung ist bis auf die Reihenfolge der Faktoren eindeutig. Man sagt, αi ist eine doppelte Nullstelle, wenn mi ≥ 2, eine dreifache Nullstelle, wenn mi ≥ 3 usw. Man kann die Vielfachheit einer Nullstelle mit Hilfe der formalen Ableitungen eines Polynoms P k messen: Für Polynome f = n k=0 fk x ∈ R[X] mit Koeffizienten in einem beliebigen kommutativen Ring wird durch (1.8) f ′ := n X kfk xk−1 k=1 auf rein algebraischem Wege und ohne Grenzprozeß eine Ableitung definiert. Man verifiziert dann leicht, daß die übliche Summen- und Produktregel gelten: (1.9) (f + g)′ = f ′ + g ′ , (f g)′ = f ′ g + f g ′ . Allerdings kann es vorkommen, daß f ′ = 0, ohne daß f ein Polynom vom Grad 0 ist. Das passiert zum Beispiel für das Polynom xp ∈ Fp [x]. Dieses Phänomen wird später noch wichtig werden. 6 Polynomgleichungen Aus einer Zerlegung f (x) = (x − α)m g(x), m > 0, erhält man durch Ableiten (1.10) f ′ (x) = (x − α)m g ′ (x) + m(x − α)m−1 g(x) = (x − α)m−1 ((x − α)g ′ (x) + mg(x)). Wir können deshalb schließen: Satz 1.1 (Huddesche1 Regel) — α ∈ K ist genau dann eine mehrfache Nullstelle von f ∈ K[x], wenn α eine gemeinsame Nullstelle von f und f ′ ist. Wenn der Körper K die Charakteristik 0 hat, d.h. wenn alle natürlichen Zahlen in K invertierbar sind, kann man die Vielfachheit mit Hilfe höherer Ableitungen genau angeben: Satz 1.2 — Es sei K ein Körper der Charakteristik 0. Ein Polynom f ∈ K[X] hat in α ∈ K eine Nullstelle der Vielfachheit m, wenn f (α) = f ′ (α) = . . . = f (m−1) (α) = 0 (1.11) und f (m) (α) 6= 0. Beweis. Ohne Einschränkung ist f nicht konstant und ℓ ∈ N0 maximal mit der Eigenschaft, daß es eine Zerlegung f (x) = (x − α)ℓ g(x) gibt. Alle Ableitungen f (k) , k < ℓ, enthalten den Faktor (x − α)ℓ−k und damit die Nullstelle α, und f (ℓ) (x) = (1.12) ℓ−1 X i=0 Es folgt f (ℓ) ℓ!2 (x − α)ℓ−i g (ℓ−i) (x) + ℓ!g(x). i!(ℓ − i)!2 (α) = ℓ!g(α) 6= 0. 1.2. Lösungsformeln. Wir wollen die klassischen Lösungsformeln für Polynomgleichungen f (x) = 0 für reelle Polynome vom Grad ≤ 4 besprechen. Lineare Gleichungen (1.13) f0 x + f1 = 0 mit f0 6= 0 haben stets die eindeutige Lösung x = −f1 /f0 . Allgemeiner kann man in jeder Gleichung f0 xn + . . . + fn = 0 mit nichttrivialem Leitkoeffizienten stets durch f0 teilen und deshalb ohne Einschränkung annehmen, daß f0 = 1. Eine quadratische Gleichung x2 + f 1 x + f2 = 0 (1.14) wird durch quadratische Ergänzung vereinfacht: 2 f1 f1 f2 f2 (1.15) x+ = x2 + 2 x + 1 = 1 − f 2 . 2 2 4 4 Setzt man y = x + f21 , so hat man die ursprüngliche Gleichung auf eine sogenannte reine Gleichung (1.16) y2 = b mit der Diskriminante b= f12 − f2 4 zurückgeführt. Man erhält die formale Lösung r f12 f1 (1.17) x=− ± − f2 2 4 der Gleichung f = 0. Damit diese formale Lösung für konkrete Zahlenwerte wirklich Lösungen liefert, muß die Diskriminante Wurzeln besitzen. Das Wissen, wie man quadratische Gleichungen löst, ist uralt. Die berühmte Keilschrifttafel ‘Plimpton 322’ ist ca 3700 Jahre alt und wird heute als Beispielsammlung für Zahlen verstanden, die in Rechenaufgaben zu quadratischen Gleichungen eingehen. 1Johan Hudde, b23. April 1628, d15. April 1704 jeweils in Amsterdam. Algebra I im Wintersemester 2015 7 Dagegen ist die Auflösung kubischer Gleichung ein Ergebnis des 16. Jahrhunderts. Die Entdeckung der im Folgenden erklärten Verfahren geht auf die italienischen Mathmematiker S CIPIONE DEL F ERRO (1465 - 1526), H ANNIBAL DEL NAVE (1500 - 1558), A NTONIO M ARIA F IOR , N ICCO LO (F ONTANA ) TARTAGLIA (ca 1499 - 1557), G EROLAMO C ARDANO (1501–1576), L ODOVICO F ERRARI (1522 - 1565) zurück. Für die ebenso spannende wie verwickelte Geschichte verweise ich auf Bücher zur Mathematikgeschichte, insbesondere das Buch ‘A History of Algebra: From alKhwarizmi to Emmy Noether’ von VAN DER WAERDEN. Wir betrachten eine kubische Gleichung x3 + f 1 x2 + f 2 x + f 3 = 0 (1.18) und nehmen der Einfachheit an, der Koeffizientenkörper sei der Körper der reellen Zahlen. Der Vergleich mit dem binomischen Ausdruck 3 f1 f2 f3 (1.19) x+ = x3 + f 1 x2 + 1 x + 1 3 3 27 legt nahe, die Substitution (1.20) y =x+ f1 , 3 x=y− f1 3 durchzuführen. Man erhält x3 + f 1 x2 + f 2 x + f 3 = = 3 2 f1 f1 f1 y− + f1 y − + f2 y − + f3 3 3 3 2 3 1 1 f1 . y 3 + f2 − f12 y + f3 − f1 f2 + 3 3 27 Durch diese Substitution kann man also den quadratischen Term eliminieren, erhält aber nicht sofort eine reine Gleichung vom Typ y 3 = b. Wenn wir die Unbestimmte wieder mit x bezeichnen und der Tradition folgend die konstanten und linearen Terme auf der anderen Seite des Gleichungszeichens sammeln, ist das Ausgangsproblem auf eine Gleichung der Form x3 = ax + b (1.21) zurückgeführt. Wenn a = 0, handelt es sich um eine reine Gleichung, die man sofort lösen kann, wenn man weiß, wie man Kubikwurzeln zieht. Wir nehmen also an, daß a 6= 0. Mit dem Ansatz x = u + v mit zwei neuen Unbestimmten und der Identität (1.22) x3 = (u + v)3 = (u3 + v 3 ) + (3uv)x folgt, daß die Gleichung (1.21) jedenfalls dann gelöst wird, wenn (1.23) 3uv = a gilt. Aus u3 + v 3 = b und (u3 )(v 3 ) = Gleichung (1.24) und a3 27 u3 + v 3 = b folgt, daß u3 und v 3 Lösungen der quadratischen 0 = (t − u3 )(t − v 3 ) = t2 − bt + a3 27 sind. Bis auf eine irrelevante Vertauschung der Variablen bedeutet dies: r r b b2 b2 a3 b a3 3 3 (1.25) u = + − , v = − − . 2 4 27 2 4 27 Man erhält so die sogenannte Cardanische Formel s s r r 3 2 3 b 3 b a a3 b b2 + − + − − . (1.26) x= 2 4 27 2 4 27 8 Polynomgleichungen Dabei ist bei der Bildung der dritten Wurzeln das Folgende zu beachten: Bekanntlich hat jede komplexe Zahl 6= 0 nicht eine, sondern drei dritte Wurzeln, die sich um Potenzen der dritten Einheitswur√ zel ρ = 12 (−1 + i 3) unterscheiden. Das Wurzelzeichen ist also auf gefährliche Weise mehrdeutig. Aber nicht jede der 9 Kombinationen der beiden Wurzeln ist zulässig, denn u und v müssen der Nebenbedingung 3uv = a genügen. Deshalb legt die Wahl der Wurzel für u die Wahl der Wurzel für v fest. Zum Beispiel hat die Gleichung x3 = 18x + 35 (1.27) die Lösung x1 = = s r 3 35 352 352 183 183 − + − − 4 27 2 4 27 r r 19 19 3 35 3 35 + + − = 3 + 2 = 5, 2 2 2 2 s 3 35 + 2 r aber auch die Lösungen (1.28) x2 = 3ρ + 2ρ2 = −2 + ρ und x3 = 3ρ2 + 2ρ = −3 − ρ. (Es ist ρ2 + ρ + 1 = 0!) Es ist verblüffend, daß zwischen der Entdeckung der Lösungsmethoden für quadratische und für kubische Gleichungen drei Jahrtausende liegen, daß die Lösung für biquadratische Gleichungen fast zeitgleich mit der Lösung für kubische Gleichungen gefunden wurde, und zwar von L UDOVICO F ER RARI . Beide Lösungen wurden von C ARDANO in seinem Buch Ars Magna de Regulis Algebraicis (1545) veröffentlicht. Mit demselben Trick wie im Falle der quadratischen und kubischen Gleichungen kann man bei allen Polynomgleichungen f (x) = xn + f1 xn−1 + . . . + fn = 0 mit der Substitution y = x + fn1 den Term vom Grad n − 1 eliminieren: (1.29) f (x) = F (y) = y n + (f2 − n−1 2 n−2 f )y 2n 1 + ... Bei einer biquadratischen Gleichungen kann man also stets den Term vom Grad 3 eliminieren. Wir gehen gleich von der normalisierten Form x4 = ax2 + bx + c (1.30) aus und geben zunächst eine leicht modifizierte Form des ursprünglichen Arguments von F ERRARI, natürlich ausgedrückt in der modernen symbolischen Sprache, die F ERRARI noch nicht zur Verfügung stand. Die Idee besteht darin, auf beiden Seiten einen quadratischen Ausdruck so zu addieren, daß jede Seite für sich ein Quadrat ist: (1.31) x4 + 2px2 + p2 = (a + 2p)x2 + bx + (c + p2 ). Dabei ist p ein Parameter, über dessen Wert noch zu verfügen ist. Die linke Seite ist offensichtlich (x2 + p)2 . Die rechte Seite ist genau dann ein Quadrat, wenn die Diskriminante des quadratischen Polynoms verschwindet, d.h. wenn 4(a + 2p)(c + p2 ) − b2 = 0. (1.32) Dies ist eine kubische Gleichung (1.33) (2p)3 + a(2p)2 + 4c(2p) + (4ac − b2 ) = 0 Algebra I im Wintersemester 2015 9 für den Parameter p. Diese Gleichung nennt man eine kubische Resolvente für die Ausgangsgleichung. Wenn man nun eine Nullstelle p der kubischen Resolventen bestimmt hat und in (1.31) einsetzt, kann man auf beiden Seiten die Wurzel ziehen und erhält p p (1.34) x2 + p = ±( a + 2p x + c + p2 ), wobei die beiden Wurzeln so zu wählen sind, daß sie die Nebenbedinung p p (1.35) 2 a + 2p c + p2 = b erfüllen, was nach Wahl von p stets möglich ist. Auf diese Weise ist die Lösung der biquadratischen Gleichung (1.30) auf das Lösen einer kubischen und mehrerer quadratischer Gleichungen zurückgeführt. D ESCARTES löst die Gleichung x4 − ax2 − bx − c = 0 (1.36) mit dem Ansatz x4 − ax2 − bx − c = (x2 − ux + v)(x2 + ux + w) (1.37) mit den Unbestimmten u, v, w. Durch Koeffizientenvergleich erhält man die Bedingungsgleichungen −a = −u2 + v + w −b = u(v − w) −c = vw Aus der ersten Gleichung kann man w eliminieren: w = −a + u2 − v. Wenn b = 0, ist die Ausgangsgleichung eine quadratische Gleichung in x2 und kann sofort mit den üblichen Mitteln gelöst werden. Wir nehmen deshalb ohne Einschränkung an, daß b 6= 0 ist. Falls das Gleichungssystem also überhaupt eine Lösung hat, muß jedenfalls auch u 6= 0 gelten, und man kann aus der ersten und der zweiten Gleichung auch v elimineren: u3 − au − b u3 − au + b , w= . 2u 2u Die dritte Bedingungsgleichung liefert dann nach Multiplikation mit dem Hauptnenner (1.38) v= 0 = = (u3 − au − b)(u3 − au + b) + 4cu2 u6 − 2au4 + (a2 + 4c)u2 − b2 . Dies ist eine kubische Gleichung für u2 , die im Übrigen durch eine einfache Substitution in (1.33) übergeht. Ein anderer sehr eleganter Ansatz geht auf E ULER zurück: Man setzt (1.39) x=u+v+w mit drei Unbestimmten u, v, w. Zur Abkürzung führen wir die Bezeichnungen A = u2 + v 2 + w 2 , (1.40) B = u2 v 2 + v 2 w 2 + w 2 u2 , T = uvw ein. Dann gilt (1.41) x2 = (u2 + v 2 + w2 ) + 2(uv + vw + wu) = A + 2(uv + vw + wu) und (x2 − A)2 = 4(uv + vw + wu)2 = 4 · (u2 v 2 + v 2 w2 + w2 u2 ) + 2(u2 vw + v 2 uw + w2 uv) = 4B + 8(u + v + w)uvw = 4B + 8T x. 10 Polynomgleichungen Zusammengenommen heißt das x4 = 2Ax2 + 8T x + (4B − A2 ). (1.42) Substituiert man diesen Ausdruck in (1.30), (2A − a)x2 + (8T − b)x + (4B − A2 − c) = 0, (1.43) so ist diese Gleichung offenbar identisch erfüllt, wenn u, v und w so gewählt werden, daß 1 1 1 1 2 (1.44) A = a, T = b, B = c + a . 2 8 4 16 Konstruktionsgemäß sind u2 , v 2 und w2 die Nullstellen des kubischen Polynoms (Y − u2 )(Y − v 2 )(Y − w2 ) = = = Y 3 − (u2 + v 2 + w2 )Y 2 + (u2 v 2 + v 2 w2 + w2 u2 )Y − u2 v 2 w2 Y 3 − AY 2 + BY − T 2 1 1 1 2 1 2 Y 3 − aY 2 + c+ a Y − b . 2 4 16 64 Bezeichnen also λ1 , λ2 , λ3 die drei Nullstellen dieses Polynoms, so ist √ √ √ (1.45) x = u + v + w mit u = ± λ1 , v = ± λ2 , w = ± λ3 eine Lösung der biquadratischen Gleichung (1.30), wobei die Vorzeichen der Wurzeln so zu wählen sind, daß die Nebenbedingung 1 (1.46) uvw = T = b 8 erfüllt ist. Von den 23 = 8 denkbaren Vorzeichenwahlen scheiden also 4 aus, und die übrigen liefern vier Lösungen x1 , x2 , x3 , x4 . Im Ausnahmefall, daß b = 0, verschwindet eine Nullstelle, etwa λ3 , √ √ und die vier Lösungen der biquadratischen Gleichung ergeben sich aus ± λ1 ± λ2 . In der Folgezeit haben viele Mathematiker vergeblich versucht, auch für Gleichungen vom Grad 5 Lösungsformeln zu finden, bis sich das Verständnis durchgesetzt hat, daß es solche Lösungsformeln vielleicht nicht gibt. Daß es Lösungsformeln für Polynomgleichungen vom Grad ≥ 5 nicht geben kann, wurde 1799 von RUFFINI (mit unvollständigem Argument) und schließlich 1824 von N IELS A BEL bewiesen. Allerdings bedeutet dies nicht, daß es nicht Gleichungen vom Grad 5 gibt, deren Nullstellen man durch Wurzelausdrücke angeben kann. So hat A LEXANDRE -T HÉOPHILE VANDER 2πk MONDE 1771 gezeigt, daß die Zahlen 2 cos 11 , k = 1, . . . , 5, die die Nullstellen des Polynoms x5 + x4 − 4x3 − 3x2 + 3x + 1 sind, durch iterierte Wurzelausdrücke angegeben werden können. Es entsteht so das Problem zu bestimmen, für welche Gleichungen man eine oder alle reellen oder komplexen Nullstellen durch iterierte Wurzelausdrücke schreiben kann. Diese Frage wurde von E VARISTE G ALOIS 1832 auf ein kombinatorisches Problem zurückgeführt, das in der weiteren Entwicklung zur Entstehung der modernen Gruppentheorie führte. Ich empfehle die Bücher von Tignol Galois’ theory of algebraic equations und van der Waerden A history of Algebra als vertiefende Lektüre zur Entstehungsgeschichte des Gruppenbegriffs. Algebra I im Wintersemester 2015 11 §2. Ringe 2.1. Grundbegriffe. Definition 2.1. — Ein Ring ist eine Menge A mit zwei Verknüpfungen + und · mit den folgenden Eigenschaften: (1) (A, +) ist eine kommutative Gruppe. Das Neutralelement der Addition wird mit 0 bezeichnet, das additive Inverse zu a mit −a. (2) Die Multiplikation · ist assoziativ. (3) Es gelten die Distributivgesetze (a + b)c = ac + bc und a(b + c) = ab + ac für alle a, b, c ∈ A. Ein Element 1 ∈ A heißt Einselement, wenn 1 · a = a = a · 1 für alle a ∈ A. Falls ein Einselement existiert, ist es eindeutig bestimmt. Der Nullring 0 ist die Menge {0} mit den trivialen Verknüpfungen 0 + 0 = 0 · 0 = 0. Im Nullring ist 0 zugleich Null- und Einselement. Aus den Ringaxiomen folgt, daß 0 · a = 0 = a · 0 für alle a ∈ A. In der Regel sollten keine Mißverständnisse daraus erwachsen, daß wir alle Nullelemente in allen Ringen mit 0 und alle Einselemente mit 1 bezeichnen. Wenn es darauf ankommt, schreiben wir 0A und 1A , um zu betonen, daß es sich um die Neutralelemente der Addition und der Multiplikation in A handelt. Definition 2.2. — Ein Ring A heißt kommutativ, wenn es ein Einselement gibt und die Multiplikation kommutativ ist. Definition 2.3. — Es sei A ein Ring mit Einselement 1 6= 0. Ein Element b ∈ A ein Rechtsinverses von a ∈ A und a ein Linksinverses von b, falls ab = 1. Ein Ring A ist ein Schiefkörper, wenn jedes von 0 verschiedene Element ein Rechtsinverses besitzt. In diesem Falle hat jedes Element a 6= 0 auch ein Linksinverses, und Links- und Rechtsinverse sind gleich und werden mit a−1 bezeichnet. Ein kommutativer Schiefkörper heißt Körper. Definition 2.4. — Eine Abbildung f : A → B von Ringen ist ein Ringhomomorphismus, wenn f (a + b) = f (a) + f (b) und f (ab) = f (a)f (b). Wenn A und B kommutative Ringe sind, wird zusätzlich vorausgesetzt, daß f (1A ) = 1B .e Weil jeder Ringhomomorphismus f : A → B auch ein Gruppenhomomorphismus der zugrundeliegenden additiven Gruppen ist, gilt stets f (0A ) = 0B und f (−a) = −f (a) für alle a ∈ A. Man definiert für alle a ∈ A und n ∈ Z induktiv 0Z · a = 0A , (n + 1) · a = n · a + a, falls n ≥ 0, und n · a = −((−n) · a), falls n < 0. Für jedes a ist dann die Abbildung Z → (A, +), n 7→ na, ein Gruppenhomomorphismus. Wenn es ein Einselement gibt, ist die Abbildung (2.1) Z → A, n 7→ nA := n · 1A , ein Ringhomomorphismus. Ähnlich definiert man für n ∈ N und a ∈ A rekursiv Potenzen a1 := a, an+1 := an · a und, falls A ein Einselement besitzt, a0 := 1. Es gelten dann die Rechenregeln an+m = an · am und (an )m = anm für alle n, m ∈ N bzw. N0 . Definition 2.5. — Es sei A ein kommutativer Ring. (1) Ein Element a ∈ A ist invertierbar oder eine Einheit, wenn es ein b ∈ A mit ab = 1 gibt. Die Einheiten in A bilden eine Gruppe mit der Ringmultiplikation als Verknüpfung, die mit A× bezeichnete Einheitengruppe von A. (2) a ∈ A ist ein Nullteiler, wenn es ein b ∈ A \ {0} mit ab = 0 gibt. A ist nullteilerfrei oder ein Integritätsbereich, wenn A 6= 0 und wenn 0 der einzige Nullteiler in A ist. In einem 12 Ringe Integritätsbereich gilt für a, b, c ∈ A mit c 6= 0 die Kürzungsregel: a = b. (3) a ∈ A ist nilpotent, falls an = 0 für ein n ∈ N. (4) e ∈ A ist idempotent, falls e2 = e. ac = bc ⇒ 2.2. Ideale und Faktorringe. Definition 2.6. — Es sei A ein kommutativer Ring. (1) Eine nichtleere Teilmenge I ⊂ A ist ein Ideal, wenn für alle x, x′ ∈ I und alle a ∈ A gilt: x + x′ ∈ I und ax ∈ I. (2) Für jedes a ∈ A ist die Menge (a) = {ra | r ∈ A} ein Ideal, das von a erzeugte Hauptideal. In jedem Ring gibt es daes Nullideal (0) = {0} und das Einsideal (1) = A. Schließlich ist A ein Hauptidealring, wenn jedes Ideal in A ein Hauptideal ist. (3) Für S ⊂ A ist (S) := {a1 s1 + . . . + an sn | n ∈ N0 , ai ∈ A, si ∈ S} das von S erzeugte Ideal. (S) ist auch der Durchschnitt aller Ideale in A, die S enthalten. Ist S = {s1 , . . . , sn }, schreibt man (s1 , . . . , sn ) := (S). Ein Ideal I ist endlich erzeugt, wenn es s1 , . . . , sn ∈ A mit I = (s1 , . . . , sn ) gibt. Der Ring A heißt noethersch2, wenn jedes Ideal endlich erzeugt ist. Für jeden Ringhomomorphismus ϕ : A → A′ von kommutativen Ringen ist der Kern (2.2) ker(ϕ) = ϕ−1 (0) ein Ideal in A. Das Bild eines Ringhomomorphismus ist ein Unterring in A′ , aber im Allgemeinen T kein Ideal. Ist {Is }s∈S eine Familie von Ideal in A, so sind auch der Durchschnitt s∈S Is und P die Summe s∈S Is := ∪s∈S Is Ideale in A. Und sind I1 und I2 Ideale in A, so ist auch I1 I2 := {x1 x2 | xi ∈ Ii } ein Ideal in A. Definition 2.7. — Es sei nun A ein kommutativer Ring mit einem Ideal I. Nach einer von Gauß3 eingeführten Bezeichnungsweise sagt man, zwei Elemente a, b ∈ A seien kongruent modulo I, in Zeichen (2.3) a ≡ b mod I, wenn a + I = b + I, oder äquivalent, wenn a − b ∈ I. Für jedes a ∈ A bezeichne a := a + I die Restklasse von a modulo I, und A/I die Menge aller Restklassen. Die Abbildung π : A → A/I, die jedes a ∈ A auf seine Restklasse a = a + I schickt, heißt kanonische Projektion. Lemma 2.8 — Es gibt genau eine Ringstruktur auf A/I, bezüglich der π ein Ringhomomorphismus wird, nämlich (2.4) a + b := a + b, a · b := ab. Beweis. Es ist klar, daß die Verknüpfungen nur so definiert werden können, weil π surjektiv ist. Man zeigt dann, daß die so definierten Verknüpfungen wohldefiniert sind. Für die Wohldefiniertheit der Addition wird nur benutzt, daß I eine additive Untergruppe ist. Für die Wohldefiniertheit der Multiplikation wird die Idealeigenschaft gebraucht: Es seien a, a′ und b, b′ Elemente aus A mit a + I = a′ + I und b + I = b′ + I, also a′ = a + x und b′ = b + y mit x, y ∈ I. Dann hat man (2.5) a′ b′ = (a + x)(b + y) = ab + (ay + xb + xy) ∈ ab + I. 2Emmy Noether, b23. März 1882 in Erlangen, d14. April 1935. Begründerin der modernen Algebra. 3Carl Friedrich Gauß, b30. April 1777 in Braunschweig, d23. Februar 1855 in Göttingen. Algebra I im Wintersemester 2015 13 Daß die Ringaxiome in A/I erfüllt sind, folgt dann automatisch, weil π surjektiv ist und die Verknüpfungen erhält und weil A ein Ring ist. Definition 2.9. — Es sei A ein kommutativer Ring und I ⊂ A ein Ideal. Der Ring A/I heißt Restklassenring von A bezüglich I. Satz 2.10 (Universelle Eigenschaft des Restklassenrings) — Es sei A ein kommutativer Ring, I ⊂ A ein Ideal und π : A → A/I die kanonische Projektion. Zu einem Ringhomomorphismus ϕ : A → B gibt es genau dann einen Ringhomomorphismus ϕ : A/I → B mit ϕ = ϕ ◦ π, wenn I ⊂ ker(ϕ). In diesem Falle ist ϕ eindeutig bestimmt. Man sagt, ϕ faktorisiere über π und ϕ. Beweis. Falls ein solches ϕ existiert, so ist es offensichtlich eindeutig bestimmt, weil π surjektiv ist. Außerdem gilt in diesem Falle für jedes x ∈ I, daß ϕ(x) = ϕ(π(x)) = ϕ(0) = 0, also I ⊂ ker(ϕ). Es gelte nun umgekehrt I ⊂ ker(ϕ). Wir definieren ϕ(π(a)) := ϕ(a). Es genügt zu zeigen, daß ϕ wohldefiniert ist. Für a, b ∈ A mit π(a) = π(b) folgt a − b ∈ I ⊂ ker(ϕ), also ϕ(a) − ϕ(b) = ϕ(a − b) = 0. Definition 2.11. — Es sei A ein kommutativer Ring. (1) Ein Ideal p ⊂ A ist ein Primideal, ewenn p 6= A, und wenn für beliebige Ringelemente a, b ∈ A aus ab ∈ p folgt: a ∈ p oder b ∈ p. (2) Die Menge Spec(A) := {p | p ist ein Primideal} heißt das Primspektrum oder kurz das Spektrum von A. (3) Ein Ideal m ⊂ A ist ein maximales Ideal, wenn m 6= A, und wenn für jedes Ideal I mit m ⊂ I gilt m = I oder I = A. Lemma 2.12 — Es sei A ein kommutativer Ring und p ⊂ A ein Ideal. (1) p ist ein Primideal ⇔ A/p ist ein Integritätsbereich. (2) p ist ein maximales Ideal ⇔ A/p ist ein Körper. Beweis. Zu 1: p ist genau dann ein Primideal, wenn aus ab ∈ p und a ∈ / p folgt b ∈ p. Das ist äquivalent zu der Aussage: Wenn ab = 0 ∈ A/p und a 6= 0 ∈ A/p, so ist a = 0. Aber das ist genau die Definition der Nullteilerfreiheit von A/p. Zu 2: p ist genau dann ein maximales Ideal, wenn für alle x ∈ A\p gilt p+(x) = A oder äquivalent: 1 − xy ∈ p für ein y ∈ A. Das ist äquivalent zu der Aussage: Für alle x ∈ (A/p) \ {0} existiert ein y ∈ A mit xy = 1 ∈ A/p. Und das bedeutet genau, daß A/p ein Körper ist. Satz 2.13 — Es sei A ein kommutativer Ring und I ( A ein echtes Ideal. Dann gibt es ein maximales Ideal m ⊂ A mit I ⊂ m. Beweis. Beweis durch transfinite Induktion: Es sei X die Menge aller echten Ideale J ( A mit I ⊂ J. Da X das Ideal I enthält, ist X nicht leer. Die Inklusionsordnung ist eine Halbordnung S auf X. Jede nichtleere Kette K ⊂ X besitzt die obere Schranke: Es sei nämlich JK := J∈K J. Offensichtlich enthält JK das Ideal I. Das Ideal JK ist nicht der ganze Ring, denn andernfalls läge 1 in JK , und definitionsgemäß müßte es ein J ∈ K mit 1 ∈ J geben. Deshalb liegt JK in der Menge X, und nach der Definitions von JK ist klar, daß JK eine obere Schrankte von K ist. Damit ist gezeigt, daß X induktiv geordnet ist. Nach dem Zornschen Lemma gibt es ein maximales Element m ∈ X. Für jedes a ∈ A folgt nun: m + (a) = A oder m + (a) ∈ X. Wegen der Maximalität von m muß im zweiten Fall m = m + (a) gelten. Es gibt also keine Ideale, die echt zwischen m und A liegen. 14 Ringe Eine unmittelbare Folgerung daraus ist, daß jeder Ring A 6= 0 wenigstens ein maximales Ideal und damit wenigstens ein Primideal besitzt, d.h. Spec(A) = ∅ genau dann, wenn A = 0. 2.3. Lokalisierung und Quotientenringe. Weil in den ganzen Zahlen die multiplikativen Inversen fehlen, führt man in der elementaren Arithmetik die rationalen Zahlen ein. Allgemeiner konstruiert man zu einem Integritätsbereich A seinen Quotientenkörper Q(A), in dem alle Elemente aus A \ {0} invertierbar sind. Lokalisierung ist ein Verfahren, zu einem gegebenen kommutativen Ring A einen neuen Ring zu konstruieren, in dem eine vorgegebene Menge von Elementen invertierbar wird. Definition 2.14. — Es sei A ein kommutativer Ring. Eine Teilmenge S ⊂ A ist multiplikativ abgeschlossen, wenn 1 ∈ S und wenn f1 f2 ∈ S für alle f1 , f2 ∈ S. Beispiele 2.15. — Es sei A ein kommutativer Ring. (1) Für jedes f ∈ A ist {1, f, f 2 , . . .} multiplikativ abgeschlossen. (2) Für ein Ideal I ⊂ A ist A \ I genau dann multiplikativ abgeschlossen, wenn I ein Primideal ist. (3) Ist A ein Integritätsbereich, so ist A \ {0} multiplikativ abgeschlossen. Es sei nun A ein kommutativer Ring und S ⊂ A ein multiplikativ abgeschlossene Teilmenge. Wir betrachten auf der Menge A × S die folgende Relation: (2.6) (a, s) ∼ (a′ , s′ ) :⇔ es gibt ein t ∈ S mit tas′ = ta′ s. Lemma 2.16 — Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Reflexivität und Symmetrie sind offensichtlich. Zum Beweis der Transitivität seien Paare (a, s) ∼ (a′ , s′ ) ∼ (a′′ , s′′ ) vorgegeben. Definitionsgemäß gibt es dann u, t ∈ S mit as′ t = a′ st und a′ s′′ u = a′′ s′ u. Nun folgt: (2.7) as′′ (s′ tu) = (as′ t)(s′′ u) = (a′ st)(s′′ u) = (a′ s′′ u)(st) = (a′′ s′ u)(st) = (a′′ s)(s′ tu). Weil S multiplikativ ist, ist s′ tu ∈ S. Definitionsgemäß folgt (a, s) ∼ (a′′ , s′′ ). Wenn A ein Integritätsbereich ist und 0 6∈ S, kann wegen der Gültigkeit der Kürzungsregel in der Definition der Relation stets t = 1 gewählt werden. Würde man für einen beliebigen kommutativen Ring diese Definition wählen, also (2.8) (a, s) ≈ (a′ , s′ ) :⇔ as′ = a′ s setzen, so stößt man bei dem Versuch, die Transitivität zu beweisen, auf das folgende Problem: (2.9) (as′′ )s′ = (as′ )s′′ = (a′ s)s′′ = (a′ s′′ )s = (a′′ s′ )s = (a′′ s)s′ . Im Ring der ganzen Zahlen und allgemeiner in einem Integritätsbereich kann mit der Kürzungsregel jetzt auf as′′ = a′′ s schließen, in einem allgemeinen kommutativen Ring nicht. Das ist der Grund für den merkwürdigen zusätzlichen Faktor in der Definition von ∼. Wir bezeichnen mit S −1 A := A × S/ ∼ den Quotienten nach der Relation ∼ und mit as die Klasse von (a, s). Satz 2.17 — Auf S −1 A wird durch a a a′ a′ as′ + a′ s aa′ (2.10) und + ′ := · := s s ss′ s s′ ss′ −1 eine Ringstruktur definiert. Die Abbildung i : A → S A, a 7→ a/1, ist ein Ringhomomorphismus. S −1 A ist genau dann der Nullring, wenn 0 ∈ S. Der Homomorphismus i ist genau dann injektiv, wenn S keine Nullteiler enthält. Algebra I im Wintersemester 2015 15 Beweis. Übung −1 −1 Der Ring S A oder genauer: die Abbildung i : A → S A heißt Lokalisierung von A nach der Menge S. Im Ring S −1 A ist das Bild i(s) = s/1 von s ∈ S invertierbar: i(s)−1 = 1/s. Der Ring S −1 A ist durch diese Eigenschaft charakterisiert: Satz 2.18 (Universelle Eigenschaft der Lokalisierung) — Es sei A ein kommutativer Ring, S ⊂ A eine multiplikativ abgeschlossene Menge und i : A → S −1 A die zugehörige Lokalisierung. Ist ϕ : A → B ein Ringhomomorphismus in einen kommutativen Ring B mit ϕ(S) ⊂ B × , dann gibt es einen eindeutig bestimmten Ringhomomorphismus ψ : S −1 A → B mit ϕ = ψ ◦ i. Beweis. Falls ψ existiert, muß wegen ϕ(a) = ψ(a/1) = ψ(a/s)ψ(s/1) = ψ(a/s)ϕ(s) gelten: ψ(a/s) = ϕ(a)ϕ(s)−1 . Daher ist ψ jedenfalls eindeutig. Definiert man umgekehrt ψ auf diese Weise, dann ist ψ wohldefiniert und ein Homomorphismus. In den folgenden Fällen werden spezielle Bezeichnungen verwendet: A sei ein kommutativer Ring. (1) Für f ∈ A schreibt man Af := {f n | n ∈ N0 }−1 A. (2) Für ein Primideal p ⊂ A setzt man Ap := (A \ p)−1 A. (3) Die Menge N N T (A) der Nichtnullteiler von A ist multiplikativ abgeschlossen. Die zugehörige Lokalisierung Q(A) := NNT(A)−1 A heißt der totale Quotientenring von A. Wenn A ein Integritätsbereich ist, ist Q(A) ein Körper, der sogenannte Quotientenkörper von A. Beispiele 2.19. — 1. Der Quotientenkörper von Z ist der Körper der rationalen Zahlen Q(Z) = Q. 2. Q(Z[i]) = Q(i) := {a + bi | a, b ∈ Q} ⊂ C. 3. Es sei K ein Körper. Der Polynomring K[X] ist ein Integritätsbereich. Der Körpere (2.11) K(X) := Q(K[X]) heißt Körper der rationalen Funktionen (mit Koeffizienten in K). Im Falle K = R kann man die formalen Brüche p(X)/q(X) als Funktionen f : R \ D → R, die außerhalb der Nullstellenmenge D des Nenners definiert sind, auffassen. 4. Es sei p ∈ N eine Primzahl und (p) ⊂ Z das zugehörige Primideal. Man unterscheide die Lokalisierungen: o na ∈ Q der einzige Primfaktor von s ist p. (2.12) Zp := s und (2.13) Z(p) := na s o ∈ Q kein Primfaktor von s ist p. e Insbesondere ist Zp ∩ Z(p) = Z. Der Umgang mit diesen Bezeichnungen wird dadurch erschwert, daß in vielen mathematischen Texten Zp für den Restklassenring Z/p verwendet wird, und in wieder anderen Texten Zp den Ring der ganzen p-adischen Zahlen bezeichnet. Da hilft nur: Auf den Kontext achten! 2.4. Aufgaben. Aufgabe 2.20. — Es seien A1 , . . . , An Ringe. Das kartesische Produkt A = A1 × . . . × An mit den komponentenweise definierten Verknüpfungen (2.14) (a + b)i = ai + bi , (ab)i = ai bi für alle i = 1, . . . , n ist ein Ring. A besitzt genau dann eine Eins bzw. ist kommutativ, wenn dies für alle Faktoren A1 ,. . . ,An gilt. 16 Ringe Aufgabe 2.21. — Es sei A ein kommutativer Ring mit 1 und einem idempotenten Element e1 . Man zeige: (1) e2 := 1 − e1 ist ebenfalls idempotent, und e1 e2 = 0. (2) Die Teilmenge Ai := ei A = {ei a | a ∈ A}, i = 1, 2, ist ein Unterring mit Einselementei . (3) Die Abbildung A → A1 × A2 , a 7→ (e1 a, e2 a) ist ein Ringisomorphismus. Aufgabe 2.22. — Es sei A ein Ring mit nilpotenten Elementen f und g. Wenn f und g vertauschen, d.h. wenn f g = gf , so ist auch f + g nilpotent. Algebra I im Wintersemester 2015 17 §3. Polynomringe 3.1. Polynomringe in einer Variablen. Es sei A ein kommutativer Ring. Wir betrachten auf der Menge (3.1) A(N0 ) = {(a0 , a1 , . . .) | ai ∈ A, und ai = 0 für alle hinreichend großen i.} aller endlichen Folgen in A die folgenden Verknüpfungen: (3.2) und (a + b)n := an + bn (ab)n := n X ak bn−k . k=0 Man sieht leicht, daß a + b und ab tatsächlich endliche Folgen sind, so daß + und · wirklich Verknüpfungen auf A(N0 ) sind, und ebenso, daß (A(N0 ) , +, ·) ist ein kommutativer Ring mit Nullelement 0 := (0, 0, . . .) und Einselement 1 := (1, 0, 0, . . .) ist. Genauer ist die Abbildung (3.3) i : A 7→ A(N0 ) , a 7→ (a, 0, 0, . . .) ein injektiver Ringhomomorphismus. Wir identifizieren deshalb jedes a ∈ A mit seinem Bild in A und fassen A als Unterring von A(N0 ) auf. Es bezeichne nun (3.4) X := (0, 1, 0, 0, . . .). Dann ist die Potenz X m die Folge, die eine einzige 1 an der m-ten Stelle und sonst nur Nulleinträge hat, wenn man die Folgenglieder beginnend mit dem Index 0 zählt. Tatsächlich gilt für beliebige Elemente aus A(N0 ) : (3.5) (a0 , a1 , a2 , . . .) = a0 + a1 X + a2 X 2 + . . . , wobei die Summe auf der rechten Seite endlich ist, weil nur endlich viele Folgenterme 6= 0 sind. Üblicherweise schreibt man (3.6) A[X] := (A(N0 ) , +, ·) für diesen Ring. Der Name X für die angegebene Folge ist natürlich beliebig austauschbar. Elemente in A[X] heißen Polynome in der Unbestimmten X mit Koeffizienten in A. Dieser Polynomring hat die folgenden wichtigen Strukturmerkmale: Einen Ringhomomorphismus i : A → A[X] und ein ausgezeichnetes Element X ∈ A[X]. Er ist durch die folgende universelle Eigenschaft charakterisiert: Satz 3.1 (Universelle Eigenschaft des Polynomrings) — Es sei B ein Ring mit Eins und ψ : A → B ein Ringhomomorphismus mit ψ(1A ) = 1B . Zu jedem α ∈ B, das mit allen Elementen aus dem Bild ψ(A) kommutiert, gibt es genau einen Ringhomomorphismus Ψ : A[X] → B mit Ψ(a) = ψ(a) für alle a ∈ A und Ψ(X) = α. Beweis. Da jedes Polynom eine Linearkombination aus Potenzen von X mit Koeffizienten aus A ist, ist ein Ringhomomorphismus auf A[X] vollständig bestimmt, wenn man seine Werte auf A und auf X kennt. Damit ist Ψ in jedem Falle eindeutig bestimmt und muß wie folgt aussehen: (3.7) Ψ((a0 , a1 , a2 , . . .)) := ∞ X ψ(ak )αk . n=0 Es bleibt zu verifizieren, daß die so definierte Abbildung ein Homomorphismus ist. Dabei ist klar, daß Ψ additiv ist, und die Null- und Einselemente jeweils ineinander überführt werden. Es bleibt zu zeigen, daß Ψ auch multiplikativ ist. An dieser Stelle geht ein, daß α mit ψ(A) vertauscht: Es seien 18 Polynomringe a = (a0 , a1 , . . .), b = (b0 , b1 , . . .) gegeben und c = ab mit cn = alle Summen endlich sind und beliebig vertausch werden dürfen: Ψ(a)Ψ(b) = ∞ X ψ(ak )αk k=0 ak bn−k . Dann gilt, weil ψ(bℓ )αℓ ℓ=0 k=0 X = ∞ X Pn ψ(ak )αk ψ(bℓ )αℓ k,ℓ≥0 X = ψ(ak )ψ(bℓ )αk αℓ k,ℓ≥0 = (weil ψ ein Ringhomomorphismus ist) X ψ(ak bℓ )αk+ℓ k,ℓ≥0 = X n≥0 = X n X k=0 ψ(ak bn−k ! αn ψ(cn )αn = Ψ(c). n≥0 Definition 3.2. — Der Grad eines nichtverschwindenden Polynoms f = (3.8) deg(f ) := max{k | fk 6= 0}, Pn k=0 fk X k ist und deg(0) := 0. Ist f ∈ A[X] ein nichttriviales Polynom vom Grad d, dann heißt Lt(f ) := fd X d der Leitterm von f , Lc(f ) := fd der Leitkoeffizient und Lm(f ) := X d das Leitmonom. Für alle f, g gilt: deg(f + g) ≤ max{deg(f ), deg(g)} und deg(f g) ≤ deg(f ) deg(g). Satz 3.3 (Polynomdivision) — Es sei q = qn X n + . . . + q0 ein Polynom vom Grad n, dessen Leitkoeffizient qn eine Einheit in A ist. Dann gibt es zu jedem Polynom f ∈ A[X] eindeutig bestimmte Polynome p, r ∈ A[X] mit (3.9) f = pq + r und deg(r) < deg(q) oder r = 0. Beweis. Beweis durch vollständige Induktion nach deg(f ). Wenn deg(f ) < deg(q), ist nichts zu zeigen: Man setzt p = 0 und r = f und ist fertig. Es sei also m := deg(f ) ≥ n := deg(q) ≥ 0 X m−n q und die Behauptung für alle Polynome kleineren Grades schon gezeigt. Das Polynom fqm n hat denselben Leitterm wie f . Deshalb hat die Differenz (3.10) g=f− fm m−n X q qn einen kleineren Grad als f und besitzt nach Induktionsannahme eine Darstellung g = bq + r mit deg(r) < deg(q). Dann hat man (3.11) f =g+ fm m−n fm m−n X q = (b + X )q + r. qn qn Mit p = b + fqm X m−n folgt die Existenz der Darstellung durch Induktion. Zur Eindeutigkeit: Sind n ′ f = pq + r = p q + r′ zwei Zerlegungen, so gilt (p − p′ )q = r′ − r. Die rechte Seite ist entweder 0 oder hat Grad < deg(q), während die rechte Seite entweder 0 ist oder einen Grad ≥ deg(q) hat, weil der Leitkoeffizient von q eine Einheit ist und deshalb deg((p − p′ )q) = deg(p − p′ ) + deg(q) gilt. Aus dem Vergleich folgt: r = r′ und pq = p′ q, und weil der Leitkoeffizient von q invertierbar ist, muß auch p = p′ gelten. Algebra I im Wintersemester 2015 19 3.2. Polynomringe in mehreren Variablen. Auf analoge Weise können wir Polynomringe mit beliebig vielen Unbestimmten einführen: Dazu bezeichne S eine beliebige Indexmenge, im endlichen Falle etwa die Menge {1, . . . , ℓ}. Weiter sei (S) M := N0 die Menge aller Folgen (ns )s∈S mit ns ∈ N0 und ns 6= 0 für höchstens endlich viele s ∈ S. Durch die Verknüpfung (n + n′ )s := ns + n′s (3.12) wird M zu einem abelschen Monoid mit dem Nullelement 0 = (0)s∈S . Bezeichnet es ∈ M für P s ∈ S die Folge (es )s′ = δs,s′ , so kann man jedes Element n ∈ M in der Form n = s∈S ns es schreiben. In der formal unendlichen Summe sind nur endlich viele Summanden ungleich Null. Wir definieren auf (3.13) B := {f : M → A | fm = 0 für fast alle m ∈ M } wie folgt zwei Verknüpfungen: (3.14) (f · g)m = (f + g)m := fm + gm , X m′ +m′′ =m fm′ · gm′′ . Summe und Produkt sind wohldefiniert, weil man aus den endlich vielen Termen {m′ | fm′ 6= 0} und den endlich vielen Termen {m′′ | gm′′ 6= 0} auch nur endlich viele Summen kombinieren kann. Man rechnet sofort nach, daß (B, +, ·) ein kommutativer Ring ist. Speziell können wir für jedes s ∈ S die Abbildung Xs : M → A mit der Eigenschaft (Xs )m = δes ,m betrachten, und Q für jedes m ∈ M das Monom X m := s∈S Xsms . Mit diesen Bezeichnungen gilt nun X 0 = 1, ′ ′ X m · X m = X m+m für alle m, m′ ∈ M und X fm X m für jedes f ∈ B. (3.15) f= m∈M Außerdem ist die Abbildung A → B, a 7→ aX 0 , ein injektiver Ringhomomorphismus. Wir identifizieren A mit dem Bild in B und bezeichnen mit A[{Xs }s∈S ] := B den Polynomring in den Unbestimmten {Xs }s∈S . Satz 3.4 (Universelle Eigenschaft des Polynomrings) — Es sei ϕ : A → R ein Ringhomomorphismus in einen kommutativern Ring R und r = (rs )s∈S eine Folge von Elementen in R. Dann gibt es genau einen Ringhomomorphismus (3.16) Φ : A[{Xs }s∈S ] −→ R mit Φ|A = ϕ und Φ(Xs ) = rs . P n Beweis. Falls Φ existiert, muß Φ jedenfalls auf einem Polynom f = n fn X folgendermaßen aussehen: Y n X Y X rs s . ϕ(fn ) Φ(Xs )ns = ϕ(fn ) (3.17) Φ(f ) = n s n s Definiert man umgekehrt eine Abbildung Φ auf diese Weise, so hat Φ alle gewünschten Eigenschaften. Der Ringhomomorphismus Φ heißt Auswertungsabbildung in b. Wir schreiben kurz f (r) := Φ(f ). Die Aussage bleibt auch für nichtkommutative Ringe R mit Eins richtig, solange die Elemente rs , s ∈ S, untereinander und mit ϕ(A) vertauschen. Meist hat man mit Polynomringen in endlich vielen Variablen zu tun, etwa (3.18) A[X1 , . . . , Xℓ ]. 20 Polynomringe Wir verwenden dann die folgenden Multiindexbezeichnungen und schreiben (3.19) n X n := X1n1 · . . . · Xℓ ℓ . für einen Multigrad n = (n1 , . . . , nℓ ) ∈ Nℓ0 . Die Summe |n| = n1 + . . . + ns ist der Gesamtgrad oder Totalgrad des Monoms X n . Jedes f ∈ A[X1 , . . . , Xℓ ] schreibt sich nun in der Form X fn X n , (3.20) f= n∈Nℓ0 wobei für fast alle n ∈ Nℓ0 der Koeffizient fn verschwindet. 3.3. (*) Potenzreihenringe. Es sei A ein kommutativer Ring. Auf der Menge (3.21) B := {f : N0 → A} Pn wird durch (f + g)n := fn + gn und (f g)n := d=0 fd gn−d die Struktur eines kommutativen Rings mit Eins definiert. Der Unterschied zur Konstruktion des Polynomrings besteht darin, daß von den Abbildungen f nicht verlangt wird, daß fast alle Werte 0 sind. Wir notieren Elemente in B durch (3.22) f= ∞ X fn X n . n=0 Die Summe hat also zunächst lediglich den Charakter einer Notation. Wir werden erst später im Zusammenhang mit der Vervollständigung von Ringen sehen, daß die Summe tatsächlich wie in der Analysis als Grenzwert einer Summation von unendlich vielen Folgentermen aufgefaßt werden kann. Elemente in B heißen (formale) Potenzreihen mit Koeffizienten in A, und man nennt den Ring A[[X]] := B den Potenzreihenring. P∞ n ∈ A[[X]] ist genau dann invertierbar, wenn der Satz 3.5 — Eine Potenzreihe f = n=0 fn X konstante Term f0 eine Einheit in A ist. P m Beweis. Wir machen einen Ansatz g = ∞ für die Identität m=0 gm X (3.23) 1 = f g = (f0 g0 ) + (f1 g0 + f0 g1 )X + (f2 g0 + f1 g1 + f0 g2 )X 2 + . . . . Wenn f invertierbar ist, d.h. wenn ein solches g existiert, zeigt der Koeffizientenvergleich, daß f0 g0 = 1, d.h. f0 ist eine Einheit in A. Es sei umgekehrt f0 in A invertierbar und g0 := f0−1 . Für alle m > 0 soll die Identität (3.24) 0 = f0 gm + f1 gm−1 + . . . + fm g0 bestehen. Wir können induktiv annehmen, daß Elemente g0 , . . . , gn−1 bereits so bestimmt sind, daß diese diese Identität für alle m < n tatsächlich gilt. Aber weil f0 invertierbar ist, kann man die Gleichung für m = n nach gn auflösen: (3.25) gn := −g0 (f1 gn−1 + . . . + fn g0 ). Mit dieser Wahl ist die Identität auch für m = n richtig. Induktiv kann man so g = f −1 konstruieren. In diesem Sinne gilt die aus der elementaren Analysis bekannte Identität (3.26) 1 = 1 + X + X2 + . . . 1−X für die geometrische Reihe auch im Ring A[[X]]. Algebra I im Wintersemester 2015 21 3.4. Aufgaben. Aufgabe 3.6. — Es sei n eine natürliche Zahl und A ein kommutativer Ring, in dem n invertierbar ist. Dann gibt es zu jeder Potenzreihe F ∈ A[[X]] mit F ≡ 1 mod (X) eine eindeutig bestimmte √ Reihe G mit G ≡ 1 mod (X) und Gn = F . Man schreibt n F := G. 22 Polynomringe §4. Symmetrische Polynome Es sei A ein kommutativer Ring. Ein Polynom f ∈ A[x1 , . . . , xn ] in n Unbestimmten x1 , . . . , xn heißt symmetrisch, wenn es invariant unter allen Vertauschungen der Variablen ist. Das bedeutet, daß (4.1) f (x1 , . . . , xn ) = f (xπ(1) , . . . , xπ(n) ) für alle Permutationen π ∈ Sn . Es ist klar, daß Summen und Produkte von symmetrischen Polynomen wieder symmetrisch sind. Die symmetrischen Polynome bilden deshalb einen Unterring A[x1 , . . . , xn ]Sn im Ring aller Polynome. 4.1. Symmetrische Polynome in zwei Variablen. Wir betrachten zunächst den Fall von zwei Variablen x1 und x2 . Die Polynome s1 = x1 + x2 n und s2 = x1 x2 sind symmetrisch. Auch die Polynome xn 1 + x2 sind für jedes n ∈ N symmetrisch. Man sieht sofort: x21 + x22 = (x1 + x2 )2 − 2x1 x2 = s21 − 2s2 (4.2) und (4.3) x31 + x32 = (x1 + x2 )3 − 3x21 x2 − 3x1 x22 = (x1 + x2 )3 − 3(x1 + x2 )(x1 x2 ) = s31 − 3s1 s2 . Tatsächlich gilt allgemein: Satz 4.1 — Zu jedem symmetrischen Polynom f (x, y) mit Koeffizienten in einem kommutativen Ring A gibt es ein Polynom g ∈ A[z1 , z2 ] mit der Eigenschaft, daß f (x, y) = g(x + y, xy). Beweis. Ein Polynom (4.4) f (x, y) = f0 xn + f1 xn−1 y + . . . + fn y n ist genau dann symmetrisch, wenn f0 = fn , f1 = fn−1 usw. Man kann deshalb das Polynom folgendermaßen zusammenfassen: (4.5) f (x, y) = f0 (xn + y n ) + f1 (xy)(xn−2 + y n−2 ) + . . . wobei der letzte Term fm (xy)m bzw. fm (xy)m (x + y) ist je nachdem, ob n = 2m gerade oder n = 2m + 1 ungerade ist. Die Aufgabe f (x, y) als Polynom in x + y und xy zu schreiben, wird also darauf zurückgeführt, dies für die Polynome xn + y n zu tun. Nun gilt: (4.6) xn + y n = (x + y)(xn−1 + y n−1 ) − xy(xn−2 + y n−2 ). Induktiv hat man das Problem damit auf die trivialen Fälle x1 + y 1 und x0 + y 0 zurückgeführt. Palindromische Gleichungen — Man nennt ein Polynom (4.7) a(x) = an xn + an−1 xn−1 + . . . + a1 x + a0 ∈ C[x] palindromisch, wenn ai = an−i für alle i = 0, . . . , n, d.h. wenn die Koeffizienten symmetrisch zur Mitte des Polynoms sind. Satz 4.2 — Gleichungen der Form a(x) = 0 mit einem palindromischen Polynom lassen sich immer auf Gleichungen kleineren Grades und ein quadratisches Polynom zurückführen. Dazu macht sich zunächst klar: Lemma 4.3 — Ist a ein palindromisches Polynom von ungeradem Grad, so ist a(x) durch x + 1 teilbar, und der Quotient ist wieder palindromisch. Algebra I im Wintersemester 2015 23 Beweis. Übung. Deshalb kann man sich auf den Fall von Polynomen geraden Grades beschränken. Es sei also n = 2m gerade und an 6= 0. Weil dann auch a0 6= 0, ist 0 jedenfalls keine Lösung der Gleichung a(x) = 0. Wir dividieren die Gleichung formal durch xm und erhalten: (4.8) an xm + an−1 xm−1 + am−1 x + . . . + am + am+1 x−1 . . . + a0 x−m = 0. Mit einer neuen Variablen y = x−1 können wir diese Gleichung wie folgt umschreiben: (4.9) an xm + an−1 xn−2 + . . . + am−1 x + am + am+1 y + . . . + a0 y m = 0. Weil a palindromisch ist, ist die linke Seite ein in x und y symmetrisches Polynom vom Grad m = n2 und kann Satz 4.1 als ein Polynom a(x)x−m = g(x + y, xy) in u := x + y = x + x1 und xy = 1 ausgedrückt werden. Das Lösen der Ausgangsgleichung a(x) = 0 wird also darauf zurückgeführt, zunächst die Gleichung (4.10) g(u, 1) = 0 von halbem Grad in der Variablen u und anschließend eine quadratische Gleichung (4.11) x2 − ux + 1 = 0 für x zu lösen. Wir betrachten dazu das folgende Beispiel: Regelmäßige Fünfecke und fünfte Einheitswurzeln — Wie kann man mit Zirkel und Lineal ein reguläres Fünfeck konstruieren? Man kann sowohl geometrisch wie algebraisch zu einer Konstruktionsmethode kommen. Ich skizziere zunächst einen geometrischen Weg, bevor wir zur algebraischen Methode kommen: Dazu betrachten wir ein reguläres Fünfeck und bezeichnen die Länge der Diagonale mit d, die einer Seite mit s. Ein Blick auf die Zeichnung zeigt einem ähnliche gleichschenklige Dreiecke mit den Seitenlängen (d, d, s) und (s, s, d − s). Das Seitenverhältnis d s 1 (4.12) x := = = s d−s x−1 genügt also der quadratischen Gleichung (4.13) x2 − x − 1 = 0, und weil x > 1 ist, hat man √ 1 (1 + 5). 2 Gibt man sich also eine Strecke s vor, so genügt es, eine Strecke der Länge d = xs zu konstruieren, was mit Zirkel und Lineal leicht ist, und dann über der Strecke s das entsprechende spitzwinklige Dreieck zu errichten. Es ist dann leicht, das Dreieck zu einem Fünfeck zu vervollständigen. √ Das Verhältnis − − −d : s = 21 (1 + 5) heißt der Goldene Schnitt. Der numerische Wert ist ungefähr 1, 618. (4.14) x= 24 Symmetrische Polynome Algebraisch kann man so vorgehen: Die fünften Einheitswurzeln e2πik/5 , k = 0, . . . , 4 lassen sich alle als Potenzen einer Wurzel ζ = e2πi/5 schreiben. Als Punkte der komplexen Ebene gelesen, bilden sie die Ecken eines regulären Fünfecks, das dem Einheitskreis einbeschrieben ist. ζ ζ2 1 ζ3 ζ4 Definitionsgemäß genügt ζ der Gleichung ζ 5 − 1 = 0. Weil ζ 6= 1, können wir durch ζ − 1 teilen. Man erhält ζ 4 + ζ 3 + ζ 2 + ζ + 1 = 0. (4.15) Die linke Seite ist das sogenannte fünfte Kreisteilungspolynom Φ5 (ζ). Wir werden später allgemeiner Φn für beliebige n ∈ N definieren. Allerdings gilt nur für Primzahlen p die einfache Beziehung Φp (X) = (X p − 1)/(X − 1). Die Gleichung Φ5 (ζ) = 0 ist palindromisch und hat geraden Grad. Mit der oben eingeführten Substitution u = ζ + ζ1 wird man auf die quadratischen Gleichungen (4.16) Φ5 (ζ) 1 1 = ζ 2 + ζ + 1 + + 2 = u2 + u − 1 = 0 ζ2 ζ ζ und ζ 2 − uζ + 1 = 0 geführt. Also gilt (4.17) u=ζ+ 1 = 2 cos ζ 2π 5 = √ 1 (−1 + 5). 4 Um den Punkt ζ wirklich zu konstruieren, genügt es, u/2 zu kennen, weil man dann ζ und ζ −1 als Schnittpunkte der Senkrechten zur x-Achse durch u/2 mit dem Einheitskreis gewinnt. 4.2. Symmetrische Polynome in beliebig vielen Variablen. Die Vorüberlegungen zum Falle von zwei Variablen lassen sich wie folgt auf den Fall von n Variablen x1 , . . . , xn verallgemeinern: Die Potenzsummen pk := xk1 + . . . + xkn , k > 0, sind symmetrische Polynome. Mit einer Hilfvariablen t kann man das folgende Produkt bilden und nach Potenzen von t zusammenfassen: (4.18) (1 + tx1 ) · . . . · (1 + txn ) = 1 + s1 t + s2 t2 + . . . + sn tn . Dabei sind s1 , . . . , sn gewisse Polynome in den xi vom Grad deg(si ) = i. Weil die linke Seite offensichtlich invariant unter Vertauschung der xi ist, gilt dasselbe für die rechte Seite, d.h. die Polynome s1 , . . . , sn sind symmetrisch. Man nennt si das i-te elementarsymmetrische Polynom in den Variablen x1 , . . . , xn . Konstruktionsgemäß ist X (4.19) sk := x i1 · · · x i k , i1 <...<ik für 0 < k ≤ n. Ausgeschrieben lauten die elementarsymmetrischen Polynome für n = 4: s1 = x1 + x2 + x3 + x4 s2 = x1 x2 + x1 x3 + x1 x4 + x2 x3 + x2 x4 + x3 x4 s3 = x1 x2 x3 + x1 x2 x4 + x1 x3 x4 + x2 x3 x4 s4 = x1 x2 x3 x4 Algebra I im Wintersemester 2015 25 Die Bezeichnungen sk sind nicht ganz befriedigend, weil man nur aus dem Kontext auf die Anzahl der relevanten Variablen schließen kann. Aber zusätzliche Indizierungen würden die Lesbarkeit unnötig erschweren. Formeln von Girard4 und Viète5 — In A[x1 , . . . , xn , t] gilt die Beziehung (4.20) (t − x1 ) · . . . · (t − xn ) = tn − s1 tn−1 + s2 tn−2 + . . . + (−1)n sn . Das liefert die Formeln von Girard und Viète über den Zusammenhang zwischen den Koeffizienten eines Polynoms und seinen Nullstellen: Sind λ1 , . . . , λn ∈ A die Nullstellen eines Polynoms (4.21) f = xn + f1 xn−1 + f2 xn−2 + . . . + fn−1 x + fn , so gilt (4.22) fk = (−1)k sk (λ1 , . . . , λn ). Dabei sind die Nullstellen so häufig einzusetzen, wie es ihrer Vielfachheit entspricht. Der folgende Satz ist die Verallgemeinerung von Satz 4.1 für beliebig beliebig viele Variablen: Satz 4.4 (Hauptsatz über symmetrische Polynome, Waring6 1762) — Es sei A ein kommutativer Ring. Jedes symmetrische Polynom f ∈ A[x1 , . . . , xn ] läßt sich auf eindeutige Weise als Polynom mit Koeffizienten in A in den elementarsymmetrischen Polynomen s1 , . . . , sn ausdrücken. Etwas formaler kann man den Satz wie folgt umschreiben: Wir betrachten zwei Polynomringe mit den Unbestimmten x1 , . . . , xn bzw. y1 , . . . , yn . Wenn man y1 , . . . , yn in dieser Reihenfolge auf s1 , . . . , sn abbildet, setzt sich diese Abbildung auf eindeutige Weise zu einem Ringhomomorphismus (4.23) Φ : A[y1 , . . . , yn ] → A[x1 , . . . , xn ], yi 7→ s i , fort. Es ist klar, daß das Bild von Φ im Invariantenunterring liegt. Man kann den Sachverhalt des Satzes deshalb auch so ausdrücken: Satz 4.5 — Der Ringhomomorphismus Φ : A[y1 , . . . , yn ] → A[x1 , . . . xn ]Sn ist ein Isomorphismus. Die Surjektivität von Φ entspricht dann die Darstellbarkeit eines beliebigen symmetrischen Polynoms durch elementarsymmetrische und die Injektivität der Eindeutigkeit einer solchen Darstellung. Beweis. Der Beweis ist konstruktiv: Wir geben zwei Algorithmen an, die für jedes symmetrische Polynom eine Darstellung als Polynom in elementarsymmetrischen Polynomen liefern. Algorithmus 1: Der erste Algorithmus verwendet Monomordnungen, wie sie in erweiterter Form heute in der Computeralgebra von zentraler Bedeutung sind. Wir ordnen die Monome xd = xd11 · · · xdnn lexikographisch nach ihren Exponentenfolgen d = (d1 , . . . , dn ) und d′ = (d′1 , . . . , d′n ), d.h. wir ′ setzen xd > xd genau dann, wenn es ein i mit der folgenden Eigenschaft gibt: dj = d′j für alle P j < i und di > d′i . Das Leitmonom eines Polynoms f = t ft xt ist das größte Monom, dessen zugehöriger Koeffizient nicht 0. Das Produkt aus diesem Leitkoeffizienten und dem Leitmonom ist der Leitterm. 4Albert Girard, b1595 in St Mihiel, d8.12.1632 in Leiden. 5François Viète, b1540 in Fontenay-le-Comte, d13.12.1603 in Paris. 6Edward Waring, b1736 in Old Heath, d15 August 1798 in Pontesbury. 26 Symmetrische Polynome P Es sei nun f = ft xt ein symmetrisches Polynom. Für das Leitmonom xd von f gilt wegen der Symmetrieannahme, daß d1 ≥ d2 ≥ . . . ≥ dn . Das symmetrische Polynom (4.24) d n−1 g := fd sd11 −d2 sd22 −d3 · · · sn−1 −dn dn sn hat denselben Leitterm wie f . Die Differenz f −g hat daher einen strikt kleineren Leitterm bezüglich der Monomordnung als f . Durch Induktion folgt nun die Behauptung. Ähnlich beweist man die Injektivität: Das Polynom sν11 · · · sνnn hat das Leitmonom (4.25) x1ν1 +...+νn xν22 +...+νn · · · xνnn . Die Bilder verschiedener Monome y1ν1 · · · ynνn unter dem Ringhomomorphismus Φ : yn 7→ sn haP ben verschiedene Leitmonome. Deshalb kann es in Φ( ν aν y ν ) nicht zu einer vollständigen Auslöschung aller Monome in den Variablen xi kommen. Algorithmus 2: Wir argumentieren durch Induktion über die Anzahl der Variablen. Im Falle n = 1 ist die Aussage trivialerweise richtig. Es sei also n > 1, und die Aussage sei für alle kleineren Anzahlen von Variablen schon bewiesen. Es sei f ∈ A[x1 , . . . , xn ] ein symmetrisches Polynom in n Variablen. Das Polynom (4.26) f˜(x1 , . . . , xn−1 ) := f (x1 , . . . , xn−1 , 0) in n − 1 Variablen ist ebenfalls symmetrisch. Nach Induktionsannahme gibt es ein Polynom g ∈ A[y1 , . . . , yn−1 ] mit der Eigenschaft, daß (4.27) f˜(x1 , . . . , xn−1 )) = g(s′1 , . . . , s′n−1 ), wobei s′i (x1 , . . . , xn−1 ) = si (x1 , . . . , xn−1 , 0) für i = 1, . . . , n − 1 das i-te elementarsymmetrische Polynom in den Variablen x1 , . . . , xn−1 bezeichnet. Das Polynom F := f − g(s1 , . . . , sn−1 ) verschwindet konstruktionsgemäß, sobald man xn = 0 setzt, ist also durch xn teilbar. Weil F symmetrisch ist, ist es auch durch die anderen Variablen x1 , . . . , xn−1 teilbar und somit auch durch das Produkt sn = x1 · · · xn . Es gibt deshalb ein Polynom h(x1 , . . . , xn ) so, daß f − g(s1 , . . . , sn−1 ) = F = sn h. Notwendigerweise ist auch h symmetrisch. Weil h kleineren Grad als f hat, kann man durch Induktion über den Grad annehmen, daß h = k(s1 , . . . , sn ) für ein gewisses Polynom k. Es folgt: (4.28) f = g(s1 , . . . , sn−1 ) + sn k(s1 , . . . , sn ). Das beweist die Existenz. Die Eindeutigkeit kann man ähnlich zeigen: Angnommen, p ist ein Polynom mit p(s1 , . . . , sn ) = 0. Setzt man xn = 0, so folgt p(s′1 , . . . , s′n−1 , 0) = 0. Induktiv kann man annehmen, daß die Injektivität für n − 1 Variablen schon gezeigt ist. Dann weiß man, daß p(y1 , . . . , yn−1 , 0) = 0. Das bedeutet, daß p durch yn teilbar ist, etwa p = yn q. Nach Voraussetzung ist 0 = p(s1 , . . . , sn ) = sn q(s1 , . . . , sn ). Aber dann ist schon q(s1 , . . . , sn ) = 0. Durch Induktion über den Grad von p schließt man auf q = 0 und somit p = 0. Eine fundamentale Konsequenz des Hauptsatzes, die wir in der Folge häufig anwenden werden, ist das folgende Prinzip: Folgerung 4.6 — Es seien A ⊂ B Ringe und f = xn + a1 xn−1 + . . . + an ∈ A[x] ein Polynom, das über B in Linearfaktoren zerfällt: (4.29) f (x) = (x − λ1 ) · . . . · (x − λn ), λi ∈ B. Dann liegt jedes Element b ∈ B, das sich symmetrisch und polynomiell in den Nullstellen λ1 , . . . , λn ausdrücken läßt, schon in A. Algebra I im Wintersemester 2015 27 Beweis. Es sei ϕ : A[x1 , . . . , xn ] → B der Ringhomomorphismus mit ϕ : xi 7→ λi . Die Annahme über b besagt, daß es ein symmetrisches Polynom f mit ϕ(f ) = b gibt. Nun gilt nach den Formeln von Girard und Viète, daß ϕ(si ) = (−1)i ai ∈ A. Nach dem Hauptsatz gibt es ein Polynom g ∈ A[y1 , . . . , yn ] mit f = g(s1 , . . . , sn ). Es folgt b = ϕ(f ) = g(Φ(s1 ), . . . , ϕ(sn )) = g(−a1 , a2 , . . .) ∈ A. 4.3. Potenzsummen und Newtonsche Formeln. Die Potenzsummen pk := xk1 + . . . + xkn , k ∈ N, sind besonders wichtige Beispiele von symmetrischen Polynomen. Deswegen gehen wir näher auf die Frage ein, wie sich denn pk konkret durch s1 , . . . , sn ausdrücken läßt. Zum Beispiel gilt für n = 3 und k = 1, 2, 3: p1 = s1 p2 = s21 − 2s2 p3 = s31 − 3s1 s2 + 3s3 Im Folgenden setzen wir sk = 0, wenn k größer als die Anzahl der betrachteten Variablen ist. Newton hat für die Berechung der pk die folgenden Rekursionsgleichungen angegeben: Satz 4.7 (Newton7) — Für alle k ≥ 1 gilt (4.30) pk − s1 pk−1 + s2 pk−2 − . . . + (−1)k ksk = 0. Dabei ist sℓ = 0 zu setzen, wenn ℓ größer als die Anzahl der Variablen ist. Beweis. Es sei n die Anzahl der Unbestimmten x1 , . . . , xn . Wertet man Gleichung (4.20) in xi aus, erhält man (4.31) n−1 0 = xn + . . . + (−1)n sn . i − s 1 xi Summation über alle i = 1, . . . , n liefert die Behauptung für den Fall k = n. Wenn k > n erhält man zunächst die Gültigkeit der Formel für k Variablen x1 , . . . , xk . Die Substitution xn+1 = . . . = xk = 0 liefert die Behauptung. Für den Fall k < n kann man so argumentieren: Wir wissen, daß sich alle pi durch die elementarsymmetrischen Polynome s1 , . . . , sn ausdrücken lassen. Aus Gradgründen können in dem Ausdruck für pk aber aber nur s1 , . . . , sk vorkommen. Wenn man nun eine Formel pk = Φ(s1 , . . . , sk ) betrachtet und nun xk+1 = . . . = xn = 0 setzt, erhält man eine gültige Formel derselben Gestalt. Jede Gleichung zwischen symmetrischen Polynomen vom Grad ≤ k muß also richtig bleiben, wenn man die Zahl der Variablen von k auf n erhöht. Daraus lassen sich die pi rekursiv durch die sk , k ≤ n, ausdrücken, ohne daß man auf den allgemeinen Algorithmus des Hauptsatzes 4.4 zurückgreifen muß. Man beachte den Vorfaktor n vor sn in der Identität (4.30). Deshalb entstehen beim umgekehrten Auflösen nach den sn Nenner. Die Formeln s1 = s2 = s3 = p1 1 2 (p1 − p2 ) 2 1 3 1 1 p1 − p1 p2 + p3 6 2 3 gelten daher nur in Q-Algebren, d.h. in kommutativen Ringen, in denen alle natürlichen Zahlen invertierbar sind. Die Umrechnungsformeln zwischen elementarsymmetrischen Polynomen und Potenzsummen lassen sich einigermaßen geschlossen ausdrücken. Um solche Ausdrücke herzuleiten, verwenden 7Sir Isaac Newton, b1643 d1727 28 Symmetrische Polynome wir erzeugende Funktionen. Mit einer Hilfsvariablen t betrachten wir die Identität n Y (4.32) (1 + xi t) = i=1 n X s k tk , k=0 wobei auf der rechten Seite s0 = 1 ist. Wenn wir wieder sk = 0 für k > n verabreden, können wir den Laufindex k auf der rechten Seite auch gegen ∞ gehen lassen. Das erleichtert das Aufschreiben der Formeln. Wir nehmen auf beiden Seiten den Logarithmus, und zwar im Sinne von formalen Potenzreihen in t. Deshalb spielen Konvergenzfragen hier keine Rolle. Man erhält: n X (4.33) log(1 + xi t) = log(1 + i=1 und somit (4.34) ∞ X (−1)m−1 m m=1 n X k=1 n X i=1 xm i ! tm = ∞ X (−1)ℓ−1 ℓ ℓ=1 Der Koeffizientenvergleich für die Monome tm zeigt: pm = Koeffizient von tm in (−1)m m ∞ X X (−1)ℓ ℓ ℓ=1 s k tk ) ℓ1 +...+ℓn =ℓ n X s k tk k=1 !ℓ . ℓ! sℓ1 · · · sℓnn tℓ1 +2ℓ2 +...+nℓn ℓ1 ! · · · ℓn ! 1 Die Summanden auf der rechten Seite, die zum Koeffizienten von tm beitragen, gehören zu den Indextupeln (ℓ1 , . . . , ℓn ) mit ℓ1 + 2ℓ2 + . . . + nℓn = m. Deshalb erhält man schließlich: Satz 4.8 — Für alle m ≥ 1 gilt: (4.35) (−1)m pm = m X (−1)ℓ1 +...+ℓn ℓ1 +2ℓ2 +...+nℓn =m (ℓ1 + . . . + ℓn − 1)! ℓ1 s1 · · · sℓnn . ℓ1 ! · · · ℓ n ! Analog findet man umgekehrt Formeln, die die elementarsymmetrischen Polynome durch Potenzsummen ausdrücken: !! n n X X i si t = exp log (1 + xj t) i=0 j=1 = = ∞ X (−1)m p m tm exp m m=1 ∞ X i=0 (−t)i X i1 +2i2 +3i3 Durch Koeffizientenvergleich erhält man also wieder: ! Y 1 p j ij − ij ! j ...=i j Satz 4.9 — Für alle m gilt: (4.36) sm = (−1)m X m1 +2m2 +3m3 Y 1 p j mj − mj ! j ...=m j≥1 Für m = 4 ist die Summe über die Tupel (m1 , m2 , . . .) mit den Werten (4, . . .), (2, 1, . . .), (1, 0, 1, . . .), (0, 2, . . .), (0, 0, 0, 1, . . .) zu nehmen, wobei irrelevante Nullen nicht aufgezählt sind. Man findet so, ohne in eine Rekursion einsteigen zu müssen: (4.37) s4 = 1 4 1 2 1 1 1 p1 − p1 p2 + p1 p3 + p22 − p4 . 4! 4 3 8 4 Algebra I im Wintersemester 2015 29 4.4. Invarianten der alternierenden Gruppe. Wenn man statt der Symmetrie unter der vollen symmetrischen Gruppe Sn von einem Polynom f ∈ R[x1 , . . . , xn ] nur verlangt, daß es invariant unter allen geraden Permutationen der alternierenden Gruppe An ist, erwartet man einen größeren Invariantenring: R[X1 , . . . , Xn ]Sn ⊂ R[X1 , . . . , Xn ]An ⊂ R[X1 , . . . , Xn ]. Diesen Unterring kann man wie folgt bestimmen: Es sei dazu zunächst f ein An -invariantes Polynom. Für eine beliebige Transposition τ ist dann τ (f ) wieder An invariant, denn für π ∈ An hat man πτ = τ (τ −1 πτ ) = τ π ′ mit π ′ = τ −1 πτ ∈ An , so daß π(τ (f )) = τ (π ′ (f )) = τ (f ). Weil sich jede Permutation σ ∈ Sn in der Form σ = π oder σ = τ π mit π ∈ An schreiben läßt, hat man in jedem Falle σ(f ) ∈ {f, τ (f )}. Genauer gilt mit den Abkürzungen 1 1 f+ := (f + τ (f )) f− := (f + τ (f )) 2 2 die Beziehungen f = f+ + f− , σ(f+ ) = f+ , σ(f− ) = sgn(σ)f− für alle σ ∈ Sn . Damit wir f+ und f− bilden können, setzen wir voraus, daß R ein Integritätsbereich ist, in dem 2 invertierbar ist. Man nennt Elemente h mit der Eigenschaft σ(h) = sgn(σ)h für alle σ ∈ Sn Antiinvarianten oder relative Invarianten von Sn zum Charakter sgn : Sn → {±1}. Jedes An -invariante Polynom zerfällt also in einen Sn -invarianten und einen Sn -antiinvarianten Anteil. Wir müssen den letzteren genauer verstehen. Wir entwickeln ein vorgelegtes antiinvariantes Polynom h nach Potenzen von x1 − x2 und x1 + x2 : X (x1 − x2 )a (x1 + x2 )b hab (x3 , . . . , xn ). h(x1 , . . . , xn ) = a,b Unter der Wirkung der Transposition (12) wechselt h das Vorzeichen, aber auf der rechten Seite wechseln nur die Terme zu ungeradem a das Vorzeichen. Folglich ist hab = 0 für gerade a. Insbesondere ist h durch x1 − x2 teilbar. Aus Symmetriegründen ist h dann auch durch das Produkt Y (xi − xj ) δ := i<j teilbar. Tatsächlich ist der Quotient h/δ nun eine Sn -Invariante, denn σ(h) sgn(σ)h h h = = . σ = δ σ(δ) sgn(σ)δ δ Das zeigt: Jede An -Invariante f hat die Form f = a + bδ mit a, b ∈ R[x1 , . . . , xn ]Sn = R[s1 , . . . , sn ], wo s1 , . . . , sn wie oben die elementarsymmetrischen Polynome bezeichnen. Erst recht weiß man nun: R[x1 , . . . , xn ]An wird von s1 , . . . , sn , δ erzeugt. Außerdem weiß man noch, daß δ 2 nicht nur An -invariant, sondern sogar Sn -invariant ist, denn σ(δ 2 ) = (σ(δ))2 ) = (sgn(σ)δ)2 = δ 2 . Nach dem Hauptsatz über symmetrische Polynome gibt es ein eindeutig bestimmtes Polynom discn ∈ R[s1 , . . . , sn ], die sogenannte Diskriminante, mit δ 2 = discn . Damit haben wir zusammengefaßt den folgenden Satz bewiesen: Satz 4.10 — R[x1 , . . . , xn ]An = R[s1 , . . . , sn , δ]/(δ 2 − discn (s1 , . . . , sn )). 30 Symmetrische Polynome 4.5. Aufgaben zu symmetrischen Polynomen. Aufgabe 4.11. — Finden Sie eine Konstruktion mit Zirkel und Lineal für ein regelmäßiges Fünfeck, das (1) auf einer gegebenen Seite errichten werden soll; (2) einem gegebenen Kreis einbeschrieben werden soll. Aufgabe 4.12. — Bestimmen Sie ein Polynom vom Grad 3 mit rationalen Koeffizienten, das 2 cos(2π/7) als Wurzel hat, und zwar (1) indem Sie die Argument des Textes für siebte Einheitswurzeln anpassen. (2) Aus den Additionsformeln für die trigonometrischen Funktionen und dem Umstand, daß cos(6π/7) = cos(8π/7). Aufgabe 4.13. — Leiten Sie aus der Geometrie des regelmäßigen Dreiecks, Vierecks und Fünfecks für die Winkel 30o , 45o , 72o Wurzelausdrücke ihrer Sinus und Cosinus her. Wenn man weiß, wie man Wurzeln aus reellen Zahlen bis zu einer vorgegebenen numerischen Genauigkeit ziehen kann, kann man mit Hilfe der Additionstheoreme für die trigonometrischen Funktionen die Werte sin(3o ) und cos(3o ) bis zu jeder vorgegebenen Genauigkeit berechnen. Berechnen Sie diese Werte auf diese Weise bis auf vier Nachkommastellen. Wieder mit den Additionstheoremen erhält man eine grobe Sinus- und Cosinustabelle für alle Winkel der Form 3n0 , n ∈ N. Informieren Sie sich über Berechnungsmethoden für Tabellen für Sinus- und Sehnenwerte bei den Griechen bis Ptolemaios und bei den Mathematikern der indischen Keralaschule. Aufgabe 4.14. — Programmieren Sie einen oder beide Algorithmen in Mupad (oder Maple oder ...). Präzisieren Sie zunächst die Aufgabenstellung: Sie übergeben eine beliebigen Ausdruck, in dem viele Bezeichner vorkommen können, eine Liste von Bezeichnern, die den Unbestimmten im Satz entsprechen, sowie eine Liste von Werten (!), die den elementarsymmetrischen Polynomen entsprechen. Da Sie nicht wissen, welche Werte übergeben werden, dürfen Sie nicht zu früh substituieren... Aufgabe 4.15. — Drücken Sie die folgenden symmetrischen Polynome durch elementarsymmetrische Polynome aus: (1) x41 + x42 + x43 + x44 . (2) Es sei hk ∈ A[x1 , . . . , xn ] die Summe aller Monome vom Grad k. Die hk heißen vollständige symmetrische Polynome. Schreiben Sie hk für n = 3 und k = 1, . . . , 3 als Polynom in den elementarsymmetrischen Polynomen. Q (3) ∆ := 1≤i<j≤3 (xi − xj )2 . Q Aufgabe 4.16. — Das Polynom ∆ := i<j (xi − xj )2 ∈ Z[x1 , . . . , xn ] ist symmetrisch. Deshalb gibt es ein Polynom discn , die sogenannte Diskriminante, mit ∆ = discn (s1 , . . . , sn ), wobei s1 , . . . , sn die elementarsymmetrischen Polynome in den xi bezeichnen. (1) Bestimmen Sie disc2 und disc3 . (2) Es sei f = xn − f1 xn−1 + . . . + (−1)n fn . Zeigen Sie: f hat genau dann eine mehrfache Nullstelle, wenn disc(f1 , . . . , fn ) = 0. (3) Wir betrachten den Raum V = {f = x3 − ax − b | a, b ∈ R} ∼ = R2 . Bestimmen Sie die Orte V1 ⊂ V aller Polynome mit mehrfacher Nullstelle und V0 ⊂ V1 aller Polynome mit dreifacher Nullstelle. (Zeichnung). Aufgabe 4.17. — Betrachten Sie die letzte Frage aus Aufgabe 4.16 auch für Polynome vom Grad 4: Es sei V = {f = x4 + ax2 + bx + c | a, b, c ∈ R}. Bestimmen Sie die Orte V2 aller Polynome mit mindestens doppelter Nullstelle, V22 mit mindestens zwei doppelten Nullstellen, V3 mit mindestens einer dreifachen Nullstelle und V4 mit einer vierfachen Nullstelle. Algebra I im Wintersemester 2015 31 Aufgabe 4.18. — Wir betrachten den Polynomring S = C[xij , 1 ≤ i, j ≤ n] in n2 Unbestimmten. Das charakteristische Polynom χA (t) = tn − χ1 tn−1 + . . . + (−1)n χn der Matrix A = (xij ) ∈ Mn (C) hat Koeffizienten χk ∈ S. Für jede Matrix M ∈ Mn (C) sind (−1)i χi (M ) die Koeffizienten des charakteristischen Polynoms von M . (1) Es gibt ein Polynom p ∈ S mit der Eigenschaft, daß jede Matrix M ∈ Mn (C) genau dann paarweise verschiedene Eigenwerte hat, wenn p(M ) 6= 0. (2) Finden Sie für n = 4 eine Formel, die die Koeffizienten χi (M ), i = 1, . . . , n durch die Spuren tr(M k ), k = 1 . . . , n, ausdrückt. Hinweis zum zweiten Teil: Betrachten Sie zunächst diagonalisierbare Matrizen und verwenden Sie dann ein Stetigkeitsargument. 32 Symmetrische Polynome §5. Euklidische Ringe 5.1. Allgemeine Teilbarkeitsbegriffe. Definition 5.1. — Es sei A ein kommutativer Ring. (1) a ∈ A ist ein Teiler von b ∈ A und b ein Vielfaches von a, wenn es ein c ∈ A mit b = ac gibt. In Zeichen: a|b. Falls a kein Teiler von b ist, schreibt man a6 | b. (2) d ∈ A ist ein gemeinsamer Teiler von S ⊂ A, wenn d|a für alle a ∈ S, und d ist ein größter gemeinsamer Teiler von S, wenn d ein gemeinsamer Teiler ist und wenn für jeden anderen gemeinsamen Teiler x von S gilt x|d. (3) a, b ∈ A sind assoziiert, in Zeichen: a ∼ b, wenn a = ub für eine Einheit u. (4) v ∈ A ist ein gemeinsames Vielfaches von S, wenn a|v für alle a ∈ S, und v ist ein kleinstes gemeinsames Vielfaches von S, wenn v ein gemeinsames Vielfaches ist und wenn für jedes andere gemeinsame Vielfache y gilt v|y. Für die Teilbarkeitsrelation gelten die folgenden Rechenregeln: (1) (2) (3) (4) (5) (6) 1|a|0 für alle a ∈ A. a|b und a|c ⇒ a|(λb + µc) für alle λ, µ ∈ A. a|b und b|c ⇒ a|c. a ∼ b ⇔ a|b und b|a. Falls ein größter gemeinsamer Teiler für S ⊂ A existiert, ist er eindeutig bis auf Einheiten. Falls ein kleinstes gemeinsames Vielfaches für S ⊂ A existiert, ist es eindeutig bis auf Einheiten. Satz 5.2 — Es sei A ein Hauptidealring. Dann besitzt jede Menge S ⊂ A einen größten gemeinsamen Teiler d. Außerdem gibt es Elemente s1 , . . . , sn ∈ S und α1 , . . . , αn ∈ A mit d = α1 s1 + . . . + αn sn . Die Koeffizienten α1 , . . . , αn heißen Bézout-Koeffizienten von d. Beweis. Das von S erzeugte Ideal ist ein Hauptideal, etwa S = (d). Dann besitzt d wegen d ∈ (S) eine additive Darstellung wie angegeben. Wegen s ∈ S ⊂ (S) = (d) gilt d|s für alle s ∈ S. P Schließlich folgt aus x|s für alle s ∈ S auch x| i αi si = d. Damit ist d ein größter gemeinsamer Teiler. 5.2. Euklidische Ringe. Definition 5.3. — Ein euklidischer Ring ist ein Integritätsbereich A mit einer Gradfunktion δ : A \ {0} → N0 und der Eigenschaft, daß es für alle a ∈ A und b ∈ A \ {0} Elemente q, r ∈ A mit a = qb + r und r = 0 oder δ(r) < δ(b) gibt. Das Element r ist der Rest bei Division von a durch b. Dabei muß man allerdings daran denken, daß das Paar (q, r) im allgemeinen durch (a, b) nicht eindeutig bestimmt ist. Dies ist nicht einmal im Ring Z der ganzen Zahlen mit δ(a) := |a| der Fall: 7 = 1 · 5 + 2 = 2 · 5 − 3. Beispiel 5.4. — Der Ring der ganzen Zahlen Z ist ein euklidischer Ring mit Gradfunktion δ(a) := |a|. Die Division mit Rest ist die gewöhnliche ganzzahlige Division. Wenn man zusätzlich vereinbart, daß der Rest grundsätzlich ≥ 0 sein soll, ist die Division sogar eindeutig. Beispiel 5.5. — Der Ring der sogenannten G AUSSschen Zahlen Z[i] = {m + ni ∈ C | m, n ∈ Z} ist ein euklidischer Ring mit Gradfunktion δ(m, ni) = |m + ni|2 = m2 + n2 . Zum Beweis dieser Aussage seien Elemente a = α + α′ i ∈ Z[i] und b = β + β ′ i ∈ Z[i] \ {0} vorgegeben. Wir können Algebravorlesung im Wintersemester 2015 33 im Körper C den Quotienten z = a/b bilden und Real- und Imaginärteil von z durch ganze Zahlen approximieren. Es gibt sicher m, m′ ∈ Z mit | Re(z) − m| ≤ 1 , 2 | Im(z) − m′ | ≤ 1 . 2 Es folgt |z − (m + m′ i)|2 ≤ 21 . Wir setzen nun q = m + m′ i und r = a − bq = b(z − q) ∈ Z[i]. Es folgt: 1 δ(r) = |r|2 = |b|2 |z − q|2 ≤ δ(b) < δ(b). 2 Wenn man sich die G AUSSschen Zahlen als Gitterpunkte in einem quadratischen Gitter in C vorstellt, so landet der Quotient z in einem der Gitterquadrate, und q ist die durch die Wahl eines nächstliegenden Gitterpunktes bestimmt. Diese Wahl ist nicht eindeutig. Beispiel 5.6. — Auf ähnliche Weise zeigt man, daß der Ring der Ring der E ISENSTEINzahlen Z[ρ] = {m + nρ | m, n ∈ Z} mit ρ = exp(2πi/3) ein euklidischer Ring mit Gradfunktion δ(m + nρ) = |m + nρ|2 = m2 − mn + n2 ist. Beispiel 5.7. — Für jeden Körper K ist der Polynomring K[X] ein euklidischer Ring mit Gradfunktion δ(f ) = deg(f ). Dies ergibt sich unmittelbar aus dem Satz über Polynomdivision 3.3. Satz 5.8 — Euklidische Ringe sind Hauptidealringe. Beweis. Es sei (A, δ) ein euklidischer Ring und I ⊂ A ein Ideal. Falls I = 0, ist nichts zu zeigen. Es sei also I 6= 0 und b ∈ I \ {0} ein Element mit δ(b) = min{δ(c) | c ∈ I \ {0}}. Offensichtlich gilt (b) ⊂ I. Es sei a ∈ I beliebig und r = a − qb ein Rest bei Division von a durch b, so daß also r = 0 oder δ(r) < δ(b). Da r = a − qb ∈ I, ist die zweite Möglichkeit wegen der Minimalitätsbedingung an b ausgeschlossen. Deshalb bleibt nur Option r = 0 und somit a = qb ∈ (b). Das zeigt die umgekehrte Inklusion I ⊂ (b). Die Umkehrung ist falsch, obwohl es nicht so leicht ist, dies an Gegenbeispielen zu nachzu√ weisen. R ICHARD D EDEKIND zeigt, daß R = Z[ 21 (1 + −19)] ein Hauptidealring ist (vgl. das bekannte Lehrbuch: Dirichlet-Dedekind: Vorlesungen über Zahlentheorie. 4. Aufl 1894). T HEODO RE M OTZKIN zeigt in dem Aufsatz The Euclidean algorithm. Bull. Amer. Math. Soc. 55, (1949), pp. 1142–1146, daß R kein euklidischer Ring ist. Eine elementare Darstellung beider Aussagen findet man bei JACK W ILSON: A principal ideal ring that is not a eulidean ring, Mathematics Magazine vol. 46, No. 1 (1973), pp. 34-38). M OTZKIN und W ILSON verwenden eine Definition des Begriffs Euklidischer Ring, die scheinbar enger ist, als die von uns verwendete. Daß dem nicht so ist, zeigt P IERRE S AMUEL: About Euclidean Rings. J. Alg. vol. 19 (1971), pp. 282 - 301. Details dazu im Abschnitt 5.7 5.3. Der euklidische Algorithmus. Unter dem euklidischen Algorithmus versteht man das folgende Verfahren, um zu gegebenen a, b in einem euklidischen Ring (A, δ) einen größten gemeinsamen Teiler d und Bézout-Koeffizienten zu berechnen. Wir setzen a0 = a und a1 = b und berechnen an rekursiv wie folgt: Es sei n ≥ 1 und an schon berechnet. Falls an = 0 bricht das Verfahren ab. Andernfalls gibt es Elemente qn , an+1 ∈ A mit an−1 = qn an + an+1 und an+1 = 0 oder δ(an+1 ) < δ(an ). 34 Euklidische Ringe Dieses Verfahren muß abbrechen, d.h. man muß nach endlich vielen Schritten auf ein Element an = 0 stoßen, weil andernfalls (δ(an )) eine strikt monoton fallende Folge natürlicher Zahlen wäre. Aus der trivialen Umformung ⇔ an−1 = qn an + an+1 an+1 = an−1 − qn an folgt: Jeder (größte) gemeinsame Teiler von an−1 und an ist auch ein (größter) gemeinsamer Teiler von an und an+1 und umgekehrt. Wenn das Verfahren mit aN +1 = 0 abbricht, so gilt offenbar aN |aN −1 . Deshalb ist aN ein größter gemeinsamer Teiler des Paares (aN −1 , aN ) und damit auch des Paares (a0 , a1 ) = (a, b). Zusammengefaßt: Das letzte nichtverschwindende Glied der Folge (a1 , a2 , . . .) ist ein größter gemeinsamer Teiler von a und b. Zur Berechnung der Bézout-Koeffizienten betrachten wir die Identitäten a0 = q1 a 1 + a 2 a1 = .. . q2 a 2 + a 3 aN −2 = qN −1 aN −1 + aN a N1 = qN a N + 0 und machen den Ansatz (5.1) ai = αi a + βi b, mit (α0 , β0 ) = (1, 0) und (α1 , β1 ) = (0, 1). Aus an+1 = an−1 − qn an folgt rekursiv: an+1 = (αn−1 a + βn−1 b) − qn (αn a + βn b) = (αn−1 − qn αn )a + (βn−1 − qn βn )b, also αn+1 = αn−1 − qn αn , βn+1 = βn−1 − qn βn . Die Bézoutkoeffizienten genügen also exakt denselben Rekursionsgleichungen wie die an selbst, und man erhält für den größten gemeinsamen Teiler die Darstellung aN = αN a + βN b. Beispiel 5.9. — Es seien a = 412 und b = 34 im euklidischen Ring Z vorgegeben. Der euklidische Algorithmus verläuft dann so: 412 = 12 · 34 + 4 34 = 8·4+2 4 = 2 · 2 + 0. Deshalb ist 2 ein größter gemeinsamer Teiler von 412 und 34 (aber −2 auch!), und die BézoutKoeffizienten findet man so: 412 = 1 · 412 + 0 · 34 34 = 0 · 412 + 1 · 34 4 = 1 · 412 − 12 · 34 2 = (0 − 8 · 1) · 412 + (1 − 8 · (−12)) · 34, also 2 = (−8) · 412 + 97 · 34. Algebravorlesung im Wintersemester 2015 35 5.4. Lineare Kongruenzen. G AUSS hat in den 1801 erschienenen Disquisitiones Arithmeticae die folgende Notation eingeführt: Er nennt zwei ganze Zahlen a, b ∈ Z kongruent nach dem Modul m ∈ N, wenn m|(a − b), und schreibt in diesem Falle (5.2) a ≡ b mod m. Das Kongruenzzeichen ≡ ist dabei bewußt so gewählt, daß es an ein Gleichheitszeichen erinnert. In moderner Sprache betrachtet man das von m erzeugte Hauptideal (m) und geht zum Faktorring Z/(m) über, den wir in der Regel kürzer Z/m schreiben. Die Aussage (5.2) ist dann äquivalent zu der Aussage, daß a und b dieselbe Restklasse in Z/m haben. Wir erweitern die Begriffsbildung für beliebige Ideale I in kommutativen Ringen A und verwenden mit äquivalenter Bedeutung die Schreibweisen: a ≡ b mod I ⇔ a−b∈I ⇔ ā = b̄ ∈ A/I. Unter einer linearen Kongruenz in Z versteht man eine Gleichung der Form ax ≡ b mod m. Dazu sind eigentlich zwei Zahlen x, y ∈ Z mit ax + my = b zu bestimmen. Satz 5.10 — Es seien a, b, m ∈ Z, m 6= 0, und d ein größter gemeinsamer Teiler von a und m. Die lineare Kongruenz ax ≡ b mod m hat genau dann eine Lösung, wenn b ein Vielfaches von d ist, etwa b = ℓd. Gilt d = αa + µm mit Bézoutkoeffizienten α, µ ∈ Z, so sind alle Lösungen der Kongruenz von der Form x ≡ ℓα mod m/d. Beweis. Wenn es eine Darstellung b = ax + my gibt, liegt b definitionsgemäß im Ideal (a, m) = (d) und ist ein Vielfaches von d. Die Bedingung ist also sicher notwendig. Ist umgekehrt b = ℓd und d = αa + µm, so erhält man durch Multiplikation mit ℓ die Aussage b = ℓd = (ℓα)a + (ℓµ)m. Deshalb ist x = ℓα eine Lösung der Kongruenz. Damit schließlich eine andere Zahl x′ = x + u die Kongruenz löst, muß gelten m|(au). Das ist äquivalent zu der Aussage (m/d)|(a/d)u, und weil m/d und a/d teilerfremd sind, bedeutet dies m/d | u, also x′ ≡ x mod m/d. Der Satz gilt analog mit identischem Beweis für jeden nullteilerfreien Hauptidealring. Man beachte, daß die Kongruenz, falls sie überhaupt lösbar ist, eine eindeutige Lösung x0 nach dem möglicherweise kleineren Modul m/d hat, die aber in mehrere Klassen x0 , x0 + m , d ..., x0 + (d − 1) m d mod m aufspaltet, falls d keine Einheit ist. Beispiel 5.11. — Die Kongruenz 6x ≡ 4 mod 10 ist lösbar, weil 2 ein ggT von a = 6 und m = 10 ist und ein Teiler von b = 4. Mit 4 = 2 · 2 und 2 = 2 · 6 + (−1) · 10 ist x = 2 · 2 = 4 eine Lösung, die aber nur eindeutig modulo 10/2 = 5 ist. Bezüglich dem Ausgangsmodul 10 hat man zwei Lösungen 4 und 9. 36 Euklidische Ringe Unter einer simultanen linearen Kongruenz versteht man ein System von Kongruenzen a1 x ≡ b1 mod m1 a2 x ≡ .. . b2 mod m2 an x ≡ bn mod mn Nach dem gerade beschriebenen Verfahren für lineare Kongruenzen kann man jede einzelne Kongruenz so ersetzen, daß die Koeffizienten ai der linearen Terme alle gleich 1 werden. Dabei ändern sich aber auch die Koeffizienten bi und die Moduln mi . Wir können also der Einfachheit halber von einem System x (5.3) x ≡ .. . ≡ b1 mod m1 bn mod mn ausgehen. Satz 5.12 (Chinesischer Restklassensatz) — Es seien m1 , . . . , mn paarweise teilerfremde ganze Zahlen 6= 0. Dann hat das System (5.3) für beliebige b1 , . . . , bn eine eindeutige Lösung x mod m1 · . . . · mn . Beweis. Es sei M = m1 · . . . · mn und Mi = M/mi = m1 . . . mi−1 mi+1 · · · mn für alle i = 1, . . . , n. Weil jedes mi teilerfremd zu allen mj , j 6= i, ist, ist mi auch teilerfremd zu Mi . Deshalb gibt es Koeffizienten αi , βi ∈ Z mit 1 = αi mi + βi Mi . Dann hat ei := βi Mi die Eigenschaften ei ≡ δij mod mj . Folglich erfüllt x0 := P i bi ei die Bedingung X X δij bi ≡ bj mod mj bi e i ≡ x0 ≡ i i für alle j = 1, . . . , n. Eine andere Zahl x löst dieselbe Kongruenz, wenn mi |(x − xi ) für alle i. Und weil die mi paarweise teilerfremd sind, ist das äquivalent zu M |(x − xi ). Die Lösung x = x0 ist also eindeutig modulo M . Satz und Beweis bleiben wieder für beliebige nullteilerfreie Hauptidealringe richtig, und über euklidischen Ringen mit einer effektiven Division mit Rest ist das im Beweis verwendete Verfahren ein effektiver Algorithmus. Man kann den Satz auch wie folgt umformulieren: Für jeden Index i = 1, . . . , n hat man eine surjektive Abbildung ψi : Z → Z/mi , und diese setzen sich zu einem Ringhomomorphismus ψ= n Y i=1 ψi : Z → Z/m1 × . . . × Z/mn zusammen. Unter den Bedingungen des Satzes ist die Abbildung surjektiv und hat als Kern das Ideal (m1 · · · mn ). Deshalb kann man den Satz auch so aussprechen: Satz 5.13 — Es seien m1 , . . . , mn ∈ Z\{0} paarweise teilerfremde Zahlen. Dann ist die natürliche Abbildung ψ : Z/(m1 · · · mn ) −→ Z/m1 × . . . × Z/mn ein Ringisomorphismus. Algebravorlesung im Wintersemester 2015 37 Die im Beweis zum Chinesischen Restklassensatz konstruierten Zahlen e1 , . . . , en besimmen die zu ψ inverse Abbildung ψ −1 : (b̄1 , . . . , b̄n ) 7→ b1 e1 + . . . + bn en . Man kann den Chinesischen Restklassensatz für beliebige kommutative Ringe verallgemeinern: Definition 5.14. — Es sei A ein kommutativer Ring. Zwei Ideale I, J ⊂ A heißen koprim, wenn I + J = A. Offenbar sind I und J genau dann koprim, wenn es x ∈ I und y ∈ J mit x + y = 1 gibt. Satz 5.15 — Es sei A ein kommutativer Ring mit paarweise koprimen Idealen I1 , . . . , In → A. Es sei weiter pi : A → A/Ii die kanonische Projektion. Dann ist die zusammengesetzte Abbildung p = (p1 , . . . , pn ) : A → A/I1 × . . . A/In surjektiv mit Kern I1 ∩ . . . ∩ In = I1 · . . . · In . Insbesondere ist die natürliche Abbildung A/(I1 · · · In ) → A/I1 × . . . × A/In ein Isomorphismus. Beweis. Wir wählen für jedes Paar i 6= j Elemente aij ∈ Ii mit aij + aji = 1. Dann gilt aij ≡ 0 mod Ii und aij ≡ 1 mod Ij für alle j 6= i. Insbesondere hat Y aij ej := i6=j die Eigenschaft ej ≡ 0 mod Ii für alle i 6= j und ej ≡ 1 mod Ij . Sind also Klassen [aj ] ∈ A/Ij , P j = 1, . . . , n mit Repräsentanten aj ∈ A vorgegeben, so hat a := j aj ej die Eigenschaft a ≡ T aj mod Ij für alle j. Deshalb ist p surjektiv. Der Kern von p ist offensichtlich das Ideal I = j Ij . Es bleibt zu zeigen, daß I = I1 · · · In . Dabei ist die Inklusion ⊃ offensichtlich. Die Rückrichtung zeigt man durch Induktion: Im Falle n = 2 gilt für jedes Element a ∈ I1 ∩ I2 die Beziehung a = a(a12 + a21 ) = aa12 + aa21 . Weil a12 ∈ I2 , ist aa12 ∈ I1 I2 , und weil a21 ∈ I2 , ist aa21 ∈ I1 I2 . Das zeigt: I1 ∩ I2 ⊂ I1 I2 . Die Behauptung folgt nun induktiv aus der Tatsache, daß I1 koprim zum Produkt I2 · · · In ist, sofern I1 koprim zu jedem einzelnen Ideal I2 , . . . , In ist: A = A · · · A = (I1 + I2 ) · · · (I1 + In ) ⊂ I1 + I2 · · · In . 5.5. Einheiten in Z/n. Ein Element ā ∈ Z/n ist eine Einheit, wenn es ein x̄ ∈ Z/n mit ā x̄ = 1 gibt. Das ist äquivalent zur Kongruenz ax ≡ 1 mod n. Bezeichnet wie üblich (Z/n)× die Gruppe der Einheiten in Z/n, so folgt: (Z/n)× = {ā ∈ Z/n | 0 < a < n und a ist teilerfremd zu n.} Satz 5.16 — Sind A1 , . . . , As kommutative Ringe, so gilt × (A1 × . . . × As )× = A× 1 × . . . × As . Beweis. Addition und Multiplikation in A1 × . . . × As werden komponentenweise ausgeführt. Deshalb ist ein Element (a1 , . . . , as ) genau dann invertierbar, wenn jede Komponente ai in Ai invertierbar ist. Daraus erhält man die angegebene Bijektion. Aus demselben Grund ist es auch ein Homomorphismus von Gruppen. 38 Euklidische Ringe Folgerung 5.17 — Sind m1 , . . . , ms paarweise teilerfremde natürliche Zahlen und m = m1 · . . . · ms , so gilt × × (Z/m)× ∼ = (Z/m1 ) × . . . × (Z/ms ) Beweis. Nach dem Chinesischen Restklassensatz gilt Z/m = Z/m1 × . . . × Z/ms . Die Behauptung folgt dann aus dem vorigen Satz. Definition 5.18. — Die Abbildung ϕ : N → N mit ϕ(n) = |(Z/n)× | = |{a ∈ {1, . . . , n − 1} | a teilerfremd zu n.}| für n ≥ 2 und ϕ(1) = 1 heißt E ULERsche phi-Funktion. Satz 5.19 — Die ϕ-Funktion hat die folgenden Eigenschaften: (1) Sind m1 , . . . , ms ∈ N paarweise teilerfremd, so gilt ϕ(m1 · · · ms ) = ϕ(m1 ) · · · ϕ(ms ). (2) Für jede Primzahl p gilt ϕ(pn ) = pn−1 (p − 1). (3) Für jede natürliche Zahl n gilt Y ϕ(n) 1 = . 1− n p p|n prim (4) Für jede natürliche Zahl n gilt n= X ϕ(d). d|n wobei d durch alle positiven Teiler von n läuft. Beweis. Die erste Aussage ergibt sich aus Folgerung 5.17 durch Übergang zu den Gruppenordnungen. Die zweite Aussage erhält man durch einfaches Abzählen: Eine Zahl a ist genau dann teilerfremd zu pn , wenn sie nicht durch p teilbar ist. Die durch p teilbaren Zahlen in {1, . . . , pn } sind p, 2p, . . . , pn−1 p. Die Mächtigkeit des Komplements ist daher pn − pn−1 = pn−1 (p − 1). Für die Q dritte Aussage zerlegt man n in Primfaktoren: n = p|n pνp und schließt: Y Y ν −1 Y p p (p − 1) = n (1 − p1 ). ϕ(pνp ) = ϕ(n) = p|n p|n p|n Die letzte Aussage erhält man so: Jede Zahl a ∈ {1, . . . , n} hat einen eindeutig bestimmten positiven größten gemeinsamen Teiler d mit n. Weiter ist dann a/d teilerfremd zu n/d. Ist umgekehrt α teilerfremd zu n/d, so hat αd den größten gemeinsamen Teiler d mit n. Deshalb hat die Menge der a, die zum Teiler d|n gehören, die Mächtigkeit ϕ( nd ). Da aber jede Zahl a zu irgendeinem Teiler P P gehören muß, ergibt sich: n = d|n ϕ( nd ) = t|n ϕ(t). Die letzte Gleichung ergibt sich daraus, daß man statt über d über den komplementären Teiler t = n/d summiert. Für eine Primzahl p ist ϕ(p) = p − 1, so daß (Z/p)× = (Z/p) \ {0}. Das ist das bekannte Ergebnis, daß Fp := Z/p ein Körper ist. Wir wollen die wichtige Aussage herleiten, daß die Einheitengruppe F× p selbst eine zyklische Gruppe ist. Das bedeutet: Es gibt eine natürliche Zahl g < p mit der Eigenschaft, daß 1, g, g 2 , . . . , g p−2 ein Vertretersystem für F× p ist. Solche Zahlen heißen Primitivwurzeln modulo p. Für p = 7 ist g = 3 eine Primitivwurzel: 30 ≡ 1, 31 ≡ 3, 32 ≡ 2, 33 ≡ 6, 34 ≡ 4, 35 ≡ 5 mod 7. Algebravorlesung im Wintersemester 2015 39 Für p = 11 ist g = 2 eine Primitivwurzel: 20 ≡ 1, 25 ≡ 10, 21 ≡ 2, 26 ≡ 9, 22 ≡ 4, 27 ≡ 7, 23 ≡ 8, 28 ≡ 3, 24 ≡ 5, 29 ≡ 6 mod 11. Satz 5.20 — Die Einheitengruppe F× p ist zyklisch. Insbesondere gibt es zu jeder Primzahl p eine Primitivwurzel g mit der Eigenschaft, daß die Exponentialabbildung Z/(p − 1) → (Z/p)× , m 7→ g m , ein Gruppenisomorphismus ist. Die Anzahl der Primitivwurzeln modulo p ist ϕ(p − 1). Wir zeigen gleich etwas allgemeiner: Satz 5.21 — Es sei K ein Körper und G < K × eine endliche Untergruppe der Einheitengruppe von K. Dann ist G zyklisch. Genauer ist die Anzahl der Erzeuger gleich ϕ(|G|). Insbesondere ist für jeden endlichen Körper F die Einheitengruppe F× zyklisch. Beweis. Es sei d die Ordnung eines Elements a ∈ G. Dann gilt ad = 1. Die Potenzen ai , i = 0, . . . , d−1 sind nach Definition der Ordnung paarweise verschieden, und alle haben die Eigenschaft (ai )d = (ad )i = 1, sind also d verschiedene Nullstellen des Polynoms X d − 1 ∈ K[X]. Dieses Polynom hat aber nur höchstens d Nullstellen. Deshalb ist jedes Element b ∈ G der Ordnung d in der ∼ Z/d enthalten. Ein Element in der additiven Gruppe Z/d hat die maximale zyklischen Gruppe hai = Ordnung d genau dann, wenn es teilerfremd zu d ist. Deshalb gibt es in G genau ϕ(d) Elemente der Ordnung d. Natürlich ist d ein Teiler der Ordnung n := |G|. Es sei nun ψ(d) die Anzahl der Elemente der Ordnung d in G. Die bisherigen Überlegungen sagen: Entweder ist ψ(d) = 0 oder ψ(d) = ϕ(d). Da jedes Element in G aber eine Ordnung besitzt, die n teilt, folgt mit Satz 5.19: X X ϕ(d) = n. ψ(d) ≤ |G| = d|n d|n Die Endterme der Ungleichung sind gleich, deshalb muß an jeder Stelle ψ(d) = ϕ(d) gelten. Insbesondere ist die Anzahl der Elemente der Ordnung |G| gleich ϕ(|G|). Folgerung 5.22 — Es sei p eine Primzahl. Die Kongruenz x2 ≡ −1 mod p besitzt genau dann eine Lösung, wenn p = 2 oder wenn p ≡ 1 mod 4 ist. Beweis. Die Behauptung für p = 2 ist offensichtlich. Für jede natürliche Zahl x ist x2 ≡ 0 mod 4, falls x gerade ist, und x2 ≡ 1 mod 4, falls x ungerade ist. Die quadratische Kongruenz x2 ≡ −1 mod p kann also keine Lösung haben, wenn p ≡ 3 mod 4 ist. Es bleibt der Fall zu betrachten, daß p eine ungerade Primzahl der Form p = 4m + 1 ist. Es sei g eine Primitivwurzel mod p. Definitionsgemäß hat g die Ordnung 4m. Also ist y = g 2m nicht kongruent zu 1, genügt aber der Kongruenz y 2 ≡ 1 mod p, deren einzige Lösungen 1 und −1 sind. Das bedeutet: (g m )2 = g 2m ≡ −1 mod p. Somit sind x = ±g m Lösungen der Kongruenz x2 ≡ −1 mod p. 5.6. (*) Die Einheitengruppe von Z/pm . Lemma 5.23 — 1. Es sei p eine ungerade Primzahl. Dann gilt (1 + gpm )p ≡ 1 + gpm+1 mod pm+2 für alle m ≥ 1 und g ∈ Z. 2. Für die Primzahl p = 2 gilt (1 + g2m )2 ≡ 1 + g2m+1 mod 2m+2 für alle m ≥ 2 und g ∈ Z. 40 Euklidische Ringe Der Unterschied ist also der Geltungsbereich für den Exponenten m. Die Behauptung ist für ≡ 1 mod 23 . p = 2 und m = 1 falsch: (1 + 2g)2 = 1 + 8 g+1 2 Beweis. Für alle Primzahlen p gilt m p (1 + gp ) = 1 + gp m+1 ! p−1 X p i mi + g p + g p ppm . i i=2 Der Exponent von p in den Summanden zu 2 ≤ i < p ist ≥ 1 + mi ≥ m + 2 für i ≥ 2. Der Exponent von p im letzten Term ist pm, und dies ist ≥ m + 2, sobald m ≥ 2 oder p ≥ 3. Satz 5.24 — Es sei p eine ungerade Primzahl. Die Einheitengruppe (Z/pn )× ist zyklisch von der Ordnung pn−1 (p − 1). Beweis. Jede zu pn teilerfremde Zahl ist auch zu p teilerfremd. Durch Reduktion modulo p erhält man also eine exakte Sequenz 1 −→ U −→ (Z/pn )× −→ (Z/p)× −→ 1. Dabei ist (5.4) U := {ā ∈ Z/pn | a ≡ 1 mod p} = {1 + pg |g = 0, . . . , pn−1 } die sogenannte Gruppe der Einseinheiten. Offenbar ist U = |pn−1 |. Wir zeigen zunächst: 1. Schritt: U ist zyklisch mit Erzeuger 1 + p. Die Ordnung von 1 + p ist in jedem Falle eine p-Potenz. Andererseits wissen wir aus Lemma 5.23 ℓ durch Induktion, daß (1 + p)p ≡ 1 + pℓ+1 mod pℓ+2 für alle ℓ ≥ 0. Deshalb hat 1 + p in U jedenfalls keine Ordnung < pn−1 . 2. Schritt: Es gibt eine Element g ∈ (Z/pn )× der Ordnung p − 1. Wir zeigen dies durch Induktion über n, wobei der Induktionsanfang einfach die Existenz einer Primitivwurzel modulo p ist. Wir nehmen also induktiv an, es sei g eine Primitivwurzel modulo p, die der verschärften Bedingung g p−1 ≡ 1 mod pn−1 genügt, d.h. g p−1 ≡ 1 + ℓpn−1 mod pn . Mit dem Ansaz g ′ = g + xpn−1 ist g ′ sicher wieder eine Primitivwurzel modulo p, und es gilt (g ′ )p−1 ≡ 1 + ℓpn−1 + (p − 1)g p−2 xpn−1 mod pn . Weil (p − 1) und g Einheiten modulo p sind, kann man die Kongruenz ℓ + (p − 1)g p−2 x ≡ 0 mod p nach x auflösen. Mit einem solchen x erfüllt g ′ die Bedingung (g ′ )p−1 ≡ 1 mod pn . 3. Schritt: Ist g das im zweiten Schritt konstruierte Element der Ordnung p − 1, so erzeugen offenbar g und 1 + p eine Untergruppe, deren Ordnung ein Vielfaches von p − 1 und von pn−1 ist und deshalb mit (Z/pn )× zusammenfällt. Es gilt also n−1 ∼ n (Z/pn )× ∼ = h1 + pi × hgi ∼ = Z/(p − 1) × Z/p = Z/ϕ(p ), wie behauptet. Satz 5.25 — Für m ≥ 3 ist die Abbildung Z/2 × Z/2m−2 −→ (Z/2m )× , (ε, ℓ) 7→ (−1)ε 5ℓ , ein Isomorphismus. Algebravorlesung im Wintersemester 2015 41 5.7. (*) Minimale Euklidische Gradfunktionen. Es gibt Definitionen des Begriffs des euklidischen Rings, die verschieden von Definition 5.3, aber dazu äquivalent sind. Definition 5.26. — Es sei A ein Integritätsbereich. Eine Abbildung ϕ : A → N ist eine euklidische Gradfunktion, wenn es zu a, b ∈ A mit b 6= 0 stets Elemente q, r ∈ A mit a = bq + r und 0 ≤ ϕ(r) < ϕ(b) gibt. Wenn A eine euklidische Gradfunktion ϕ besitzt, ist A sicher euklidisch im Sinne von Definition 5.3. Ist umgekehrt δ eine Gradfunktion im Sinne von 5.3, genügt es, ϕ(0) := 0 und ϕ(a) := δ(a)+1 für alle a 6= 0 zu setzen. Der Grund für unsere frühere Wahl der Definition ist der, daß im Falle eines Polynomrings K[X] der ’natürliche’ Grad eines Polynoms die Definition 5.3 erfüllt, aber nicht 5.26. Dafür hat die neue Definition 5.26 Vorteile, die wir in diesem Abschnitt betrachten wollen. Die Ideen dazu gehen auf die folgenden Arbeiten zurück: Theodore Motzkin:The Euclidean algorithm. Bull. Amer. Math. Soc. 55, (1949), pp. 1142–1146 Jack Wilson: A principal ideal ring that is not a eulidean ring, Mathematics Magazine vol. 46, No. 1 (1973), pp. 34-38. Pierre Samuel: About Euclidean Rings. J. Alg. vol. 19 (1971), pp. 282 - 301. Lemma 5.27 — Es sei A ein Integritätsbereich und S die Menge aller euklidischen Gradfunktionen auf A. Wenn S nicht leer ist, ist ϕ0 (a) := min{ϕ(a) | ϕ ∈ S} eine euklidische Gradfunktion auf A. Beweis. Es seien a, b ∈ A mit b 6= 0 gegeben. Es gibt ein ϕ ∈ S mit ϕ0 (b) = ϕ(b). Es gibt dann q, r ∈ A mit a = bq + r und 0 ≤ ϕ(r) < ϕ(b). Definitionsgemäß gilt dann auch ϕ0 (r) ≤ ϕ(r) < ϕ(b) = ϕ0 (b). Jeder Integritätsbereich, der also überhaupt eine euklidische Gradfunktion besitzt, hat also eine ausgezeichnete minimale solche. Es sei also A ein Integritätsbereich mit einer minimalen euklidischen Gradfunktion. Für n ∈ N0 S sei An := {a ∈ A | ϕ0 (a) = n} und A′n = A0 ∪ A1 ∪ . . . ∪ An gesetzt, so daß A = n≥0 An . Es gilt dann A0 = A′0 = {0}. Denn einerseits gilt 0 < ϕ0 (b) für alle b 6= 0 nach Definition 5.26, und andererseits gilt ϕ0 (0) = 0, weil man im Falle ϕ0 (0) > 0 durch ϕ′ (0) := 0 und ϕ′ (a) = ϕ0 (a) für a 6= 0 eine neue Gradfunktion erhielte, die der Minimalität von ϕ0 widerspräche. Lemma 5.28 — Für alle n > 0 gilt: An = {a ∈ A \ A′n−1 | Die Komposition A′n−1 → A → A/(a) ist surjektiv.}. Beweis. Es bezeichne Bn die rechte Seite der Identität im Lemma. Damit ϕ0 eine euklische Gradfunktion ist, muß es für a 6= 0 in jeder Restklasse A/(a) mindestens einen Vertreter r mit ϕ(r) < ϕ(a) geben. Wenn also ϕ0 (a) = n, muß die Zusammensetzung A′n−1 → A → A/(a) surjektiv sein, d.h. a ∈ Bn . Das zeigt An ⊂ Bn . Wenn nun umgekehrt a ∈ Bn ist, so ist die Abbildung ψ mit ψ(a) = n und ψ(b) = ϕ0 (b) für alle b 6= a wieder eine euklidische Normfunktion. Aus der Minimalität von ϕ0 folgt ψ = ϕ0 , also ϕ0 (a) = n. Damit hat man auch die Umkehrung Bn ⊂ An . In gewissen Fällen kann man das Lemma zur Berechnung der minimalen Gradfunktion verwenden: Beispiel 5.29. — Im Ring Z hat man zunächst A0 = {0}. Die Menge A1 besteht dann aus allen a ∈ A mit A/(a) = (0), d.h. den Einheiten von Z, also A1 = {±1} und A′1 = {a | |a| < 21 }. Tatsächlich gilt allgemein: A′n = {a | |a| < 2n } wie man durch Induktion sieht. Daraus folgt: ϕ0 (a) = ⌊log2 (a) + 1⌋ für a 6= 0. Die minimale Gradfunktion unterscheidet sich also sehr von der ’natürlichen’ Gradfunktion a 7→ |a|. 42 Euklidische Ringe Beispiel 5.30. — Im Polynomring K[X] über einem Körper findet man A0 = {0}, A1 = K \ {0} und allgemein An = {f | deg(f ) = n + 1} für n > 0. Die minimale Gradfunktion ist also ϕ0 (f ) = deg(f ) + 1 für f 6= 0. Man kann das Lemma aber auch verwenden, um zu zeigen, daß ein gegebener Ring nicht euklidisch ist. Satz 5.31 — Es sei A ein Integritätsbereich. Die Mengen An , A′n seien rekursiv durch die Festsetzungen A0 = A′0 = {0}, An := {a ∈ A \ A′n−1 | A′n−1 → A → A/(a) ist surjektiv} S und A′n = A′n−1 ∪ An definiert. A ist genau dann euklidisch, wenn A = n≥0 An . S Beweis. Wenn A euklidisch ist, folgt aus Lemma 5.28, daß A = n≥0 An . Gilt umgekehrt diese Gleichheit, so wird durch ϕ(a) := n für a ∈ An eine euklidische Gradfunktion definiert. die Behauptung Es ist aus der rekursiven Definition der Mengen An für einen beliebigen Integritätsbereich klar, daß die Folge A′0 ⊂ A′1 ⊂ A′2 ⊂ . . . stationär wird, sobald einmal A′n = A′n+1 gilt. Daraus ergibt sich das Kriterium: Satz 5.32 — Ist A ein Integritätsbereich und gilt für ein n ∈ N die Beziehung A′n = A′n+1 ( A, so ist A nicht euklidisch. √ 5.8. (*) Der Ring Z[ 12 (1 + −19)]. √ Wir betrachten den Ring Z[ω] = {x0 + x1 ω | xi ∈ Z}, wobei zur Abkürzung ω := 12 (1 + 19i) √ gesetzt sei. Z[ω] ist wirklich ein Ring, denn ω 2 = 41 1 + 2 19i − 19 = −5 + ω. Als Unterring des Körpers C ist Z[ω] nullteilerfrei. Wir zeigen in diesem Unterabschnitt, daß Z[ω] ein Hauptidealring, aber nicht euklidisch ist. Die Normfunktion N : Z[ω] → R, z 7→ |z|2 , nimmt Werte in den ganzen Zahlen, denn N (x0 + x1 ω) = x20 + x0 x1 (ω + ω) + x21 ωω = x20 + x0 x1 + 5x21 , und ist multiplikativ. Deshalb ist x0 + x1 ω genau dann eine Einheit, wenn N (x0 + x1 ω) = 1. Aber die einzigen ganzzahligen Lösungen der Gleichung x20 + x0 x1 + 5x21 = 1 sind x0 = ±1, x1 = 0. Das zeigt: Z[ω]× = {±1}. Satz 5.33 — Z[ω] ist ein Hauptidealring. Beweis. Es sei dazu I ⊂ Z[ω] ein nichttriviales Ideal und x ∈ I \ {0} ein Element mit minimaler Norm N (x) > 0. Falls I kein Hauptideal ist, gibt es ein Element y ∈ I \ (x). Es sei y so gewählt, daß N (y) minimal ist. Wir setzen z = y/x ∈ C∗ und leiten eine Reihe von Ungleichungen für z her, die nicht simultan erfüllbar sind. Das liefert den gesuchten Widerspruch. (1) Indem man gegebenenfalls y durch −y ersetzt, kann man zunächst ohne Einschränkung annehmen, daß Im(z) ≥ 0. (2) Und weil y von minimaler Norm in I \ (x) ist, gilt N (y) ≤ N (y − ux) für alle u ∈ Z[ω]. Das bedeutet N (z) ≤ N (z − u) für alle u ∈ Z[ω], d.h. z liegt vom Ursprung nicht weiter entfernt als von jedem anderen Punkt des Gitters Z[ω]. Das läßt für z nur den folgenden schraffierten Bereich zu (linkes Bild): Algebravorlesung im Wintersemester 2015 43 (3) Weil x ein nichttriviales Element in I von minimaler Norm ist, gilt N (uy − vx) ≥ N (x) für alle u, v ∈ Z[ω] mit uy 6= vx, also speziell N (y) ≥ N (x) sowie N (2y − ωx) ≥ N (x) und N (2y + ωx) ≥ N (x). Deshalb muß z außerhalb der Vereinigung der offenen Kreisscheiben vom Radius 1 um den Ursprung und vom Radius 12 um die Punkte ω/2 und (ω − 1)/2 = −ω/2 liegen (rechtes Bild). Da die Kreisscheiben das schraffierte Fünfeck ganz überdecken, gibt es keine Lösungen für z. Wir benötigen noch einen Satz aus der Zahlentheorie: Satz 5.34 — Für jedes nichttriviale Elemente u ∈ Z[ω] gilt: |Z[ω]/(u)| = N (u). Beweis. 1. Schritt: Wenn u ∈ Z, ist die Aussage sicher richtig: Ist nämlich n1 , . . . , n|u| ∈ Z ein Restklassensystem von Z modulo u, so bilden die Elemente ni + nj ω ein Restklassensystem von Z[ω] modulo u. Die Anzahl dieser Elemente ist |Z[ω]/(u)| = |u|2 = N (u). 2. Schritt: Weil ω = −ω+1, geht der Unterring Z[ω] ⊂ C unter komplexer Konjugation isomorph in sich über. Dabei wird das Ideal (u) auf das Ideal (u) abgebildet, und man erhält einen Ringisomorphismus Z[ω]/(u) → Z[ω]/(u), a mod u 7→ a mod u. Das zeigt: |Z[ω]/(u)| = |Z[ω]/(u)|, und es gilt sowieso N (u) = N (u). 3. Für beliebige nichttriviale Elemente u, v ∈ Z[ω] gilt N (uv) = N (u)N (v) und |Z[ω]/(uv)| = |Z[ω]/(u)| · |Z[ω]/(v)|. Weil nämlich (uv) ⊂ (u), hat man einen natürlichen surjektiven Ringhomomorphismus π : Z[ω]/(uv) → Z[ω]/(u), a mod uv 7→ a mod u. Der Kern besteht aus allen Restklassen der Form tu mod vu mit t ∈ Z[ω]. Deshalb ist die Abbildung Z[ω]/(v) → ker(π), t mod v 7→ tu mod vu ein Isomorphismus von Gruppen. Es folgt: |Z[ω]/(u)| = [Z[ω]/(uv) : ker(π)] = |Z[ω]/(uv)| / |Z[ω]/(v)|, wie behauptet. 4. Für ein beliebiges nichttriviales u ist a := uu ∈ Z. Deshalb schließt man wie folgt: |Z[ω]/(u)|2 = = |Z[ω]/(u)| · |Z[ω]/(u)| = |Z[ω]/(uu)| |Z[ω]/(a)| = N (a) = N (uu) = N (u)N (u) = N (u)2 . Das war zu zeigen. Damit haben wir alle Bausteine zusammen, um den letzten Stein der Gesamtargumentation zu setzen: Satz 5.35 — Z[ω] ist nicht euklidisch. Beweis. Wir wollen das Kriterium 5.32 verwenden. Man hat A0 = {0} und A1 = Z[ω]× = {±1}. Deshalb hat A′1 = {−1, 0, 1} drei Elemente, und wenn A′1 → A/(a) für ein a ∈ A2 surjektiv sein 44 Euklidische Ringe soll, darf A/(a) höchstens aus 3 Restklassen bestehen. Nach dem vorstehenden Lemma geht das nur, wenn N (a) ≤ 3. Aber die einzigen ganzzahligen Lösungen der Ungleichung N (x0 + x1 ω) = x20 + x0 x1 + 5x21 = (x0 + 12 x1 )2 + 19 2 x 4 1 ≤3 sind x1 = 0 und x20 ≤ 1, also x0 + x1 ω ∈ A′1 . Deshalb ist A2 leer. Aus A′1 = A′2 folgt mit 5.32, daß Z[ω] nicht euklidisch ist. 5.9. Aufgaben. Aufgabe 5.36. (Satz von Wilson) — Man zeige: (1) Es sei p eine Primzahl. Zeige, daß (p − 1)! ≡ −1 mod p. 2 ! ≡ −1 mod p. (2) Für ungerade Primzahlen der Form p = 4m + 1 gilt p−1 2 [Hinweis: Man kann dies auf verschiedene Weisen angehen: Man gruppiert die Elemente in (Z/p)× zu Paaren {x, x1 }. Oder man wählt eine Primitivwurzel g modulo p.] Aufgabe 5.37. (Primfaktorzerlegungen in Z[i]) — Es bezeichne ge: die komplexe Konjugation. Zei- (1) Die Einheiten in Z[i] sind 1, i, −1, −i. (2) Wenn π = a + bi ein Primelement in Z[i] ist und ein Primfaktor von n ∈ Z, so ist ππ ein Teiler von n. (3) Alle Primelemente in Z[i] sind bis auf Einheiten entweder Primzahlen aus Z oder von der Form a + bi mit natürlichen Zahlen a, b, für die a2 + b2 eine Primzahl ist. Zum Beispiel hat die Primfaktorzerlegungen 2 = (−i)(1+i)2 , 5 = (2+3i)(2−3i) in Z[i], während 3 unzerlegbar ist, weil sich 3 nicht in der Form a2 + b2 mit ganzen Zahlen a, b ∈ Z schreiben läßt. Zeige: (4) Ist p eine Primzahl mit p ≡ 3 mod 4, so ist p auch in Z[i] prim. (5) Ist p ≡ 1 mod4, so gibt es natürliche Zahlen a, b mit a2 + b2 = p. Insbesondere ist p in Z[i] nicht prim, sondern besitzt eine Faktorisierung p = (a + bi)(a − bi). [Hinweise zu (5): Wähle m mit m2 ≡ −1 mod p, so daß also m2 + 1 = pℓ, und bestimme einen ggT für p und m + i in Z[i].] Aufgabe 5.38. — Bekanntlich gilt die Formel (a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 . Zeige: Eine natürliche Zahl n läßt sich genau dann also Summe von genau zwei Quadratzahlen schreiben, wenn n keinen ungeraden Primfaktor p mit p ≡ 3 mod 4 hat. (Unter einer Quadratzahl wird hier eine Zahl der Form u2 mit u ∈ Z verstanden.) Aufgabe 5.39. (Euklidischer Algorithmus im Ring der Hurwitzquaternionen) — Wir betrachen im Ring H der Quaternionen die Teilmenge H := { 21 (a + bi + cj + dk) | a, b, c, d ∈ Z, die alle gerade oder alle ungerade sind.}. Zeige: (1) H ist ein (nichtkommutativer) Ring mit 1, der Zh1, i, j, ki als Unterring enthält. (2) Für alle z ∈ H ist δ(z) := zz ganzzahlig, und es gilt δ(zw) = δ(z)δ(w). (3) Für alle z ∈ H gibt es ein q ∈ H mit δ(z − q) < 1. Der Ring H ist nichtkommutativ. Deshalb müssen wir bei der Division mit Rest eine linke und eine rechte Variante unterscheiden. Zeige: (4) Sind a, b ∈ H mit b 6= 0, so gibt es Elemente q1 , r1 und q2 , r2 ∈ H mit a = bq1 + r1 = q2 b + r2 und δ(r1 ) < δ(b) und δ(r2 ) < δ(b). Algebra I im Wintersemester 2015 45 §6. Faktorielle Ringe 6.1. Primfaktorzerlegungen. Definition 6.1. — Es sei A ein Integritätsbereich und f ∈ A \ ({0} ∪ A× ). (1) f ∈ A ist irreduzibel, wenn f = ab ⇒ f ∼ a oder f ∼ b. (2) f ∈ A ist prim, wenn f |ab ⇒ f |a oder f |b. Lemma 6.2 — Jedes Primelement ist irreduzibel. Beweis. Es sei f prim und f = ab. Dann gilt ohne Einschränkung f |a, also a = f c. Daraus folgt f = f bc, also f (1 − bc) = 0. Weil A ein Integritätsbereich ist und f 6= 0, folgt 1 = bc, so daß b und c Einheiten sein müssen und f ∼ a. Beispiel 6.3. — Die Umkehrung ist im Allgemeinen falsch, wie das folgende Beispiel zeigt: Wir betrachten den Ring (6.1) √ √ A = Z[ −5] = {a + b −5 | a, b ∈ Z} ⊂ C. √ √ Die Normabbildung N : A → Z, a + b −5 7→ |a + b −5|2 = a2 + 5b2 , ist multiplikativ, d.h. N (xy) = N (x)N (y) für alle x, y ∈ A. Wenn x eine Einheit mit Inversem y ist, folgt N (x)N (y) = √ N (xy) = N (1) = 1. Umgekehrt hat x = a + b −5 die Norm N (x) = 1 nur dann, wenn a2 + 5b2 = 1, was nur für b = 0 und a = ±1, also x = ±1 möglich ist. Deshalb sind ±1 die einzigen Einheiten in A. Weiter ist z ∈ A sicher irreduzibel, wenn in jeder nichttrivialen Faktorzerlegung N (z) = u · v wenigstens einer der Faktoren u oder v nicht im Bild von N liegt. Nun gibt es in A die Zerlegung (6.2) 6 = 2 · 3 = (1 + √ −5)(1 − √ −5). Die Normen (6.3) N (2) = 4, N (3) = 9, N (1 ± √ −5) = 6 haben in jeder nichttrivialen Zerlegung wenigstens einen Faktor 2 oder 3, während diese Zahlen in √ der Menge im(N ) = {1, 4, 5, 6, . . .} nicht vorkommen. Deshalb sind 2, 3 und 1 ± −5 irreduzibel. √ √ Aber keiner dieser Faktoren ist prim, denn aus 2 · 3 = (1 + −5)(1 − −5) müßte für einen primen Faktor folgen, daß er einen der beiden Faktoren auf der anderen Seite teilt. Dasselbe müßte dann für ihre Normen gelten. Aber zwischen 4, 6 und 9 gibt es keine Teilbarkeitsbeziehungen. √ √ All das zeigt, daß 2, 3 und 1 ± −5 irreduzible Elemente in Z[ −5] sind, die aber nicht prim sind. Definition 6.4. — Ein kommutativer Ring A heißt faktoriell, wenn A nullteilerfrei ist und wenn jedes Element a ∈ A \ {0} eine Produktdarstellung a = ǫ · p1 · . . . · pℓ mit einer Einheit ǫ ∈ A× und primen Elementen pi , i = 1, . . . , ℓ, ℓ ∈ N0 , besitzt. Lemma 6.5 — Es sei A ein faktorieller Ring und a ∈ A \ {0}. Die Primfaktorzerlegung a = ǫ·p1 ·. . .·pℓ ist eindeutig bis auf Einheiten und die Reihenfolge der Faktoren, d.h. sind a = ǫ·p1 ·. . .·pℓ und a = ǫ′ · p′1 · . . . · p′n zwei Primfaktorzerlegungen, dann gilt ℓ = n, und es gibt eine Permutation π ∈ Sn mit der Eigenschaft, daß pi ∼ p′π(i) für i = 1, . . . , ℓ. Beweis. Ohne Einschränkung ist ℓ ≤ n. Wenn ℓ = 0, ist a = ε eine Einheit. Dann sind auch alle Faktoren ε′ und p′i Einheiten. Das geht nur, wenn auch n = 0. Es sei also ℓ > 0. Dann teilt p1 das Element a = ε′ p′1 · · · p′n , also auch einen der Faktoren p′i . Nach Umordnung kann man annehmen, daß es p′1 ist. Es gilt nun p′1 = p1 x mit einem x ∈ A. Da p′1 46 Faktorielle Ringe irreduzibel ist und p1 keine Einheit, ist x eine Einheit, d.h. p1 ∼ p′1 . Nach Kürzen von p1 hat man Zerlegungen εp2 · · · pℓ = (ε′ x)p′2 · · · p′n . (6.4) Induktion nach ℓ zeigt n = ℓ und p′i ∼ pi für i = 2, . . . , n, nach passender Umordnung. Satz 6.6 — Es sei A ein Integritätsbereich. A ist genau dann faktoriell, wenn gilt: (1) Jedes irreduzible Element in A ist prim. (2) Jede aufsteigenden Kette von Hauptidealen in A wird stationär. Beweis. Es sei zunächst A faktoriell und f ein irreduzibles Element. Nach Voraussetzung gibt es eine Primfaktorzerlegung f = εp1 · · · pℓ . Da f irreduzibel ist, gilt f |pi für ein i. Weil pi auch irreduzibel ist, hat man f ∼ pi für ein i. Insbesondere ist f prim. Weiter sei (a1 ) ⊂ (a2 ) ⊂ (a3 ) ⊂ . . . eine aufsteigende Kette von Hauptidealen. Das ist äquivalent dazu, daß a2 |a1 , a3 |a2 , etc. Aus der Eindeutigkeit der Primfaktorzerlegung folgt, daß die Primfaktoren von a2 bis auf Assoziation eine Teilmenge der Primfaktoren von a1 sind. Sind die Primfaktoren einschließlich Vielfachheit gleich, unterscheiden sich a1 und a2 höchstens um eine Einheit, was (a1 ) = (a2 ) impliziert. Ist also die Inklusion (a2 ) ⊂ (a1 ) echt, so hat a2 weniger Primfaktoren als a1 . In der Idealkette kann echte Inklusion demnach nur endlich oft vorkommen. Es gelte umgekehrt die Bedingung (2). Ein Element a ∈ A \ {0} heiße zerlegbar, wenn sich a als Produkt aus Einheiten und irreduziblen Elementen darstellen läßt. Offenbar sind alle Einheiten und alle irreduziblen Elemente zerlegbar, ebenso alle Produkte aus zerlegbaren Elementen. Angenommen, es gibt ein unzerlegbares Element a ∈ A \ {0}. Dann ist a weder eine Einheit noch irreduzibel und besitzt deshalb eine Zerlegung a = a′ a′′ in Faktoren, die beide keine Einheit sind. Wenigstens einer der Faktoren ist ebenfalls unzerlegbar, etwa a′ . Wir setzen a1 = a und a2 = a′ und verfahren mit a′ analog. Dies führt auf eine Idealkette (a1 ) ⊂ (a2 ) ⊂ . . ., in der alle Inklusionen echt sind, im Widerspruch zur Annahme. Demnach besitzen alle nichttrivialen Elemente in A eine multiplikative Zerlegung in irreduzible Elemente und Einheiten. Gilt zusätzlich die Bedingung (1), so besitzt jedes nichttriviale Element eine Primfaktorzerlegung. Satz 6.7 — Nullteilerfreie Hauptidealringe sind faktoriell. Beweis. Es sei A ein nullteilerfreier Hauptidealring. Dann wird jede aufsteigende Kette von Idealen stationär. Nach Satz 6.6 genügt es zu zeigen, daß jedes irreduzible Element f prim ist. Es gelte dazu f |ab und f6 | a. Das Ideal (f, a) ist ein Hauptideal, etwa (f, a) = (c). Es bestehen dann Gleichungen (6.5) f = mc, a = nc, c = pf + qa, ab = f r mit geeigneten Koeffizienten m, n, p, q, r ∈ A. Da f irreduzibel ist, ist entweder c ∼ f oder c ∼ 1. Der erste Fall ist wegen c|a und f6 | a ausgeschlossen. Im zweiten Falle folgt b = (bc−1 )c = (bc−1 )(pf + qa) = c−1 (bpf + qf r) = c−1 (bp + qr)f , also f |b. Es sei A ein faktorieller Ring und D ⊂ A ein Vertretersystem für die Klassen assoziierter Primelemente, d.h. jedes Primelement ist zu genau einem Primelement in D assoziiert. In manchen Ringen läßt sich ein solches Vertretersystem durch eine einfache Konvention auszeichnen: In Z unterscheiden sich assoziierte Primelemente höchsten um ein Vorzeichen und wir können D = {p ∈ N | p Primzahl} wählen. Im Polynomring K[X] über einem Körper X unterscheiden sich assoziierte Primelemente höchstens um eine nichttriviale Konstante. In jeder Klasse gibt es also genau ein normiertes Polynom, d.h. ein Polynom mit Leitkoeffizienten 1, und wir können D = {f | f ist normiert und irreduzibel} setzen. Algebra I im Wintersemester 2015 47 Mit einem solchen Vertretersystem D können wir jedes Element a ∈ A \ {0} auf eindeutige Weise in der Form Y ν (6.6) a=u p p p∈D schreiben, wobei νp = 0 für fast alle p ∈ D. Man nennt ordp (a) := νp die Ordnung von a bezüglich p. Wir setzen formal ordp (0) := ∞. Man verifiziert leicht die Eigenschaften: (1) ordp (ab) = ordp (a) + ordp (b) für alle a, b ∈ A und p ∈ D. (2) a|b ⇔ ordp (a) ≤ ordp (b) für alle p ∈ D. Inbeondere ist für ein Tupel a1 , . . . , an ∈ A, die nicht alle verschwinden, die Zahl Y min{ord (a ) | i=1,...,n} p i p (6.7) d= d∈D ein größter gemeinsamer Teiler von a1 , . . . , an . Zwischen den Begriffen euklidischer Ring, Hauptidealbereich und faktorieller Ring haben wir also die folgenden Beziehungen: (6.8) {euklidischer Ringe} ⊂ {Hauptidealbereiche} ⊂ {faktorielle Ringe} ⊂ {Integritätsbereiche} In faktoriellen Ringen kann man immer größte gemeinsame Teiler finden. Diese sind aber nur durch die Primfaktorzerlegung, also multiplikativ bestimmt. In Hauptidealbereichen gibt es eine additive Darstellung des größten gemeinsamen Teilers, und in euklidischen Ringen kann man die zugehörigen Bézout-Koeffizienten mit dem euklidischen Algorithmus berechnen. √ Die Inklusionen sind echt: Wir haben in Abschnitt 5.8 gesehen, daß der Ring Z[ 12 (1+ −19)] ein nullteilerfreier Hauptidealring, aber nicht euklidisch ist. Die Ringe Z[X] und C[X, Y ] sind faktoriell, wie wir bald sehen werden (Folgerung 6.13), aber sicher keine Hauptidealringe, denn die Ideale √ (2, X) bwz. (X, Y ) sind keine Hauptideale. Und der Ring Z[ −5] ist als Unterring des Körpers C sicher ein Integritätsbereich, aber nach Beispiel 6.3 nicht faktoriell. 6.2. Der Satz von Gauß. Im Folgenden wollen wir für einen faktoriellen Ring A die Eigenschaften von A[X] untersuchen. Dazu betrachten wir auch noch den Quotientenkörper K = Q(A) und den zugehörigen Polynomring, so daß wir die folgenden Inklusionsverhältnisse haben: (6.9) A ∩ K ⊂ ⊂ A[X] ∩ K[X] Wir verwenden, daß A nach Voraussetzung faktoriell ist und daß K[X] ein Hauptidealring ist, weil K ein Körper ist. Zunächst erweitern wir die Primfaktorzerlegung auf den Quotientenkörper: Für a = b/c ∈ Q(A)× mit b, c ∈ A und p ∈ D bezeichne (6.10) ordp (a) := ordp (b) − ordp (c) ∈ Z die Ordnung von a. Um die Wohldefiniertheit zu verifizieren, ist zu zeigen, daß aus b/c = b′ /c′ folgt ordp (b) − ordp (c) = ordp (b′ ) − ordp (c′ ) für alle p ∈ D. Aber das folgt aus der Additivität der Ordnung, angewandt auf bc′ = b′ c. Aus der Eindeutigkeit der Primfaktorzerlegung folgt nun, daß (6.11) ordp : Q(A)× → Z ein Gruppenhomomorphismus ist. Mit diesen Bezeichnungen haben wir dann für jedes a ∈ Q(A)× eine eindeutige Zerlegung Y ord (a) p p (6.12) a=u p∈D 48 Faktorielle Ringe mit einer Einheit u ∈ A. Definition 6.8. — Es sei A ein faktorieller Ring, D ⊂ A ein Repräsentantensystem der Klassen assoziierter Primelemente. (1) Für ein Tupel {a0 , . . . , an } von Elementen in Q(A), die nicht alle gleichzeitig verschwinden, heißt Y min{ord (a )|i=0,...,n} p i p ∈ Q(A) (6.13) Inh(a0 , . . . , an ) = p∈D der Inhalt des Tupels. P n ∈ Q(A)[X] \ {0} heißt Inh(f ) = Inh(f0 , . . . , fn ) der Inhalt des (2) Für f = n i=0 fn X Polynoms f . (3) Ein Polynom f ∈ Q(A)[X] \ {0} heißt primitiv, wenn Inh(f ) = 1. Im Folgenden gehen wir, wenn von einem faktoriellen Ring A die Rede ist, immer davon aus, daß ein Vertretersystem D ⊂ A für Primelemente gewählt ist, und die Begriffe ’Inhalt’ und ’primitiv’ beziehen sich stets auf dieses fest gewählte System. Man verifiziert leicht die folgenden Aussagen: (1) Für jedes a ∈ Q(A)× ist a/ Inh(a) eine Einheit in A. (2) Für a ∈ Q(A)× und f ∈ Q(A)[X] \ {0} gilt Inh(af ) = Inh(a) Inh(f ). (3) Ein nichttriviales Polynom f ∈ Q(A)[X] ist genau dann primitiv, wenn f ∈ A[X] und wenn die Koeffizienten von f teilerfremd sind. (4) Für f ∈ Q(A)[X] \ {0} ist f / Inh(f ) primitiv. Es folgen eine Reihe von Sätzen, die in der Regel nach Gauß benannt werden. Gauß beweist in Disq. Arith. Art. 42 eigentlich den folgenden Satz: Sind f, g ∈ Q[X] normierte Polynome von positivem Grad und ist f g ∈ Z[X], dann haben auch f und g ganzzahlige Koeffizienten. Die Beweismethode verallgemeinert sich auf faktorielle Ringe und führt zu den folgenden Aussagen: Lemma 6.9 — Es sei A ein faktorieller Ring. Sind f, g ∈ A[X] nichttriviale primitive Polynome, so ist auch f g ∈ A[X] primitiv. Beweis. Wir machen den Ansatz (6.14) f = f0 + f1 X + . . . + fn X n , g = g 0 + g1 X + . . . + g m X m , und f g =: h = h0 + h1 X + . . . + hn+m X n+m . Es sei ein Primelement p ∈ D fixiert. Da f und g primitiv sind, gibt es Indizes i und j mit ordp (fi ) = 0 und ordp (gj ) = 0. Es seien i0 bzw. j0 die größten Indizes mit dieser Eigenschaft. Das bedeutet, daß p6 | fi0 aber p|fi für alle i > i0 , und analog p6 | gj0 aber p|gi für alle j > j0 . Mit der Bezeichung k0 = i0 + j0 gilt dann: Im Ausdruck X X (6.15) h k 0 = f i 0 gj 0 + fi gk0 −i + fk0 −j gj . i>i0 j>j0 ist im zweiten Summanden jeweils der erste Faktor durch p teilbar, und im dritten Summanden jeweils der zweite Faktor. Andererseits ist fi0 gi0 nicht durch p teilbar. Folglich ist hi0 +j0 nicht durch p teilbar und somit p kein Faktor des Inhalts von h. Da dies für alle p ∈ D gilt, ist h primitiv. Lemma 6.10 — Es sei A ein faktorieller Ring. Für nichttriviale Polynome f, g ∈ Q(A)[X] gilt: Inh(f g) = Inh(f ) Inh(g). Beweis. Die Polynome f / Inh(f ) und g/ Inh(g) sind primitiv, nach Lemma 6.9 also auch der Bruch f g/(Inh(f ) Inh(g)). Daraus folgt Inh(f g) fg . = (6.16) 1 = Inh Inh(f ) Inh(g) Inh(f ) Inh(g) Algebra I im Wintersemester 2015 49 Satz 6.11 — Es sei A ein faktorieller Ring. Ein nichtkonstantes Polynom f ∈ A[X], das in A[X] irreduzibel ist, ist auch in Q(A)[X] irreduzibel. Beweis. Es sei f ∈ A[X] ein nichtkonstantes irreduzibles Polynom. Dann ist f insbesondere primitiv und Inh(f ) = 1. Angenommen, es gibt eine Zerlegung f = gh mit nichtkonstanten Polynomen g, h ∈ Q(A)[X]. Dann gilt 1 = Inh(f ) = Inh(g) Inh(h) und somit (6.17) f= h g . Inh(g) Inh(h) Auf der rechten Seite stehen zwei nichtkonstante Polynome in A[X] im Widerspruch zur Irreduzibilität von f . Satz 6.12 (Satz von Gauß) — A faktoriell ⇒ A[X] faktoriell. Beweis. A[X] genügt der Kettenbedingung für Hauptideale: Hat man (f1 ) ⊂ (f2 ) ⊂ . . ., so fällt der Grad der Polynome fn monoton und muß konstant werden, etwa für alle n ≥ n0 . Dann ist fn /fn0 =: an ∈ A für n ≥ n0 eine Folge von Ringelementen mit (an ) ⊂ (an+1 ) ⊂ . . .. Weil A der Kettenbedingung für Hauptideale genügt, wird auch diese Kette stationär. Nach Satz 6.6 genügt es zu zeigen, daß jedes in A[X] irreduzible Element f prim ist. Wenn f konstant ist, ist dies klar. Es sei also f ein nicht konstantes, irreduzibles Polynom, und es gelte f |ab für Polynome a, b ∈ A[X]. Nach Satz 6.11 ist f in Q(A)[X] irreduzibel, und weil Q(A)[X] ein Hauptidealring ist, auch prim. Ohne Einschränkung können wir daher annehmen, daß f |a in Q(A)[X], etwa a = f c mit c ∈ Q(A)[X]. Gemäß Lemma 6.10 hat man (6.18) Inh(a) = Inh(f ) Inh(c) = Inh(c) ∈ A. Aber dann ist auch c ∈ A[X]. Deshalb ist f schon in A[X] ein Teiler von a. Zusammengenommen zeigt dies, daß f prim ist. Durch Induktion über die Anzahl der Variablen erhält man: Folgerung 6.13 — Für jeden faktoriellen Ring A ist A[X1 , . . . , Xℓ ] faktoriell. Insbesondere ist Z[X1 , . . . , Xℓ ] und für jeden Körper K auch K[X1 , . . . , Xℓ ] faktoriell. 6.3. Irreduzibilitätskriterien. Die folgenden Kriterien erweisen sich als außerordentlich nützlich, wenn man die Irreduzibilität eines Polynoms testen will. Satz 6.14 — Es sei K ein Körper. Ein nichtkonstantes Polynom f ∈ K[X] vom Grad ≤ 3 ist genau dann irreduzibel, wenn es keine Nullstelle hat. Beweis. Das ist offensichtlich: In jeder Zerlegung müßte wenigstens ein linearer Faktor vorkommen. Satz 6.15 (Eisensteinkriterium) — Es sei A ein faktorieller Ring und p ein Primelement in A. Gilt für das nichtkonstante primitive Polynom f = f0 + . . . + fn X n , daß (6.19) p6 | fn , p|fn−1 , ..., p|f0 , p26 | f0 , so ist f in A[X] irreduzibel. Beweis. Es sei f = gh eine Zerlegung mit Polynomen g = g0 +. . .+gm X m , h = h0 +. . .+hℓ X ℓ ∈ A[X], die keine Einheiten sind. Da f primtiv ist, sind g und h auch nicht konstant. Wir betrachten die kanonische Projektion A[X] → A/(p)[X] und schreiben f für das Bild von f etc. Nach Annahme ist gh = f = X n . Notwendigerweise ist dann g = g m X m und h = hℓ X ℓ . Das bedeutet, daß p 50 Faktorielle Ringe ein Teiler von g0 und von h0 ist. Aber dann teilt p2 das Produkt g0 h0 = f0 , im Widerspruch zur Annahme. Satz 6.16 (Reduktionskriterium) — Es sei A ein faktorieller Ring und p ⊂ A ein Primideal mit Restklassenring A. Es sei f ∈ A[X] ein nichtkonstantes primitives Polynom mit Lc(f ) 6∈ p. Ist die Reduktion f ∈ A[X] irreduzibel, so ist auch f irreduzibel. Beweis. Angenommen, f ist nicht irreduzibel und besitzt eine Zerlegung f = gh, in der g und h keine Einheiten sind. Da f primitiv ist, können g und h keine Konstanten sein. Die Annahme Lc(f ) 6∈ p bedeutet, daß f und f denselben Grad haben. Wegen f = gh haben daher auch g und h denselben Grad wie g bzw. h und sind nichtkonstante Polynome. Das Widerspricht der Annahme, daß f irreduzibel ist. Algebra I Wintersemester 2015 51 §7. Grundbegriffe der Gruppentheorie 7.1. Gruppen, Homomorphismen, Erzeuger. Die folgenden Grundbegriffe der Gruppentheorie sollten aus den Anfängervorlesungen bekannt sein. Definition 7.1. — Eine Menge G mit einer assoziativen Verknüpfung ◦ : G × G → G ist eine Halbgruppe. Ein Element e einer Halbgruppe G ist ein Neutralelement, wenn a ◦ e = a = e ◦ a für alle a ∈ G. Falls ein Neutralelement existiert, ist es eindeutig. Eine Halbgruppe mit einem Neutralelement ist ein Monoid. Wenn in einem Monoid die Relation a ◦ b = e besteht, heißt b ein Rechtsinverses von a und a ein Linksinverses von b. Ein Monoid ist eine Gruppe, wenn jedes Element ein Rechtsinverses besitzt. Die Gruppe, die nur aus dem Neutralelement besteht, heißt die triviale Gruppe und wird mit dem Symbol 1 bezeichnet. Wenn kein anderes spezifisches Symbol für die Gruppenmultiplikation vereinbart ist, schreiben wir a · b und kürzer ab für die Verknüpfung und verwenden wegen der Gültigkeit des Assoziativitätsgesetzes Klammern nur zur graphischen Hervorhebung bestimmter Teile eines Produkts oder lassen sie ganz weg. Lemma 7.2 — Ist G eine Gruppe und b ein Rechtsinverses von a, so ist b auch ein Linksinverses von a und eindeutig bestimmt. Es gelten die Rechenregeln e−1 = e, (a−1 )−1 = a und (ab)−1 = b−1 a−1 . Man spricht deshalb einfach vom Inversen von a und schreibt es als a−1 Beweis. Es sei also b ein Rechtsinverses von a und c ein Rechtsinverses von b. Dann folgt: c = ec = (ab)c = a(bc) = ae = a. Somit ist a ein Links- und ein Rechtsinverses von b. Ist b′ ein anderes Rechtsinverses von b, so hat man b = be = b(ab′ ) = (ba)b′ = eb′ = b′ . Von den Rechenregeln sind die beiden ersten trivial, und die dritte ergibt sich aus (ab)(b−1 a−1 ) = a(bb−1 )a−1 = aa−1 = e. Definition 7.3. — Eine Halbgruppe, ein Monoid oder eine Gruppe heißt abelsch8, wenn die Verknüpfung kommutativ ist, d.h. wenn g ◦ h = h ◦ g für je zwei Elemente g, h ∈ G. Häufig wird die Verknüpfung in einer abelschen Gruppe additiv geschrieben, d.h. mit dem Symbol +. In diesem Falle wird das Neutralelement meist mit 0 bezeichnet und das Inverse zu g mit −g. Die triviale Untergruppe einer abelschen Gruppe wird in der Regel mit dem Symbol 0 bezeichnet. Definition 7.4. — Eine Teilmenge H ⊂ G ist eine Untergruppe, wenn H nicht leer ist, wenn h ◦ h′ ∈ H für alle h, h′ ∈ H, und wenn H mit der Einschränkung der Verknüpfung wieder eine Gruppe ist. Eine Untergruppe H < G heißt normal oder ein Normalteiler, wenn ghg −1 ∈ H für alle h ∈ H und g ∈ G. Um zu prüfen, ob eine nichtleere Teilmenge H ⊂ G eine Untergruppe ist, genügt es zu verifizieren, daß gh−1 ∈ H für alle g, h ∈ H. Gelegentlich schreiben wir H < G, um auszudrücken, daß H eine Untergruppe von G ist. Wir schreiben H ⊳ G um auszudrücken, daß H ein Normalteiler von G ist. Beispiele 7.5. — 1. In abelschen Gruppen ist jede Untergruppe ein Normalteiler. 2. Das Zentrum einer Gruppe ist die Menge (7.1) Z(G) := {g ∈ G | hg = gh für alle h ∈ G}. 8Niels Abel, norwegischer Mathematiker, b5. August 1802 auf Finnøy, d6. April 1829 in Froland. 52 Grundbegriffe der Gruppentheorie Das Zentrum ist ein Normalteiler von G. 3. Ist H ⊂ G eine Untergruppe, so heißt (7.2) ZG (H) := {g ∈ G | ghg −1 = h für alle h ∈ H} der Zentralisator und (7.3) NG (N ) := {g ∈ G | ghg −1 ∈ H für alle h ∈ H} der Normalisator von H in G. Beides sind Untergruppen in G. Es gilt ZG (H) ∩ H = Z(H) und H ⊂ NG (H). Dabei ist H ein Normalteiler in NG (H). Definition 7.6. — Ein Gruppenhomomorphismus ϕ : G → G′ ist eine Abbildung von Gruppen mit ϕ(gh) = ϕ(g)ϕ(h). Für einen solchen Gruppenhomomorphismus gilt stets ϕ(e) = e′ und ϕ(a)−1 = ϕ(a−1 ) für alle a ∈ G. Ein Gruppenhomomorphismus ϕ ist ein Isomorphismus, wenn ϕ bijektiv ist. In diesem Falle ist die inverse Abbildung ϕ−1 automatisch ein Homomorphismus. Ein Isomorphismus ϕ : G → G von einer Gruppe G in sich selbst heißt Automorphismus von G. Wir bezeichnen einen trivialen Homomorphismus ϕ : G → G′ , der ganz G auf das Neutralelement e′ ∈ G′ abbildet, durch ϕ = e′ . Ist ϕ : G → G′ ein Gruppenhomomorphismus, so ist der Kern ker(ϕ) = ϕ−1 (e′ ) ⊂ G stets ein Normalteiler, das Bild im(ϕ) = ϕ(G) ⊂ G′ in der Regel aber zunächst nur eine Untergruppe. Definition 7.7. — Eine endliche oder unendliche Folge (7.4) ϕ ψ . . . −→ Gn−1 −−→ Gn −−→ Gn+1 . . . von Gruppenhomomorphismen heißt exakt an der Stelle Gn , wenn ker(ψ) = im(ϕ). Zum Beispiel ist eine Sequenz 1 → G′ → G exakt an der Selle G′ , wenn G′ → G injektiv ist, und G → G′′ → 1 ist exakt an der Stelle G′′ , wenn G → G′′ surjektiv ist. Definition 7.8. — Ist S eine Teilmenge einer Gruppe G, so bezeichnet hSi die von S erzeugte T Untergruppe. Definitionsgemäß ist hSi = S⊂H H, wobei H durch die Menge der Untergruppen, die S enthalten, läuft. Alternativ ist (7.5) hSi = {s1 · . . . · sn | n ∈ N0 , s1 , . . . , sn ∈ S ∪ S −1 }. Im Falle der leeren Menge ist h∅i = {e} die triviale Untergruppe. S ist ein Erzeugersystem von G, wenn G = hSi. Eine Gruppe heißt endlich erzeugt, wenn sie ein endliches Erzeugendensystem besitzt. Eine Gruppe, die von einem Element erzeugt wird, heißt zyklisch. Ist G eine zyklische Gruppe mit einem Erzeuger g, so ist die Abbildung ϕ : Z → G, n 7→ g n , ein surjektiver Gruppenhomomorphismus. Der Kern ist entweder die trivialer Untergruppe {0}, oder die Menge (m) = {nm | n ∈ Z} einer natürlichen Zahl m. Im ersten Fall ist G isomorph zu Z, im zweiten Fall zu Z/m. 7.2. Nebenklassen, Index, Faktorgruppen. Definition 7.9. — Für eine Untergruppe H < G und ein Gruppenelement a ∈ G bezeichnet (7.6) aH = {ah | h ∈ H} die von a erzeugte Linksnebenklasse von H und (7.7) Ha = {ha | h ∈ H} die von a erzeugte Rechtsnebenklasse zu H. Die Menge aller Linksnebenklassen wird mit G/H, die Menge aller Rechtsnebenklassen mit H\G bezeichnet. Algebra I Wintersemester 2015 53 Das Invertieren von Gruppenelementen i : G → G, g 7→ g −1 , bildet die Linksnebenklasse aH bijektiv auf die Rechtsnebenklasse Ha−1 ab. Die so definierte Abbildung G/H → H\G, aH 7→ Ha−1 , ist eine Bijektion. Dies führt auf den Begriff des Indexes einer Untergruppe: Definition 7.10. — Es sei H ⊂ G eine Untergruppe. (7.8) [G : H] := |G/H| = |H\G| heißt der Index von H in G. Satz 7.11 (Satz von Lagrange9) — Für jede Untergruppe H von G gilt (7.9) |G| = |H| · [G : H] Dabei spielt es keine Rolle, ob G oder H endliche oder unendliche Gruppen sind. Beweis. Offensichtlich haben alle Nebenklassen dieselbe Mächtigkeit wie H. Außerdem sind je zwei Links- bzw. Rechtsnebenklassen entweder disjunkt oder gleich, d.h. G ist die disjunkte Vereinigung ihrer Links- bzw. Rechtsnebenklassen. Die Mächtigkeit jeder Linksnebenklasse ist |H|, die Mächtigkeit der Menge der Linksnebenklassen ist [G : H]. Daraus folgt die Behauptung. Definition 7.12. — Es sei G eine Gruppe. Für g ∈ G heißt (7.10) ord(g) := inf{n ∈ N | g n = e} ∈ N ∪ {∞} die Ordnung von g. Es gilt: ord(g) = |hgi|. Mit dem Satz von Lagrange folgt, daß die Ordnung jedes Elements g ∈ G die Gruppenordnung |G| teilt. Eine Untergruppe N ist genau dann ein Normalteiler, wenn aN = N a für alle a ∈ G. In diesem Falle sind die Mengen G/N und N \G nicht nur gleichmächtig, sondern tatsächlich gleich. Satz 7.13 (Hölder10) — Es sei N ⊳ G ein Normalteiler. Es gibt genau eine Gruppenstruktur auf G/N , bezüglich der die kanonische Projektion π : G → G/N ein Gruppenhomomorphismus ist. G/N mit dieser Gruppenstruktur heißt Faktorgruppe zum Normalteiler N . Beweis. Da π : G → G/N surjektiv ist, ist die Gruppenstruktur durch die Forderung (7.11) g1 N · g2 N = π(g1 ) · π(g2 ) = π(g1 g2 ) = g1 g2 N eindeutig bestimmt. Definiert man umgekehrt die Verknüpfung auf die angegebene Weise, so ist zunächst zu zeigen, daß · wohldefiniert ist. In der Tat, falls g1 N = g1′ N und g2 N = g2′ N , so gibt es n1 , n2 ∈ N mit g1′ = g1 n1 und g2′ = g2 n2 . Daraus folgt (7.12) g1′ g2′ = g1 n1 g2 n2 = g1 g2 (g2−1 n1 g2 )n2 . Weil N ein Normalteiler ist, gilt (g2−1 n1 g2 )n2 ∈ N , was zu zeigen war. Jetzt folgt leicht, daß · eine Gruppenstruktur und π ein Homomorphismus ist. Satz 7.14 (Homomorphiesatz) — Es sei ϕ : G → G′ ein Gruppenhomomorphismus. Dann induziert ϕ einen Isomorphismus G/ker(ϕ) → im(ϕ). Beweis. Indem wir G′ durch ϕ(G) ersetzen, können wir ohne Einschränkung annehmen, daß ϕ surjektiv ist. Es sei N = ker(ϕ). Nun folgt: ϕ(g1 ) = ϕ(g2 ) genau dann, wenn g1−1 g2 ∈ N , d.h. wenn g1 N = g2 N . Deshalb ist ϕ̄ : G/N → G′ , g1 N 7→ ϕ(g1 ), wohldefiniert, ein Gruppenhomomorphismus und bijektiv. 9Joseph-Louis Lagrange, italienischer Mathematiker, b25. Januar 1736 Turin, d10. April 1813 Paris. 10Otto Ludwig Hölder, b22. Dezember 1859 in Stuttgart, d29. August 1937 in Leipzig. 54 Grundbegriffe der Gruppentheorie Satz 7.15 (Universelle Eigenschaft der Faktorgruppe) — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und π : G → G/N die kanonische Projektion. Ein Gruppenhomomorphismus ϕ : G → G′ faktorisiert genau dann über G/N , d.h. es gibt einen Homomorphismus ϕ̄ : G/N → G′ mit ϕ = ϕ̄ ◦ π, wenn N ⊂ ker(ϕ). Beweis. Wenn ϕ̄ existiert, so gilt ϕ(N ) = ϕ̄(π(N )) = ϕ̄(ē) = e′ , d.h. N ⊂ ker(ϕ). Wir nehmen umgekehrt an, die Bedingung N ⊂ ker(ϕ) sei erfüllt. Dann gilt für zwei Repräsentanten g1 , g2 derselben Nebenklasse g1 N = g2 N ∈ G/N , daß g1−1 g2 ∈ N , also ϕ(g1 )−1 ϕ(g2 ) = e′ oder ϕ(g1 ) = ϕ(g2 ). Das zeigt, daß ϕ̄(g1 N ) := ϕ(g1 ) wohldefiniert ist. Es folgt dann sofort, daß ϕ̄ ein Gruppenhomomorphismus ist, und nach Konstruktion gilt ϕ̄ ◦ π = ϕ. 7.3. Konjugationsklassen, Automorphismen, semidirekte Produkte. Es sei im Folgenden G eine multiplikativ geschriebene Gruppe mit Neutralelement e. Definition und Satz 7.16. — Zwei Elemente a, b ∈ G heißen konjugiert, wenn es ein g ∈ G mit b = gag −1 gibt. Konjugiert zu sein, ist eine Äquivalenzrelation. Die zugehörigen Äquivalenzklassen heißen Konjugationsklassen. Beweis. Es bezeichne a ∼ b die Relation: Es gibt ein g mit b = gag −1 . Die Relation ∼ ist reflexiv, denn a = eae−1 für alle a ∈ G, und symmetrisch, denn aus b = gag −1 folgt a = g −1 b(g −1 )−1 . Sie ist auch transitiv: Aus b = gag −1 und c = hbh−1 folgt c = h(gag −1 )h−1 = (hg)a(hg)−1 . Lemma 7.17 — Eine Untergruppe H ⊂ G ist genau dann ein Normalteiler, wenn H mit jedem Element auch dessen gesamte Konjugationsklasse enthält. Die Komposition zweiter Gruppenisomorphismen G → H und H → K ist wieder ein Isomorphismus. Insbesondere ist die Komposition zweiter Automorphismen von G wieder ein Automorphismus. Definition 7.18. — Die Menge Aut(G) aller Automorphismen der Gruppe G ist eine Gruppe unter der gewöhnlichen Verknüpfung von Abbildungen und heißt Automorphismengruppe von G. Satz und Definition 7.19 — Es sei G eine Gruppe. (1) Für jedes g ∈ G ist die Abbildung cg : G → G, a 7→ gag −1 , ein Gruppenisomorphismus, ein sogenannter innerer Automorphismus von G. Ein Automorphismus, der kein innerer Automorphismus ist, heißt äußerer Automorphismus. (2) Für alle g, h ∈ G gilt cg ◦ ch = cgh . Deshalb ist die Abbildung c : G → Aut(G) ein Gruppenhomomorphismus. (3) Es gilt ker(cg ) = Z(G). Das Bild Im(cg ) = {cg | g ∈ G} =: Int(G) ist die Untergruppe der inneren Automorphismen. (4) Für jeden Automorphismus Φ : G → G gilt Φ ◦ cg ◦ Φ−1 = cΦ(g) . Deshalb ist Int(G) ein Normalteiler in Aut(G). Die Faktorgruppe Aut(G)/Int(G) =: Out(G) heißt äußere Automorphismengruppe. Die Sequenz (7.13) i c p 1 −→ Z(G) −→ G −→ Aut(G) −→ Out(G) −→ 1 wo i die Inklusion und p die kanonische Projektion bezeichnen, ist exakt. Beweis. Wegen cg (ab) = g(ab)g −1 = gag −1 gbg −1 = cg (a)cg (b) ist cg : G → G ein Gruppenhomomorphismus. Wegen cg ch (a) = g(hah−1 )g = (gh)a(gh)−1 cgh (a) gilt cg ◦ch = cgh . Insbesondere ist cg ◦ cg−1 = cgg−1 = ce = idG . Deshalb ist cg−1 invers zu cg und somit cg eine Bijektion, also ein Automorphismus. Es gilt cg = eAut(G) = idg genau dann, wenn a = cg (a) = gag −1 Algebra I Wintersemester 2015 55 für alle a ∈ G, d.h. wenn ga = ag für alle a ∈ G. Das ist gleichbedeutend damit, daß a im Zentrum von G liegt. Wendet man einen Automorphismus Φ auf eine cg (x) = gxg −1 an, erhält man (Φ ◦ cg )(x) = Φ(gxg −1 ) = Φ(g)Φ(x)Φ(g −1 ) = Φ(g)Φ(x)Φ(g)−1 = (cΦ(g) ◦ Φ)(x). Das zeigt Φ ◦ cg = cΦ(g) ◦ Φ oder Φ ◦ cg ◦ Φ−1 = cΦ(g) . Das die angegebene Sequenz exakt ist, bedeutet genau, daß Z(G) der Kern von c ist, und daß das Bild von c der Kern der Projektion auf Out(G) ist, was einfach definitionsgemäß so ist. Beispiele 7.20. — 1. Wenn G abelsch ist, gilt Z(G) = G, und jeder innere Automorphismus ist trivial. 2. Die Kleinsche Vierergruppe V4 ∼ = Z/2 × Z/2 besteht aus dem Neutralelement und drei weiteren Elementen a, b, c, für die die Relationen (7.14) a2 = b2 = c2 = e, ab = c, bc = a, ca = b gelten. Jede Bijektion Φ : G → G, die e in sich abbildet und die übrigen Elemente permutiert, ist ein Automorphismus. Deshalb gilt: Aut(V4 ) ∼ = Out(V4 ) ∼ = S3 . (7.15) Satz 7.21 — Jeder Automorphismus der zyklischen Gruppe Z/n hat die Form φk (a) = ka für eine Einheit k ∈ (Z/n)× . Die Abbildung (7.16) Ψ : (Z/n)× −→ Aut(Z/n), k 7→ (a 7→ ka), ist ein Gruppenisomorphismus. Beweis. Für jedes k ∈ Z/n ist die Abbildung φk sicher ein Gruppenhomomorphismus von Z/n in sich. Für zwei Elemente k, ℓ gilt weiter φkl = φk φℓ . Bezeichnet ℓ speziell das Inverse zu einer Einheit k, so gilt φk φℓ = φ1 = id. Deshalb ist φℓ eine zu φk inverse Abbildung. Damit ist einerseits gezeigt, daß, wenn k eine Einheit ist, φk eine Bijektion und damit ein Isomorphismus von Z/n ist. Und andererseits ist die Abbildung (Z/n)× → Aut(Z/n), k 7→ ck , ein Gruppenhomomorphismus. Es sei nun Φ ein beliebiger Automorphismus von Z/n und k := Φ(1). Für jede natürliche Zahl m gilt nun Φ(m) = Φ(1̄ + . . . + 1̄) = Φ(1̄) + . . . + Φ(1̄) = m1̄ = mk. Ist d > 0 ein ggT von k und n, so gilt Φk (n/d) = n(k/d) = 0, d.h. n/d ist ein Element im Kern von Φk und deshalb kongruent zu 0. Das ist nur möglich, wenn d = 1, d.h. wenn k eine Einheit in Z/n ist. Deshalb ist Ψ surjektiv. Schließlich ist Ψ offensichtlich injektiv, denn Ψ(k̄)(1̄) = φk (1̄) = k̄ 6= id(1̄). Für eine beliebige Familie {Gi }i∈I ist das kartesische Produkt Y Gi (7.17) i∈I mit komponentenweise definierter Verknüpfung (7.18) (gi )i∈I ◦ (hi )i∈I := (gi ◦ hi )i∈I wieder eine Gruppe, das sogenannte direkte Produkt der Gruppen Gi . Im Falle einer endlichen Indexmenge I = {i1 , . . . , is } schreibt man Gi1 × . . . × Gis . Es seien nun N und H zwei Gruppen und G = N × H. Die Abbildungen (7.19) i : N → G, n 7→ (n, eH ), und j : H → G, h 7→ (eG , h), sind injektive Gruppenhomomorphismen. Wenn man N und H auf diese Weise mit ihren Bildern in G identifiziert, werden sie zu Untergruppen in G mit der Eigenschaft, daß jedes n ∈ N mit jedem h ∈ H kommutiert, auch wenn N und H selbst nicht abelsch sind. 56 Grundbegriffe der Gruppentheorie Diese Konstruktion kann wie folgt variiert werden: Wir fixieren einen Gruppenhomomorphismus α : H → Aut(N ) und definieren auf N × H wie folgt eine Verknüpfung: (7.20) (n, h) ◦ (n′ , h′ ) := (nα(h)(n′ ), hh′ ). Lemma 7.22 — Die Verknüpfung ◦ definiert eine Gruppenstruktur auf N × H. Beweis. 1. Das Element e = (eN , eH ) ist ein Neutralelement, denn (7.21) (n, h) ◦ (eN , eH ) = (nα(h)(eN ), heH ) = (neN , heH ) = (n, h) weil jeder Automorphismus α(h) ∈ Aut(N ) das Neutralelement in sich abbildet, und (7.22) (eN , eH )(n, h) = (eN α(eH )(n), eH h) = (eN n, eH h) = (n, h), weil α(eH ) = eAut(N ) = idN . 2. Die Verknüpfung ist assoziativ, denn (n, h) ◦ ((n′ , h′ ) ◦ (n′′ , h′′ )) = (n, h) ◦ (n′ α(h′ )(n′′ ), h′ h′′ ) = (nα(h)(n′ α(h′ )(n′′ )), h(h′ h′′ ) = (nα(h)(n′ )(α(h) ◦ α(h′ ))(n′′ ), (hh′ )h′′ ) = ((nα(h)(n′ ))α(hh′ )(n′′ ), (hh′ )h′′ ) = (nα(h)(n′ ), hh′ ) ◦ (n′′ , h′′ ) = ((n, h) ◦ (n′ , h′ )) ◦ (n′′ , h′′ ). 3. (n, h) besitzt ein Inverses, nämlich (α(h)−1 (n−1 ), h−1 ). Definition 7.23. — Die Menge N × H mit der so definierten Verknüpfung heißt ein semidirektes Produkt von N und H und wird mit N ⋊α H bezeichnet. Man beachte, daß die Gruppenstruktur von der Wahl von α abhängt. Es gibt also unter Umständen viele verschiedene semidirekte Produkte von N und H. Satz 7.24 — Es sei G = N ⋊α H das semidirekte Produkt von N und H zum Homomorphismus α : H → Aut(N ). Die Abbildung i : N → N ⋊α H, n 7→ (n, eH ), ist ein injektiver Gruppenhomomorphismus, dessen Bild ein Normalteiler ist. Die Abbildung j : H → N ×α H, j p h 7→ (eN , h), ist ein injektiver Gruppenhomomorphismus. Die Komposition H −→ G −→ G/i(N ) ist ein Isomorphismus. Beweis. Daß i und j injektive Homomorphismen sind, ist klar. Ebenso ist π : G → H, (n, h) 7→ h, ein surjektiver Homomorphismus mit π ◦ j = idH und ker(π) = i(N ). Deshalb ist N ein Normalteiler, und nach dem Homomorphiesatz induziert π einen Isomorphismus G/i(N ) → H. Wenn man N und H mit ihren Bildern in N ×α H vermöge i bzw. j identifiziert, kann man für n ∈ N und h ∈ H schreiben: hnh−1 = α(h)(n). 7.4. Kommutatoruntergruppen. Es sei G eine Gruppe. Der Kommutator zweier Elemente a, b ∈ G ist (7.23) [a, b] := aba−1 b−1 . Die Kommutatoruntergruppe von G ist die von allen Kommutatoren erzeugte Untergruppe. Übliche Bezeichnungen sind [G, G] oder G′ , wobei wir die Bezeichnung G′ hier meiden, weil diese Notation auch häufig schlicht zur Indizierung einer Reihe G, G′ , G′′ , . . . von Gruppen verwendet wird. Satz 7.25 — [G, G] ist ein Normalteiler von G. Die Faktorgruppe Gab := G/[G, G] ist abelsch. Algebra I Wintersemester 2015 57 Beweis. Die erste Aussage folgt aus der einfachen Relation g[a, b]g −1 = [gag −1 , gbg −1 ] für alle a, b, g ∈ G. Die zweite Aussage ergibt sich aus ab = [a, b]ba, also ab = ba mod[G, G]. Definition 7.26. — Die Gruppe Gab := G/[G, G] heißt die Abelisierung von G. Eine Gruppe G heißt perfekt, wenn G = [G, G]. Satz 7.27 (Universelle Eigenschaft der Abelisierung) — Es sei G eine Gruppe und π : G → Gab die kanonische Projektion auf die Abelisierung. Zu jedem Gruppenhomomorphismus ϕ : G → A in eine abelsche Gruppe A gibt es genau einen Gruppenhomomorphismus ϕ̄ : Gab → A mit ϕ = ϕ̄◦π. Beweis. Weil A abelsch ist, gilt für jeden Kommutator [g, h] ∈ G die Beziehung ϕ([g, h]) = ϕ(g)ϕ(h)ϕ(g)−1 ϕ(h) = ϕ(g)ϕ(g)−1 ϕ(h)ϕ(h)−1 = e. Deshalb liegt [G, G] im Kern von ϕ, und nach der universellen Eigenschaft der Faktorgruppe gibt es genau einen Gruppenhomomorphismus ϕ̄ : G/[G, G] → A mit ϕ̄ ◦ π = ϕ. Beispiel 7.28. — Weil das Bild des Signaturhomomorphismus sgn : Sn → {±1} abelsch ist, gilt [Sn , Sn ] ⊂ ker(sgn) = An . Andererseits hat man [(12), (23)] = (12)(23)(12)(23) = (123)2 = (132) ∈ [Sn , Sn ]. Weil An von 3-Zykeln erzeugt wird, hat man also auch die umgekehrte Inklusion An ⊂ [Sn , Sn ]. Zusammengefaßt gilt also [Sn , Sn ] = An für alle n ≥ 2. 7.5. Endliche abelsche Gruppen. Definition 7.29. — Es sei G eine Gruppe. (7.24) ex(G) := sup{ord(g) | g ∈ G} ∈ N ∪ {∞} heißt Exponent von G. Satz 7.30 — Es sei G eine abelsche Gruppe. Dann gilt ord(g)| ex(G) für alle g ∈ G. Beweis. Falls ex(G) = ∞, ist nichts zu zeigen. Andernfalls sei x ∈ G ein Element mit ord(x) = ex(G) =: n. Jedes andere Element hat dann ebenfalls endliche Ordnung. Angenommen, es gibt ein a ∈ G mit ord(a)6 | n. Dann gibt es eine Primzahl p, die die Ordnung von a häufiger teilt als die Ordnung von x. Es sei pℓ die maximale p-Potenz, die ord(a) teilt, und pk die maximale p-Potenz, die ℓ k in n aufgeht. Das Element a′ := aord(a)/p hat genau die Ordnung pℓ und das Element x′ := xp hat genau die zu p prime Ordnung n′ = n/pk . Wir betrachten das Element z = a′ x′ und setzen m = ord(z). Aus e = z m = bm xm folgt a′m = x′−m ∈ ha′ i ∩ hx′ i. Deshalb gilt einerseits ord(a′m )|ord(a′ ) = pℓ und andererseits ord(a′m )|ord(x′ ) = n′ . Weil pℓ und n′ teilerfremd sind, ist ord(a′m ) = 1 und somit a′m = e = x′−m . Daraus folgt pℓ |m und n′ |m, also auch pℓ−k n = pℓ n′ |m. Damit ist ord(z) > n = ord(x), im Widerspruch zur Definition des Exponenten von G. Satz 7.31 (Hauptsatz über endliche abelsche Gruppen) — Jede endliche abelsche Gruppe G besitzt eine Zerlegung (7.25) G = Z/d1 × . . . × Z/ds mit natürlichen Zahlen di > 1, die der Bedingung d1 |d2 | . . . |ds genügen. Beweis. Es sei x ∈ G ein Element mit ord(x) = ex(G) =: d. Falls hxi = G sind wir fertig. Andernfalls ist die zyklische Gruppe hxi ein echter Normalteiler in G. Es bezeichne ϕ : G → G′ := G/hxi die Projektion auf die Faktorgruppe. Weil G′ eine kleinere Ordnung als G hat, können wir durch Induktion über die Gruppenordnung annehmen, daß der Satz für G′ schon bewiesen ist und wir eine Zerlegung (7.26) G′ ∼ = Z/d1 × . . . × Z/ds−1 58 Grundbegriffe der Gruppentheorie haben. Es seien y1 , . . . , ys+r′ ∈ G′ Erzeuger der zyklischen Faktoren. Wir wählen weiter Urbilder zi ∈ G mit ϕ(zi ) = yi und setzen ni = ord(zi ). Weil hzi i ։ hyi i, gilt di |ni . Das Element zidi liegt im Kern von ϕ und läßt sich deshalb in der Form zidi = xmi mit 0 ≤ mi < d schreiben. Aus e = zini = (zidi )ni /di = xmi ni /di folgt d|mi ndii . und somit ndi di |mi . Aber ni teilt d. Deshalb ist d/ni eine ganzen Zahl und somit di ein Teiler von mi . Setze xi := zi x−mi /di . Dann gilt einerseits ϕ(xi ) = yi , also di |ord(xi ) und andererseits xdi i = zidi x−mi = e. Demnach haben die Elemente xi genau die Ordnung di . Wir finden so einen Gruppenhomomorphismus (7.27) a Z/d1 × . . . × Z/ds−1 × Z/d −→ G, (a1 , . . . , as1 , a) 7→ xa1 1 · . . . · xs1s−1 · xa , der nach Konstruktion surjektiv ist. Weil beide Gruppen die gleiche Ordung haben, ist die Abbildung ein Isomorphismus von Gruppen. Man kann jeden Faktor Z/di nach dem chinesischen Restklassensatz weiter in ein Produkt aus zyklischen Gruppen von Primpotenzordnung zerlegen. Damit erhält man insgesamt eine Zerlegung (7.28) m m G∼ = Z/p1 1 × . . . × Z/ps s mit nicht notwendig verschiedenen Primzahlen p1 , . . . , ps und Exponenten m1 , . . . , ms ∈ N. 7.6. Aufgaben. Aufgabe 7.32. — Das Zentrum Z(G) einer Gruppe G ist ein Normalteiler. Q Aufgabe 7.33. — Es sei {Gi }i∈I eine Familie von Gruppen, G = i∈I Gi das mengentheoretische kartesische Produkt und πi : G → Gi , g = (gj )j∈I 7→ gi , die Projektion auf den i-ten Faktor. Man zeige: (1) Auf G wird für g = (gi ) und h = (hi ) durch (g · h)i := gi hi eine Gruppenstruktur definiert. (2) Die Projektionen πi : G → Gi sind Gruppenhomomorphismen. (3) (Universelle Eigenschaft) Ist H eine beliebige Gruppe mit einer Familie von Gruppenhomomorphismen {ψi : H → Gi }i∈I , so gibt es genau einen Gruppenhomomorphismus ψ : H → G mit der Eigenschaft πi ◦ h = hi für alle i ∈ I. Die Gruppe G heißt das direkte Produkt der Gruppen {Gi }i∈I . Aufgabe 7.34. — Es sei G eine Gruppe mit Normalteilern N1 , N2 . Man zeige: N1 ∩ N2 ist ein Normalteiler in G. Wenn N1 ∩ N2 = {e}, so gilt nm = mn für alle n ∈ N1 und m ∈ N2 . Aufgabe 7.35. — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und H < G eine Untergruppe. Man zeige: (1) Die Menge N H := {nh | n ∈ N, h ∈ H} ist eine Untergruppe in G. (2) N ist ein Normalteiler in N H, und N ∩ H ist ein Normalteiler in H. (3) Die Abbildung ϕ : N H/N → H/(N ∩H), [nh] 7→ [h], ist wohldefiniert. Dabei bezeichnet [−] die Restklasse modulo N bzw. modulo H ∩ H. (4) ϕ ist ein Isomorphismus. Aufgabe 7.36. — Es seien N ⊂ H ⊂ G Normalteiler von G. Man zeige: (1) H/N ist ein Normalteiler in G/N . (2) Die Projektion G → G/N induziert einen Isomorphismus G/H → (G/N )/(H/N ). Aufgabe 7.37. — Es sei C = hxi eine zyklische Gruppe der Ordnung n. Man zeige: (1) Ist H ⊂ G eine nichttriviale Untergruppe und a ∈ N minimal mit der Eigenschaft xa ∈ H, so gilt a|n, und ist eine von xa erzeugte zyklische Gruppe der Ordnung n/a. (2) Zu jedem Teiler d|n gibt es genau eine zyklische Untergruppe Hd < G der Ordnung d. Alle Untergruppen von G haben diese Form, und es gilt Hd < Hd′ genau dann, wenn d|d′ . Algebra I Wintersemester 2015 59 Aufgabe 7.38. — Es sei n ∈ N. Die Diedergruppe Dn der Ordnung 2n ist die Untergruppe der Gruppe O(2) der orthogonalen Matrizen vom Rang 2, die von einer Drehung d in der euklidischen 0 Ebene den Winkel 2π/n und der Spiegelung s = ( −1 0 1 ) an der x-Achse erzeugt wird. Man zeige: (1) (2) (3) (4) ord(d) = n und ord(s) = 2. Es gilt sds = d−1 und dsd−1 = sd−2 . Jedes Element in G hat die Form dm oder dm s für m = 0, . . . , n − 1. Die von d erzeugte zyklische Untergruppe Cn ⊂ Dn ist ein Normalteiler. Man bestimme alle Untergruppen und Normalteiler von Dn . [Hinweis: ist H ⊂ Dn eine Untergruppe, so ist H ∩ Cn eine Untergruppe in Cn , und H ist entweder gleich H ∩ Cn oder wird von H ∩ C und einer weiteren Spiegelung dm s erzeugt.] 60 Grundbegriffe der Gruppentheorie §8. Auflösbare Gruppen 8.1. Gruppenwirkungen. Definition 8.1. — Eine Linkswirkung der Gruppe G auf einer Menge X ist eine Abbildung s : G × X → X mit der Eigenschaft s(e, x) = x und s(g, s(h, x)) = s(gh, x) für alle g, h ∈ G, x ∈ X. Eine G-Menge ist eine Menge X mit einer G-Wirkung. Wenn die Wirkung aus dem Kontext klar ist, schreibt man kürzer gx := s(g, x). Eine Abbildung α : X → Y von G-Mengen heißt G-äquivariant, wenn α(gx) = gα(x) für alle x ∈ X und g ∈ G. Die Bedingung an die Wirkung liest sich in der verkürzten Notation wie die übliche Assoziativitätsbedingung: ex = x, g(hx) = (gh)x für e, g, h ∈ G und x ∈ X. Man muß aber immer daran denken, daß g, h und x aus ganz verschiedenen Mengen stammen. Analog definiert man eine Wirkung von rechts als eine Abbildung t : X × G → X mit t(t(x, g), h)) = t(x, gh) und t(x, e) = x. Man kann auf die folgende Weise stets eine Rechtswirkung t in eine Linkswirkung s umwandeln und umgekehrt: (8.1) s(g, x) := t(x, g −1 ). Im Folgenden betrachten wir deshalb der Einfachheit halber nur Linkswirkungen. Alle Begriffe übertragen sich in analoger Weise auf Rechtswirkungen. Definition 8.2. — Es sei X eine G-Menge. Die Bahn (oder der Orbit) von x ∈ X ist die Menge Ox = Gx := {gx |g ∈ G}. Die Standgruppe (oder Isotropie- oder Stabilisatorgruppe) von x ∈ X ist die Untergruppe Gx := StabG (x) := {g ∈ G | gx = x}. Der Bahnenraum ist die Menge aller Bahnen und wird für eine Linkswirkung mit G\X und für eine Rechtswirkung mit X/G bezeichnet. Die kanonische Projektion π : X → G\X bildet jedes x ∈ X auf seine Bahn ab. Eine Wirkung heißt transitiv, wenn alle Elemente von X in einer Bahn liegen. Die Wirkung ist frei, wenn alle Standgruppen trivial sind. Schließlich ist x ∈ X ein Fixpunkt, wenn Gx = {x}, oder anders gesagt, wenn Gx = G. Die Menge aller Fixpunkte wird mit X G bezeichnet. Das Symbol G\X kann mit der mengentheoretischen Subtraktion G \ X (’ohne’) verwechselt werden. Deshalb und aus ästhetischen Gründen schreibt man auch bei Linkswirkungen häufig X/G für den Bahnenraum und verwendet die andere Schreibweise nur dann, wenn gleichzeitig Links- und Rechtswirkungen betrachtet und unterschieden werden müssen. Beispiel 8.3. — Die Gruppe G = SO(2) wirkt auf der Einheitssphäre S 2 ⊂ R3 durch Verdrehung der ersten beiden Koordinaten: x ax+by (8.2) ( ac db ) , y 7→ cx+dy . z z 0 Es gibt zwei Fixpunkte: die beiden Pole ± 0 . Die Bahnen dieser Wirkung sind genau die Pole 1 und die Breitenkreise. Die Standgruppe von y ∈ S 2 ist die volle Gruppe SO(2), wenn y ein Pol ist, und sonst die triviale Gruppe. Beispiel 8.4. — Die Symmetrische Gruppe Sn wirkt auf der Menge [n] = {1, . . . , n} durch (π, k) 7→ π(k). Die Wirkung ist sicher transitiv: Sind x, y ∈ [n] verschiedene Elemente, so bildet die Transposition τ = (x y) das Element x auf y ab, d.h. alle Elemente liegen in einer Bahn. Die Standgruppe jedes Elements ist isomorph zur symmetrischen Gruppe Sn−1 . Zwischen den Mächtigkeiten von X und seinen Bahnen und den Ordnungen von G und der Standgruppen bestehen Relationen, die durch die Bahnengleichungen präzisiert werden: Satz 8.5 (Bahnengleichungen) — Es sei G eine endliche Gruppe und G × X → X eine Gruppenwirkung. Algebra I Wintersemester 2015 61 P (1) Es gilt |X| = B∈G\X |B|. (2) Für jedes x ∈ X gilt |G| = |Gx | · |Gx| und |Gx| = [G : Gx ]. Beweis. Jedes Element von X liegt in genau einer Bahn, d.h. X ist die disjunkte Vereinigung aller Bahnen. Durch Übergang zu Mächtigkeiten folgt die erste Aussage. Es sei nun x ∈ X beliebig. Wir betrachten die Abbildung p : G → Gx, g 7→ gx. Nach Konstruktion ist p surjektiv. Es sei y ∈ Gx beliebig und g0 ∈ p−1 (y). Dann gilt g ∈ p−1 (y) genau dann, wenn gx = g0 x, d.h. (g0 )−1 gx = x, also (g0 )−1 g ∈ Gx oder g ∈ g0 Gx . Das bedeutet insbesondere, daß |p−1 (y)| = |Gx | für alle P y ∈ Gx. Es folgt |G| = y∈Gx |p−1 (y)| = |Gx| · |Gx |. Beispiel 8.6. — Es sei H < G eine Untergruppe. Dann wirkt H durch Multiplikation von links und von rechts auf G. Die Bahnen sind genau die Rechts- bzw. Linksnebenklassen. Man beachte die Vertauschung von links und rechts: die Rechtsnebenklasse von H zu a ist die Menge Ha = {ha | h ∈ H}. Die Wirkung ist frei. Die Bahnengleichung führt auf den Satz von Lagrange. Lemma 8.7 — Es sei G × X → X eine Gruppenwirkung, x ∈ X und g ∈ G. Dann gilt Ggx = gGx g −1 . (8.3) Beweis. h liegt genau dann in Ggx , wenn hgx = gx, d.h. wenn g −1 hgx = x. Das ist genau dann der Fall, wenn g −1 hg ∈ Gx , oder äquivalent: wenn h ∈ gGx g −1 . Beispiel 8.8. — Jede Gruppe G operiert auf sich selbst durch Konjugation: (8.4) c : G × G → G, (g, h) 7→ ghg −1 . Die Standgruppe eines Elements h ist die Untergruppe (8.5) ZG (h) := {g ∈ G | gh = hg} aller Elemente, die mit h vertauschen, der sogenannte Zentralisator von h in G. Die Bahn von h ist die Menge {ghg −1 | g ∈ G}, d.h. die Konjugationsklasse von h. Schließlich ist h ein Fixpunkt, wenn h mit allen Gruppenelementen vertauscht. Anders gesagt: Die Fixpunktmenge dieser Wirkung ist das Zentrum Z(G) der Gruppe. 8.2. p-Gruppen. Definition 8.9. — Es sei p eine Primzahl. Eine endliche Gruppe G ist eine p-Gruppe, wenn |G| = pn für ein n ∈ N. Beispiel 8.10. — Es gibt fünf 2-Gruppen der Ordnung 8, die drei abelschen Gruppen Z/8, Z/4 × Z/2, Z/2×Z/2×Z/2 und die beiden nichtabelschen Gruppen D4 und Q8 . Dabei ist D4 die Diedergruppe der Ordnung 8, also die Symmetriegruppe eines Quadrats, und Q8 ist die Quaternionengruppe Q8 = {±1, ±I, ±J, ±K} ⊂ M2 (C), wobei 0 1 0 , J = −1 K = IJ. (8.6) 1 = ( 10 01 ) , I = 0i −i 0 , Die zentrale Beobachtung, die der Ausgangspunkt für viele Strukturaussagen über p-Gruppen ist, ist das folgende einfache Lemma: Lemma 8.11 — Es sei G eine p-Gruppe, die auf einer endlichen Menge X wirkt. Dann ist |X| ≡ |X G | mod p, wenn X G die Fixpunktemenge der Wirkung bezeichnet. Beweis. Es seien Bi ⊂ X, i = 1, . . . , n, die Bahnen der G-Wirkung und Gi die Standgruppen von ausgewählten Elementen bi ∈ Bi . Dann gelten die Bahnengleichungen X |Bi | und |Bi | = |G|/|Gi |. (8.7) |X| = i 62 Auflösbare Gruppen Fixpunkte entsprechen bijektiv den Bahnen der Länge 1. Für alle anderen Bahnen ist |Bi | ein nichttrivialer Teiler von |G|, also selbst durch p teilbar. Rechnet man modulo p, bleibt von der Bahnengleichung nur X (8.8) |X| ≡ 1 mod p x∈X G übrig. Das war zu zeigen. Satz 8.12 — Es sei G eine p-Gruppe. Dann ist das Zentrum von G nicht trivial. Insbesondere gibt es ein zentrales Element der Ordnung p. Beweis. Wir wenden Lemma 8.11 auf die folgende Situation an: Die Gruppe G wirke auf sich durch Konjugation. Ein Element g ∈ G ist genau dann ein Fixpunkt, wenn es mit allen Elementen in G vertauscht, also im Zentrum liegt. Deshalb gilt |Z(G)| ≡ |G| ≡ 0 mod p. Da das Zentrum aber mindestens das Neutralelement enthält, ist |Z(G)| ≥ p. Ein beliebiges nichttriviales x ∈ Z(G) hat m−1 die Ordnung pm für ein m ≥ 1. Nun ist y = xp ein zentrales Element der Ordnung p. Satz 8.13 — Es sei G eine p-Gruppe. Dann gibt es eine Folge von Untergruppen (8.9) {e} = G0 < G1 < · · · < Gn = G i der Ordnung |Gi | = p mit der Eigenschaft, daß Gi für jedes i ein Normalteiler in G ist. Beweis. Es sei x ∈ Z(G) ein Element der Ordnung p. Die von x erzeugte zyklische Untergruppe G1 = hxi ist zentral und daher ein Normalteiler in G. Die Faktorgruppe G/G1 ist ebenfalls eine p-Gruppe. Durch Induktion nach der Ordnung der Gruppe schließen wir auf die Existenz von Normalteilern 1 < G2 < . . . < Gn = G/G1 mit |Gk | = pk−1 . Es sei Gk das Urbild von Gk unter der Projektion G → G/G1 . Als Urbilder von Normalteilern sind die Gk selbst Normalteiler, und ihre Ordnung ist |Gk | = |G1 | · |Gk | = pk . Definition 8.14. — Es sei G eine endliche Gruppe, p eine Primzahl und m die Multiplizität von p in der Ordnung von G. Eine p-Untergruppe S ⊂ G mit |S| = pm heißt p-Sylowuntergruppe11. Satz 8.15 (Sylow) — Es sei G eine endliche Gruppe und p eine Primzahl. (1) (2) (3) (4) G besitzt p-Sylowuntergruppen. Für die Anzahl sp der p-Sylowuntergruppen gilt sp | |G| und sp ≡ 1 mod p. Jede p-Untergruppe von G liegt in einer p-Sylowuntergruppe. Alle p-Sylowuntergruppen von G sind konjugiert. Dieser wichtige Satz wurde von Sylow zuerst in der Arbeit Théorèmes sur les groupes de substitutions, Math. Annalen 5 (1872), S. 584-594, bewiesen. Der hier gegebene Beweis folgt späteren Bearbeitungen. Wir variieren dazu den Beweisgedanken von Lemma 8.11: Beweis. 1. Es sei |G| = n = pm u mit p6 | u. Wir betrachten die Menge X aller pm -elementigen Teilmengen von G. Die Gruppe G operiere auf X durch Linkstranslation, d.h. für Y = {y1 , . . . , ypm } ∈ X und g ∈ G ist gY = {gy1 , . . . , gypm }. Es sei nun H := GY die Standgruppe von Y . Definitionsgemäß heißt das, daß H aus allen h ∈ G mit hY = Y besteht. Insbesondere erhalten wir eine neue Gruppenwirkung H × Y → Y, (h, y) 7→ hy, die nicht mit der Wirkung von G auf X zu verwechseln ist. Offensichtlich ist die Wirkung von H auf Y frei, denn H und Y sind Teilmengen von G, und Y zerfällt in eine disjunkte Vereinigung von Rechtsnebenklassen von H. Aber das bedeutet insbesondere: Die Ordnung von H ist ein Teiler 11Peter Ludwig Mejdell Sylow, norwegischer Mathematiker, b12. Dezember 1832, d7. September 1918 in Christiana Algebra I Wintersemester 2015 63 ′ der Mächtigkeit von Y , d.h. H ist eine p-Gruppe der Ordnung pm für ein m′ ≤ m. Und H ist genau dann eine p-Sylowuntergruppe, wenn Y aus einer einzigen H-Bahn besteht, also die Form Y = Hy hat. Gehen wir wieder zur Wirkung von G auf X über, so bedeutet dies: Die Länge der Bahn von ′ Y ist |G|/|H| = upm−m , also genau dann nicht durch p teilbar, wenn Y = Hy für eine pSylowuntergruppe H. Es sei X0 ⊂ X die Menge aller Teilmengen der Form Y = Hy mit einer p-Sylowuntergruppe H und y ∈ G. Aus der Bahnengleichung folgt: (8.10) |X| ≡ |X0 | mod p. Nun gilt nach Lemma 8.16 die Gleichung (8.11) pm u pm |X0 | ≡ |X| = ! ≡ u 6≡ 0 mod p. Da u teilerfremd zu p ist, ist X0 nicht leer, d.h. es gibt p-Sylowuntergruppen. 2. Weiter gibt es zu jeder p-Sylowuntergruppe H genau u = [G : H] verschiedene Nebenklassen Hy in X0 . Andererseits ist H als Standgruppe der Nebenklasse Hy eindeutig bestimmt, d.h. ein Elemente aus X0 gehört immer nur zu genau einer p-Sylowuntergruppe. Deshalb gilt |X0 | = usp . Zusammen mit der Kongruenz 8.11 erhält man u ≡ |X| ≡ |X0 | = usp mod p, also sp ≡ 1 mod p. 3. Es sei S < G eine p-Sylowuntergruppe und H < G eine beliebige p-Untergruppe. Wir wenden Lemma 8.11 direkt auf die Wirkung von H auf der Menge G/S durch Linksmultiplikation an. Da (8.12) |G/S| = |G|/|S| = u 6≡ 0 mod p, gibt es einen Fixpunkt yS ∈ G/S, d.h. eine Nebenklasse yS mit HyS = yS. Aber das bedeutet, daß y −1 Hy ⊂ S bzw. H ⊂ ySy −1 . Demnach liegt H in der p-Sylowuntergruppe ySy −1 , was zu zeigen war. 4. Dieses Argument liefert in dem Spezialfall, daß H selbst schon eine p-Sylowuntergruppe ist, eine Inklusion H ⊂ ySy −1 . Da beide Gruppen p-Sylowuntergruppen sind, sind sie gleichmächtig. Die Inklusionsbeziehung ist daher schon eine Gleichheit. Folglich sind je zwei p-Sylowuntergruppen konjugiert. 5. Schließlich betrachten wir die Wirkung von G auf der Menge X1 der p-Sylowuntergruppen durch Konjugation: (g, S) 7→ gSg −1 . Wir haben gerade gesehen, daß alle p-Sylowuntergruppen konjugiert sind. Es gibt deshalb nur eine Bahn. Bezeichnet K die Standgruppe von S ∈ X1 , so folgt: |G| = |K| · |X1 |, also ist sp = |X1 | ein Teiler von |G|. Im Beweis haben wir die folgende Kongruenz benutzt: Für jede Primzahl p und jede zu p teilerfremde natürliche Zahl u gilt ! upm ≡ u mod p. (8.13) pm Tatsächlich gilt eine allgemeinere Aussage: Lemma 8.16 — Es sei p eine Primzahl, u ∈ N und 0 ≤ k ≤ u. Dann gilt ! ! upm u ≡ mod p (8.14) k kpm für alle m ∈ N. Beweis. Im Polynomring Fp [x, y] gilt (x + y)p = xp + y p . Induktiv folgt (x + y)p und schließlich (8.15) (x + y)up m = (xp m m + y p )u . m m = xp + y p m 64 Auflösbare Gruppen Indem man auf beiden Seiten nach der binomischen Formel expandiert und die Koeffizienten vergleicht, findet man die behauptete Formel. 8.3. Auflösbare Gruppen. Definition 8.17. — Unter der derivierten Reihe einer Gruppe G versteht man die rekursiv definierte, absteigende Kette von Untergruppen D0 (G) = G und Dn+1 (G) = [Dn (G), Dn (G)]. Eine Gruppe heißt auflösbar, wenn Dn (G) = 1 für ein n ∈ N0 . Konstruktionsgemäß ist Dn+1 (G) ein Normalteiler in Dn G. Außerdem sind die Faktorgruppen D (G)/Dn (G) = Dn (G)ab abelsch. Wenn G endlich ist, ist G entweder auflösbar, oder es gibt ein n, für das Dn (G) perfekt, aber nicht trivial ist. n Beispiel 8.18. — Für die symmetrische Gruppe S4 findet man als derivierte Reihe S4 ⊲A4 ⊲V4 ⊲1, wobei A4 die alternierende Gruppe der geraden Permutationen bezeichnet und (8.16) V4 = {(1), (12)(34), (13)(24), (14)(23)} die Kleinsche Vierergruppe. S4 ist also auflösbar. Die abelschen Faktorgruppen sind (8.17) S4 /A4 ∼ = Z/2, A4 /V4 ∼ = Z/4, V4 /1 ∼ = Z/2 × Z/2. In diesem Beispiel sind alle Gruppen der derivierten Reihe tatsächlich Normalteiler der Ausgangsgruppe S4 . Beispiel 8.19. — Alle abelschen Gruppen sind auflösbar. Satz 8.20 — 1. Jede Untergruppe einer auflösbaren Gruppe ist auflösbar. 2. Ist N ⊂ G ein Normalteiler, so ist G genau dann auflösbar, wenn N und G/N auflösbar sind. Beweis. Für jede Untergruppe H ⊂ G gilt Dn (H) ⊂ Dn (G). Ähnlich erhält man aus der Surjektion G → G/N surjektive Homomorphismen Dn (G) → Dn (G/N ) für alle n. Wenn Dn (G) für ein n trivial wird, gilt dasselbe für Dn (H) und Dn (G/N ). Es sei umgekehrt N ein Normalteiler mit der Eigenschaft, daß N und G/N auflösbar sind. Es gibt dann ein n mit Dn (G/N ) = 1. Demnach liegt Dn (G) im Kern der Abbildung G → G/N , also in N . Bildet man erneut iterierte Kommutatoren, so gilt Dn+m (G) ⊂ Dm (N ). Weil Dm (N ) für große m trivial wird, gilt dasselbe für Dn+m (G). Als Anwendung der Sylowsätze können wir von vielen Gruppen die Auflösbarkeit aus der Faktorisierung ihrer Gruppenordnung schließen. Satz 8.21 — Alle p-Gruppen sind auflösbar. Beweis. Nach Satz Satz 8.13 besitzt jede Gruppe G der Ordnung pn , p prim, einen Normalteiler G′ ⊂ G der Ordnung pn−1 . Die Faktorgruppe G/G′ = Z/p ist abelsch, also auflösbar, und wir können durch Induktion über die Gruppenordnung annehmen, daß auch G′ auflösbar ist. Damit ist auch G auflösbar. Satz 8.22 — Es seien p < q Primzahlen. Dann ist jede Gruppe der Ordnung pq auflösbar. Beweis. Es sei G eine Gruppe der Ordnung pq. Die Anzahl s der q-Sylowgruppen in G ist ein Teiler von p und kongruent 1 modulo q. Weil p < q, läßt das nur die Möglichkeit s = 1. Deshalb gibt es genau eine q-Sylowuntergruppe U , und die ist ein Normalteiler. Weil U und G/U zyklische Gruppen der Ordnung q bzw. p sind, sind sie auflösbar. Folglich ist auch G auflösbar. Satz 8.23 — Es seien p < q < r Primzahlen. Dann ist jede Gruppe der Ordnung pqr auflösbar. Algebra I Wintersemester 2015 65 Beweis. Es sei G eine Gruppe der Ordnung pqr. Wenn G für eine der Primzahlen genau eine Sylowuntergruppe hat, ist diese ein Normalteiler, und die zugehörige Faktorgruppe ist auflösbar, weil ihre Ordnung ein Produkt aus zwei verschiedenen Primzahlen ist. Dann ist auch G auflösbar. Andernfalls gibt es mindestens q + 1 q-Sylowuntergruppen und genau pq r-Sylowuntergruppen. Es gibt dann mindestens (q + 1)(q − 1) Elemente der Ordnung q in G und genau pq(r − 1) Elemente der Ordnung r in G, weil zwei verschiedene Sylowuntergruppen (zur selben Primzahl) nur das neutrale Element gemeinsam haben. Also enthält G mindestens pq(r − 1) + (q 2 − 1) + 1 ≥ pqr + (q − p)q > |G| Elemente, ein offensichtlicher Widerspruch. Wir zitieren ohne Beweis zwei berühmte Sätze aus der Gruppentheorie: Satz 8.24 (Burnside 1906) — Jede Gruppe der Ordnung pn q m mit Primzahlen p und q ist auflösbar. William Burnside: On Groups of Order pα q β . Proc. London Math. Soc˙(1904), 388 - 392. Satz 8.25 (Feit - Thompson 1963) — Jede Gruppe von ungerader Ordnung ist auflösbar. Walter Feit, John G. Walter: Solvability of groups of odd order. Pacific J. Math. 13 (1963), 775 - 1029. 8.4. Kompositionsreihen. Definition 8.26. — Eine Gruppe G heißt einfach, wenn G nicht trivial ist, und wenn 1 und G die einzigen Normalteiler in G sind. Satz 8.27 — Für jede Primzahl p ist Z/p eine einfache Gruppe. Bemerkung 8.28. — Die endlichen einfachen Gruppen sind vollständig klassifiziert. Es gibt, wie wir gesehen haben, • Die zyklischen Gruppen Z/p, p prim. • Die alternierenden Gruppen An , n ≥ 5. Darüberhinaus gibt es 16 Serien von Gruppen vom sogenannten Lie-Typ. Schließlich gibt es noch 26 endliche einfache Gruppen, die nicht in Serien auftreten und deshalb sporadische Gruppen genannt werden. Die größte unter den sporadischen Gruppen heißt Monstergruppe M . Sie wurde von Fischer und Griess 1973 vorausgesagt und 1982 von Griess konstruiert. Sie hat |M | = 246 · 320 · 59 · 76 · 112 · 133 · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71 = 808017424794512875886459904961710757005754368000000000 Elemente. Es gibt merkwürdige Beziehungen zwischen der Monstergruppe und gewissen Funktionen, die in der Theorie der Modulformen auftauchen. Diese Beziehungen erschienen bei ihrem ersten Auftreten so verrückt, daß sie seither unter dem Schlagwort Mondschein (moonshine) bekannt sind. Für die Klärung vieler damit verbundener Fragen erhielt Borcherds 1998 die Fields-Medaille. Definition 8.29. — Es sei G eine Gruppe. Eine Folge von Untergruppen (8.18) G = G0 ⊃ G1 ⊃ G2 ⊃ . . . ⊃ Gn = 1 ist eine Normalreihe, wenn für alle i = 0, . . . , n − 1 die Gruppe Gi+1 ein Normalteiler in Gi ist. Eine Normalreihe ist eine Kompositionsreihe, wenn alle Faktorgruppen Gi /Gi+1 einfach sind. Satz 8.30 — Es sei G eine endliche Gruppe. Jede Normalreihe läßt sich Hinzunahme weiterer Gruppen zu einer Kompositionsreihe verfeinern. Beweis. Es sei G = G0 ⊃ G1 ⊃ . . . ⊃ Gn = 1 eine Normalreihe. Falls alle Faktoren Gi /Gi+1 einfach sind, ist nichts zu zeigen. Andernfalls gibt es einen Index i und einen Normalteiler 1 ( N ( Gi /Gi+1 . Es bezeichne π : Gi → Gi /Gi+1 die natürliche Projektion. Das Urbild G′ := 66 Auflösbare Gruppen π −1 (N ) ist eine Untergruppe in Gi mit Gi+1 ⊂ G′ ⊂ Gi . Weil N ein Normalteiler in Gi /Gi+1 ist, ist G′ ein Normalteiler in Gi , und weil 1 ein Normalteiler in N ist, ist Gi+1 ein Normalteiler in N . Dieser Vorgang läßt sich wiederholen, solange wenigstens eine Faktorgruppe der gegebenen Normalreihe nicht einfach ist. Da die Länge einer Normalreihe bei einer endlichen Gruppe durch die Gruppenordnung und eigentlich sogar durch log2 (|G|) beschränkt ist, muß dieses Verfahren nach endlich vielen Schritten mit dem Erreichen einer Kompositionsreihe abbrechen. Folgerung 8.31 — Die folgenden Aussagen über eine endliche Gruppe G sind äquivalent: (1) G ist auflösbar. (2) G besitzt eine Normalreihe mit abelschen Faktoren. (3) G besitzt eine Kompositionsreihe, deren Faktoren zyklisch von Primzahlordnung sind. Satz 8.32 (Jordan-Hölder) — Es sei G ein endliche Gruppe. Die Faktorgruppen einer Kompositionsreihe von G hängen bis auf Isomorphie und Reihenfolge nicht von der Wahl der Faktorgruppe ab. Beweis. Wir können induktiv annehmen, daß die Behauptung ür alle Gruppen kleinerer Ordnung als |G| schon gezeigt ist. Es seien nun (8.19) G = G′0 ⊲ G′1 ⊲ . . . ⊲ G′m = 1. und G = G0 ⊲ G1 ⊲ . . . ⊲ Gn = 1 zwei Kompositionsreihen, möglicherweise von verschiedener Länge. Die Menge N = G′1 ∩ G1 ist als Durchschnitt zweier Normalteiler selbst ein Normalteiler von G. Das liefert das folgende kommutative Diagramm mit exakten Zeilen und Spalten: (8.20) 1 −→ 1 −→ 1 −→ 1 x G1 /N x −→ N x −→ G1 x 1 x −→ G/G′1 x −→ G′1 x −→ −→ G x 1 1 1 x B x −→ 1 −→ 1 G′1 /N x −→ 1 G/G1 x 1 mit B := (G/G′1 )/(G/N ) = G/(G′1 G1 ) = (G/G1 )/(G′1 /N ). Weil nach Voraussetzung G/G′1 eine einfache Gruppe ist, ist entweder B oder G1 /N trivial. Aber G1 /N kann nur trivial sein, wenn G1 = G1 ∩ G′1 , d.h. wenn G1 ⊂ G′1 . In diesem Falle ist G′1 /G1 eine echte Untergruppe der einfachen Gruppe G/G1 und deshalb trivial. Das bedeutet: G1 = G′1 . Die beiden Kompositionsreihen haben also denselben Anfang, und Induktion liefert die Behauptung. Im anderen Fall ist B trivial, also G1 /N ∼ = G/G′1 und G′1 /N ∼ = G/G1 . Wir wählen eine Kompositionsreihe N = N0 ⊲ N1 ⊲ . . . ⊲ Nℓ = 1 und erhalten so zwei weitere Kompositionsreihen für G: (8.21) und G ⊲ G 1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1 G ⊲ G′1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1. Die Faktorgruppen für die neuen Reihen sind: (8.22) ′ G/G1 , G1 /N ∼ = G/G1 , N/N1 , . . . bzw. G/G′1 , G′1 /N ∼ = G/G1 , N/N1 , . . . . Bis auf die Reihenfolge und Isomorphie sind die Faktorgruppenreihen gleich. Es genügt also, die beiden Reihen (8.23) G ⊲ G1 ⊲ G2 ⊲ . . . ⊲ 1 und G ⊲ G 1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1 Algebra I Wintersemester 2015 67 bzw. (8.24) G ⊲ G′1 ⊲ G′2 ⊲ . . . ⊲ 1 und G ⊲ G′1 ⊲ N ⊲ N1 ⊲ . . . ⊲ 1 zu vergleichen. Der Unterschied zwischen den Reihen beginnt aber jeweils erst bei G1 bzw. bei G′1 . Die Behauptung folgt also durch Induktion über die Gruppenordnung. Camille Jordan zeigte zunächst, daß die Folge der Indizes [Gi : Gi+1 ], i = 0, . . . , n − 1, einer Kompositionsreihe bis auf die Reihenfolge unabhängig von der Wahl der Kompositionsreihe ist. Er nannte diese Indizes die Faktoren der Gruppe G. Nachdem Otto Hölder später den Begriff der Faktorgruppe gebildet und deren Eigenschaften studiert hatte, konnte er die hier diskutierte Verschärfung des Satzes von Jordan beweisen. 8.5. Aufgaben zur Gruppentheorie. Aufgabe 8.33. — Es sei q = ps eine Primzahlpotenz und Fq der Körper mit q Elementen. Die Gruppe GLn (Fq ) der invertierbaren n × n-Matrizen mit Koeffizienten in Fq operiert durch Linksmultiplikation auf dem Vektorraum Fn q . Man zeige: n (1) Fn q besteht aus zwei Bahnen: {0} und Fq \ {0}. (2) Die Standgruppe des ersten Standardeinheitsvektors ist ( ) ! 1 u n−1 (8.25) H= . A ∈ GLn−1 (Fq ), u ∈ Fq 0 A (3) Man leite aus der Bahnengleichung und den Aussagen (1) und (2) eine rekursive Beziehung für die Gruppenordnungen von GLn−1 (Fq ) und GLn (Fq ) her. n Q k (4) | GLn (Fq )| = q ( 2 ) n k=1 (q − 1). Aufgabe 8.34. — Es sei G eine Gruppe und S ⊂ G eine Teilmenge und X die Menge aller Untergruppen von G, die S enthalten. Zeigen Sie: (1) X ist nicht leer. T (2) hSi := H∈X H ist ein Element in X. hSi heißt die von S erzeugte Untergruppe von G, und G heißt von S erzeugt, wenn G = hSi. Aufgabe 8.35. — Es sei G eine Gruppe und S ⊂ G eine Teilmenge. Es sei H die Menge aller Produkt s1 · · · sn mit n ∈ N0 und si ∈ S oder s−1 ∈ S. Zeigen Sie, daß H = hSi. i 0 Aufgabe 8.36. — Es sei n ∈ N gegeben. Es bezeichne s = 10 −1 ∈ O(2) die Spiegelung an der − sin(2π/n) ∈ O(2) die Drehung um den Winkel 2π/n. x-Achse und d = cos(2π/n) sin(2π/n) cos(2π/n) (1) Die Untergruppe Cn := hdi in der orthogonalen Gruppe O(2) ist zyklisch mit Ordnung n, d.h. Cn ∼ = Z/n. (2) Die Untergruppe Dn := hs, di heißt Diedergruppe. Man zeige, daß |Dn | = 2n. (3) Man bestimme alle Konjugationsklassen von Dn . (Vorsicht: Unterscheide die Fälle n gerade und n ungerade.) (4) Man bestimme alle Untergruppen und Normalteiler in Dn . Es sei H < G eine Untergruppe. Das Verhältnis [G : H] := |G/H| = |G|/|H| wird als Index von H in G bezeichnet. Aufgabe 8.37. — Jede Untergruppe H < G vom Index [G : H] = 2 ist ein Normalteiler. Aufgabe 8.38. — Es sei G eine Gruppe, N ⊳ G ein Normalteiler und H < G eine Untergruppe. (1) N ∩ H ist ein Normalteiler in H. (2) Die Menge N H = {nh | n ∈ N, h ∈ H} ist eine Untergruppe in G. (3) N ist ein Normalteiler in N H. 68 Auflösbare Gruppen (4) Die Abbildung N H → N H/N hat den Kern N ∩ H. (5) Die Abbildung H/(N ∩ H) → N H/N , h mod (N ∩ h) 7→ h mod N , ist ein Isomorphismus (Erster Isomorphiesatz). (6) Ist auch H ein Normalteiler, so ist N ∩ H ein Normalteiler in G. Aufgabe 8.39. — Es sei m : G × X → X eine Linkswirkung. Dann ist q(x, g) := m(g −1 , x) eine Rechtwirkung von G auf X. Aufgabe 8.40. — Es sei G × X → X eine Gruppenwirkung. Liegen x und y in derselben Bahn, so sind ihre Standgruppen Gx , Gy < G konjugierte Untergruppen. Wie hängen Ggy und Gy zusammen? Aufgabe 8.41. — Es sei p eine Partition von n. Man bestimme die Mächtigkeit der Konjugationsklasse aller Permutationen vom Zykeltpy p. Aufgabe 8.42. — Es sei G eine Gruppe und g ∈ G. Der Zentralisator von g in G ist die Menge ZG (g) = {h ∈ G | hg = gh}. Man zeige: (1) ZG (g) ist eine Untergruppe von G. (2) ZG (x) ist die Standgruppe von x bezüglich der Wirkung G × G → G, (g, x) 7→ gxg −1 . (3) Es sei speziell G = Sn und π ∈ Sn ein Permutation. Man drücke die Ordnung von ZSn (π) durch den Zykeltyp von π aus. Aufgabe 8.43. — Es seien N und H Gruppen und α : H → Aut(N ) ein Gruppenhomomorphismus. Das semidirekte Produkt N ⋊α H ist die Menge N × H mit der folgenden Gruppenstruktur: (8.26) (n, h) · (n′ , h′ ) := (nα(h)(n′ ), hh′ ). Zeigen Sie: 1. Die angegebene Verküpfung definiert tatsächlich eine Gruppenstruktur. 2. Die Abbildungen N → N ⋊α H, n 7→ (n, e), und H → N ⋊α H, h 7→ (e, h), sind injektive Gruppenhomomorphismen. 3. Identifiziert man N und H mit ihren Bildern in N ⋊ H, so gilt: N ist ein Normalteiler in N ⋊ H, und die Inklusion von H induziert einen Isomorphismus H ∼ = (N ⋊ H)/N . 4. Für n ∈ N und h ∈ H gilt: hnh−1 = α(h)(n). ∼ Z/6 oder S3 je 5. Es sei α : Z/2 → Aut(Z/3) ein Homomophismus. Dann gilt Z/3 ⋊α Z/2 = nachdem, ob α die triviale Abbildung ist oder nicht. Aufgabe 8.44. — Es seien s0 , s1 : R → R die Punktspiegelungen an den Punkten 0 bzw. 1. Zeigen Sie: Die von s0 und s1 erzeugte Gruppe G ist isomorph zu Z ⋊α Z/2, wobei α : Z/2 → Aut(Z) den eindeutigen Gruppenisomorphismus bezeichne Aufgabe 8.45. — Es sei V ein K-Vektorraum. Die Gruppe GL(V ) der K-linearen Automorphismen von V ist eine Untergruppe in der Gruppe Aut(V ) der Automorphismen von V als abelsche Gruppe. Es sei α : GL(V ) → Aut(V ) die Inklusionsabbildung. Die Gruppe Aff(V ) := V ⋊α GL(V ) heißt affine Gruppe von V . Man zeige, daß Aff(V )×V → V , ((b, A), v) 7→ Av+b, eine Gruppenwirkung von Aff(V ) auf V ist. Aufgabe 8.46. — Es sei K ein Körper und G ⊂ GLn (K) die Untergruppe der oberen Dreiecksmatrizen. Zeigen Sie, daß G auflösbar ist. Aufgabe 8.47. — 1. Für alle n ≥ 2 gilt [Sn , Sn ] = An . 2. A2 = {(1)}, A3 ∼ = Z/3, also insbesondere [A3 , A3 ] = {(1)}. 3. [A4 , A4 ] = V4 := {(12)(34), (13)(24), (14)(23)}, und [V4 , V4 ] = {(1)}. 4. Für n ≥ 5 ist [An , An ] = An . [Ohne Rückgriff auf die in der Vorlesung bewiesene Einfachheit von An .] Algebra I Wintersemester 2015 69 Es sei K ein Körper. GLn (K) bezeichnet die Gruppe der invertierbaren n×n-Matrizen, SLn (K) die Untergruppe der Matrizen mit Determinante 1, und Zn die Untergruppe der Vielfachen der Einheitsmatrix. Man sieht leicht, daß Zn ein Normalteiler ist. Wir definieren PSLn (K) := SLn (K)/(Zn ∩ SLn (K)) und PGLn (K) := GLn (K)/Zn . Aufgabe 8.48. — Es sei Fq ein12 endlicher Körper mit q Elementen. Bestimmen Sie die Ordnungen der endlichen Gruppen GLn (Fq ), SLn (Fq ), PGLn (Fq ) and PSLn (Fq ). Aufgabe 8.49. — Es sei K ein Körper und n ∈ N. 1. Falls (K, n) 6= (F2 , 2), gilt [GLn (K), GLn (K)] = SLn (K). 2. Falls (K, n) 6= (F2 , 2), (F2 , 3), gilt [SLn (K), SLn (K)] = SLn (K) [Elementarmatrizen Eij (λ) mit Eij (λ)mn = δmn + λδim δjn betrachten.] 3. Was geschieht in den Ausnahmefällen? Aufgabe 8.50. — Wir betrachten in GL2 (C) die Untergruppe Q8 , die von den Matrizen 0 (8.27) I := 0i −i und J := ( 01 −1 0 ) erzeugt wird. Zeigen Sie, daß Q8 eine endliche Gruppe der Ordnung 8 ist. Q8 heißt Quaternionengruppe. Bestimmen Sie alle Untergruppen und Normalteiler in Q8 . Aufgabe 8.51. — Es gibt bis auf Isomorphie genau fünf Gruppen der Ordnung 8, nämlich (8.28) Z/2 × Z/2 × Z/2, D4 , Q8 . 0 Dabei ist D4 die Diedergruppe, die von der Spiegelung 10 −1 und der Drehung ( 01 −1 0 ) erzeugt wird, und Q8 ist die Quaternionengruppe. Zu welcher dieser Gruppen ist die Gruppe n 1 ∗ ∗ o 0 1 ∗ (8.29) N= ⊂ GL3 (F2 ) Z/8, Z/4 × Z/2, 0 0 1 isomorph? Aufgabe 8.52. — Es sei G eine endliche Gruppe mit |G| = pq mit Primzahlen p > q. Zeigen Sie: (1) Es gibt genau eine p-Sylowuntergruppe N . (2) Ist H eine q-Sylowuntergruppe, so ist G isomorph zu einem semidirekten Produkt N ⋊α H. (3) Wenn q kein Teiler von p − 1 ist, ist G zyklisch. Aufgabe 8.53. — Zeigen Sie: (1) Es sei G eine Gruppe mit Zentrum Z. Wenn G/Z zyklisch ist, so ist G abelsch. (2) Es sei p eine Primzahl. Jede Gruppe der Ordnung p2 ist abelsch. Wie viele Gruppen der Ordnung p2 gibt es? (3) Sei p eine Primzahl. Zeigen Sie: In einer nichtabelschen Gruppe der Ordnung p3 hat das Zentrum die Ordnung p. Wir wiederholen in den folgenden Aufgaben einige Ergebnisse aus der Vorlesung Elementare Algebra und Zahlentheorie. Es sei G eine abelsche Gruppe. Die Zahl e(G) := sup{ord(g) | g ∈ G} ∈ N ∪ {∞} heißt Exponent von G. Aufgabe 8.54. — Es sei G eine Gruppe mit kommutierenden Elementen a und b von endlicher Ordnung m = ord(a) bzw. n = ord(b). Man zeige: (1) Sind m und n teilerfremd, so gibt es k, ℓ ∈ Z mit (ab)k = a und (ab)ℓ = b, und das Element ab hat die Ordnung mn. (2) Es gibt ein Element c ∈ ha, bi < G mit ord(c) = kgV(m, n). 12Wir werden im Laufe der Vorlesung sehen, daß es bis auf Isomorphie genau einen endlichen Körper mit q Elementen gibt, wenn q eine Primzahlpotenz ist. 70 Auflösbare Gruppen Aufgabe 8.55. — Es sei G eine endliche abelsche Gruppe. Dann gilt ord(g)|e(G) für alle g ∈ G, und e(G) teilt die Gruppenordnung. [Hinweis: Aufgabe 8.54.] Aufgabe 8.56. — Es sei K ein Körper und G < K × eine endliche Untergruppe der Einheitengruppe. Dann ist G zyklisch. Insbesondere ist für jeden endlichen Körper F die Einheitengruppe F× zyklisch. [Hinweis: Man zeige, daß alle g ∈ G Nullstellen des Polynoms X e(G) − 1 ∈ K[X] sind.] Die Bestimmung der Einheitengruppe (Z/n)× für eine beliebige natürliche Zahl zerfällt in zwei Q i Teile. Zunächst zerlegt man n = i pm in seine Primfaktoren. Nach dem Chinesischen Restklasi sensatz gilt dann zunächst Y i (8.30) Z/n ∼ Z/pm = i i und damit auch (8.31) (Z/n)× ∼ = Y i × (Z/pm i ) . i Es bleibt das Problem, die Struktur von (Z/n)× für den Fall einer Primzahlpotenz n = pm zu bestimmen. Das geschieht in den folgenden Aufgaben. Aufgabe 8.57. — Es sei p eine ungerade Primzahl. Für alle m ≥ 0 gilt: (8.32) (1 + p)p m Für alle m ≥ 0 gilt (8.33) (1 + 22 )2 m ≡ 1 + pm+1 ≡ pm+2 . ≡ 1 + 2m+2 ≡ 2m+3 . Aufgabe 8.58. — Es sei p eine ungerade Primzahl und m ≥ 1. Es sei U der Kern des Homomorphismus ϕ : (Z/pm )× → (Z/p)× . (1) U ist eine p-Gruppe. (2) U wird von 1 + p erzeugt. (3) (Z/pm )× ist zyklisch der Ordnung (p − 1)pm−1 . Aufgabe 8.59. — Es sei m ≥ 2 und U der Kern des Homomorphismus ϕ : (Z/2m )× → (Z/4)× . (1) U ist eine 2-Gruppe. (2) U wird von 5 erzeugt. (3) (Z/2m )× ∼ = Z/2 × Z/2m−2 , wobei die Faktoren von −1 und 5 erzeugt werden. Algebra I im Sommersemester 2008 71 §9. Die symmetrische Gruppe Definition 9.1. — Die symmetrische Gruppe Sn vom Grad n ∈ N ist die Menge der Bijektionen der Menge [n] = {1, . . . , n} in sich mit der Komposition als Verknüpfung. Insbesondere ist |Sn | = n!. Permutationen sind also Abbildungen. In einer Verknüpfung σ ◦ π wird nach den üblichen Konventionen für Abbildungen die Permutation π zuerst ausgeführt, danach die Permutation σ. Definitionsgemäß ist S1 die triviale Gruppe. S2 besteht aus zwei Elementen und ist somit isomorph zu Z/2. 9.1. Partitionen. Eine Partition von n ∈ N ist eine Zerlegung n = λ1 + λ2 + . . . + λs in natürliche Zahlen λ1 , . . . , λs . Dabei kommt es auf die Reihenfolge nicht an. Üblicherweise ordnet man die Partition fallend und schreibt λ = [λ1 , . . . , λs ] mit λ1 ≥ . . . ≥ λs > 0. Die Zahl 4 besitzt zum Beispiel die folgenden fünf Partitionen: [4], [3, 1], [2, 2], [2, 1, 1], [1, 1, 1, 1]. Bezeichnet p(n) die Anzahl der Partitionen von n, und vereinbart man noch, daß p(0) = 1, weil 0 nur die leere Partition [] besitzt, so kann man die erzeugende Funktion p(t) = ∞ X n=0 p(n)tn = 1 + t + 2t2 + 3t3 + 5t4 + 11t5 + . . . ∈ Z[[t]] wie folgt als ein unendliches Produkt schreiben: ∞ X p(n)tn = n=0 ∞ Y m=1 1 . 1 − tm 9.2. Zykelzerlegung und Konjugationsklassen. Für jede Folge (n1 , . . . , nk ) von k ≥ 1 paarweise verschiedenen Zahlen aus [n] bezeichnet (n1 . . . nk ) ∈ Sn die Permutation mit der Eigenschaft n 1 7→ n 2 , n 2 7→ n 3 , . . . , n k 7→ n 1 und i 7→ i für alle i 6∈ {n1 , . . . , nk }. Permutationen dieser Form heißen k-Zykel oder Zykel der Länge k. Zykel der Länge 2 heißen Transpositionen. Es ist dann klar, daß (n1 . . . nk ) = (nk n1 . . . nk−1 ) und daß (n1 n2 . . . nk )−1 = (nk nk−1 . . . n1 ). Zwei Zykel (n1 . . . nk ) und (m1 . . . mℓ ) sind disjunkt oder elementfremd, falls die Mengen {n1 , . . . , nk } und {m1 , . . . , mℓ } disjunkt sind. Schließlich bezeichnen wir gelegentlich die Identität auf [n] mit dem 1-Zykel (1) = (2) = . . . = (n). Es sei eine Permutation π ∈ Sn gegeben. Die von π erzeugte zyklische Gruppe hπi operiert auf der Menge [n], und unter dieser Wirkung zerfällt [n] in Bahnen B1 , . . . , Bs . Diese seien so numeriert, daß |B1 | ≥ |B2 | ≥ . . .. Es gilt [B1 | + . . . + |Bs | = n. Die Partition Z(π) = [|B1 |, |B2 |, . . . , |Bs |] von n heiße der Zykeltyp der Permutation π. Zum Beispiel ist der Zykeltyp von (145)(27) ∈ S8 die Partition [3, 2, 1, 1, 1]. Man sieht leicht, daß umgekehrt jede Partition von n wirklich als Zykeltyp einer Partition vorkommt. Satz 9.2 — Jede Permutation π ∈ Sn läßt sich als Produkt von elementfremden Zykeln schreiben, und diese Produktdarstellung ist eindeutig bis auf die Reihenfolge der Faktoren. Beweis. Jede Bahn B von π der Länge ℓ ≥ 2 bestimmt einen eindeutigen ℓ-Zykel ζ wie folgt: Es sei x ∈ B beliebig gewählt. Wir setzen ζ = (x π(x) π 2 (x) . . . π ℓ−1 (x)). Definiert man auf diese Weise zu jeder Bahn Bi der Länge ℓi ≥ 2 einen Zykel ζi , so sind alle Zykel ζ1 , ζ2 ,. . . paarweise disjunkt und es gilt π = ζ1 ζ2 . . .. Nur im Falle π = id[n] gibt es überhaupt keine Bahnen der Länge ≥ 2, 72 Die symmetrische Gruppe und π ist das leere Produkt. Auf diese Weise läßt sich jede Permutation als Produkt von disjunkten Zykeln schreiben. Die Eindeutigkeit ist klar. Lemma 9.3 — Für Zykel (a1 . . . as ) und (as . . . am ) mit paarweise verschiedenen a1 ,. . . ,am , gilt (a1 . . . as )(as . . . am ) = (a1 . . . as . . . am ). Insbesondere besitzt jeder Zykel (b1 . . . bk ) eine Zerlegung in Transpositionen: (b1 . . . bk ) = (b1 b2 )(b2 b3 ) . . . (bk−1 bk ), und allgemein ist jede Permutation ein Produkt von Transpositionen. Beweis. Man verifiziert die erste Aussage direkt, die zweite Aussage erhält man durch wiederholte Anwendung der ersten Aussage auf das angegebene Produkt von Transpositionen. Satz 9.4 (Coxetersystem) — Die Transpositionen (12), (23), . . . , (n − 1 n) erzeugen Sn . Beweis. Es sei si = (i i + 1). Man verfiziert für k < m: sk sk+1 . . . sm−1 sm sm−1 . . . sk+1 sk = (km). Aus den Transpositionen s1 , . . . , sn−1 erhält man auf diese Weise alle Transpositionen, und diese erzeugen Sn . Satz 9.5 — Für jede Permutation π und jeden k-Zykel (n1 . . . nk ) in Sn gilt π · (n1 . . . nk ) · π −1 = (π(n1 ) . . . π(nk )). Zwei Permutationen π, π ′ ∈ Sn sind genau dann konjugiert, wenn sie denselbe Zykeltyp haben. Insbesondere ist die Abbildung {Konjugationsklassen von Sn } ↔ {Partitionen von n}, π 7→ Zykeltyp von π, eine Bijektion. Beweis. Die erste Aussage ergibt sich durch eine einfache Rechnung. Es folgt unmittelbar, daß πσπ −1 und σ denselben Zykeltyp haben. Sind umgekehrt σ und σ ′ Permutationen vom selben Zykeltyp, so kann man die Elemente in [n] so benennen, daß σ = (a1 . . . aℓ1 )(aℓ1 +1 . . . aℓs ) · · · (aℓs−1 +1 . . . aℓs ) und σ ′ = (b1 . . . bℓ1 )(bℓ1 +1 . . . bℓ2 ) · · · (bℓs−1 +1 . . . bℓs ), wobei auch die Fixpunkte von σ bzw. von σ ′ in Form von 1-Zykeln aufgenommen sind, so daß {1, . . . , n} = {a1 , . . . , aℓs } = {b1 , . . . , bℓs }. Bezeichnet nun π die Permutation mit π : ai 7→ bi für i = 1, . . . , n, so gilt πσπ −1 = σ ′ . Demnach liegen π und π ′ in derselben Konjugationsklasse. Es sei λ = [λ1 , λ2 , . . . , λt ] eine Partition von n, d.h. λ1 ≥ . . . ≥ λt > 0 und n = λ1 + . . . + λt . Es bezeichne mλ (i) := {j | λj = i} die Vielfachheit, mit der i in der Partition λ vorkommt. Wir schreiben dann auch λ = (1mλ (1) 2mλ (2) · · · ). Zum Beispiel ist [4, 2, 2, 1, 1, 1] = (13 22 41 ) eine Partition von 11. Satz 9.6 — Es sei λ = (1m1 2m2 · · · ) eine Partition von n. Dann ist die Mächtigkeit der Konjugationsklasse Cλ aller Permutationen in Sn vom Zykeltyp λ gleich |Cλ | = Q n! . m m i! i i i Algebra I im Sommersemester 2008 73 n! Beweis. Es gibt insgesamt a!b!···z! Möglichkeiten, aus einer n-elementigen Menge in dieser Reihenfolge erst a, dann b, etc. und schließlich z Elemente ohne Rücksicht auf ihre Anordnung auszuwähQ len. Wenn dabei mi -mal jeweils i Elemente auszuwählen sind, ist die Anzahl n!/ i (i!)mi . Wenn es dabei auf die Reihenfolge zwischen den i-elementigen Mengen nicht ankommt, ist die Anzahl der Q Möglichkeiten n!/ i mi !(i!)mi . Schließlich ist die Anzahl der i-Zykel, die dieselbe i-elementige Menge permutieren, genau (i − 1)!. Daraus folgt die Behauptung. 9.3. Der Signaturhomomorphismus und die alternierende Gruppe. Wir diskutieren, zwei Methoden den Signaturhomomorphismus sgn : Sn → {±1} zu beschreiben, die natürlich zum selben Ergebnis führen. Erste Methode: Satz 9.7 — Für jede Permutation π ∈ Sn nimmt das Produkt Y π(i) − π(j) sgn(π) := i−j i<j den Wert 1 oder −1 an. Die Abbildung sgn : Sn → {±1} ist ein Gruppenhomomorphismus. Für einen Zykel ζ der Länge ℓ gilt sgn(ζ) = (−1)ℓ−1 . Beweis. Weil der Quotient (π(i) − π(j))/(i − j) nicht von der Reihenfolge der Elemente i und j abhängt, kann man das Produkt auch über die Menge U aller zweielementigen Teilmengen {i, j} von [n] ausführen, statt über die Menge der Paare (i, j) mit i < j. Weil π eine Bijektion ist, kommen in dem Produkt Y π(i) − π(j) i−j {i,j}∈U bis auf Vorzeichen dieselben Faktoren vor. Deshalb hat das Produkt den absoluten Wert 1. Sind π und σ Permutationen, so gilt Y π(σ(i)) − π(σ(j)) Y π(σ(i)) − π(σ(j)) Y σ(i) − σ(j) = i−j σ(i) − σ(j) i−j {i,j} {i,j} {i,j} Im ersten Faktor der rechten Seite können wir nun umindizieren: Wenn {i, j} einmal durch T läuft, so gilt dasselbe für {k, ℓ} := {π(i), π(j)}. Deshalb gilt: Y π(σ(i)) − π(σ(j)) Y π(k) − π(ℓ) Y σ(i) − σ(j) = i−j k−ℓ i−j {i,j}∈U {k,ℓ}∈U {i,j}∈U Das zeigt sgn(π ◦ σ) = sgn(π)sgn(σ). Somit ist sgn ein Gruppenhomomorphismus. Speziell für die Transposition (12) haben alle Faktoren (τ (i)−τ (j))/(i−j) positives Vorzeichen bis auf den Faktor zum Paar {i, j} = {1, 2}. Deshalb gilt sgn((12)) = −1. Weil sgn ein Gruppenhomomorphismus ist, nimmt sgn auch auf allen zu (12) konjugierten Permutationen, d.h. auf allen Transpositionen den Wert −1 an. Schließlich ist jeder ℓ-Zykel ein Produkt aus ℓ − 1 Transpositionen. Daraus ergibt sich die letzte Aussage. Zweite Methode: Wir definieren direkt für eine Permutation π, in deren Zerlegung in elementfremde Zykel genau s Zykel vorkommen, alle 1-Zykel mitgezählt, den Wert sgn(π) := (−1)n−s . 74 Die symmetrische Gruppe Bei einem ℓ-Zykel ζ müssen also alle n − ℓ 1-Zykel mitgezählt werden, so daß man auf sgn(ζ) = (−1)n−(1+n−ℓ) = (−1)ℓ−1 kommt. Es bleibt aber zu zeigen, daß sgn ein Gruppenhomomorphismus ist. Dazu betrachten wir die Wirkung einer Transposition (1k) auf einem Zykel (12 . . . m) mit k ≤ m: (1k) · (12 . . . m) = (12 . . . k − 1)(k . . . m). Eine erneute Multiplikation mit derselben Transposition gibt (1k) · (12 . . . k − 1)(k . . . m) = (12 . . . m). Durch die Multiplikation mit einer Transposition (ij) auf einer Permutation π wird also die Anzahl der Zykel in der Zykelzerlegung um 1 erhöht bzw. um eins vermindert je nachdem, ob die beiden Elemente i und j zum selben Zykel von π gehören oder nicht. Aber in beiden Fällen ändert sich die Parität modulo 2 um 1. Deshalb gilt sgn(τ · π) = −sgn(π). Induktiv folgt für ein σ, daß sich als Produkt von ℓ Transpositionen schreiben läßt: sgn(σ · π) = (−1)ℓ sgn(π). Und indem man dies auf π = id anwendet: sgn(σ) = (−1)ℓ . Jetzt ist die Homomorphieeigenschaft von sgn offenkundig: Sind π und σ Produkte von k bzw. ℓ Transpositionen, so ist πσ ein Produkt von k + ℓ Transpositionen, und man erhält: sgn(πσ) = (−1)k+ℓ = sgn(π)sgn(σ). Definition 9.8. — Der Kern An := ker(sgn) ⊂ Sn ist ein Normalteiler vom Index 2, die sogenannte alternierende Gruppe. Die Elemente in An heißen gerade Permutationen, alle übrigen ungerade Permutationen. Transpositionen sind ungerade. Eine Permutationen ist genau dann gerade bzw. ungerade, wenn sie sich als Produkt einer geraden bzw. ungeraden Anzahl von Transpositionen schreiben läßt. Satz 9.9 — An wird von der Menge der 3-Zykel erzeugt. Beweis. Weil alle 3-Zykel gerade sind, ist klar, daß die von diesen erzeugte Untergruppe in An liegt. Umgekehrt ist eine Permutation π genau dann gerade, wenn sie sich als Produkt einer geraden Anzahl von Transpositionen schreiben läßt, etwa π = τ1 τ2 · · · τ2m = (τ1 τ2 ) · · · (τ2m−1 τ2m ). Es genügt deshalb zu zeigen, daß sich Produkte τ τ ′ von zwei Transpositionen mit 3-Zykeln schreiben lassen. Falls τ = τ ′ , ist dies trivial. Wenn τ und τ ′ ein Element gemeinsam haben, etwa τ = (ij) und τ ′ = (jk), hat man τ τ ′ = (ijk). Wenn schließlich τ und τ ′ elementfremd sind, etwa τ = (ij) und τ ′ = (kℓ′ ), gilt τ τ ′ = (ij)(jk)(jk)(kℓ) = (ijk)(jkℓ). Satz 9.10 — Es gilt [Sn , Sn ] = An . Außerdem ist An ist die einzige Untergruppe in Sn vom Index 2. Algebra I im Sommersemester 2008 75 Beweis. Weil An von der Menge der 3-Zykel erzeugt wird, genügt es zu zeigen, daß jeder 3-Zykel als Kommutator geschrieben werden kann. In der Tat gilt nun [(12), (23)] = (12)(23)(12)(23) = (123)(123) = (132). Ist H ⊂ Sn eine Untergruppe vom Index 2, so ist H ein Normalteiler mit abelscher Faktorgruppe Sn /H ∼ = Z/2. Deshalb muß der Kommutator [Sn , Sn ] = An in H liegen. Weil beide Untergruppen denselben Index haben, sind sie gleich. 9.4. Die Gruppe S3 . Die Diedergruppe D3 , d.h. die Gruppe der Symmetrien eines ebenen gleichseitigen Dreiecks mit den Ecken p1 , p2 , p3 permutiert die drei Ecken des Dreiecks. Man erhält so einen Gruppenhomomorphismus D3 → S3 , und diese Abbildung ist ein Isomorphismus, weil jede Symmetrie, die die Ecken einzeln festläßt, auch die Identität auf der ganze Ebene sein muß. Unter diesem Isomorphismus wird die Untergruppe der Drehungen auf die alternierende Gruppe A3 = h(123)i abgebildet. 9.5. Die Gruppe S4 . Die derivierte Reihe der Gruppe S4 ist S4 ⊲ A4 ⊲ V4 ⊲ 1, wobei V4 = [A4 , A4 ] = {(1), (12)(34), (13)(24), (14)(23)} die sogenannte Kleinsche Vierergruppe bezeichnet. Die drei nichttrivialen Elemente von V4 haben die Ordnung 2, und das Produkt von zwei verschiedenen Elementen der Ordnung 2 ist stets das übrig gebliebene dritte Element. Es gilt V4 ∼ = Z/2 × Z/2. Um einen Isomorphismus hinzuschreiben, muß man allerdings die Symmetrie zwischen den Elementen (12)(34), (13)(24) und (14)(23) brechen und zwei davon als Erzeuger auswählen. Weil V4 mit jedem Element auch dessen konjugierte enthält, ist V4 nicht nur in A4 , sondern auch in S4 ein Normalteiler. Für die Faktorgruppe gilt S4 /V4 ∼ = S3 . Daß S4 einen nichttrivialen Homomorphismus π : S4 → S3 in eine symmetrische Gruppe von kleinerem Grad > 2 zuläßt, ist eine Besonderheit der Zahl 4. Abstrakt kombinatorisch stellt sich dieser Zusammenhang so dar: Es gibt drei Möglichkeiten, die Mengen A = {a1 , a2 , a3 , a4 } in zwei Teilmengen mit je 2 Elementen zu zerlegen: m1 = {{1, 2}, {3, 4}}, m2 = {{1, 3}, {2, 4}}, m3 = {{1, 4}, {2, 3}}. Werden die Elemente der Menge A auf irgendeine Weise vertauscht, so werden auch die Elemente der Menge M = {m1 , m2 , m3 } M1 untereinander vertauscht. Dies definiert einen surjektiven Homomorphismus S4 ∼ = S3 . = Sym(A) → Sym(M ) ∼ Diese kombinatorische Situation wird wie folgt geometrisch realisiert: Bezeichnen P1 , P2 , P3 und P4 vier Punkte in der Ebene in allgemeiner Lage, so schneiden sich die sechs Geraden durch je zwei Punkte in drei weiteren Punkten Q1 , Q2 und Q3 . Jede Permutation der vier Punkte Pi führt zu einer Permutation der drei Punkte Qj . Q1 P2 P4 Q3 P1 P3 Q2 76 Die symmetrische Gruppe Der Homomorphismus S4 → S3 läßt sich auch mit den Symmetrien eines Würfels realisieren. Es bezeichne W einen Würfel im R3 mit Mittelpunkt im Koordinatenursprung. Die Untergruppe SO(W ) ⊂ SO(3) aller Drehungen, die den Würfel in sich abbilden, hat die Ordnung 24: Die Gruppe operiert transitiv auf den 8 Ecken, und die Standgruppe einer Ecke besteht aus den drei Drehungen um die Achse durch diese Ecke mit den Drehwinkeln 0, 2π/3 und 4π/3. Nach den Bahnengleichungen ist die Ordnung von SO(W ) also 8 · 3 = 24. Die Gruppe SO(W ) permutiert zum einen die vier Diagonalen durch die acht Ecken des Würfels, was auf einen Homomorphismus ψ : SO(W ) → S4 führt. Eine Drehung, die alle vier Diagonalen in sich abbildet, muß die Identität sein. Deshalb ist ψ injektiv, und weil die beiden Gruppen dieselbe Mächtigkeit haben, sogar ein Isomorphismus. Färbt man die Ecken des Würfels abwechseln weiß und schwarz ein, werden zwei Tetraeder T ′ und T ′′ mit weißen bzw. schwarzen Ecken definiert. Unter ψ entspricht die Untergruppe SO(T ′ ) = SO(T ′ ) ⊂ SO(W ) genau der Gruppe A4 . Andererseits permutiert SO(W ) auch die drei Achsen durch die sechs Flächenmittelpunkte, und dies führt auf einen Homomorphismus SO(W ) → S3 . Durch Zusammensetzung mit ψ −1 erhält man wieder den alten Homomorphismus S4 → S3 . 9.6. Einfachheit der alternierenden Gruppen An , n ≥ 5. Eine Gruppe G heißt einfach, wenn G nicht trivial ist und wenn G und die triviale Untergruppe die einzigen Normalteiler in G sind. Satz 9.11 — Die Gruppen An sind für n ≥ 5 einfach. Beweis. Es sei n ≥ 5 und N ⊂ An ein nichttrivialer Normalteiler. Weil An von den 3-Zykeln erzeugt wird, genügt es zu zeigen, daß N alle 3-Zykel enthält. Wenigstens einer der folgenden Fälle muß eintreten: 1. Fall: N enthält einen 3-Zykel, ohne Einschränkung π = (123). Ist nun (ijk) irgendein anderer 3-Zykel, so gibt es eine Permutation σ ∈ Sn mit σ(123)σ −1 = (ijk). Aber auch σ ′ = σ(45) hat die Eigenschaft σ ′ (123)σ ′−1 = (ijk). Weil σ und σ ′ verschiedenes Vorzeichen haben, liegt entweder σ oder σ ′ in An . Damit ist (ijk) in An zu (123) konjugiert und liegt in N . Deshalb enthält N alle 3-Zykel und ist gleich An . 2. Fall: N enthält eine Permutation π, deren Zykelzerlegung einen Zykel der Länge ≥ 4 enthält, etwa π = (1234 · · · ) · . . .. Mit π liegt dann auch (123)π(123)−1 π −1 = (123)(1234 · · · )(132)(· · · 4321) = (124) in N . Weiter mit Fall 1. 3. Fall: N enthält eine Permutation π, deren Zykelzerlegung einen 3-Zykel und einen weiteren Zykel der Länge ≥ 2 enthält, etwa π = (123)(45 · · · ) · . . .. Mit π enthält N auch (124)π(124)−1 π −1 = (124)(123)(45)(142)(45)(132) = (12534). Weiter mit Fall 2. 4. Fall: N enthält eine Permutation π, deren Zykelzerlegung wenigstens drei 2-Zykel enthält, etwa π = (12)(34)(56) · . . .. Mit π enthält N dann auch (135)π(135)−1 π −1 = (135)(12)(34)(56)(153)(56)(34)(12) = (135)(264). Weiter mit Fall 3. 5. Fall: N enthält eine Permutation π, deren Zykelzerlegung genau zwei Faktoren der Länge 2 enthält, etwa π = (12)(34). Mit π enthält N dann auch (125)π(125)−1 π −1 = (125)(12)(34)(152)(34)(12) = (152). Weiter mit Fall 1. Algebra I im Sommersemester 2008 77 Folgerung 9.12 — Für n ≥ 5 ist An perfekt, d.h. [An , An ] = An . Beweis. Die Kommutatoruntergruppe ist ein Normalteiler und deshalb entweder trivial oder gleich An . Da An nicht abelsch ist, ist die erste Möglichkeit ausgeschlossen. Folgerung 9.13 — Es sei n ≥ 1. Die einzigen Normalteiler von Sn sind die triviale Gruppe, An und Sn . Beweis. Ist N ein Normalteiler von Sn , so ist N ∩ An ein Normalteiler in An . Falls N ∩ An = An , hat man N = An oder N = Sn . Falls N ∩ An = 1, hat N die Ordnung ≤ 2. Aber alle Konjugationsklassen von Elementen der Ordnung 2 bestehen aus mehr als einem Element. Deshalb muß N trivial sein. 9.7. (*) Zur Kombinatorik der Zahlen 5 und 6. Wenn m < n, kann man die Gruppe Sm in natürlicher Weise als eine Untergruppe der Gruppe Sn auffassen, nämlich als die Gruppe derjenigen Permutationen der Menge [n] = {1, . . . , n}, die die Elementen m + 1, . . . , n fest lassen. Diese Standardeinbettung sei mit i : Sm → Sn bezeichnet. Durch Konjugation πi(Sm )π −1 ⊂ Sn erhält man andere zu Sm isomorphe Untergruppen, die aber kombinatorisch ähnlich gebaut sind: Statt der Elemente {m + 1, . . . , n} lassen sie die Elemente {π(m + 1), . . . , π(n)} fest. Für das Paar (m, n) = (5, 6) tritt die Besonderheit ein, daß es eine Einbettung j : S5 → S6 gibt, für die die Untergruppe j(S5 ) nicht zur Untergruppe i(S5 ) konjugiert ist. Das kann man auf verschiedene Weise sehen: 1. Methode: Die Anzahl der 5-Sylowuntergruppen von S5 ist ein Teiler von 5!/5 = 24 und kongruent zu 1 modulo 5, was nur die Möglichkeiten 1 und 6 läßt. Der erste Fall ist ausgeschlossen, weil S5 sonst einen Normalteiler der Ordnung 5 hätte. Es gibt also genau sechs 5-Sylowgruppen U1 ,. . . ,U6 . Die Gruppe S5 operiert auf der Menge X := {U1 , . . . , U6 } durch Konjugation, und diese Wirkung ist nach der Theorie der Sylowgruppen transitiv. Dies definiert einen Homomorphismus ∼ S6 . Weil die Wirkung transitiv ist, hat der Kern mindestens den Index 6 in j : S5 → Sym(X) = S5 . Aber die einzigen Normalteiler in S5 sind die triviale Gruppe, A5 und S5 mit den Indizes 60, 2 und 1. Also ist der Kern die triviale Untergruppe, d.h. j ist injektiv. Alle zu i(S5 ) konjugierten Untergruppen lassen ein Element fest, während j(S5 ) transitiv operiert. Deshalb kann j(S5 ) nicht zu i(S5 ) isomorph sein. Um diesen Gedankengang weiter auszubeuten, betrachten wir irgendeine Gruppe H ⊂ S6 der Ordnung |H| = 120. Dann ist [S6 : H] = 6, und die Menge der Nebenklassen S6 /j(S5 ) hat genau sechs Elemente, auf denen S6 durch Multiplikation von links transitiv operiert. Man erhält einen Homomorphismus ∼ S6 . Ψ : S6 → Sym(S6 /H) = Der Kern dieses Homomorphismus hat mindestens den Index 6 in S6 , und der einzige Normalteiler mit dieser Eigenschaft ist die triviale Gruppe. Deshalb ist Ψ injektiv und aus Mächtigkeitsgründen ein Isomorphismus. Man erhält also einen Automorphismus Ψ : S6 → S6 , der die Standgruppe der Nebenklasse H, also die Untergruppe H selbst, auf die Untergruppe derjenigen Bijektionen von S6 /H abbildet, die die Nebenklasse H fest lassen. Unter dem Isomorphismus Sym(S6 /H) ∼ = S6 ist das eine Untergruppe, die zu i(S5 ) konjugiert ist! Das zeigt: Satz 9.14 — Zu jeder Untergruppe H ⊂ S6 vom Index [S6 : H] = 6 gibt es einen Automorphismus Ψ : S6 → S6 , der H isomorph auf i(S5 ) abbildet. Speziell für j(S5 ) bedeutet dies, daß der Automorphismus Ψ : S6 → S6 , der j(S5 ) auf i(S5 ) schickt, kein innerer Automorphismus sein kann. Wir schließen: Satz 9.15 — S6 hat äußere Automorphismen. 78 Die symmetrische Gruppe Nach einem Satz von Hölder ist S6 die einzige symmetrische Gruppe mit dieser Eigenschaft! Dieselbe Methode erlaubt auch einen durchsichtigen geometrischen Beweis des Satzes: Satz 9.16 — PGL2 (F5 ) ∼ = S5 und PSL2 (F5 ) ∼ = A5 . Dabei bezeichnet GL2 (F5 ) die Gruppe der invertierbaren 2 × 2-Matrizen mit Werten in dem endlichen Körper F5 mit 5 Elementen und SL2 (F5 ) die Untergruppe der Matrizen mit Determinante 1. Diese Gruppen haben die Ordnung 480 bzw. 120. Das Zentrum beider Gruppen besteht aus Vielfachen der Einheitsmatrix: ∗ Z(GL2 (F5 )) = {λI2 | λ 6= 0} ∼ = F5 und Z(SL2 (F5 )) = {λI2 | λ2 = 1} = {±1}. Die Faktorgruppen PGL2 (F5 ) = GL2 (F5 )/F∗5 ⊃ PSL2 (F5 ) = SL2 (F5 )/{±1} heißen die projektive lineare bzw. projektive spezielle lineare Gruppe vom Grad 2 über dem Körper F5 . Die Ordnungen sind | PGL2 (F5 )| = 120 und | PSL2 (F5 )| = 60. Beweis. Der projektive Raum P1 (F5 ) := (F25 \ {0})/v ∼ λv hat sechs Elemente: x = [x : 1], x ∈ F5 , und ∞ = [1 : 0]. Die Gruppe PGL2 (F5 ) operiert darauf durch Multiplikation von links, [A] · [v] := [Av], und zwar transitiv. Dies definiert einen Homomorphismus j : PGL2 (F5 ) → Sym(P1 (F5 )) ∼ = S6 . Wenn [A] im Kern liegt, muß A alle Ursprungsgeraden in der Ebene F25 in sich abbilden. Das geht nur, wenn A ein Vielfaches der Einheitsmatrix ist, also [A] das Neutralelement in der Faktorgruppe PGL2 (F5 ). Anders gesagt: j ist injektiv. Deshalb ist j(PGL2 (F5 )) eine Untergruppe vom Index 6 in S6 . Es gibt also einen Automorphismus Ψ : S6 → S6 , der j(PGL2 (F5 )) isomorph auf i(S5 ) abbildet. Dabei geht die Untergruppe PSL2 (F5 ) isomorph auf eine Untergruppe von S5 vom Index 2, also A5 . Eine Variation derselben Argumente zeigt auch: Satz 9.17 — Eine Gruppe der Ordnung 60 ist entweder isomorph zu A5 oder auflösbar. Beweis. Es sei G eine Gruppe der Ordnung 60. Dann hat G entweder eine oder sechs verschiedene 5-Sylowgruppen. Im ersten Fall ist die 5-Sylowgruppe U ⊂ G ein auflösbarer Normalteiler mit einer Faktorgruppe G/U der Ordnung 12, die somit ebenfalls auflösbar ist. In diesem Fall ist auch G auflösbar. Im zweiten Fall operiert G transitiv auf der Menge X = {U1 , . . . , U6 } der 5-Sylowgruppen, und man erhält einen nichttrivialen Homomorphismus ϕ : G → Sym(X) ∼ = S6 . Weil G nach Voraussetzung einfach ist, ist die Abbildung injektiv. Und weil die Komposition sgn ◦ ϕ : G → Z/2 keinen von 1 und G verschiedenen Kern haben kann, liegt ϕ(G) in A6 . Folglich ist G isomorph zu einer Untergruppe vom Index 6 in A6 . Die Wirkung von A6 auf der Menge der Nebenklassen A6 /ϕ(G) definiert einen Homomorphismus ψ : A6 → S6 , der aus denselben Gründen wie im vorigen Absatz injektiv mit Bild in A6 sein muß. Also ist ψ : A6 → A6 ein Automorphismus, der ϕ(G) isomorph auf A5 abbildet. 2. Methode: Wir konstruieren einen äußeren Automorphismus Ψ : S6 → S6 kombinatorisch. Die Gruppe S6 hat 15 Transpositionen: (12), (13), . . . , (56). Aus diesen Transpositionen lassen sich auf 15 verschiedene Weisen Tripel von paarweise elementfremden Transpositionen auswählen: (12)(34)(56), (12)(35)(46), (12)(36)(45), (13)(24)(56), . . . , Algebra I im Sommersemester 2008 79 Und aus diesen Permutationen lassen sich auf genau sechs verschiedene Weisen Quintupel zusammenstellen, die zusammengenommen, alle 15 Transpositionen erhalten: A = (12)(34)(56), (13)(25)(46), (14)(26)(35), (15)(24)(36), (16)(23)(45) B = (12)(34)(56), (13)(26)(45), (14)(25)(36), (15)(23)(46), (16)(24)(35) C = (12)(35)(46), (13)(24)(56), (14)(25)(36), (15)(26)(34), (16)(23)(45) D = (12)(35)(46), (13)(26)(45), (14)(23)(56), (15)(24)(36), (16)(25)(34) E = (12)(36)(45), (13)(24)(56), (14)(26)(35), (15)(23)(46), (16)(25)(34) F = (12)(36)(45), (13)(25)(46), (14)(23)(56), (15)(26)(34), (16)(24)(35) Tatsächlich macht man sich leicht klar, daß sich jedes Tripel auf zwei Weisen zu einem Quintupel vervollständigen läßt, und daraus erhält man für die Anzahl der Quintupel die Formel 15 · 2/5 = 6, ohne alle Quintupel hinschreiben zu müssen. Es seien A, B, C, D, E, F diese sechs Quintupel. Jede Permutation der Ziffern 1, 2, 3, 4, 5, 6 führt zu einer Permutation der Buchstaben A, B, C, D, E, F . Man erhält so einen Gruppenisomorphismus Φ : Sym({1, 2, 3, 4, 5, 6}) −→ Sym({A, B, C, D, E, F }). Jede willkürliche Numerierung der Menge {A, B, C, D, E, F }, d.h. jede Wahl einer Bijektion {A, B, C, D, E, F } → {1, 2, 3, 4, 5, 6} macht aus Φ einen Automorphismus Ψ ∈ Aut(Sym({1, 2, 3, 4, 5, 6})) = Aut(S6 ). Dieser Automorphismus Ψ kann kein innerer Automorphismus sein. Das sieht man so: Die Transposition (12) ist Teil von genau drei Tripeln, und jedes dieser Tripel gehört zu genau zwei verschiedenen Quintupeln. Unter der Permutation (12) werden die drei Tripel auf sich selbst abgebildet, aber die zugehörigen Quintupel jeweils vertauscht. Deshalb wird unter dem Isomorphismus Φ die Transposition (12) vom Zykeltyp [2, 1, 1, 1, 1] auf eine Permutation vom Zykeltyp [2, 2, 2] abgebildet, nämlich (12) 7→ (AB)(CD)(EF ). Deshalb kann Ψ kein innerer Automorphismus sein. 3. Methode: Man kan die außergewöhnliche Einbettung j : A5 → A6 geometrisch am Dodekaeder realisieren. In ein Dodekaeder kann man auf fünf verschiedene Weisen einen Würfel so einbeschreiben, daß die Würfelecken eine Teilmenge der Dodekaederecken sind. Jede der zwölf Kanten eines Würfels bildet jeweils eine Diagonale einer Seitenfläche des Dodekaeders. 80 Die symmetrische Gruppe Die Gruppe I ⊂ SO(3) der orientierungserhaltenden Symmetrien eines Dodekaeders hat die Ordnung 60: Die Gruppe operiert transitiv auf den 20 Ecken, und die Standgruppe einer Ecke besteht aus den drei Drehungen um die Achse durch die Ecke mit den Winkeln 0, 2π/3 und 4π/3. Diese Gruppe muß die eingebetteten Würfel untereinander permutieren. Man erhält so einen Homomorphismus a : I → S5 . Eine Drehung, die alle Würfel festläßt, muß auch alle Achsen in sich abbilden und ist deshalb ein Vielfaches der Identität. Weil die Abbildung orientierungserhaltend ist, ist es die Identität, d.h. der Homomorphismus ρ ist injektiv. Das Bild ist eine Untergruppe vom Index 2 in S5 und deshalb gleich der alternierenden Gruppe A5 . Andererseits gibt es genau 6 Achsen durch die Flächenmittelpunkte der begrenzenden Fünfecke, und diese werden von der Gruppe I transitiv permutiert. Man erhält einen zusammengesetzten Homomorphismus a−1 j : A5 −−−→ I −→ S6 . Die Abbildung ist nicht trivial und damit sogar injektiv, weil A5 einfach ist. Und weil die Einschränkung des Signaturhomomorphismus sgn : S6 → {±1} trivial sein muß, liegt das Bild in A6 ⊂ S6 . Schließlich ist j nicht die Standardeinbettung, weil die Wirkung von I auf den sechs Flächenmittelpunktsachsen transitiv ist. Algebra I im Wintersemester 2015 81 §10. (*) Lineare Gruppen 10.1. Matrizengruppen. Es sei K ein beliebiger Körper. Die invertierbaren n × n-Matrizen mit Koeffizienten in K bilden die sogenannte allgemeine lineare Gruppe GLn (K). Die Determinante ist ein surjektiver Homomorphismus det : GLn (K) → K × . Ihr Kern ist die spezielle lineare Gruppe SLn (K) der Matrizen mit Determinante 1. In der SLn (K) liegen unter anderem die Elementarmatrizen Eij (λ) mit den Einträgen (Eij (λ))ab = δab + λδai δbj . Dabei sind i, j verschiedene Indizes und λ ∈ K ein beliebiger Skalar. Lemma 10.1 — SLn (K) wird als Gruppe von Elementarmatrizen erzeugt. Beweis. Die Multiplikation einer Matrix A von links bzw. rechts mit einer Elementarmatrix entspricht einer elementaren Zeilen- bzw. Spaltentransformation. Bekanntlich läßt sich jede Matrix A durch wiederholte Zeilen- und Spaltentransformationen auf Diagonalgestalt bringen. Es genügt also zu zeigen, daß sich jede Diagonalmatrix als Produkt von Elementarmatrizen schreiben läßt. Nun gilt 1 1 a a b c a−1 d .. . = 1 ab 1 1 .. . (ab)−1 1 .. . abc (abc)−1 .. × . ··· Deshalb kann man sich auf den Fall von 2 × 2-Matrizen zurückziehen. Für a ∈ K gilt ! ! ! ! ! a 0 1 −1 1 0 1 a 1 0 = 0 a−1 0 1 1 − a−1 1 0 1 a−2 − a−1 1 Satz 10.2 — Von den Ausnahmefällen SL2 (F2 ) und SL2 (F3 ) abgesehen, sind alle Gruppen SLn (K) für n ≥ 2 und beliebige Körper K perfekt. Beweis. Weil SLn (K) von Elementarmatrizen erzeugt wird, genügt es zu zeigen, daß sich jede Elementarmatrix Eij (λ) als Kommutator schreiben läßt. Falls n ≥ 3, kann man k verschieden von i und j wählen. Dann gilt [Eik (λ), Ekj (1)] = Eij (λ). Im Falle n = 2 gilt die Identität: ! !# " ! 1 (a2 − 1)b a 0 1 b . = , 0 1 0 a−1 0 1 Wenn der Körper mehr als 3 Elemente enthält, kann man immer ein a 6= −1, 0, 1 finden. Dann sind sowohl a wie a2 − 1 invertierbar, und mit der Wahl b = λ/(a2 − 1) hat man eine Darstellung von E12 (λ) als Kommutator gefunden. Die Matrix E21 (λ) erhält man analog. Demnach ist SLn (K) perfekt bis auf die möglichen Ausnahmen n = 2 und |K| ≤ 3. Auf der Menge K n \ {0}, n ≥ 1, wird durch v ∼ v′ :⇔ v ′ = λv für ein λ ∈ K × eine Äquivalenzrelation definiert. Die Menge der Äquivalenzklassen Pn−1 (K) := K n \ {0}/ ∼ heißt der n − 1-dimensionale projektive Raum über dem Körper K. Punkte in Pn−1 entsprechen wahlweise Äquivalenzklassen in K n \ {0} oder eindimensionale Untervektorräume in K n , nämlich die von den Äquivalenzklassen aufgespannten Geraden. 82 Lineare Gruppen Die Gruppen GLn (K) und SLn (K) operieren auf Pn−1 (K) durch Linksmultiplikation: Für zwei nichttriviale Vektoren v, v ′ ∈ K n gilt v ∼ v ′ ⇔ Av ∼ Av ′ . Deshalb ist die Wirkung GLn (K) × Pn−1 (K) → Pn−1 (K), (A, [v]) 7→ [Av], wohldefiniert. Lemma 10.3 — Eine Matrix A ∈ GLn (K) wirkt auf Pn−1 (K) genau dann trivial, wenn A ein Vielfaches der Einheitsmatrix ist. Beweis. Die Wirkung ist genau dann trivial, wenn A jede Gerade in K n in sich abbildet. Bezüglich der Standardbasis e1 , . . . , en hat A also Diagonalgestalt, etwa A = diag(a1 , . . . , an ). Damit auch e1 + . . . + en ein Eigenvektor ist, müssen alle Eigenwerte a1 , . . . , an untereinander gleich sein. Die Gruppe Z := {λIn | λ ∈ K × } ist genau das Zentrum von GLn (K) und deshalb ein Normalteiler. Als Gruppe ist Z isomorph zur Einheitengruppe K × . Weil die Elemente des Zentrums trivial auf dem projektiven Raum operieren, steigt die Wirkung von GLn (K) auf Pn−1 (K) zu einer Wirkung der Faktorgruppe PGLn (K) := GLn (K)/Z ab. Der Durchschnitt Z0 = Z ∩ SLn (K) = {λIn | λn = 1} ist isomorph zur Gruppe µn (K) = {λ ∈ K | λn = 1} der n-ten Einheitswurzeln in K. Analog steigt die Wirkung von SLn (K) zu einer Wirkung der Faktorgruppe PSLn (K) := SLn (K)/Z0 ab. Die Gruppen PGLn (K) und PSLn (K) heißen die allgemeine bzw. spezielle projektive lineare Gruppe über K. Alle diese Gruppen lassen sich in dem folgenden kommutativen Diagramm mit exakten Zeilen und Spalten anordnen: 1 −→ 1 −→ 1 −→ 1 y µn (K) y −→ PSLn (K) y −→ −→ SLn (K) y 1 wobei K ×n = {an | a ∈ K × }. Im Folgenden soll die Wirkung 1 y a7→an K× y −−−−→ PGLn (K) y − −−− → GLn (K) y 1 y K ×n y det − −−− → det 1 K × /K × y PGLn (K) × Pn−1 (K) −→ Pn−1 (K) oder in äquivalenter Formulierung der Gruppenhomomorphismus ρ : PGLn (K) → Sym(Pn−1 (K)) untersucht werden. K× y 1 n −→ 1 −→ 1 −→ 1 Algebra I im Wintersemester 2015 83 10.2. Transitive und imprimitive Wirkungen. Definition 10.4. — Es sie G × X → X eine Gruppenwirkung. (1) Die Wirkung heißt transitiv, wenn es zu beliebigen x, y ∈ X ein Gruppenelement g ∈ G mit gx = y gibt. (2) Die Wirkung heißt k-fach transitiv, wenn zu beliebigen k-Tupeln von paarweise verschiedenen Punkten x1 , . . . , xk ∈ X und y1 , . . . , yk ∈ X ein Gruppenelement g ∈ G mit gx1 = y1 ,. . . , gxk = yk gibt. (3) Eine transitive Wirkung heißt imprimitiv, wenn es eine disjunkte Zerlegung X = B1 ∪ B2 ∪ . . . in echte, mehrelementige Teilmengen von X gibt, die von allen g ∈ G erhalten wird, d.h. wenn g(Bi ) = Bj für jedes i und geeignetes j. Die Mengen B1 , B2 , . . . heißen Imprimitivitätsgebiete. Eine transitive Wirkung, die nicht imprimitiv ist, heißt primitiv. Satz 10.5 — Es sei n ≥ 2. Die Wirkung von PSLn (K) auf Pn−1 (K) ist zweifach transitiv. Beweis. Es seien x1 , x2 und y1 , y2 zwei Paare verschiedener Punkte auf Pn−1 (K), die von Vektoren v1 , v2 bzw. w1 , w2 in K n repräsentiert werden. Daß x1 und x2 verschieden sind bedeutet, daß v1 und v2 linear unabhängig sind. Sie lassen sich deshalb zu einer Basis v1 , . . . , vn erweitert. Ebenso gibt es eine Erweiterung von w1 und w2 zu einer Basis w1 , . . . , wn von K n . Es bezeichne A die eindeutig bestimmte Matrix mit Avi = wi für i = 1, . . . , n. Indem man wn nötigenfalls um einen Skalar abändert, kann man erreichen, daß det(A) = 1. Dann ist [A] ∈ PSLn (K) mit [A]xi = yi für i = 1, 2. Satz 10.6 — Die Wirkung von PGL2 (K) auf P1 (K) ist dreifach transitiv. Beweis. Es seien x1 , x2 , x3 und y1 , y2 , y3 zwei Tripel von paarweise verschiedenen Punkten auf P1 (K). Es seien Vektoren v1 , v2 , v3 und w1 , w2 , w3 gewählt, die diese Punkte repräsentieren. Weil x1 6= x2 , sind v1 und v2 linear unabhängig und eine Basis von K 2 . Schreibt man v3 = αv1 + βv2 , so ist α 6= 0, weil x3 6= x2 , und analog β 6= 0, weil x3 6= x1 . Indem man gegebenenfalls v1 und v2 durch αv1 und βv2 ersetzt, kann man ohne Einschränkung erreichen, daß v1 + v2 = v3 . Analog verfährt man mit den Vektoren w1 , w2 und w3 = w1 + w2 . Die eindeutig bestimmte Matrix A mit Av1 = w1 und Av2 = w2 hat dann auch die Eigenschaft Av3 = w3 . Es folgt [A]xi = yi für i = 1, 2, 3. Es sei G × X → X eine transitive Wirkung von X, d.h. die Menge X besteht aus einer einzigen Bahn unter G. Dagegen zerfällt X für eine Untergruppe H ⊂ G möglicherweise in mehrere Bahnen Hx, x ∈ R ⊂ X. Spezielle für den Fall eines Normalteilers N passiert das Folgende: Wir betrachten eine N -Bahn N x und den Effekt einer zusätzlichen Wirkung durch ein g ∈ G. Es gilt gN x = gN g −1 (gx) = N (gx). Das Element g bildet also die Bahn N x wieder auf eine Bahn N (gx) ab. Die zweite Bahn stimmt entweder mit der ersten überein oder zu dieser disjunkt. Läßt man g durch die ganze Gruppe G laufen, erhält man wegen der Transitivität der G-Wirkung auf X eine Zerlegung von X in gleichgroße disjunkte G-Bahnen: Satz 10.7 — Es sei G × X → X eine transitive Gruppenwirkung und N ⊳ G ein Normalteiler. (1) Die Menge X zerfällt in gleich große N -Bahnen, die unter der Wirkung von G permutiert werden. (2) Wenn G zweifach transitiv operiert, so ist die Wirkung von N auf X entweder trivial oder ebenfalls transitiv. 84 Lineare Gruppen Beweis. Es bleibt die zweite Aussage zu beweisen. Wir nehmen an, die Wirkung von G auf X sei zweifach transitiv, und die Wirkung von N sei weder trivial noch transitiv. Dann gibt es wenigstens zwei verschiedene N -Bahnen B und B ′ in X, die jeweils aus mehr als einem Element bestehen, etwa B = {x, y, . . .} und B ′ = {x′ , y ′ , . . .}. Weil die Wirkung von G zweifach transitiv ist, gibt es ein g ∈ G mit gx = x und gy = y ′ . Dann ist gB weder zu B disjunkt, noch stimmt es mit B überein. Widerspruch. 10.3. Endliche lineare Gruppen. Im Folgenden betrachten wir speziell die im ersten Abschnitt eingeführten linearen Gruppen für den Fall eines endlichen Körpers Fq mit q Elementen. Dann sind alle linearen und projektiven linearen Gruppen endlich. Wir besimmten zunächst ihre Ordnungen: n Satz 10.8 — | GLn (Fq )| = q ( 2 ) Qn i=1 (q i n − 1) und | SLn (Fq )| = q ( 2 ) Qn i=2 (q i − 1). Beweis. Die Gruppe GLn (Fq ) operiert durch Multiplikation von links transitiv auf der Menge der n von 0 verschiedenen Vektoren im Vektorraum Fn q . Die Anzahl dieser Vektoren ist demnach q − 1. Die Standgruppe des ersten Standardbasisvektors ist ) ! ( 1 u n−1 H= u ∈ Fq , A ∈ GLn−1 (Fq ) . 0 A Das führt auf die rekursive Beziehung: | GLn (Fq )| = (q n − 1)|H| = (q n − 1)q n−1 | GLn−1 (Fq )|. Daraus folgt die erste Behauptung durch Induktion. Die zweite folgt aus der ersten, weil das Bild der Determinante die Ordnung |F× q | = q − 1 hat. Weil die Einheitengruppe von Fq zyklisch von der Ordnung q − 1 ist, ist die Gruppe µn (Fq ) der n-ten Einheitswurzeln isomorph zur Untergruppe in Z/(q − 1) aller Elemente a mod (q − 1) mit na ≡ 0. Deren Anzahl ist ggT(q − 1, n). Mit anderen Worten: Folgerung 10.9 — Es gilt |µn (Fq )| = ggT(q − 1, n) und | PSLn (Fq )| = n n Y q( 2 ) (q i − 1). ggT(q − 1, n) i=2 Der n − 1-dimensionale projektive Raum hat |Pn−1 (K)| = |K n \ {0}| qn − 1 = = q n−1 + . . . + q + 1 q−1 |F× q | Elemente. Insbesondere definiert die Wirkung von PGLn (Fq ) einen injektiven Gruppenhomomorphismus qn − 1 . ρ : PGLn (Fq ) → Sm , m = q−1 PGL2 (F2 ) Die Gruppen PGL2 (F2 ), GL2 (F2 ), PSL2 (F2 ) und SL2 (F2 ) sind alle gleich und haben die Mächtigkeit 6. Man hat einen injektiven Gruppenhomomorphismus ρ : PGL2 (F2 ) → Sm , 2 −1 = 3. Das zeigt: m = 22−1 PSL2 (F2 ) ∼ = S3 . Insbesondere ist PSL2 (F2 ) auflösbar. PGL2 (F3 ) Es gilt | GL2 (F3 )| = 48, und | PGL2 (F3 ) = 24. Aus der Injektivität des Homomor- phismus ρ : PGL2 (F3 ) → Sm , m = 32 −1 3−1 = 4, folgt: PGL2 (F3 ) ∼ = S4 Insbesondere ist PSL2 (F3 ) auflösbar. und PSL2 (F3 ) ∼ = A4 . Algebra I im Wintersemester 2015 PGL2 (F4 ) Man hat | GL2 (F4 )| = 180 und | PGL2 (F4 ) = 60. Die Wirkung auf P1 (F4 ) de- finiert eine injektiven Homorphismus ρ : PGL2 (F4 ) → Sm , m = Isomorphismus PSL2 (F4 ) = PGL2 (F4 ) ∼ = A5 . PGL2 (F5 ) 85 42 −1 4−1 = 5, und somit einen Es gilt | GL2 (F5 )| = 480 und PGL2 (F5 ) = 120. Der injektive Homomorphis2 −1 mus ρ : PGL2 (F5 ) → Sm , m = 55−1 = 6, definiert also Einbettungen PGL2 (F5 ) → S6 und PSL2 (F5 ) → A6 vom Index 6. Wie in Abschnitt 9.7 ausgeführt folgt hieraus schon: PGL2 (F5 ) ∼ = S5 und PSL2 (F5 ) ∼ = A5 . Insbesondere hat man den merkwürdigen Umstand: Satz 10.10 — PSL2 (F4 ) ∼ = PSL2 (F5 ) ∼ = A5 . Satz 10.11 — Für alle (n, q) 6= (2, 2), (2, 3) sind die Gruppen PSLn (Fq ) einfach. Beweis. Wenn (n, q) 6= (2, 2), (2, 3), ist die Gruppe G = SLn (Fq ) nach Satz 10.2 perfekt und operiert nach Satz 10.5 zweifach transitiv auf Pn−1 (Fq ). Insbesondere ist die Wirkung primitiv. Angenommen, G ist nicht einfach. Es sei dann N ⊳ G ein maximaler nichttrivialer echter Normalteiler. Weil N nichttrivial und die Wirkung von G auf Pn−1 (Fq ) effektiv ist, haben die N -Bahnen eine Länge n ≥ 2. Nach Satz 10.7 muß N ebenfalls transitiv auf Pn−1 (Fq ) operieren. Betrachte die Untergruppe #) (" ∗ ∗ < G, H= 0 ∗ nämlich die Standgruppe der vom ersten Standardbasisvektor e1 aufgespannten Gerade. Weil N transitiv wirkt, hat man G = N H. Die Gruppe U= (" 1 0 ∗ In−1 #) ist eine normale Untergruppe in H. Deshalb ist N U ein Normalteiler in G = N H. Weil U alle Elementarmatrizen der Gestalt E1j (λ) enthält, erzeugen die konjugierten Untergruppen gU g −1 , g ∈ G, zusammen die Gruppe G. Deshalb kann U keine Untergruppe von N sein, so daß N ( N U . Nach Voraussetzung war N aber ein maximaler echter Normalteiler von G, so daß N U = G gelten muß. Wir berechnen die Kommutatoruntergruppe von G aus der Darstellung G = N U . Weil G perfekt, N normal und U abelsch ist, hat man: G = [G, G] = [N U, N U ] ⊂ N [U, U ] = N, Widerspruch. Die nächstgrößeren Gruppen nach PSL2 (F4 ) und PSL2 (F5 ) sind die Gruppen PSL2 (F7 ) und PSL3 (F2 ). Nach den obigen Regeln findet man leicht | PSL2 (F7 )| = | PSL3 (F2 )| = 3 · 7 · 8 = 168. Es ist klar, daß eine Gruppe der Ordnung 168 nicht zu einer alternierenden Gruppe isomorph sein kann. Im Übrigen gilt: Satz 10.12 — Es gibt bis auf Isomorphie nur eine einfache Gruppe der Ordnung 168. Insbesondere gilt PSL2 (F7 ) ∼ = PSL3 (F2 ). 86 Lineare Gruppen §11. Körpererweiterungen 11.1. Charakteristik und Grad. Wir kennen drei prinzipielle Methoden, um aus Ringen Körper zu konstruieren: (1) Ist A ein kommutativer Ring und m ein maximales Ideal, dann ist der Restklassenring A/m ein Körper, der Restklassenkörper von m. Aus Z gewinnt man so für jede Primzahl p den endlichen Körper Fp = Z/p. (2) Ist A ein Integritätsbereich, so ist der totale Quotientenring Q(A) ein Körper, der Quotientenkörper von A. Das verallgemeinert den Übergang von den ganzen Zahlen Z zum Körper Q = Q(Z) der rationalen Zahlen. (3) Es sei K ein Körper. Dann ist K[X] ein Integritätsbereich. Sein Quotientenkörper ist der Funktionenkörper f (X) F (X) := f, g ∈ K[X], g 6= 0 . g(X) Analog kann man mit einer beliebigen Anzahl von Unbestimmten verfahren. Eine der wichtigsten Invarianten eines Körpers ist seine Charakteristik: Es sei K ein Körper und 1K das Einselement. Für jedes n ∈ N bezeichne nK die n-fache Summe von 1K mit sich. Die Abbildung N → K, n → nK , setzt sich zu einem Ringhomomorphismus Φ : Z → K fort. Der Kern von Φ ist notwendigerweise ein Primideal. Die Charakteristik char(K) ist die Zahl 0 oder die Primzahl p je nachdem, ob ker(Φ) = (0) oder ker(Φ) = (p). Es gibt also zwei fundamental verschiedene Fälle: (1) char(K) = 0. Dieser Fall tritt genau dann ein, wenn nK 6= 0 für alle n ∈ N. Der Ring Z wird durch Φ auf eindeutige Weise in K eingebettet. Jedes Element 6= 0 in Z ist in K invertierbar. Deshalb setzt sich die Abbildung Φ zu einem kanonischen injektiven Homomorphismus Q → K des Quotientenkörpers fort. Φ Z u u u u /K u: Φ̃ Q(Z) = Q (2) char(K) = (p) für eine Primzahl p. Dabei ist p die kleinste natürliche Zahl n mit nK = 0. Nach der universellen Eigenschaft des Restklassenrings induziert Z → K einen kanonischen injektiven Homomorphismus Fp = Z/(p) → K. (p) /Z Φ /K ? Φ̄ Fp Ein Unterkörper in einem Körper K ist eine Teilmenge k ⊂ K, die unter Addition und Multiplikation abgeschlossen und mit diesen ererbten Verknüpfungen ein Körper ist. Der Durchschnitt aller Unterkörper in einem gegebenen Körper ist selbst ein Unterkörper, und zwar der kleinstmögliche. Er heißt der Primkörper von K. Offenbar ist der Primkörper eines Körpers auf kanonische Weise zu Q oder Fp isomorph je nachdem, ob char(K) = 0 oder p. Körper der Charakteristik p > 0 unterscheiden sich in zahlreichen Punkten von Körpern der Charakteristik 0. Alle endlichen Körper haben positive Charakteristik. Ein Beispiel für einen unendlichen Körper von positiver Charakteristik ist der Körper Fp (X) der rationalen Funktionen über Fp . Die Binomialkoeffizienten kp sind für 0 < k < p durch p teilbar. Deshalb gilt in den Körpern der Charakteristik p > 0 die Rechenregel (11.1) (a1 + . . . + an )p = ap1 + . . . + apn . Algebra I im Wintersemester 2015 87 Daraus ergibt sich der Satz: Satz 11.1 — Es sei p eine Primzahl und K ein Körper der Charakteristik p. Die Abbildung F : K → K, a 7→ ap , ist ein injektiver Ringhomomorphismus, der sogenannte Frobeniushomomorphismus. Definition 11.2. — Es sei K ein Körper. Eine K-Algebra ist ein Ring R zusammen mit einer Verknüpfung K × R → R, so daß R mit der Ringaddition und dieser skalaren Verknüpfung ein K-Vektorraum ist und die Ringmultiplikation R × R → R eine K-bilineare Abbildung ist. Wenn R ein Einselement besitzt, also insbesondere wenn R ein kommutativer Ring ist, definiert jede K-Algebrenstruktur einen Ringhomomorphismus K → R, λ 7→ λ1R , und umgekehrt definiert jeder solche Ringhomomorphismus auf R die Struktur einer K-Algebra. K-Algebren lassen sich mit Mitteln der linearen Algebra untersuchen. Definition 11.3. — Es sei K ein Körper. Ein Homomorphismus K → L in einen Körper L heißt Körpererweiterung von K. Die Dimension von L als K-Vektorraum heißt Grad der Erweiterung und wird mit [L : K] := dimK (L) notiert. Eine Erweiterung K → L heißt endlich, wenn [L : K] < ∞. Da jede Körpererweiterung notwendigerweise injektiv ist, identifizieren wir K häufig mit seinem Bild und betrachten K als einen Unterkörper von L, wenn es ohne Gefahr von Mißverständnissen möglich ist. Man spricht auch von einer Einbettung des Körpers K in den Körper L. Wenn man den Homomorphismus K → L nicht betonen will, schreibt man L/K für die Erweiterung. √ Beispiele 11.4. — 1. Der Körper K = Q( 3 2) besitzt drei verschiedene Einbettungen in C. Zu√ nächst hat man mit der Abkürzung α = 3 2 die Darstellung (11.2) K = {a + bα + cα2 | a, b, c ∈ Q}. Um K in C einzubetten, muß α auf eine komplexe Zahl abgebildet werden, deren dritte Potenz 2 ist. Dazu gibt es genau drei Möglichkeiten: α, αρ und αρ2 mit ρ = exp(2πi/3). Die Wahl von α liefert einfach die Standardinklusion ϕ1 = id : K → C, die beiden anderen Wahlen liefern Einbettungen ϕ2 , ϕ3 : K → C, deren Bilder nicht einmal in R landen. √ 2. Etwas anders ist die Situation im folgenden Fall: Der Körper Q( 2) besitzt zwei verschiedene √ √ √ √ Einbettungen in C, nämlich ϕ1 (a + b 2) = a + b 2 und ϕ2 (a + b 2) = a − b 2. In diesem Falle sind die Bilder der beiden Abbildungen gleich, aber die Abbildungen selbst sind verschieden. √ √ 3. Die Erweiterungen Q( 3 2)/Q und Q( 2)/Q sind endlich vom Grad 3 bzw. 2. Ähnlich ist [C : R] = 2. Die Erweiterung R/Q hat unendlichen Grad. Satz 11.5 — Es seien K → L → M Körpererweiterungen. Dann gilt (11.3) [M : K] = [M : L] · [L : K]. Beweis. Es sei {xi }i∈I eine K-Basis von L und {yj }j∈J eine L-Basis von M . Wir betrachten die Familie B := {xi yj }(i,j)∈I×J . Es genügt zu zeigen, daß B eine Basis ist, denn |I × J| = |I| · |J|. P Zunächst läßt sich jedes m ∈ M als Linearkombination m = j ℓj yj schreiben, wobei fast P alle ℓj ∈ L verschwinden. Weiter läßt sich jedes ℓj 6= 0 als Linearkombination ℓj = i aij xi P schreiben. Insgesamt sind nur endlich viele aij 6= 0. Nun gilt m = (i,j) aij xi yj . Folglich ist B ein Erzeugersystem. P P P Ist andererseits 0 = (i,j) aij xi yj = j i aij xi yj , so folgt aus der linearen UnabhängigP keit der yj zunächst, daß i aij xi = 0 für alle j, und dann aus der linearen Unabhängigkeit der xi , daß aij = 0 für alle (i, j). Folglich ist B eine Basis. Für den Satz und den Beweis ist es unerheblich, ob die Mengen I und J endlich sind oder nicht. 88 Körpererweiterungen Satz 11.6 — Es sei K ein Körper, A eine kommutative nullteilerfreie K-Algebra mit dimK (A) < ∞. Dann ist A ein Körper. Beweis. Der Beweis ist sehr leicht. Wir führen bei der Gelegenheit Bezeichnungen ein, die wir auch später gebrauchen können. Für jedes a ∈ A ist die Linksmultiplikation ℓa : A → A, x 7→ ax, eine K-lineare Abbildung. Die Nullteilerfreiheit von A impliziert, daß ℓa injektiv ist, wenn a 6= 0. Da dimK (A) < ∞, ist jeder injektive Endomorphismus des K-Vektorraums A auch surjektiv. Es gibt also insbesondere zu jedem a ∈ A \ {0} ein b ∈ A mit ab = ℓa (b) = 1. Es sei K → L eine Körpererweiterung und S ⊂ L eine Menge. Es gibt Unterkörper von L, die das Bild von K und S enthalten, zum Beispiel L selbst. Der Durchschnitt aller dieser Unterkörper hat dieselbe Eigenschaft und ist der kleinste Unterkörper mit dieser Eigenschaft. Er wird mit K(S) bezeichnet und heißt der von S über K erzeugt Unterkörper von L. Er läßt sich auch folgendermaßen beschreiben: K(S) := p(s1 , . . . , sn ) n ∈ N0 , p, q ∈ K[X1 , . . . , Xn ], s1 , . . . , sn ∈ S, q(s) 6= 0. q(s1 , . . . , sn ) Falls S = {a1 , . . . , aℓ } schreiben wir kurz K(a1 , . . . , aℓ ) statt K({a1 , . . . , aℓ }). Definition 11.7. — Es sei L/K eine Körpererweiterung. (1) Eine Menge S ⊂ L erzeugt die Erweiterung L/K, wenn L = K(S). (2) Der Körper L heißt endlich erzeugt über K, wenn es eine endliche Menge S ⊂ L mit L = K(S) gibt. (3) Eine Erweiterung L/K heißt einfach, wenn es ein Element a ∈ L mit L = K(a) gibt. Es ist klar, daß jede endliche Körpererweiterung auch endlich erzeugt ist, denn jede Basis ist erst recht ein Erzeugendensystem. Umgekehrt wird der Funktionenkörper K(X) als Körpererweiterung von K allein von X erzeugt, d.h. K(X)/K ist eine einfache Erweiterung, aber [K(X) : K] = ∞. Man beachte auch, daß es zu jedem a ∈ K(S) eine endliche Teilmenge Sa ⊂ S mit a ∈ K(Sa ) gibt, weil sich jedes a als Quotient von zwei Polynomen mitEinträgen aus S ausdrücken läßt, die aber jeweils nur von endlich vielen Elementen aus S abhängen können. 11.2. Algebraische Erweiterungen. Es sei i : K → L eine Körpererweiterung und a ∈ L. Wegen der universellen Eigenschaft des Polynomrings gibt es genau einen Ringhomomorphismus ψ : K[X] → L mit ψ|K = i und ψ(X) = a. Wir schreiben kurz ψ(f ) =: f (a). Das Bild von ψ ist ein Unterring von L und wird mit K[a] bezeichnet. Weil jeder Unterring eines Körper nullteilerfrei ist, ist der Kern von ψ ein Primideal. Deshalb bestehen zwei Möglichkeiten: (1) ker(ψ) = (f ) mit einem eindeutig bestimmten normierten irreduziblen Polynom f . Wegen der universellen Eigenschaft des Restklassenrings faktorisiert ψ über eine Einbettung ψ : K[X]/(f ) → L. Es folgt, daß K[X]/(f ) ∼ = K(a) und [K(a) : K] = [K[X]/(f ) : K] = grad(f ) =: n. Es gilt dann schon K[a] = K(a). Wir nennen a in diesem Falle algebraisch vom Grad n über K. Das Polynom f ist das eindeutig bestimmte normierte Polynom kleinsten Grades mit f (a) = 0. Es heißt das Minimalpolynom von a über K und wird mit minpola/K := f bezeichnet. (f ) ψ / w; L w w ww wwψ w ww / K[X] K[X]/(f ) Algebra I im Wintersemester 2015 89 (2) ker(ψ) = (0). In diesem Falle wird K[X] durch ψ in L eingebettet, und setzt sich gemäß der universellen Eigenschaft der Lokalisierung zu einer Einbettung des Körpers der rationalen Funktionen fort: Φ : K(X) → L. Es folgt, daß K[X] ∼ = K[a] und K(X) ∼ = K(a). Insbesondere ist [K(a) : K] = ∞. Wir nennen a in diesem Falle transzendent über K. ψ / =L {{ { {{ {{ { { K[X] K(X) Definition 11.8. — Es sei L/K eine Körpererweiterung und a ∈ L algebraisch über K. Ein Element b ∈ L ist konjugiert zu a, wenn b Nullstelle des Minimalpolynoms von a ist. Die Definition erweitert den Begriff der komplex konjugierten Zahl: In der Erweiterung C/R ist jedes z ∈ C algebraisch über R, und zwar vom Grad 1 oder 2 je nachdem ob z reell ist oder nicht. Die zu z konjugierten Zahlen sind z selbst und z, die im üblichen Sinne konjugierte komplexe Zahl. √ √ Beispiel 11.9. — Die komplexe Zahl a = 5 − 2 ist algebraisch über Q: Da 5 = a + 2, folgt √ √ √ 5 = a2 + 4a + 4. Alternativ kann man 5 aus a = 5 − 2 und a2 = 9 − 4 5 eliminieren: √ 1 (11.4) 5 = a + 2 = (9 − a2 ). 4 Auch so ergibt sich a2 + 4a − 1 = 0. Das Polynoms x2 + 4x − 1 ist irreduzibel in Q[x], weil es keine Nullstellen in Q besitzt: Jede Nullstelle müßte schon ganzzahlig sein und außerdem ein Teiler des konstanten Terms. Die einzigen Teiler sind ±1, und diese sind keine Nullstellen. Also ist x2 + 4x − 1 √ das Minimalpolynom von a. Die zu a konjugierte Nullstelle ist − 5 − 2 = −a − 4 ∈ Q(a). √ Beispiel 11.10. — Es sei a = 3 2 ∈ R. Dann ist b = a2 + a algebraisch über Q: Wir finden b2 = (a2 + a)2 = a4 + 2a3 + a2 = a2 + 2a + 4 und b3 = a6 + 3a5 + 3a4 + a3 = 6a2 + 6a + 6. Durch Elimination von a2 und a aus diesen Gleichungen findet man b3 − 6b − 6 = 0. Nach dem Eisensteinkriterium ist x3 − 6x − 6 ∈ Q[X] irreduzibel und daher das Minimalpolynom von b. Die zu b konjugierten Elemente in C sind ρa2 + ρ2 a und ρ2 a2 + ρa, wobei ρ = exp(2πi/3), wie man durch Ausmultiplizieren verifiziert: (11.5) (X − a2 − a)(X − ρa2 − ρa)(X − ρ2 a2 − ρa) = . . . = X 3 − 6X − 6. Beachte: a3 = 2, ρ2 + ρ + 1 = 0. Die zu b konjugierten Zahlen sind nicht reell und liegen sicher nicht in Q(b). Beispiel 11.11. — Um das reguläre Siebeneck in den Einheitskreis zeichnen zu können, bräuchte man eine Strecke der Länge u = cos(α), α = 2π/7. Aus dem Additionstheorem für den Kosinus folgt für beliebige a, b ∈ R: (11.6) cos(a + b) + cos(a − b) = 2 cos(a) · cos(b). Daraus ergibt sich: (11.7) cos(2α) = 2u2 − 1, cos(3α) = 2u(2u2 − 1) − u = 4u3 − 3u und (11.8) cos(4α) = 2(2u2 − 1)2 − 1 = 8u4 − 8u2 + 1. Da cos(3α) = cos(4α) für diese spezielle Wahl von α, liefert der Vergleich die Identität (11.9) 8u4 − 8u + 1 = 4u3 − 3u 90 Körpererweiterungen oder (11.10) 8u4 − 4u3 − 8u2 + 3u + 1 = 0. Das Polynom 8x4 − 4x3 − 8x2 + 3x + 1 ist aber nicht irreduzibel, es hat die Nullstelle 1. Division durch x − 1 liefert das kubische Polynom: (11.11) 8x3 + 4x2 − 4x − 1 ∈ Q[x]. Es liegt nahe, die Substitution z = 2u = eiα + e−iα vorzunehmen. z ist dann Nullstelle des Polynoms f = x3 + x2 − 2x − 1. Da ±1 keine Nullstellen von f sind, ist f irreduzibel. Also ist z algebraisch über Q mit Minimalpolynom f . Die zu z = 2 cos(α) konjugierten Elemente sind 2 cos(2α) = z 2 − 2 und 2 cos(3α) = z 3 − 3z und liegen, wie die Formeln zeigen, in Q(z). Man kann dasselbe Polynom f auch wie folgt herleiten: Es sei ζ = exp(2πi/7). Dann genügt ζ der Gleichung (11.12) ζ 6 + ζ 5 + ζ 4 + ζ 3 + ζ 2 + ζ + 1 = 0. Außerdem ist z = ζ + ζ −1 . Wir teilen (11.12) durch ζ 3 und entwickeln nach Potenzen von z: ζ 3 + ζ 2 + ζ + 1 + ζ −1 + ζ −2 + ζ −3 = = = z 3 + ζ 2 + ζ −2 − 2ζ − 2ζ −1 + 1 z 3 + z 2 − 2ζ − 2ζ −1 − 1 z 3 + z 2 − 2z − 1. Definition 11.12. — Eine Körpererweiterung K → L heißt algebraisch, wenn jedes a ∈ L algebraisch über K ist, und andernfalls transzendent. Satz 11.13 — Die folgenden Aussagen über eine Körpererweiterung L/K sind äquivalent: (1) L/K ist endlich. (2) L/K ist algebraisch und endlich erzeugt. (3) L/K ist erzeugt von endlich vielen algebraischen Elementen. Beweis. 1 ⇒ 2: Es sei L/K endlich vom Grad n. Jede Vektorraumbasis ist ein Erzeugersystem. Deshalb ist L/K sicher endlich erzeugt. Für jedes a ∈ L sind die Elemente 1, a, . . . , an linear abhängig über K. Es gelte etwa f0 + f1 a + . . . + fn an = 0. Dann ist a Nullstelle des Polynoms P f = k fk X k und deshalb algebraisch. 2 ⇒ 3: Trivial. 3 ⇒ 1: Es seien s1 , . . . , sn ∈ L Elemente, die algebraisch über K sind und L erzeugen. Wir zeigen durch Induktion über n, daß der Körper Ki = K(s1 , . . . , si ) endlich über K ist. Für i = 1 ist dies klar. Angenommen, i > 1 und [Ki−1 : K] < ∞. Nach Annahme ist si algebraisch über K, also erst recht über Ki−1 . Es folgt mit dem Gradsatz: [Ki : K] = [Ki : Ki−1 ] · [Ki−1 : K] < ∞. Mit L = Kn hat man die Behauptung. Satz 11.14 — Die folgenden Aussagen über eine Erweiterung L/K sind äquivalent: (1) L ist algebraisch über K. (2) L wird von Elementen erzeugt, die algebraisch über K sind. (3) Jede endliche Menge S ⊂ L liegt in einem Zwischenkörper M von endlichem Grad über K. Beweis. 1 ⇒ 2: Trivial. 2 ⇒ 3: Es sei T ein Erzeugendensystem von L über K aus algebraischen Elementen und S ⊂ L eine endliche Teilmenge. Zu jedem Element s ∈ S gibt es eine endliche Menge Ts ⊂ T mit s ∈ K(Ts ). Es sei T ′ die Vereinigung aller Ts . Dann ist M = K(T ′ ) ein von endlich vielen algebraischen Elementen erzeugter Zwischenkörper und nach Satz 11.13 algebraisch über K von endlichem Grad. Algebra I im Wintersemester 2015 91 3 ⇒ 1: Jedes Element a ∈ L liegt in einem Zwischenkörper von endlichem Grad über K und ist deshalb nach Satz 11.13 algebraisch über K. Eine unmittelbare Folgerung des Satzes ist die folgende: Ist L/K eine Körpererweiterung, so ist die Menge aller Elemente in L, die algebraisch über K sind, ein Zwischenkörper. Definition 11.15. — 1. Es sei L/K eine Körpererweiterung. Der Zwischenkörper aller Elemente in L, die algebraisch über K sind, heißt algebraischer Abschluß von K in L. 2. Der algebraische Abschluß von Q in C wird mit Q bezeichnet und heißt der Körper der algebraischen Zahlen. Satz 11.16 — Es sei L/K eine algebraische und M/L eine beliebige Körpererweiterung. Ein Element a ∈ M ist genau dann algebraisch über L, wenn a algebraisch über K ist. Beweis. Wenn a algebraisch über K ist, ist es trivialerweise auch algebraisch über L. Es sei also umgekehrt a algebraisch über L und f = X n + fn−1 X n−1 + . . . + f0 das Minimalpolynom. Dann ist der von den Koeffizienten von f erzeugte Zwischenkörper L′ := K(f0 , . . . , fn−1 ) ⊂ L nach Satz 11.13 endlich über K, und nach Konstruktion ist a algebraisch über L′ . Daher ist [L′ (a) : K] = [L′ (a) : L′ ][L′ : K] < ∞ und somit a algebraisch über K. Man kann diesen Satz auch so ausdrücken, daß die Eigenschaft, eine algebraische Erweiterung zu sein, transitiv ist: Folgerung 11.17 — Sind M/L/K Körpererweiterungen, so ist M/K genau dann algebraisch, wenn M/L und L/K algebraisch sind. 11.3. Nullstellen und algebraisch abgeschlossene Körper. Im letzten Abschnitt sind wir analytisch vorgegangen: Die Körpererweiterung K → L war gegeben, und zu einem algebraischen Element a ∈ L haben wir das zugehörige Minimalpolynom betrachtet. In diesem Abschnitt gehen wir den umgekehrten synthetischen Weg: Wir starten mit einem Körper K und einem irreduziblen Polynom f ∈ K[X] und konstruieren eine Erweiterung K → L, in der f eine Nullstelle besitzt. Indem wir diesen Weg zu Ende gegen, können wir zu jedem Körper K eine algebraisch abgeschlossene Erweiterung K konstruieren. Es sei i : K → L eine Körpererweiterung. Diese Abbildung erweitert sich zu einer Inklusion von Polynomringen i′ : K[X] → L[X] durch i′ |K = i und i′ (X) = X. Solange keine Gefahr von Mehrdeutigkeiten besteht, schreiben wir wieder f statt i′ (f ) für Polynome f ∈ K[X]. Ein Polynom f ∈ K[X] kann in L Nullstellen bekommen oder über L in Faktoren zerfallen, die es über K noch nicht gab. Zum Beispiel ist X 4 + 1 ∈ Q[X] irreduzibel, besitzt aber über R bzw. C die Faktorisierungen X4 + 1 = = (X 2 + √ 2X + 1)(X 2 − 3 √ 2X + 1) 5 (X − ε)(X − ε )(X − ε )(X − ε7 ) mit der primitiven 8-ten Einheitswurzel ε = exp(2πi/8). Satz 11.18 (Kronecker) — Es sei K ein Körper und f ∈ K[X] ein irreduzibles normiertes Polynom vom Grad n. Dann ist M := K[X]/(f ) eine Körpererweiterung von K vom Grad n. Die Restklasse X ∈ M von X ist eine Nullstelle von f . Beweis. Weil f ein irreduzibles Polynom ist, ist das von f erzeugte Hauptideal (f ) ein maximales Ideal und deshalb K[X]/(f ) ein Körper. Daß f (X) ≡ 0 mod (f ), kann man auch so lesen, daß für die Restklasse X := X mod (f ) gilt: f (X̄) = 0. 92 Körpererweiterungen Man beachte, daß man — mit den Bezeichnungen des Satzes — zu jedem Element 0 6= ḡ = n−1 g0 +g1 X +. . .+gn−1 X ∈ M mit dem euklidischen Algorithmus ein Inverses explizit berechnen kann: Da f irreduzibel ist, sind f und g = g0 + g1 X + . . . + gn−1 X n−1 in K[X] teilerfremd. Man bestimmt dann mit dem euklidischen Algorithmus Polynome α und β mit 1 = αf + βg. Die Restklasse von β in M ist ein Inverses zu ḡ. Folgerung 11.19 — Es seien K ein Körper und f1 , . . . , fn ∈ K[X] \ {0} Polynome. Dann gibt es eine Körpererweiterung L/K derart, daß alle fi über L in Linearfaktoren zerfallen. Beweis. Man kann sich sofort auf den Fall n = 1 zurückziehen, indem man die Polynome durch ihr Produkt ersetzt. Es sei also f ein nichttriviales Polynom. Wir argumentieren mit Induktion über den Grad von f . Falls f den Grad 0 oder 1 hat, kann man L = K wählen. Andernfalls sei g|f ein irreduzibler normierter Faktor. Der Satz 11.18 garantiert die Existenz einer Erweiterung K → M und eines Elements β1 ∈ M mit g(β1 ) = 0. Es sei h := f /(X − β1 ) ∈ M [X]. Da grad(h) < grad(f ), folgt induktiv die Existenz einer Erweiterung M → L derart, daß h in L[X] in Linearfaktoren zerfällt: h = c(X − β2 ) · · · (X − βℓ ) mit βi ∈ M und c ∈ K. Damit hat man auch f = c(X − β1 ) · · · (X − βℓ ). Definition 11.20. — Ein Körper K heißt algebraisch abgeschlossen, wenn die folgenden äquivalenten Bedingungen erfüllt sind: (1) Jedes nichtkonstante Polynome f ∈ K[X] besitzt eine Nullstelle in K. (2) Jedes nichtkonstante Polynom f ∈ K[X] zerfällt in ein Produkt aus Linearfaktoren. (3) Jedes irreduzible Polynom f ∈ K[X] hat Grad 1. Der Beweis der Äquivalenz der Bedingungen ist einfach. Satz 11.21 (Fundamentalsatz der Algebra) — C ist algebraisch abgeschlossen. Da der Körper C als Erweiterung von R definiert ist und die Konstruktion von R analytische Elemente enthält, nämlich die Vervollständigung von Q bezüglich des Betrages, kommt man nicht ganz ohne analytische Hilfsaussagen aus. Man kann sie im Kern auf das folgende Lemma reduzieren: Lemma 11.22 — Jedes Polynom in R[X] von ungeradem Grad hat in R eine Nullstelle. Für jede positive reelle Zahl a hat X 2 − a eine positive Nullstelle in R. Beweis. Zwischenwertsatz. Aus der zweiten Aussage des Lemmas ergibt sich zunächst: Lemma 11.23 — Jedes quadratische Polynom in C[X] hat in C eine Nullstelle. Beweis. Durch quadratische Ergänzung führt man das Problem auf die Aussage zurück, daß jede komplexe Zahl eine komplexe Quadratwurzel besitzt. Ist nun a + bi 6= 0 vorgegeben, so führt der Ansatz (x + iy)2 = (a + bi) auf die Gleichungen p (11.13) x2 + y 2 = a2 + b2 , x 2 − y 2 = a mit den Lösungen (11.14) r p 1 x=± a + a2 + b2 , 2 r p 1 y=± −a + a2 + b2 . 2 Dabei sind die Vorzeichen so zu wählen, daß 2xy = b. Beweis des Hauptsatzes der Algebra. Es genügt zu zeigen, daß jedes nichtkonstante reelle Polynom in C eine Nullstelle besitzt. Denn ist f ein beliebiges komplexes Polynom, so ist g = f f reell, und ist α eine Nullstelle von g, so ist entweder α oder α eine Nullstelle von f . Algebra I im Wintersemester 2015 93 Es sei nun ein normiertes Polynom f ∈ R[X] vom Grad n vorgelegt. Wir schreiben n = 2m u mit einer ungeraden Zahl u und einem Exponenten m ∈ N0 . Wir führen den Beweis durch Induktion über m. Der Induktionsanfang m = 0 ist gerade der Fall eines Polynoms von ungeradem Grad n = u und wird durch den Zwischenwertsatz erledigt. ′ Es sei also m ≥ 1 und die Behauptung für alle Polynome vom Grad 2m u′ mit m′ < m schon gezeigt. Wir wählen eine algebraische Erweiterung R ⊂ C ⊂ L so, daß f über L in Linearfaktoren Q zerfällt, f = n i=1 (X −xi ). Wir betrachten für einen noch näher zu bestimmenden Parameter t ∈ R und für jedes Paar von Indizes 1 ≤ i < j ≤ n die Elemente cij = xi + xj + txi xj , sowie das Polynom Y (X − cij ). (11.15) Ft := i<j Offensichtlich ist Ft symmetrisch unter Permutation der xi . Die Koeffizienten von Ft lassen sich nach dem Hauptsatz über symmetrische Polynome polynomiell durch t und die Koeffizienten von f ausdrücken, sind also insbesondere reell. Das Polynom Ft ∈ R[X] hat den Grad ! n (11.16) deg(Ft ) = = 2m−1 u(2m u − 1) = 2m−1 u′ mit ungeradem u′ . 2 Nach Induktionsannahme ist eine der Nullstellen cij von Ft komplex, d.h. es gibt ein von der Wahl von t abhängiges Paar (i(t), j(t)) mit u(t) := xi(t) + xj(t) + txi(t) xj(t) ∈ C. Da es mehr reelle Zahlen als Paare (i, j) gibt, gibt es zwei verschiedene reelle Parameter s, t mit (i(s), j(s)) = (i(t), j(t)) =: (i, j). Wir haben also erreicht, daß (11.17) (xi + xj ) + sxi xj = u(s) ∈ C, (xi + xj ) + txi xj = u(t) ∈ C. Dieses lineare Gleichungssystem für xi + xj und xi xj hat eine eindeutige Lösung, weil die Determinante gleich t − s 6= 0 ist. Deshalb gilt (11.18) xi + xj , xi xj ∈ C. Damit sind xi und xj die beiden Lösungen einer quadratischen Gleichung mit komplexen Koeffizienten. Wir wissen, daß diese quadratische Gleichung komplexe Lösungen besitzt. Definition 11.24. — Es sei K ein Körper und F ⊂ K[X] eine Menge von nichttrivialen Polynomen. Eine Erweiterung L/K heißt Zerfällungskörper von F , wenn (1) jedes Polynom f ∈ F über L in Linearfaktoren zerfällt und (2) L von den Nullstellen der Polynome in F erzeugt wird. Nach Folgerung 11.19 gibt es für jede endliche Menge von Polynomen einen Zerfällungskörper. Wir wollen dieselbe Aussage für beliebige Mengen zeigen: Satz 11.25 (Existenz von Zerfällungskörpern) — Für jede Menge F ⊂ K[X] von nichttrivialen Polynomen gibt es einen Zerfällungskörper. Beweis. Wir geben uns die Menge F = {f (i) }i∈I von Polynomen vom Grad ni = deg(f (i) ) vor. Ohne Einschränkung kann man davon ausgehen, daß alle Polynome normiert sind. Wir schreiben dann (i) (i) . f (i) = X ni + f1 X ni −1 + . . . + fni −1 X + fn(i) i Wir führen für jedes Polynom f (i) Unbestimmte Xi1 , . . . , Xini ein und betrachten den von allen diesen Unbestimmten erzeugten Polynomring R = K[{Xij }i∈I,j=1,...,ni ]. Es sei (i) gij := σj (Xi1 , . . . , Xini ) − fj , i ∈ I, j = 1, . . . , ni , 94 Körpererweiterungen wo σj das j-te elementarsymmetrische Polynom bezeichnet, und a = ({gij }i∈I,j=1,...,ni ) ⊂ R das von allen gij erzeugte Ideal. Über dem Faktorring R/a sind die Restklassen der gij = 0, und gemäß den Formeln von Viète hat man in (R/a)[X] die Faktorisierungen (X − Xi1 ) · · · (X − Xini ) = f (i) (X). Diese Aussage wäre trivial, wenn R/a der Nullring wäre. Wir zeigen daher zunächst: a ( R. Andernfalls hätte man 1 ∈ a, d.h. es gäbe eine endliche Menge I0 ⊂ I und gewisse λij ∈ R mit (11.19) 1= ni XX λij gij i∈I0 j=1 Nach Folgerung 11.19 gibt es einen Erweiterungskörper a : K → M mit der Eigenschaft, daß alle f (i) , i ∈ I0 , in M [X] in Linearfaktoren zerfallen, etwa f (i) = (X − µi1 ) · · · (X − µini ), µij ∈ M. Nach der universellen Eigenschaft des Polynomrings gibt es genau einen Ringhomomorphismus Φ : R → M mit den Eigenschaften Φ|K = a und Φ(Xij ) = µij für i ∈ I0 und Φ(Xij ) = 0 für i ∈ I \ I0 . Weil f (i) für i ∈ I0 in M [X] in Linearfaktoren mit den Nullstellen µij faktorisiert, verschwinden die Bilder aller gij , i ∈ I0 , unter Φ. Angewendet auf die Identität 11.19 liefert Φ deshalb den Widerspruch X 1= Φ(λij )Φ(gij ) = 0. i∈I0 Somit ist gezeigt, daß a ⊂ R ein echtes Ideal ist. Mit transfiniter Induktion sieht man nun, daß es ein maximales Ideal m ⊂ R mit a ⊂ m gibt. Über dem Restklassenkörper K ′ := R/m zerfallen alle f (i) , i ∈ I, in Linearfaktoren, deren Nullstellen die Restklassen der Unbestimmten Xij sind. Weil K ′ von diesen Restklassen als Erweiterung von K erzeugt wird, ist K ′ ein Zerfällungskörper der Menge F . Definition 11.26. — Eine Erweiterung K → K ist ein algebraischer Abschluß von K, wenn K algebraisch abgeschlossen und algebraisch über K ist. Zum Beispiel ist C algebraisch abgeschlossen, aber nicht der algebraische Abschluß von Q. Wendet man Satz 11.25 auf die Menge aller normierten Polynome in K[X] an, erhält man die Existenz eines algebraischen Abschlusses: Satz 11.27 — Jeder Körper K besitzt einen algebraischen Abschluß. 11.4. Fortsetzungen von Einbettungen. Zu jeder Körpererweiterung ψ : K → L gehört ein injektiver Ringhomomorphismus ψ : K[X] → L[X] mit ψ : f = fn X n + . . . + f1 X + f0 7→ ψ(f ) = ψ(fn )X n + . . . + ψ(f1 )X + ψ(f0 ). Verschiedene Einbettungen ψ : K → L derselben Körper K und L geben notwendigerweise auch verschiedene Abbildungen der Polynomringe. Solange aber keine Mißverständnisse zu erwarten sind, schreiben wir weiter f statt ψ(f ), so als wäre ψ einfach eine Inklusion, um die Bezeichnungen lesbar zu halten. Algebra I im Wintersemester 2015 95 Definition 11.28. — Es seien i : K → K ′ und ψ : K → L Körpererweiterungen. Eine Fortsetzung von ψ auf K ′ ist ein Ringhomomorphismus ψ ′ : K ′ → L mit ψ ′ ◦ i = ψ. Jede solche Fortsetzung ist K-linear. Umgekehrt ist jeder K-lineare Homomorphismus von Ringen K ′ → L eine Fortsetzung von ψ. ′ ψ KO ′ _ _ _/> L i K } }} }}ψ } }} Satz 11.29 — Es sei K(a)/K eine einfache algebraische Erweiterung mit Minimalpolynom f = minpola/K . Jede Fortsetzung einer gegebenen Einbettung ψ : K → L auf K(a) bildet a auf eine Nullstelle von ψ(f ) in L ab. Umgekehrt gibt es zu jeder Nullstelle β von ψ(f ) in L genau eine Fortsetzung ψ ′ : K(a) → L mit ψ ′ (a) = β. Insbesondere ist die Anzahl der verschiedenen Fortsetzungen von ψ genau die Anzahl der verschiedenen Nullstellen von f in L. Beweis. Da f (a) = 0, ist zunächst klar, daß jede Fortsetzung ψ ′ : K(a) → L das Element a auf eine Nullstelle von ψ(f ) in L abbilden muß: 0 = ψ ′ (f (a)) = ψ(f )(ψ(a)). Und da K(a) von a erzeugt ist, liegt ψ ′ durch den Wert auf a fest. Es sei nun umgekehrt eine Nullstelle β ∈ L von ψ(f ) vorgegeben. Es ist K(a) = K[X]/(f ). Wegen der universellen Eigenschaft des Polynomrings gibt es genau einen Homomorphismus ψ̃ : K[X] → L mit X 7→ β, der die Erweiterung ψ : K → L fortsetzt. Dabei geht f auf ψ̃(f (X)) = ψ(f )(ψ̃(X)) = ψ(f )(β) = 0. Insbesondere faktorisiert ψ̃ nach der universellen Eigenschaft des Restklassenrings über einen Homomorphismus ψ ′ : K(a) = K[X]/(f ) → L. Satz 11.30 (Existenz von Fortsetzungen) — Es sei L/K eine algebraische Erweiterung. Dann läßt sich jede Einbettung j : K → M in einen algebraisch abgeschlossenen Körper M zu einer Einbettung i : L → M fortsetzen. Beweis. Wir betrachten die Menge X = {(L′ , i′ )} aller Paare aus einem Zwischenkörper L′ , K ⊂ L′ ⊂ L, und einer Einbettung i′ : L′ → M mit i′ |K = j. Dann enthält X wenigstens das Element (K, j) und ist deshalb nicht leer. Die Menge X ist halbgeordnet durch die Relation (11.20) (L′ , i′ ) ≤ (L′′ , i′′ ) :⇔ L′ ⊂ L′′ und i′′ |L′ = i′ . S Ist nun Y ⊂ X eine Kette, so setzen wir LY := L′ ∈Y L′ und definieren iY : LY → M durch iY |L′ := i′ . Dann liegt das Paar (LY , iY ) wieder in X und ist nach Konstruktion eine obere Schranke von Y . Mit anderen Worten: (X, ≤) ist induktiv geordnet. Nach dem Zornschen Lemma existiert in X ein maximales Element (L0 , i0 ). Angenommen, die Inklusion L0 ⊂ L ist echt. Jedes Element a ∈ L \ L0 ist algebraisch über K, also erst recht über L0 . Das Minimalpolynom g von a über L0 besitzt in M eine Nullstelle, weil M algebraisch abgeschlossen ist. Folglich gibt es eine Fortsetzung i′0 : L0 (a) → M von i0 . Das Paar (L0 (a), i′0 ) widerspräche der Maximalität von (L0 , i0 ). Daher gilt in der Tat L0 = L, und i := i0 ist eine Fortsetzung von j, wie verlangt. Satz 11.31 (Eindeutigkeit des Zerfällungskörpers) — Es seien i1 : K → L1 und i2 : K → L2 zwei Zerfällungskörper einer Menge F von nichttrivialen Polynomen in K[X]. (1) Es gibt einen K-linearen Ringhomomorphismus a : L1 → L2 . (2) Ist L2 ⊂ M irgendeine Körpererweiterung und a : L1 → M ein K-linearer Ringhomomorphismus, so gilt a(L1 ) = L2 Insbesondere sind alle Zerfällungskörper von F isomorph. 96 Körpererweiterungen Beweis. Es gibt immer eine K-lineare Einbettung von L1 in einen algebraischen Abschluß von L2 . Deshalb ist die erste Behauptung des Satzes eine Konsequenz der zweiten, und es genügt, diese zu zeigen: Es sei f ∈ F und es seien α1 , . . . , αn die Nullstellen von f in L1 und β1 , . . . , βn die Nullstellen von f in L2 und damit in M . Deshalb gilt: (X − a(α1 )) · · · (X − a(αn )) = i2 (f )(X) = (X − β1 ) · · · (X − βn ). Bis auf die Reihenfolge stimmten die Bilder a(αi ) mit den βi überein. Weil L1 von den Nullstellen aller Polynome aus F erzeugt wird, folgt daraus zum Einen, daß a(L1 ) in L2 liegt, und weil L2 von den Nullstellen der Polynome von F erzeugt wird und diese im Bild von a liegen, folgt zum Anderen, daß a(L1 ) = L2 . Weil der algebraische Abschluß eines Körpers als Zerfällungskörper beschrieben werden kann, erhält aus dem vorigen Satz sofort: Satz 11.32 (Eindeutigkeit des algebraischen Abschlusses) — Es seien K → K ′ und K → K ′′ algebraische Abschlüsse. Dann gibt es eine K-lineare Einbettung K ′ → K ′′ , und jede solche Einbettung ist ein Isomorphismus. 11.5. Endliche Körper. Satz 11.33 — Es sei p eine Primzahl, K ein Körper der Charakteristik p, und F : K → K der Frobeniushomomorphismus. Falls K endlich oder algebraisch abgeschlossen ist, ist F surjektiv. Beweis. In jedem Falle ist F injektiv. Injektive Abbildungen einer endlichen Menge in sich selbst sind stets auch surjektiv. Das erledigt die Behauptung für endliche Körper. Falls K algebraisch abgeschlossen ist, hat die Gleichung X p − a = 0 für jedes a ∈ K eine Lösung, etwa β ∈ K. Es folgt F (β) = β = a. Also ist F auch in diesem Falle surjektiv. Satz 11.34 — Es sei p eine Primzahl und Fp ein algebraischer Abschluß von Fp . (1) Für jedes ℓ ∈ N gibt es in Fp genau einen Unterkörper mit pℓ Elementen. Dieser wird mit Fpℓ bezeichnet. (2) Ist K ein endlicher Körper der Charakteristik p und vom Grad ℓ über seinem Primkörper, ∼ Fp ℓ . so gilt K = Beweis. Die Frobeniusabbildung F : x 7→ xp ist ein Automorphismus von Fp . Dasselbe gilt dann für die ℓ-te Potenz F ℓ . Die Menge ℓ Fpℓ := {u ∈ Fp | u = F p (u) = up } der Fixpunkte von F ℓ ist ein Unterkörper von Fp . Nun besteht Fpℓ genau aus den Elementen u mit der ℓ ℓ Eigenschaft up = u, also den Nullstellen des Polynoms f = X p −X. Wegen f ′ = −1 hat f keine mehrfachen Nullstellen. Da K aber algebraisch abgeschlossen ist und f deshalb in Linearfaktoren zerfällt, hat f genau pℓ verschiedene Nullstellen. Folglich hat Fpℓ genau pℓ Elemente. Es sei nun K irgendein endlicher Körper der Charakteristik p und vom Grad ℓ über seinem Primkörper Fp . Nach Satz 11.30 gibt es eine Einbettung ψ : K → Fp . Die Einheitengruppe K × hat die ℓ Ordnung pℓ − 1. Für jedes Element x ∈ K × gilt deshalb xp −1 = 1. Insbesondere gilt für jedes ℓ Element x ∈ K die Gleichung xp = x. Aber das bedeutet ψ(K) ⊂ Fpℓ . Da die beiden Körper gleich viele Elemente enthalten, ist ψ : K → Fpℓ ein Isomorphismus. Folgerung 11.35 — Es sei p eine Primzahl. Zu jeder natürlichen Zahlen n gibt es genau einen Zwischenkörper Fp ⊂ Fpℓ ⊂ Fp . Dabei gilt Fp m ⊂ Fp n ⇔ m|n. Algebra I im Wintersemester 2015 97 Beweis. Jede endliche Erweiterung eines endlichen Körpers mit q = pm Elementen vom Grad ℓ enthält q ℓ = pmℓ Elemente. Das zeigt die Notwendigkeit der Teilbarkeitsrelation. Die Umkehrung folgt aus der Charakterisierung von Fpn als Fixpunktmenge von F n . Wir haben schon früher einen Beweis des folgenden Satzes gesehen. Der Beweis hier unterscheidet sich nur in einer Nuance von dem früheren: Satz 11.36 — Es sei K ein Körper. Jede endliche Untergruppe G ⊂ K × ist zyklisch. Beweis. G ist abelsch. Wir wissen, daß in endlichen abelschen Gruppen die Ordnung jedes Elements ein Teiler des Exponenten ex(G) = max{ord(g) | g ∈ G} ist (Satz 7.30). Für die Gruppe G heißt das, daß alle Gruppenelemente von G Nullstellen des Polynoms X ex(G) −1 sind. Dieses Polynom hat höchstens ex(G) Nullstellen, d.h. |G| ≤ ex(G). Da trivialerweise auch die umgekehrte Ungleichung besteht, gilt sogar Gleichheit. Folglich gibt es ein g ∈ G mit ord(g) = |G|, und dieses g erzeugt G. Folgerung 11.37 — Ist K ein endlicher Körper, |K| = pℓ , so ist K × zyklisch von der Ordnung pℓ − 1. Insbesondere gibt es ein Element θ ∈ K mit der Eigenschaft, daß K = Fp (θ). Das Minimalℓ polynom von θ ist ein Teiler des Polynoms xp −1 − 1 und zerfällt über K in paarweise verschiedene Linearfaktoren. Genauer ist θ eine Nullstelle des (pℓ−1 − 1)-ten Kreisteilungspolynoms Φpℓ−1 −1 (cf. Abschnitt §13). Dieses Polynom ist irreduzibel über Z, zerfällt aber im allgemeinen über Fp . Beispiel 11.38. — Wir betrachten die Erweiterung F5 ⊂ F25 . Über Z hat man eine Faktorisierung Q X 24 − 1 = n|24 Φn mit irreduziblen Faktoren. Φ1 = X − 1, Φ3 = X 2 + X + 1, Φ2 = X + 1, Φ6 = X 2 − X + 1, Φ4 = X 2 + 1, Φ12 = X 4 − X 2 + 1, Φ8 = X 4 + 1, Φ24 = X 8 − X 4 + 1. Ein Element α in F× 25 hat die Ordnung m genau dann, wenn α eine Nullstelle von Φm ist. Die Elemente der Ordnungen 1, 2 und 4 liegen schon in F× 5 . Die entsprechenden zyklotomischen Polynome zerfallen über F5 in Linearfaktoren: Φ1 ≡ X + 4, Φ2 ≡ X + 1, Φ4 ≡ (X + 2)(X + 3). Die übrigen zyklotomischen Polynome Φm , m|24, zerfallen über F5 in quadratische Polynome: Φ3 ≡ X 2 + X + 1 Φ6 ≡ X 2 + 4X + 1 und Φ24 ≡ ≡ ≡ Φ8 ≡ (X 2 + 2)(X 2 + 3) Φ12 ≡ (X 2 + 2X + 4)(X 2 + 3X + 4) X 8 + 4X 4 + 1 (X 4 + 2X 2 + 4)(X 4 + 3X 2 + 4) (X 2 + 3X + 3)(X 2 + 2X + 3)(X 2 + X + 2)(X 2 + 4X + 2) mod 5. Die Nullstellen der Polynome Φ3 , Φ6 , Φ12 und Φ24 erzeugen alle den Körper F25 als Erweiterung von F5 , aber nur die acht Nullstellen von Φ24 erzeugen F× 25 als Gruppe. 98 Körpererweiterungen §12. Galoistheorie 12.1. Separabilität. Definition 12.1. — Es sei K ein Körper. f ∈ K[X] heißt separabel, wenn f in jeder Erweiterung von K nur einfache Nullstellen hat, und andernfalls inseparabel. Es sei L/K eine Körpererweiterung, in der das nichtkonstante Polynom f ∈ K[X] eine Nullstelle α besitzt. Nach dem Kriterium von Hudde ist α genau dann eine mehrfache Nullstelle, wenn f ′ (α) = 0. In diesem Falle haben f und f ′ in L[X] einen nichtkonstanten Faktor gemeinsamen. Aber der größte gemeinsame Teiler läßt sich mit dem euklidischen Algorithmus bereits in K[X] berechnen. Damit erhält man das Kriterium: Lemma 12.2 — Ein Polynom f ∈ K[X] \ {0} ist genau dann separabel, wenn der größte gemeinsame Teiler von f und f ′ konstant ist. Satz 12.3 — Es sei f ∈ K[X] ein normiertes irreduzibles Polynom vom Grad n > 0. (1) Wenn char(K) = 0, ist f separabel. e (2) Wenn char(K) = p > 0, so sei e ∈ N0 maximal mit der Eigenschaft, daß f (X) = g(X p ) für ein Polynom g. Dann ist g normiert, irreduzibel und separabel, und f ist genau dann separabel, wenn e = 0. Beweis. Es sei f ein normiertes irreduzibles Polynom von positivem Grad. Wenn f und f ′ in einer Erweiterung von K eine gemeinsame Nullstelle haben, müssen sie schon in K[X] einen nicht konstanten gemeinsamen Teiler haben. Da grad(f ′ ) < grad(f ) und da f irreduzibel, ist dies nur möglich, wenn f ′ = 0. In Charakteristik 0 ist dies ausgeschlossen, weil f nicht konstant ist. Es sei also p = char(K) > 0. Mit dem Ansatz f = X n + fn−1 X n−1 + . . . + f1 X + f0 (12.1) folgt aus der Annahme (12.2) 0 = f ′ = nX n−1 + (n − 1)fn−1 X n−2 + . . . + f1 , daß p|k für alle k mit fk 6= 0. Mit m := n/p hat man daher (12.3) f = (X p )m + f(m−1)p (X p )m−1 + . . . + fp X p + f0 . Das bedeutet: f (X) = h(X p ) für ein geeignetes Polynom h. Es ist klar, daß h irreduzibel und normiert ist. Ist h nicht separabel, hat man h(X) = k(X p ) mit geeignetem Polynom k und so2 mit f (X) = k(X p ). Iteriert man das Argument, so kommt man nach endlich vielen Schritten zu e f (X) = g(X p ) mit separablem g ∈ K[X]. Beispiele 12.4. — 1. Es sei p eine Primzahl. Wir betrachten über dem Körper Fp (t) das Polynom f = X p − t. Nach dem Eisensteinkriterium ist f irreduzibel, denn t ist ein Primelement im faktoriellen Ring Fp [t]. Offensichtlich ist f inseparabel. 2. Das Polynom ist X 7 − 3 ∈ F7 [X] ist nicht einmal irreduzibel: Da 37 ≡ 3 mod 7, gilt X 7 − 3 = X 7 − 37 = (X − 3)7 . Definition 12.5. — Es sei L/K eine algebraische Körpererweiterung. (1) a ∈ L ist separabel über K, wenn das Minimalpolynom von a über K separabel ist, und andernfalls inseparabel. a ist rein inseparabel, wenn es neben a selbst in keiner Erweiterung von K ein anderes zu a konjugiertes Element gibt. (2) L ist separabel über K, wenn alle Elemente von L separabel über K sind, und andernfalls inseparabel. L ist rein inseparabel über K, wenn alle Elemente von L rein inseparabel über K sind. Algebra I im Wintersemester 2015 99 Die Definition bringt es sich mit sich, daß ein Element a ∈ K zugleich separabel und rein inseparabel über K ist, denn das Minimalpolynom X − a hat genau eine Nullstelle. Das klingt auf den ersten Blick etwas unangenehm, vermeidet aber Fallunterscheidungen in den Formulierungen späterer Sätze. Ein Element a ist offenbar genau dann inseparabel über K, wenn das Minimalpolynom die Form e e xp − ap hat. Definition 12.6. — Ein Körper K heißt vollkommen oder perfekt, wenn jedes normierte irreduzible Polynom über K separabel ist, oder dazu äquivalent, wenn jede algebraische Erweiterung von K separabel ist. Satz 12.7 (Kriterien für Vollkommenheit) — (1) Körper der Charakteristik 0 sind vollkommen. (2) Ein Körper K der Charakteristik p > 0 ist genau dann vollkommen, wenn die Frobeniusabbildung F : K → K, x 7→ xp , surjektiv ist, d.h. wenn jedes Element α ∈ K eine p-te Wurzel in K besitzt. Insbesondere sind endliche Körper und algebraisch abgeschlossene Körper vollkommen. Beweis. Die erste Aussage ist trivial. Zur zweiten: Wenn F nicht surjektiv ist und a ∈ K \ K p , K p := F (K), dann ist X p − a ein inseparables irreduzibles Polynom. Es sei umgekehrt F surjektiv. Angenommen, f ist ein inseparables irreduzibles Polynom. Es gibt dann ein Polynom g = gm X m + 1/p . . . + g1 X + g0 mit f (X) = g(X p ). Es sei hi := F −1 (gi ) = gi . Mit h = X m + . . . + h1 X + h0 folgt: f (X) = g(X p ) = h(X)p , im Widerspruch zur Irreduzibilität von f . Satz 12.8 — Es sei K ein endlicher Körper der Charakteristik p. Dann gilt K = Fp (a) mit einem separablen Element a. Beweis. Nach Satz 11.36 ist die Einheitengruppe eines endlichen Körpers zyklisch: Bezeichnet ℓ := [K : Fp ] den Grad der Erweiterung, so gilt K × ∼ = Z/(pℓ −1). Ist a ein Gruppenerzeuger, so hat man ℓ K = {0} ∪ {ai | i = 1, . . . , pℓ − 1}. Außerdem ist a Nullstelle des Polynoms f := X p − X. Da f ′ = −1, hat f keine mehrfache Nullstellen und somit das Minimalpolynom von a, das ein Teiler von f ist, auch nicht. Satz 12.9 (Satz vom primitiven Element) — Es sei L = K(a1 , a2 , . . . , an )/K eine algebraische Erweiterung mit separablen Elementen a1 ,. . . , an−1 . Dann ist L/K eine einfache Erweiterung, d.h. es gibt ein Element c ∈ L mit L = K(c). Sind alle Elemente a1 ,. . . ,an separabel, so kann auch c separabel gewählt werden. Beweis. Wenn K endlich ist, ist auch L endlich und wird von jedem Erzeuger θ der zyklischen Einheitengruppe L× erzeugt. Wir können deshalb im Folgenden ohne Einschränkung annehmen, daß K unendlich viele Elemente hat. Außerdem genügt es, den Fall n = 2 zu betrachten, der allgemeine Fall folgt induktiv. Wir betrachten also eine algebraische Erweiterung L = K(a, b)/K und nehmen an, daß a separabel ist. Es sei M eine Erweiterung von L, in der die Minimalpolynome f von a bzw. g von b in Linearfaktoren zerfallen. Wir bezeichnen mit a1 = a, a2 , . . . , an und b1 = b, b2 , . . . , bℓ die paarweise verschiedenen Nullstellen von f bzw. g und betrachten für ein noch näher zu bestimmendes t ∈ K × das Element c := at + b ∈ L. Dann haben die Polynome f (X) und g(c − tX) die gemeinsame Nullstelle a. Die weiteren Nullstellen von f (X) sind a2 , . . . , an , die weiteren Nullstellen von g(c − tX) die Elemente a + (b − bj )/t. Wir wählen jetzt t so, daß (ai − a)t 6= b − bj für alle i > 1 und alle j. Dies ist möglich, weil |K| = ∞ und weil durch diese Bedingung nur endlich viele Werte von t ausgeschlossen sind. 100 Galoistheorie Nun ist der größte gemeinsame Teiler von f (X) und g(c−tX) in K(c)[X] genau X −a. Deshalb läßt sich X − a als Linearkombination von f (X) und g(c − tX) mit Koeffizienten in K(c)[X] schreiben. Insbesondere liegt a in K(c), und damit auch b = c − at. Das zeigt: K(a, b) ⊂ K(c). Die umgekehrte Inklusion ist trivial. Wir nehmen jetzt an, sowohl a als auch b seien separabel. Dann kann man t auch noch so wählen, daß (ai − ai′ )t 6= bj − bj ′ falls i 6= i′ oder j 6= j ′ . Dann sind alle Elemente cij = ai + tbj paarweise verschieden. Das Polynom YY (X − cij ) (12.4) h(X) = i j ist symmetrisch unter Permutation der ai untereinander und der bj untereinander. Nach dem Hauptsatz über symmetrische Polynome lassen sich die Koeffizienten von h polynomiell durch die Koeffizienten von f und g ausdrücken und liegen deshalb in K. Deshalb ist das Minimalpolynom von c ein Teiler von h. Nach Konstruktion sind die Nullstellen von h paarweise verschieden. Deshalb ist das Minimalpolynom von c separabel. Definition 12.10. — Es sei L/K eine endliche Erweiterung und K → K ein algebraischer Abschluß. Weil alle algebraischen Abschlüsse von K isomorph sind, hängt die Anzahl der Fortsetzungen L → K nicht von der Wahl von K ab. Diese Zahl heißt der Separabilitätsgrad von L/K und wird mit [L : K]s bezeichnet. Satz 12.11 — Es sei L = K(α)/K eine einfache algebraische Erweiterung. (1) Wenn char(K) = 0, ist [L : K] = [L : K]s . (2) Wenn char(K) = p > 0, so ist [L : K] = pe [L : K]s , wobei e ∈ N0 maximal mit der e Eigenschaft ist, daß das Minimalpolynom von α die Form g(X p ) hat. Beweis. Es sei f das Minimalpolynom von α über K und n = [L : K] = grad(f ). Wenn α separabel ist, hat das Minimalpolynom n verschiedene Nullstellen in K. Deshalb gilt in diesem Falle [L : K]s = n. Wenn α nicht separabel ist, hat K positive Charakteristik p. Mit e und g wie im e e Satz gilt also f (X) = g(X p ), und g ist das Minimalpolynom von αp . Mit m = grad(g) gilt e n = mpe , und da g separabel ist, gibt es m verschiedene Fortsetzungen ϕi : K(αp ) → K. Das e e e Minimalpolynom von α über K(αp ) ist X p − αp . Es hat in K genau eine Nullstelle. Deshalb setzt sich jedes ϕi eindeutig auf K(α) fort. Darum ist [L : K]s = m = n/pe . Satz 12.12 — Es seien M/L/K endliche Erweiterungen. Dann gilt (12.5) [M : K]s = [M : L]s [L : K]s . Beweis. Es sei ein algebraischer Abschluß K → K gewählt. Es bezeichne FM/K die Menge der Fortsetzungen auf M und FL/K die Menge der Fortsetzungen auf L. Die Einschränkung ψ 7→ ψ|L definiert eine Abbildung E : FM/K → FL/K . Da sich jede Fortsetzung auf L zu einer Fortsetzung auf M fortsetzen läßt, ist E surjektiv. Es sei sei nun eine Fortsetzung ϕ : L → K fixiert. Alle Elemente in K sind algebraisch über K, also erst recht über L, und da K algebraisch abgeschlossen ist, ist K auch ein algebraischer Abschluß von L. Nach Definition gibt es genau [M : L]s verschiedene Fortsetzungen von ϕ auf M . Mit anderen Worten: |E −1 (ϕ)| = [M : L]s . Es folgt: P [M : K]s = |FM/K | = ϕ∈FL/K [M : L]s = [M : L]s [L : K]s . Satz 12.13 — Für jede endliche Erweiterung L/K ist [L : K]s ein Teiler von [L : K]. Die folgenden Aussagen sind äquivalent: (1) [L : K]s = [L : K]. (2) L/K ist separabel. (3) L wird von separablen Elementen erzeugt. Algebra I im Wintersemester 2015 101 (4) L = K(a) für ein separables Element a. Beweis. Wir wählen a ∈ L\K und betrachten die Erweiterungen K → K(a) → L. Nach den Sätzen 12.11 und 12.12 und durch Induktion über den Grad ergibt sich zunächst die Teilbarkeitsrelation (12.6) [L : K]s = [L : K(a)]s [K(a) : K]s | [L : K(a)][K(a) : K] = [L : K] und damit die erste Behauptung. 1 ⇒ 2: Wenn die äußeren Terme gleich sind, so muß auch [K(a) : K]s = [K(a) : K] gelten, d.h. a ist separabel. Die Implikation 2 ⇒ 3 ist trivial. 3 ⇒ 4: Es seien a1 , . . . an separable Elemente mit L = K(a1 , . . . , an ). Gemäß dem Satz vom primitiven Element 12.9 gibt es ein separables a ∈ L mit L = K(a). 4 ⇒ 1: Ist schließlich L = K(a) für ein separables Element, so gilt [L : K]s = [L : K] nach Satz 12.11. Satz 12.14 — Es seien M/L/K algebraische Erweiterungen. (1) L/K ist genau dann separabel, wenn L als K-Erweiterung von separablen Elementen erzeugt wird. (2) M/K ist genau dann separabel, wenn L/K und M/L separabel sind. Beweis. Es sei S ⊂ L ein Erzeugendensystem aus separablen Elementen und a ∈ L ein beliebiges Element. Dann gibt es eine endliche Teilmenge S ′ ⊂ S mit a ∈ K(S ′ ) ⊂ L. Nach Konstruktion ist [K(S ′ ) : K] < ∞, und nach Satz 12.13 folgt, daß alle Elemente in K(S ′ ) separabel über K sind. Satz 12.15 — Es sei L/K eine algebraische Körpererweiterung. Die folgenden Aussagen sind äquivalent: (1) (2) (3) (4) Jedes über K separable Element von L liegt in K. L/K ist rein inseparabel. L wird als Erweiterung von K von rein inseparablen Elementen erzeugt. [L : K]s = 1. Beweis. Falls K = L, ist der Satz aus trivialen Gründen richtig. Wir nehmen also an, daß [L : K] > 1. Zunächst gilt 1 ⇒ 2: Es sei a ∈ L \ K mit Minimalpolynom f . Nach Annahme ist a inseparabel über K. Deshalb ist p = char(K) > 0 und es gibt ein e > 0 und ein separables Polynom g mit e e f (X) = g(X p ). Nun ist ap separabel über K und liegt deshalb schon selbst in K, d.h. g ist linear und somit a rein inseparabel. Die Implikation 2 ⇒ 3 ist trivial. 3 ⇒ 4: Es sei L = K(S) mit einer Menge S von rein inseparablen Elementen. Sind f1 , f2 : L → K verschiedene Einbettungen, so muß es ein α ∈ S mit f1 (α) 6= f2 (α) geben. Aber f1 (α) und f2 (α) sind Nullstellen des Minimalpolynoms von α in K, also gleich. Widerspruch. 4 ⇒ 1: Es sei a ∈ L über K separabel. Da sich jede Einbettung K(a) → K auf L fortsetzen läßt, hat man [L : K]s ≥ [K(a) : K] > 1, im Widerspruch zur Annahme. Satz 12.16 — Es sei L/K eine algebraische Erweiterung. Dann gibt es genau einen Zwischenkörper M ⊂ L mit der Eigenschaft, daß M/K separabel und L/M rein inseparabel ist. Beweis. Es sei M ⊂ L die Menge aller über K separablen Elemente. Nach Satz 12.14 besteht K(M ) nur aus separablen Elementen, ist also gleich M . Es sei nun a ∈ L\M mit Minimalpolynom f (X) = e e g(X p ) und separablem g. Dann ist b := ap separabel über M und deshalb nach Satz 12.14 auch e separabel über K. Nach Konstruktion liegt b schon in M , und f hat die Form f (X) = X p − b. Das zeigt, daß a rein inseparabel über M ist. 102 Galoistheorie Definition 12.17. — Der Zwischenkörper M im vorstehenden Satz heißt die separable Hülle von K in L. Die separable Hülle von K in einem algebraischen Abschluß K heißt separabler Abschluß von K und wird mit K s bezeichnet. In der üblichen Weise zeigt man, daß der separable Abschluß bis auf (nicht eindeutigen) Isomorphismus eindeutig ist. 12.2. Normale Erweiterungen und Zerfällungskörper. Definition 12.18. — Es sei L/K eine Körpererweiterung. (1) L/K ist normal, wenn jedes irreduzible Polynom f ∈ K[X], das in L wenigstens eine Nullstelle besitzt, über L vollständig in Linearfaktoren zerfällt. (2) L/K ist Zerfällungskörper einer Menge F ⊂ K[X] von Polynomen, wenn jedes f ∈ F über L vollständig in Linearfaktoren zerfällt und wenn L von den Nullstellen der Polynome f ∈ F erzeugt wird. Satz 12.19 (Normalitätskriterium) — Die folgenden Aussagen über eine algebraische Erweiterung L/K sind äquivalent: (1) L/K ist normal. (2) L/K ist Zerfällungskörper einer Menge F ⊂ K[X]. (3) Jede K-lineare Einbettung σ : L → L in einen algebraischen Abschluß L von L bildet L in sich ab. In diesem Falle ist jede Abbildung σ : L → L wie in Aussage 3 ein Isomorphismus. Beweis. 1 ⇒ 2. Es sei S ⊂ L ein Erzeugendensystem von L/K und F die Menge der Minimalpolynome der Elemente aus S. Dann hat jedes Polynom aus F nach Konstruktion eine Nullstelle in L und zerfällt nach Annahme über L vollständig in Linearfaktoren. Außerdem sind die Nullstellen der Polynome f ∈ F ein Erzeugendensystem. Nach Definition ist L/K ein Zerfällungskörper von F . 2 ⇒ 3. Es sei ein algebraischer Abschluß j : L → L gewählt und σ : L → L eine K-lineare Fortsetzung: j4 L j j ? j j j j j j j j L `@ L @@ ~> ~ @@ ~ @@ ~~ ~~ σ K Dann bildet σ jede Nullstelle eines Polynoms f in eine ebensolche Nullstelle ab. Alle diese Nullstellen liegen in L. Deshalb liegen die Bilder aller Nullstellen aller f ∈ F wieder in L. Da L außerdem von diesen Nullstellen erzeugt wird, gilt σ(L) ⊂ L. 3 ⇒ 1: Es sei a ∈ L und b ∈ L eine Nullstelle des Minimalpolynoms von a. Dann gibt es eine Klineare Einbettung ψ : K(a) → L mit ψ(a) = b. Wir setzen diese zu einer Einbettung σ : L → L fort. Nach Annahme gilt σ(L) ⊂ L, also erst recht b = σ(a) ∈ L. Das zeigt, daß L normal ist. Die Schlußbehauptung folgt aus dem Eindeutigkeitssatz 11.31 für Zerfällungskörper. Satz 12.20 (Normale Hülle) — Es sei L/K eine algebraische Erweiterung. Dann gibt es eine algebraische Erweiterung N/L mit der Eigenschaft, daß N/K normal ist und daß N der kleinste Zwischenkörper von L/L mit dieser Eigenschaft ist. Wenn L/K eine endliche Erweiterung ist, so ist auch N/K endlich. N/L heißt normale Hülle von L/K. Beweis. Es sei L → L ein algebraischer Abschluß, S ⊂ L ein Erzeugendensystem von L/K und F = {minpolα/K | α ∈ S} ⊂ K[X]. Es sei N ⊂ L der von allen Nullstellen der Polynome f ∈ F erzeugte Körper. Dann ist N normal über K und enthält L und ist der kleinste Unterkörper in L Algebra I im Wintersemester 2015 103 mit diesen beiden Eigenschaften. Wenn L/K eine endliche Erweiterung ist, kann S endlich gewählt werden. Es folgt |F | < ∞ und [N : K] < ∞. Wie üblich zeigt man, daß die normale Hülle N/L einer algebraischen Erweiterung L/K bis auf (nicht eindeutigen) L-linearen Isomorphismus eindeutig ist. Beispiel 12.21. — Ist ein Polynom f ∈ K[X] vorgegeben, läßt sich der Grad des Zerfällungskörpers nur durch eine Einzeluntersuchung angeben, wie die beiden folgenden Beispiele zeigen. Wir betrachten die ähnlich aussehenden Polynome f = X 6 − 3 und g = X 6 + 3 in Q[X]. Nach dem Eisensteinkriterium sind beide irreduzibel. √ 1. Es sei L = Q(α) mit α = 6 3. In L[X] zerfällt f in vier Faktoren: (12.7) X 6 − 3 = (X − α)(X + α)(X 2 + αX + α2 )(X 2 − αX + α2 ). Die beiden quadratischen Faktoren können über L nicht weiter zerfallen, weil die Gleichung f = 0 die Lösungen αρk , k = 0, . . . , 5 mit ρ = exp(2πi/6) hat, von denen nur α und −α = αρ3 reell sind. Adjungiert man an L eine Nullstelle β von X 2 − αX + α2 , etwa M := L(β), so zerfällt dieses quadratische Polynom in die Faktoren (X − β)(X − α + β), aber auch das andere zerfällt und man erhält insgesamt die Zerlegung (12.8) X 6 − 3 = (X − α)(X + α)(X − β)(X + β)(X − α + β)(X + α − β) über M . Es gilt [M : Q] = [M : L][L : Q] = 2 · 6 = 12. 2. Völlig anders ist die Situation im Falle von g: Ist γ ∈ C eine Nullstelle von g, so gilt für ω := (γ 3 + 1)/2, daß ω 6= −1, aber 1 1 9 (γ + 3γ 6 + 3γ 3 + 1) = (−3γ 3 + 3 · (−3) + 3γ 3 + 1) = −1. 8 8 Deshalb ist ω ∈ Q(γ) eine primitive sechste Einheitswurzel, und g hat in Q(γ) sechs Nullstellen: (12.9) ω3 = −γ + γ 4 γ4 + γ γ − γ4 γ4 + γ , γω 2 = , γω 3 = −γ, γω 4 = − , γω 5 = . 2 2 2 2 Deshalb ist Q(γ) schon der Zerfällungskörper von g, und [Q(γ) : Q] = 6. (12.10) γ, γω = 12.3. Galoiserweiterungen. Definition 12.22. — Es sei L ein Körper. Die Menge der Automorphismen σ : L → L bildet mit der Komposition als Verknüpfung die Automorphismengruppe Aut(L). Es sei außerdem i : K → L eine Körpererweiterung. σ : L → L ist ein relativer Automorphismus der Erweiterung L/K, wenn σ ◦ i = i. Die relativen Automorphismen bilden eine Untergruppe Aut(L/K) < Aut(L). Ist G ⊂ Aut(L) irgendeine Teilmenge der Automorphismengruppe eines Körpers L, so ist die Fixpunktmenge LG = {x ∈ L | σ(x) = x für alle σ ∈ G} ein Unterkörper von L, wie man sich leicht klar macht. Warnung: Falls L/K inseparabel ist, muß eine K-lineare Einbettung σ : L → L kein Isomorphismus sein. Man denke an den Frobenius. Es sei nun i : K → L eine endliche Erweiterung. Ein relative Automorphismus σ ∈ Aut(L/K) ist eine Fortsetzung von i. _ _ _ _σ _ _ _/ L L `@ > @@ @@ @@ ~ ~~ ~ ~ ~~ K Nach Satz 12.13 über die Anzahl von Fortsetzungen gilt |Aut(L/K)| ≤ [L : K]s ≤ [L : K]. 104 Galoistheorie Definition 12.23. — Eine endliche Erweiterung L/K ist eine Galoiserweiterung13, wenn |Aut(L/K)| = [L : K]. In diesem Falle nennt man Gal(L/K) := Aut(L/K) die Galoisgruppe der Erweiterung. √ Beispiele 12.24. — 1. Es gibt zwei Automorphismen von Q( 3)/Q, nämlich die Identität id und √ √ √ √ σ : 3 7→ − 3. Also ist Q( 3)/Q eine Galoiserweiterung mit Galoisgruppe Gal(Q( 3)/Q) ∼ = Z/2. 2. C/R ist eine Galoiserweiterung: Die Galoisgruppe Gal(C/R) ist isomorph zu Z/2 und wird von der komplexen Konjugation z 7→ z erzeugt. √ 3. Die Erweiterung Q( 3 2)/Q ist keine Galoiserweiterung. Es gibt drei Q-lineare Einbettungen √ √ Q( 3 2) → C. Dabei wird α = 3 2 der Reihe nach auf α, ρα und ρ2 α mit ρ = exp(2πi/3) abge√ bildet. Aber die beiden letzten Zahlen liegen nicht in Q( 3 2)/Q und liefern keine Automorphismen dieses Körpers. Satz 12.25 — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G. Dann gilt K = LG . Beweis. Nach Definition gilt sicher K ⊂ M := LG und G ⊂ Aut(L/M ). Es folgt: |G| ≤ [L : M ] ≤ [L : K] = |G|. Also besteht überall Gleichheit. Insbesondere ist [L : M ] = [L : K] und M = K. Satz 12.26 (Dirichlet) — Es seien σ1 , . . . , σn : Γ → M × paarweise verschiedene Gruppenhomomorphismen von einer Gruppe Γ in die Einheitengruppe eines Körpers M . Dann sind σ1 , . . . , σn linear unabhängige Elemente im M -Vektorraum Abb(Γ, M ) aller Abbildungen von Γ nach M . Mit anderen Worten: Sind µ1 , . . . , µn ∈ M mit der Eigenschaft, daß (12.11) µ1 σ1 (x) + . . . + µn σn (x) = 0 für alle x ∈ Γ, dann gilt µ1 = . . . = µn = 0. Beweis. Es sei k minimal gewählt mit der Eigenschaft, daß (nach eventuell notwendigem Umnumerieren) die Homomorphismen σ1 , . . . , σk linear abhängig sind. Da alle σi 6= 0 sind, ist k ≥ 2. Es P gibt nun µ1 , . . . , µk ∈ M × mit ki=1 µi σi (x) = 0 für alle x ∈ Γ. Da σ1 6= σ2 , gibt es ein y ∈ Γ mit σ1 (y) 6= σ2 (y). Nun bestehen die Relationen (12.12) 0= k X µi σi (yx) = (12.13) σi (y)µi σi (x). i=1 i=1 Durch Subtraktion der Relation k X 0 = σ1 (y) k X µi σi (x) i=1 erhält man (12.14) 0= X i≥2 (σ1 (y) − σi (y))µi σi (x) für alle x ∈ K. Da σ1 (y)−σ2 (y) 6= 0 ist dies eine nichttriviale Relation zwischen den Homomorphismen σ2 . . . , σk , im Widerspruch zur Minimalität von k. Im Folgenden wollen wir den Satz von Dirichlet auf eine Folge von paarweise verschiedenen Körperhomomorphismen σ1 , . . . , σn : K → M anwenden: Die Einschränkungen der σi auf die 13Évariste Galois b25. Oktober 1811 d31. Mai 1832 Algebra I im Wintersemester 2015 105 Einheitengruppe K × sind Gruppenhomomorphismen. Deshalb ist das Lemma anwendbar und zeigt, daß die σi linear unabhängig sind. Es sei L ein Körper und G ⊂ Aut(L) eine endliche Untergruppe. Für jedes x ∈ L ist X σ(x) S(x) := σ∈G invariant unter der Gruppe G und liegt im Unterkörper LG , denn für g ∈ G folgt nach Umindizierung: X X h(x) = S(x). (gσ)(x) = g(S(x)) = σ∈G h∈G Diese Abbildung S : L → LG heißt Spurabbildung. Lemma 12.27 — Es sei L ein Körper und G < Aut(L) eine endliche Untergruppe. Die Spurabbildung S : L → LG ist LG –linear und nicht die Nullabbildung. Beweis. Zur LG -Linearität: Für λ ∈ LG und x ∈ L gilt X X X σ(x) = λS(x), σ(λ)σ(x) = σ(λ) σ(λx) = S(λx) = σ∈G σ∈G σ∈G weil σ(λ) = λ. Falls L die Charakteristik 0 hat, folgt die Aussage S 6= 0 aus der einfachen Beobachtung, daß S(1) = |G| = 6 0. Allgemeiner folgt die Behauptung für beliebige Charakteristik unmittelbar aus dem Satz von Dirichlet, denn als Linearkombination von Charakteren kann die Einschränkung von S auf L× nicht identisch verschwinden. Satz 12.28 — Es sei L ein Körper und G < Aut(L) eine endliche Untergruppe. Dann ist L/LG eine Galoiserweiterung vom Grad |G| mit Gal(L/LG ) = G. Beweis. Es sei G = {σ1 , . . . , σn } und K = LG . Schließlich sei eine Folge von K-linear unabhängigen Elementen x1 , . . . , xm ∈ L gegeben. Nach Konstruktion ist G ⊂ Aut(L/K), also n = |G| ≤ |Aut(L/K)| ≤ [L : K]. Angenommen, n < m. Die Matrix (σi−1 (xj )) ∈ Ln×m hat weniger Zeilen als Spalten. Deshalb gibt es einen nichttrivialen Vektor y = (y1 , . . . , ym )t ∈ Lm mit (12.15) m X σi−1 (xj )yj = 0, für alle i = 1, . . . , n. j=1 Nach eventuellem Umnumerieren kann man annehmen, daß y1 6= 0. Wir wissen, daß die SpurabbilP dung S = i σi nicht identisch verschwindet. Es gibt also ein u ∈ L mit S(u) 6= 0. Indem wir nötigenfalls alle yj durch yj yu1 ersetzen, können wir erreichen, daß neben den Gleichungen (12.15) zusätzlich S(y1 ) 6= 0 gilt. Wir wenden auf die i-te Gleichung in (12.15) den Automorphismus σi an und summieren über alle i = 1, . . . , n auf: (12.16) m X xj S(yj ) = 0. j=1 Die Koeffizienten S(yj ) liegen alle in K. Weil S(y1 ) 6= 0, beschreibt (12.16) eine K-lineare Abhängigkeit zwischen den Elementen x1 , . . . , xm , im Widerspruch zur Wahl der xj . Das zeigt n ≥ m. Daraus folgt, daß [L : K] ≤ n = |G|. Die umgekehrte Ungleichung gilt sowieso. Deshalb ist L/K eine endliche Galoiserweiterung. Lemma 12.29 — Es sei L/K eine Galoiserweiterung mit Galoisgruppe G = Gal(L/K). Ist {a1 , . . . , am } die G-Bahn eines Elements a ∈ L, dann ist (12.17) minpola/K = (X − a1 ) · . . . · (X − am ) ∈ K[X]. 106 Galoistheorie Insbesondere ist a separabel. Beweis. Es sei f das Minimalpolynom von a relativ K und g = (X − a1 ) · . . . · (X − am ). Zu jedem Element ai in der G-Bahn von a gibt es nach Definition des Bahnbegriffs ein σ ∈ G mit σ(a) = ai . Es folgt 0 = σ(f (a)) = f (σ(a)) = f (ai ). Demnach sind alle Bahnelemente Nullstellen von f , mit anderen Worten: g|f . Umgekehrt sind die Koeffizienten von g genau die elementarsymmetrischen Polynome der ai und deshalb invariant unter allen Permutationen der ai . Sie sind insbesondere invariant unter den Elementen der Galoisgruppe und liegen deshalb im Fixkörper K = LG . Aus g ∈ K[X] und g(a) = 0 folgt nach Definition des Minimalpolynoms die umgekehrte Teilbarkeitsrelation f |g. Da beide Polynome normiert sind, sind sie gleich. Satz 12.30 — Die folgenden Aussagen über eine endliche Körpererweiterung sind äquivalent: (1) (2) (3) (4) L/K ist eine Galoiserweiterung. L/K ist separabel und normal. L ist Zerfällungskörper eines irreduziblen separablen Polynoms aus K[X]. L ist Zerfällungskörper eines separablen Polynoms aus K[X]. Beweis. 1 ⇒ 2: Es sei a ∈ L ein beliebiges Element. Nach Lemma 12.29 zerfällt das Minimalpolynom minpola/K über L in Linearfaktoren mit paarweise verschiedenen Nullstellen. Das zeigt, daß L separabel und normal über K ist. 2 ⇒ 3: Nach dem Satz vom primitiven Element existiert ein separables Element a ∈ L mit L = K(a). Das Minimalpolynom von a ist irreduzibel und separabel. Wegen der Normalität von L/K zerfällt es über L vollständig in Linearfaktoren. Nach Wahl von a wird L von a und a fortiori von den Nullstellen von minpola/K erzeugt und ist deshalb der Zerfällungskörper von f . 3 ⇒ 4: Trivial. 4 ⇒ 1: Es sei L der Zerfällungskörper eines separablen Polynoms f ∈ K[X]. Dann ist L normal und wird von separablen Elementen erzeugt. Wir wählen einen algebraischen Abschluß L → L. Es sei G die Menge der K-linearen Einbettungen L → L. Da L/K separabel ist, ist |G| = [L : K]s = [L : K]. Für jedes a ∈ L und jedes σ ∈ G ist σ(a) eine Nullstelle des Minimalpolynoms von a und liegt wegen der Normalität von f schon in L. Das bedeutet σ(L) ⊂ L, und aus Gradgründen muß sogar Gleichheit bestehen. Demnach ist jedes σ ∈ G ein relativer Automorphismus von L/K. Da |G| = [L : K], ist L/K eine Galoiserweiterung. √ √ Beispiel 12.31. — Es sei L = Q(a, b) mit a = 2, b = 3 ∈ C. Als Zerfällungskörper des separablen Polynoms (X 2 − 3)(X 2 − 2) ist Q(a, b) eine Galoiserweiterung von Q vom Grad 4. Jeder Automorphismus σ von Q(a, b) ist eindeutig durch die Wirkung auf a und b bestimmt. Es gibt deshalb genau die vier Möglichkeiten: (12.18) σ0 σ1 σ2 σ3 : : : : a 7→ a, a 7→ −a, a 7→ a, a 7→ −a, b 7→ b b 7→ b b 7→ −b b 7→ −b Die Elemente σ1 , σ2 und σ3 haben die Ordnung 2. Deshalb ist Gal(Q(a, b)/Q)) ∼ = Z/2 × Z/2. Beispiel 12.32. — Es sei K = Fp (t) und L = Fp (u). Die Abbildung K → L, t 7→ up , ist eine Körpererweiterung vom Grad p. Das Minimalpolynom von u über K ist X p − t ∈ K[X]. Über L zerfällt X p − t in Linearfaktoren: (12.19) X p − t = X p − up = (X − u)p . Die Erweiterung ist normal, aber nicht separabel. Tatsächlich ist die relative Automorphismengruppe Aut(L/K) trivial, denn jeder relative Automorphismus von L/K ist bestimmt durch das Bild von Algebra I im Wintersemester 2015 107 u. Aber da u nur auf Nullstellen von X p − t abgebildet werden kann und u die einzige Nullstelle ist, ist die Identität der einzige relative Automorphismus. Satz 12.33 (Hauptsatz der Galoistheorie) — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G = Gal(L/K). (1) Für jede Untergruppe H < G ist K ⊂ LH ⊂ L ein Zwischenkörper. (2) Für jeden Zwischenkörper K ⊂ M ⊂ L ist L/M eine endliche Galoiserweiterung, und Gal(L/M ) ist eine Untergruppe in Gal(L/K). (3) Die Zuordnungen Φ : H 7→ LH und Ψ : M 7→ Gal(L/M ) definieren zueinander inverse Bijektionen zwischen den Mengen {H | H ist eine Untergruppe von Gal(L/K)} und {M | M ist ein Zwischenkörper von L/K}. Die Abbildungen Φ und Ψ sind inklusionsumkehrend, d.h. H ⊂ H′ ⇔ ′ LH ⊃ LH . (4) Ein Zwischenkörper M ist genau dann eine Galoiserweiterung von K, wenn Gal(L/M ) ein Normalteiler von Gal(L/K) ist. In diesem Falle ist die Folge von Gruppenhomomorphismen i r 1 −→ Gal(L/M ) −→ Gal(L/K) −→ Gal(M/K) −→ 1 exakt. Dabei bezeichnet i die Inklusion und r : Gal(L/K) → Gal(M/K) die Einschränkungsabbildung σ 7→ σ|M . Mit anderen Worten: Gal(M/K) ∼ = Gal(L/K)/Gal(L/M ). Beweis. 1. Die erste Aussage ist klar. Zu 2: Es sei M ein Zwischenkörper. Für jedes a ∈ L ist minpola/M ein Teiler von minpola/K in M [X]. Da minpola/K in L[X] vollständig in Linearfaktoren zerfällt, die paarweise verschieden sind, gilt dasselbe für minpola/M . Insbesondere ist L normal und separabel über M , also eine Galoiserweiterung. Jeder relative Automorphismus von L/M fixiert M , also erst recht K. Deshalb besteht eine Inklusion von Gruppen Gal(L/M ) ⊂ Gal(L/K). Zu 3. Es sei zunächst H ⊂ Gal(L/K) eine Untergruppe. Dann ist M := LH ein Zwischenkörper, und nach Satz 12.28 ist L/M eine Galoiserweiterung mit Gal(L/M ) = H. Das zeigt Ψ ◦ Φ = idG . Es sei nun umgekehrt M ein Zwischenkörper und H = Gal(L/M ) < Gal(L/K). Dann gilt M = LH nach Satz 12.25. Das zeigt Φ ◦ Φ = idZ . Daß Φ und Ψ inklusionsumkehrend sind, ist klar. Zu 4. Es sei M ein Zwischenkörper, der normal über K ist. Als Zwischenkörper einer separablen Erweiterung ist M auch separabel über K. Nach dem Normalitätskriterium 12.19 bildet jedes σ ∈ Gal(L/K) den Körper M in sich ab. Dies definiert einen Homomorphismus (12.20) r : Gal(L/K) → Gal(M/K), σ 7→ σ|M . Dieser ist surjektiv: Denn jeder Automorphismus σ0 ∈ Gal(M/K) setzt sich zu einer Einbettung σ : L → L in einen algebraischen Abschluß von L fort, und da L/K normal ist, gilt σ(L) = L. Somit ist σ ∈ Gal(L/K) und r(σ) = σ0 . Weiter besteht der Kern von r aus allen Automorphismen von L/K, die M festlassen, d.h. Gal(L/M ). Deshalb ist Gal(L/M ) ein Normalteiler mit Faktorgruppe Gal(M/K) = Gal(L/K)/Gal(L/M ). Es sei umgekehrt Gal(L/M ) ein Normalteiler in Gal(L/K). Um zu zeigen, daß M/K normal ist, betrachten wir eine beliebige K-lineare Einbettung ψ0 : M → L von M in einen algebraischen Abschluß von L und wählen eine Fortsetzung ψ : L → L. Da L normal ist, gilt ψ(L) = L und 108 Galoistheorie ψ ∈ Gal(L/K). Für ein beliebiges σ ∈ Gal(L/M ) gilt nun wegen der Normalteilerannahme, daß ψ −1 σψ ∈ Gal(L/M ). Deshalb gilt für jedes x ∈ M : σ(ψ(x)) = ψ((ψ −1 σψ)(x)) = ψ(x), (12.21) also ψ(x) ∈ LGal(L/M ) = M . Das zeigt ψ(M ) ⊂ M . Mit dem Normalitätskriterium 12.19 folgt die Behauptung. √ Beispiel 12.34. — Es seien ρ = exp(2πi/3), α = 3 2 und L = Q(α, ρ). Da ρ keine reelle Zahl ist, liegt ρ sicher nicht im Körper Q(α). Da ρ2 + ρ + 1 = 0, ist L/Q(α) eine Erweiterung vom Grad 2 und [L : Q] = [L : Q(α)][Q(α) : Q] = 6. Tatsächlich ist L/Q eine Galoiserweiterung, denn L ist der Zerfällungskörper des Polynoms X 3 − 2. Jeder Automorphismus L → L muß α in α, αρ oder αρ2 abbilden und ρ in ρ oder −ρ. Damit sind alle sechs Möglichkeiten charakterisiert. Die Abbildungen (12.22) σ : α 7→ αρ, ρ 7→ ρ, und τ : α 7→ α, 2 ρ 7→ −ρ. 3 erzeugen die Galoisgruppe. Es gelten die Relationen τ = id, σ = id, τ στ = σ −1 . Man sieht, daß G := Gal(L/Q) ∼ = S3 . Es ergibt sich das folgende Schema von Untergruppen und zugehörigen Zwischenkörpern: Q(α, ρ) l {id}2 kkukuu 555 llxlxx 22 k l k l k l 55 22 kkk uu lll xxxx 55 kkkk uuuu 22 k lll k l x k l k 55 l 22 2) Q(α) Q(αρ) hτ i hστ i Q(αρ hσ 2 τ i 55 22 66 EE 44 HH 55 HH EE 2 6 4 H 6 2 55 44 EE HH 66 2 EE H 2 5 HH 66 EE 444 H H 6 EE 4 Q(ρ) hσi HH EE 44 HH 666 EE 4 vv xx HH 6 v x v HH 66 EE 44 x vv HH 6 EE4 xxx H vvv x G Q √ √ Beispiel 12.35. — Wir wissen, daß die Galoisgruppe Gal(Q( 2, 3)/Q) isomorph zu Z/2 × Z/2 ist und von den Automorphismen √ √ √ √ √ √ √ √ σ2 : 2 7→ 2, 3 7→ − 3 (12.23) σ1 : 2 7→ − 2, 3 7→ 3, erzeugt wird. Die Korrespondenz zwischen Untergruppen und Zwischenkörpern sieht dann so aus: √ √ {id} Q( 2, 3) K hσ1 i t tt tt t t tt JJ JJ JJ JJ J KKK KKK KKK hσ2 i hσ1 σ2 i ss sss s s sss Z/2 × Z/2 KKK s KKK sss s KKK s s s K s s √ √ √ Q( 2) Q( 6) Q( 3) LLL r r LLL rrr LLL r r LL rrrr Q Beispiel 12.36. — Es sei ζ = exp(2πi/5) ∈ C. Die Galoisgruppe Gal(Q(ζ)/Q) hat die Ordnung 4. Jeder Automorphismus muß ζ auf eine Potenz ζ k abbilden, d.h. die Galoisgruppe Gal(Q(ζ)/Q) besteht aus den vier Automorphismen (12.24) i σ i : ζ 7→ ζ 2 , i = 0, 1, 2, 3 mod 4, die den Regeln σi σj = σi+j genügen: (12.25) j i j σi (σj (ζ)) = σi (ζ 2 ) = (ζ 2 )2 = ζ 2 i ·2j = ζ2 i+j . Algebra I im Wintersemester 2015 109 Deshalb ist Gal(Q(ζ)/Q) zyklisch, erzeugt von σ1 , und es gibt nur eine Untergruppe, die von σ12 : ζ 7→ ζ 4 = ζ −1 erzeugt wird. Der zugehörige Zwischenkörper wird von u = ζ + ζ −1 = 2 cos( 2π ) 5 erzeugt: {id} Q(ζ) hσ12 i Q(ζ + ζ −1 ) hσ1 i ∼ = Z/4 Q Beispiel 12.37. — Es sei p eine Primzahl. Für jedes n ∈ N ist Fpn der Zerfällungskörper des n separablen Polynoms X p − X ∈ F[X] und deshalb eine Galoiserweiterung von Fp . Der Frobeniushomomorphismus F : Fp n → F p n , a 7 → a p , ist ein Automorphismus, der alle Elemente aus Fp festläßt. Wir haben früher gesehen, daß Fpℓ ⊂ F genau aus den Elementen besteht, die von F ℓ festgelassen werden. Deshalb ist die Ordnung von F ∈ Gal(Fpn /Fp ) genau n. Weil |Gal(Fpn /Fp )| = [Fpn : Fp ] = n, folgt: Die Erweiterung Fpn /Fp ist eine Galoiserweiterung vom Grad n. Die Galoisgruppe Gal(Fpn /Fp ) ist zyklisch und wird vom Frobeniushomomorphismus erzeugt. √ Beispiel 12.38. — Es sei zur Abkürzung α = 4 3 gesetzt. Das Polynom f = X 4 − 3 ∈ Q[X] ist nach dem Eisensteinkriterium irreduzibel. Seine Nullstellen sind α, iα, i2 α = −α und i3 α = −iα. Der Zerfällungskörper von f ist Q(α, i) vom Grad 8 über Q. Die Galoisgruppe Gal(Q(α, i)/Q) enthält sicher die folgenden Automorphismen: Erstens die komplexe Konjugation σ : α 7→ α, i 7→ −i, und zweitens die Abbildung deren Vielfachen durch δ : α 7→ iα, δ2 : 3 δ : 4 δ : i 7→ i, α 7→ −α, α 7→ −iα, α 7→ α, i 7→ i, i 7→ i, i 7→ i, charakterisiert sind. Außerdem hat man σδσ : α 7→ α 7→ iα 7→ −iα und i 7→ −i 7→ −i 7→ i. Demnach genügen σ und δ den Relationen σ 2 = id, δ 4 = id, σδσ = δ −1 , und erzeugen zusammen eine zur Diedergruppe D4 isomorphe Gruppe hσ, δi = {id, δ, δ 2 , δ 3 , σ, σδ, σδ 2 , σδ 3 }. Da die Galoisgruppe genau die Ordnung 8 hat, gilt Gal(Q(α, i)/Q) = hσ, δi ∼ = D4 . Die Diedergruppe hat drei Untergruppen der Ordnung 4, die als Untergruppen vom Index 2 alle Normalteiler sind, nämlich hσ, δ 2 i ∼ = Z/2 × Z/2, hσδ, δ 2 i ∼ = Z/2 × Z/2, hδi ∼ = Z/4. Wenn σ in der geometrischen Interpretation der Spiegelung an der x-Achse entspricht und δ der Drehung um den Winkel π/2, so wird die Gruppe hσ, δ 2 i durch die Spiegelungen an den Achsen 110 Galoistheorie erzeugt, hσδ, δ 2 i durch die Spiegelungen an den Diagonalen, und hδi ist die zyklische Gruppe der Drehungen: Untergruppen der Ordnung zwei werden von den vier Spiegelungen σδ k , k = 0, . . . , 3 und der Punktspiegelung δ 2 = −id erzeugt. Nur die Punktspiegelung erzeugt einen Normalteiler, während die beiden Spiegelungen an den Achsen und die beiden Spiegelungen an den Diagonalen jeweils zueinander konjugiert sind. Man erhält also das folgende Diagramm von Untergruppen der Galoisgruppe, wobei Linien Inklusionsbeziehungen bedeuten: hhhm 1 WRRWRWRWRWWWW hmhmhmhmmm RRR WWWWW h h h RRR WWWW hh m RRR W hhhhmmmmm h h h RRR WWWWWWWW h m h h m h m h W h h hσδi hσi hσδ 2 i hδ 2 i QQ hσδ 3 i m EE Q m Q m v QQQ EE vv mmm QQQ EE vv mmm v Q m EE Q v m QQ vv mmm hδi hσ, δ 2 i Q hσδ, δ 2 i QQQ mmm QQQ mmm QQQ m m QQQ mm mmm hσ, δi = Gal(Q(α, i)/Q) Die zugehörigen Zwischenkörper findet man so: Invariant unter δ ist sicher i. Invariant unter δ 2 neben √ √ i auch noch α2 = 3. Invariant unter hσ, δ 2 i ist dann nur noch 3. Durch σδ werden die beiden √ 2 Erzeuer i und 3 von Q(α, i)hδ i wie folgt abgebildet: α2 7→ (iα)2 7→ −α2 , i 7→ i 7→ −i. √ Invariant ist deshalb das Element iα2 = i 3. Jetzt fehlen nur noch die Invarianten unter den Spiegelungen. σ läßt offensichtlich α fest, ebenso σδ 2 das Element iα. Sowohl α wie iα haben das Minimalpolynom X 4 − 3. Die beiden übrigen Spiegelungen sind etwas interessanter: Unter σδ geht α auf −iα. Folglich ist α − iα = α(1 − i) invariant. Entsprechend findet man, daß α(1 + i) invariant unter σδ 3 ist. Diese beiden Elemente haben das Minimalpolynom X 4 + 12. Insgesamt hat man das folgende Diagramm von Zwischenkörpern, bei analoger Anordnung: Q(α, i) VV MMMVVVVV jjjtt j j MMM VVVVVV j t j t j VVVV jj ttt MMM j j VVVV j j M V tt jjjj √ Q(α(i − 1)) Q(α) Q(iα) Q(α(i + 1)) Q(i, 3) GG LLL p u p GG u p L LLL GG pp uu p u p GG u LLL G uu ppp √ u √ p Q( 3) Q(i) JJ JJ JJ JJ JJ Q Q(i 3) q qqq q q qqq qqq Von den fünf Zwischenkörpern der zweiten Zeile, die Grad 4 über Q haben, ist nur der mittlere, √ Q(i, 3), der zum Normalteiler hδ 2 i gehört, eine Galoiserweiterung über Q, die vier anderen nicht. Man sieht an diesem Beispiel auch gut, daß die Begriffe Galoissch oder normal im Gegensatz zu den Begriffen separabel, endlich oder algebraisch nicht transitiv sind: Die Erweiterungen Algebra I im Wintersemester 2015 111 √ √ Q(α)/Q( 3) und Q( 3)/Q sind Galoiserweiterungen, dagegen die zusammengesetzte Erweiterung Q(α)/Q nicht. Bemerkung 12.39. — In jeder algebraischen Erweiterung K ⊂ L gibt es einen eindeutig bestimmten Zwischenkörper M , die separable Hülle von K in L, mit der Eigenschaft, daß M/K separabel und L/M rein inseparabel ist. Wenn L/K endlich und normal ist, kann man diese Reihenfolge auch umkehren: Wir betrachten die Gruppe Aut(L/K) der relativen Automorphismen. Da L/K normal ist, gilt |Aut(L/K)| = [L : K]s . Es sei F := LAut(L/K) . Dann ist L/F eine endliche Galoiserweiterung vom Grad [L : K]s . Aus dem Multiplikationssatz für den Separabilitätsgrad ergibt sich [L : K]s = [L : F ]s [F : K]s , also [F : K]s = 1. Damit ist F/K rein inseparabel. Ich schließe den Abschnitt mit einem Satz, der zusammen mit einem späteren Satz 18.13 über die Automorphismengruppe Aut(C) etwas Kurioses enthält. Beweis zur Übung. Satz 12.40 — Aut(R) = {id}. Beweis. Hinweis: Zeige, daß für jeden Automorphismus σ ∈ Aut(R) gilt: a > 0 ⇒ σ(a) > 0. Dazu muß man die Eigenschaft, positiv zu sein, algebraisch charakterisieren. 112 Galoistheorie §13. Kreisteilungskörper Für einen kommutativen Ring R bezeichnet R× die Gruppe der multiplikativen Einheiten. Bekanntlich bilden die Zahlen a, 0 < a < n, die zu n teilerfremd sind, ein Repräsentantensystem für (Z/n)× . Ihre Anzahl ist die Eulersche Phi-Funktion: ϕ(n) = |(Z/n)× |. Gemäß dem chinesischen a Restklassensatz gibt es für jede natürliche Zahl n mit der Primfaktorzerlegung n = pa1 1 · . . . · pℓ ℓ einen Ringisomorphismus ℓ Y Z/pai i . Z/n ∼ = i=1 Durch Übergang zu den Einheiten entsteht daraus ein Gruppenisomorphismus ℓ Y (Z/n)× ∼ = und das bedeutet für die Gruppenordnungen: ϕ(n) = (Z/pai i )× , i=1 ℓ Y ϕ(pai i ). i=1 Andererseits sieht man direkt, daß die Anzahl der zu einer Primzahl p teilerfremden natürlichen Zahlen < pa durch pa−1 (p − 1) gegeben ist. Zusammengefaßt ergibt sich die bekannte Formel ℓ Y pi − 1 ϕ(n) . = n pi i=1 Es sei nun n 2πik o µn = e n k = 0, . . . , n − 1 ⊂ C∗ die Gruppe der n-ten Einheitswurzeln. Eine Einheitswurzel ζ ∈ µn ist primitiv, wenn ζ die Ordnung n hat, also keine d-te Einheitswurzel für einen echten Teiler d von n ist. In analytischer Schreibweise sind die primitiven n-ten Einheitswurzeln durch die Ausdrücke exp(2πik/n) mit zu n teilerfremden k gegeben. Mit anderen Worten: Unter dem Gruppenisomorphismus Z/n 7→ µn , k 7→ ζ k , mit ζ = exp(2πi/n) gehen die zu n teilerfremden Restklassen bijektiv auf die primitiven n-ten Einheitswurzeln. Definition 13.1. — Das Polynom (13.1) Φn (X) := Y ζ∈µ′n (X − ζ), wo ζ durch die Menge µ′n ⊂ µn der primitiven n-ten Einheitswurzeln läuft, heißt n-tes Kreisteilungspolynom. Die ersten Kreisteilungspolynome sind Φ1 = X −1 Φ2 = X +1 Φ3 = X2 + X + 1 Φ4 = X2 + 1 Φ5 = X4 + X3 + X2 + X + 1 Φ6 = X2 − X + 1 Nach Definition gilt deg(Φn ) = ϕ(n). Da jede n-te Einheitwurzel eine primitive d-te Einheitswurzel für genau einen Teiler d von n ist, bestehen die Beziehungen X Y ϕ(d). Φd und n= (13.2) Xn − 1 = d|n d|n Algebra I im Wintersemester 2015 113 Mit der Möbiusfunktion µ und den Möbiusschen Umkehrformeln erhält man aus (13.2) die Beziehungen X µ(n/d)d (13.3) ϕn = d|n und (13.4) Φn (X) = Y d|n (X d − 1)(−1) µ(n/d) . Nach Konstruktion ist Φn ein Polynom mit komplexen Koeffizienten. Tatsächlich gilt: Satz 13.2 — Für alle n ∈ N ist Φn ∈ Z[X]. Beweis. Wir können induktiv annehmen, daß für alle echten Teiler d von n das Polynom Φd ganzzahlig und normiert ist. Es gilt nun (13.5) Φn = Q Xn − 1 . d|n, d<n Φd Der Nenner ist ein ganzzahliges normiertes Polynom. Deshalb kann man Polynomdivision nicht nur in C[X], sondern auch in Z[X] ausführen. Das Ergebnis hängt nicht von einer möglichen Erweiterung des Koeffizientenrings ab, ist also über Z und C gleich. In C[X] geht die Division auf, also auch in Z[X]. Daher ist Φn ganzzahlig und normiert. Satz 13.3 (Gauß) — Die Kreisteilungspolynome Φn sind für alle n ∈ N in Z[X] irreduzibel. Beweis. Es sei ζ eine Wurzel von Φn und f ihr Minimalpolynom über Q. Wir schreiben Φn = f g mit g ∈ Q[X]. Nach dem Lemma von Gauß sind f und g ganzzahlig. Es sei p eine zu n teilerfremde Primzahl. Dann ist ζ p ebenfalls eine primitive n-te Einheitswurzel und wegen der Zerlegung von Φn eine Nullstelle entweder von f oder von g. Angenommen, g(ζ p ) = 0. Dann haben f (X) und g(X p ) einen gemeinsamen (normierten) Faktor h(X) ∈ Z[X]. Wir reduzieren modulo p und erhalten in Fp [X] die Beziehungen h̄(X)|ḡ(X p ) = ḡ(X)p , h̄(X)|f¯(X). Ein irreduzibler Faktor von h̄ teilt somit sowohl f¯ als auch ḡ. Er teilt deshalb Φn und X n − 1 n−1 zweimal, obwohl X n − 1 sicher keine mehrfache Nullstellen hat, weil die Ableitung nX in p keiner Nullstelle verschwindet: Widerspruch. Daher ist ζ eine Nullstelle von f . Eine beliebige primitive n-te Einheitswurzel hat die Form ζ m mit zu n teilerfremden Exponenten m. Zerlegt man m = p1 · · · pℓ in ein Produkt von Primzahlen, so zeigt das vorstehende Argument, daß ζ, ζ p1 , (ζ p1 )p2 = ζ p1 p2 , ..., ζ p1 ···pℓ = ζ m Nullstellen von f sind. Demnach ist jede Nullstelle von Φn auch eine Nullstelle von f . Das zeigt Φn = f . Bei der Definition von Φn haben wir Einheitswurzeln in C verwendet. Aber da die Φn ganzzzahlige Koeffizienten haben und die Zerlegung Y Xn − 1 = Φd d|n in Z[X] besteht, sind die Kreisteilungspolynome und diese Zerlegung über jedem Körper K definiert. Natürlich bleiben die Kreisteilungspolynome dabei nicht unbedingt irreduzibel, sondern können je nach Körper auf sehr verschiedene Weise zerfallen. Ein Element x ∈ K × ist eine n-te Einheitswurzel, wenn xn = 1, und eine primitive Einheitswurzel, wenn ord(x) = n in K × . Wir bezeichnen die Gruppe der n-ten Einheitswurzeln in K mit (13.6) µn (K) := {ζ ∈ K | ζ n = 1} 114 Kreisteilungskörper Das Polynom X n − 1 ist genau dann separabel über K, wenn die Charakteristik von K kein Teiler von n ist. Falls char(K) = p > 0 und n = pe m mit p 6 |m, gilt e X n − 1 = (X m − 1)p . Jede n-te Einheitswurzel ist deshalb schon eine m-te Einheitswurzel. Primitive n-te Einheitswurzeln gibt es also nur im separablen Fall. Lemma 13.4 — Es sei p eine Primzahl, die m nicht teilt. Dann gilt ϕ(p Φp e m ≡ Φ m e ) mod p für alle e ∈ N. Beweis. Übung: Induktion über die Teiler von pe m. Satz 13.5 — Es sei K ein Körper, n eine natürliche Zahl und ζ ∈ K eine primitive n-te Einheitswurzel. Die Erweiterung K(ζ)/K ist eine Galoiserweiterung. Jedes σ ∈ Gal(K(ζ)/K) bestimmt ein eindeutiges Element φ(σ) ∈ (Z/n)× mit der Eigenschaft σ(ζ) = ζ φ(σ) . Die Abbildung φ : Gal(K(ζ)/K) → (Z/n)× ist ein injektiver Gruppenhomomorphismus. Insbesondere ist Gal(K(ζ)/K) abelsch. φ ist genau dann ein Isomorphismus, wenn Φn ∈ K[X] irreduzibel ist. Beweis. Nach Adjunktion von ζ zerfällt X n − 1 in n paarweise verschiedene Linearfaktoren: X n − 1 = (X − 1)(X − ζ)(X − ζ 2 ) · · · (X − ζ n−1 ). Insbesondere ist K(ζ) der Zerfällungskörper von X n − 1 und separabel über K. Die Voraussetzungen des Satzes sind also nur erfüllt, wenn p6 | n. Von den n Einheitswurzeln sind diejenigen, die nicht primitiv sind, Nullstellen von Φd für einen echten Teiler d von n. Deshalb ist ζ Nullstelle des Polynoms Φn , d.h. das Minimalpolynom von ζ ist Teiler von Φn in K[X]. Jeder Automorphismus σ ∈ Gal(K(ζ)/K) bildet ζ in eine primitive Einheitswurzel ab. Es gibt also genau ein φ(σ) ∈ (Z/n)× mit σ(ζ) = ζ φ(σ) . Da ζ die Erweiterung erzeugt, ist σ durch φ(σ) eindeutig bestimmt. Deshalb ist φ eine injektive Abbildung. Für zwei Automorphismen σ und τ gilt: τ (σ(ζ)) = τ (ζ φ(σ) ) = (τ (ζ))φ(σ) = (ζ φ(τ ) )φ(σ) = ζ φ(τ )φ(σ) . Andererseits hat man τ (σ(ζ)) = (τ ◦ σ)(ζ) = ζ φ(τ ◦σ) . Der Vergleich zeigt φ(τ )φ(σ) = φ(τ ◦ σ). Damit ist φ ein Homomorphismus, wie behauptet. Die letzte Aussage ist klar. Definition 13.6. — Eine Galoiserweiterung heißt abelsch, wenn ihre Galoisgruppe abelsch ist. Historisch ist die Begriffsbildung umgekehrt: Nils Abel hat Körpererweiterungen untersucht, deren relative Automorphismen kommutieren. Deshalb sprach man von Abelschen Erweiterungen. Heinrich Weber hat dann das Adjektiv ’abelsch’ von der engeren Verwendung für Galoisgruppen von Abelscher Erweiterungen auf beliebige kommutierende Gruppen vorgenommen. Das Kreisteilungspolynom Φn ∈ K[X] kann aus verschiedenen Gründen nicht irreduzibel sein: 1. Es kann sein, daß K eine m-te Einheitswurzel für ein m|n enthält. Wir betrachten das Beispiel n = 9, m = 3 und K = Q(ρ), wo ρ = exp(2πi/3) eine dritte Einheitswurzel ist. Bezeichnet ζ eine primitive neunte Einheitswurzel, so hat ζ das Minimalpolynom X 3 − ρ oder X 3 − ρ2 , und Φ9 faktorisiert wie folgt: Φ9 = X 6 + X 3 + 1 = (X 3 − ρ)(X 3 − ρ2 ). Algebra I im Wintersemester 2015 115 2. Das Minimalpolynom kann aber auch dann in kleinere Polynome zerfallen, wenn keine n-te √ Einheitswurzel in K liegt. Das zeigt das Beispiel n = 5 und K = Q( 5): Es sei ζ ∈ C eine primitive n-te Einheitswurzel und η := ζ + ζ −1 . Aus der Gleichung ζ4 + ζ3 + ζ2 + ζ + 1 = 0 gewinnt man 0 = ζ 2 + ζ + 1 + ζ −1 + ζ −2 = η 2 + η − 1. √ √ Damit ist η = (−1 + 5)/2 oder (−1 − 5)/2 je nachdem, mit welcher Einheitswurzel ζ man √ anfängt. In jedem Falle zerfällt Φ5 über Q( 5) wie folgt: X4 + X3 + X2 + X + 1 = = = (X − ζ)(X − ζ 4 )(X − ζ 2 )(X − ζ 3 ) (X 2 − ηX + 1)(X 2 − (−1 − η)X + 1) √ √ 1− 5 1+ 5 X2 + X +1 X2 + X +1 . 2 2 Beispiel 13.7. — Es sei ζ ∈ C eine primitive 7. Einheitswurzel. Die Erweiterung Q(ζ)/Q ist eine Galoiserweiterung mit zyklischer Galoisgruppe Z/6 k ∼ = −−→ 7→ (Z/7)× 3k , j ∼ = −−→ 7→ Gal(Q(ζ)/Q) (σj : ζ 7→ ζ j ) Es gibt zwei Untergruppen der Ordnung 2 bzw. 3 in Gal(Q(ζ)/Q), die von σ6 bzw. σ2 erzeugt werden. Wir betrachten die zugehörigen Zwischenkörper: Es sei H1 = {σ1 , σ6 } und K1 = Q(ζ)H1 . Das Element u = ζ + ζ 6 = 2 cos(2π/7) ist invariant unter H1 . Eine Gleichung für u findet man leicht aus 0 = ζ 3 + ζ 2 + ζ + 1 + ζ −1 + ζ −2 + ζ −3 = u3 + u2 − 2u − 1. Dann ist K1 = Q(u) = Q(cos(2π/7)). Die Galoisgruppe von K1 /Q ist zyklisch von der Ordnung 3 und wird erzeugt von dem Element u = ζ + ζ −1 7→ ζ 2 + ζ −2 = u2 − 2. Das regelmäßige Siebeneck mit dem Graphen des Polynoms 8x3 + 4x2 − 4x − 1: Nur zur Untergruppe H2 = {σ1 , σ2 , σ4 } und dem zugehörigen Zwischenkörper K2 = Q(ζ)H2 . Das Element v = ζ + ζ 2 + ζ 4 ist invariant unter H2 . Es genügt der Gleichung v 2 = ζ 2 + ζ 4 + ζ + 2(ζ 1+2 + ζ 2+4 + ζ 4+1 ) = −v − 2. 116 Kreisteilungskörper √ Insbesondere gilt (2v + 1)2 = −7. Das zeigt: K2 = Q(v) = Q( −7). Die Zwischenkörper von Q(ζ)/Q sind somit: Q(ζ) v vv vv v v vv √ Q( −7) II II II II II LLL LLL LLL L Q(cos(2π/7)) Q rr rr rr r rr rr Wir betrachten speziell den Fall der Erweiterung Q(ζ)/Q, wo ζ eine primitive p-te Einheitswurzel für eine Primzahl p ist. Satz 13.5 gibt uns einen Isomorphismus (Z/p)× −→ G := Gal(Q(ζ)/Q), k 7→ (ζ 7→ ζ k ). Andererseits ist die Einheitengruppe (Z/p)× zyklisch. Nach Wahl einer Primitivwurzel w modulo p erhält man einen Isomorphismus Z/(p − 1) −→ (Z/p)× , i 7→ w i . Das erlaubt es, die Elemente der Galoisgruppe wie folgt zu numerieren: i σi := (ζ 7→ ζ w ), i ∈ Z/(p − 1). Mit dieser Bezeichnung gilt dann σi σj = σi+j . Die Untergruppen der Galoisgruppe G stehen in Bijektion zu den Teilern f |p − 1. Bezeichnet e = (p − 1)/f den komplementären Teiler, so ist Gf := hσf i = {σ0 , σf , . . . , σ(e−1)f } eine Untergruppe der Ordnung e und vom Index f . Der zugehörige Zwischenkörper Q ⊂ Lf := Q(ζ)Gf ⊂ Q(ζ) hat Grad f über Q. Wir setzen noch i ζi := σi (ζ) = ζ w . Es gilt dann σj (ζi ) = σj (σi (ζ)) = σi+j (ζ) = ζj+i . Daraus bilden wir die sogenannten Gaußschen Perioden uf i = ζi + ζi+f + . . . + ζi+(e−1)f für i = 0, . . . , f − 1. Lemma 13.8 — 1. Die Elemente uf,0 ,. . . , uf,f −1 bilden eine Q-Basis von Lf . 2. Lf = Q(uf,i ) für jedes i = 0, . . . , f − 1. Beweis. Ad 1: Die Elemente 1, ζ, . . . , ζ p−2 bilden eine Q-Basis von Q(ζ), deshalb auch die Elemente ζ, ζ 2 , . . . ,ζ p−1 . Die Elemente ζ0 , ζ1 , . . . , ζp−2 unterscheiden sich von diesen nur durch die Anordnung, bilden also auch eine Q-Basis von Q(ζ). Für ein beliebiges a ∈ Q(ζ) gibt es deshalb eine eindeutige Darstellung p−2 X a= ai ζi i=0 Algebra I im Wintersemester 2015 mit ai ∈ Q, und σf (a) = p−2 X 117 ai ζi+f . i=0 Das Element a liegt genau dann in Lf , wenn σf (a) = a, was wiederum genau dann der Fall ist, wenn ai = ai+f (Indizes modulo p − 2). Deshalb kann man a in der folgenden Form umschreiben: a = a0 (ζ0 + ζf + ζ2f + . . .) + a1 (ζ1 + ζ1+f + . . .) + . . . = a0 uf,0 + a1 uf,1 + . . . + af −1 uf,f −1 . Das zeigt, daß die Perioden uf,0 ,. . . , uf,f −1 ein Erzeugersystem von Lf als Q-Vektorraum bilden, und weil dimQ Lf = f , bilden sie auch eine Basis. Ad 2: Die Galoisgruppe Gal(Lf /Q) = G/Gf = hσ1 i/hσf i wird von ϕ := σ1 |Lf erzeugt. Man sieht sofort: ϕ(uf,j ) = uf,j+1 . Die Perioden uf,0 , . . . , uf,f −1 haben also dasselbe Minimalpolynom vom Grad f . Insbesondere hat jede dieser Perioden den Grad f und erzeugt allein den Körper Lf als Erweiterung von Q. Wir setzen zur Abkürzung uf := uf,0 = ζ0 + ζf + . . . + ζ(e−1)f . Aus dem gerade Bewiesenen folgt: Lf = Q(uf ), ′ und wenn f |f , so gilt Lf ′ = Q(uf ′ ) ⊂ Lf = Q(uf ) und uf hat Grad f /f ′ über Lf ′ . Es sei speziell p eine Primzahl der Form p = 2k − 1. Dann sind alle Teiler von p − 1 von der Form 2ℓ , 1 ≤ ℓ ≤ k, und man erhält eine Kette von Zwischenkörpern Q = L1 ⊂ L2 ⊂ . . . ⊂ L2k = Q(ζ), und in jedem Schritt genügt u2ℓ+1 einer quadratischen Gleichung mit Koeffizienten in L2ℓ . Satz 13.9 (Gauß – Die Konstruktion des regulären 17-Ecks) — Es gilt cos 1 2π = 17 16 −1 + √ 17 + q √ 34 − 2 17 + r √ √ 68 + 12 17 − (6 + 2 17) q √ 34 − 2 17 ! Beweis. 3 ist eine Primitivwurzel modulo 17. Um das einzusehen, genügt es nachzurechnen, daß 38 6≡ 1 mod 17, und in der Tat ist 38 ≡ (81)2 ≡ (−4)2 ≡ −1. Deshalb gilt 0 ζ0 = ζ 3 = ζ, 1 ζ1 = ζ 3 = ζ 3 , 2 ζ2 = ζ 3 = ζ −8 , 3 ζ3 = ζ 3 = ζ −7 , . . . Dann lauten die Perioden: u2 = ζ + ζ −8 + ζ −4 + ζ −2 + ζ −1 + ζ 8 + ζ 4 + ζ 2 u4 = ζ + ζ −4 + ζ −1 + ζ 4 u8 = ζ + ζ −1 u16 = ζ Diese genügen den folgenden quadratischen Gleichungen, wie man durch Rechnung verifiziert: u22 + u2 − 4 = 0 u24 − u2 u4 − 1 = 0 2 u8 − u4 u8 + 21 (u4 − 1)(u2 + 1) − 1 = 0 u216 − u8 u16 + 1 = 0 118 Kreisteilungskörper Wenn man diese quadratischen Gleichungen auflöst, muß man vier Vorzeichenwahlen treffen, erhält also wie erwartet 16 verschiedene Einheitswurzeln. Für den gesuchten Kosinus kommt man mit u8 /2 aus. Über die richtigen Vorzeichenwahlen kann man numerisch entscheiden. Man findet: √ 1 u2 = −1 + 17 2 q √ √ 1 u4 = −1 + 17 + 34 − 2 17 4 und schließlich 1 u8 = 8 −1 + √ 17 + q √ 34 − 2 17 + r √ √ 68 + 12 17 − (6 + 2 17) q √ 34 − 2 17 ! Aufgabe zu Kreisteilungspolynomen. Aufgabe 13.10. — Programmieren Sie die Berechnung des n-ten Kreisteilungspolynoms a) rekursiv aus der Formel (13.5) und b) direkt aus der Formel (13.4). Zum Vergleich: Die Kreisteilungspolynome sind in Mupad unter polylib::cyclotomic aufrufbar. Aufgabe 13.11. — Wir verwenden die in Aufgabe 13.10 berechnete Tabelle für einige heuristische Überlegungen: Untersuchen Sie die Tabelle auf Regelmäßigkeiten, Stellen Sie Vermutungen an, Versuchen Sie diese zu beweisen. [z.B. Welcher Zusammenhang besteht zwischen Φn und Φ2n , zwischen Φp und Φpℓ , p prim, etc. Die Tabelle zeigt, daß für n ≤ 100 in Φn nur die Koeffizienten −1, 0, 1 vorkommen, warum? Was kann man allgemein erwarten? Beweis?] Algebra I im Wintersemester 2015 119 §14. Konstruktionen mit Zirkel und Lineal In diesem Abschnitt betrachten wir verschiedene Konstruktionsprobleme der klassischen Geometrie, die mit Zirkel und Lineal ausgeführt werden sollen. Die berühmtesten Konstruktionsprobleme sind die folgenden. (1) Die Quadratur des Kreises. Gegeben ein Kreis mit Mittelpunkt p und Radius r. Man konstruiere ein Quadrat mit gleichem Flächeninhalt. Wenn man durch Wahl einer Einheitsstrecke den Maßstab festlegt, ist das Problem dazu äquivalent, eine Strecke der Länge √ π zu konstruieren. (2) Die Dreiteilung des Winkels. Man konstruiere zu einem gegebenen Winkel α den Winkel α/3. Die Aufgabe ist für gewisse spezielle Winkel, wie α = π/2, leicht, es geht aber um einen allgemeinen Winkel. (3) Das delische Problem: Die Verdopplung des Würfels. Man konstruiere zu einer gegebenen Strecke a eine Strecke b so, daß das Volumen eines Würfels der Kantenlänge b das Doppelte des Volumens eines Würfels der Kantenlänge a ist, d.h. b3 = 2a3 . Bei gewählter √ Einheitsstrecke ist das Problem dazu äquivalent, eine Strecke der Länge 3 2 zu konstruieren. Die ersten drei Aufgaben sind unlösbar. Der Unmöglichkeitsbeweis wird dadurch erbracht, daß man die Aufgaben algebraisiert und mit Körpertheorie zeigt, daß die entsprechenden algebraischen Probleme nicht lösbar sind. Für die Dreiteilung des Winkels und die Verdopplung des Würfels genügen dazu einfache Aussagen über Körpererweiterungen. Die Unmöglichkeit der Kreisquadratur ist sprichwörtlich. Der Beweis benötigt allerdings den Satz von Lindemann, daß π eine transzendente Zahl ist. Diesen klassischen Problemen fügen wir das folgende hinzu: (4) Regelmäßige n-Ecke. Für welche natürlichen Zahlen n kann man ein reguläres n-Eck konstruieren? Es war spätestens den Pythagoräern bekannt, daß man das Dreieck, das Viereck, das Fünfeck und das Fünfzehneck sowie alle regulären n-Ecke, die daraus durch wiederholte Verdopplung der Eckenzahl hervorgehen, konstruieren kann. In arabischen Quellen findet man eine Archimedes zugeschriebene Konstruktion des regelmäßigen Siebenecks durch eine sogenannte Neusis. Daß man auch mit Zirkel und Lineal etwas weiter kommt, war eine überraschende Entdeckung von Gauß. Man beachte, daß die negativen Antworten für die oben genannten Probleme nur bei Beschränkung der gewählten Mittel Zirkel und Lineal Geltung haben. Läßt man andere Hilfsmittel, Maschinen oder Methoden zu, gibt es sehr wohl Lösungen. Wir präzisieren den Begriff der Konstruktion mit Zirkel und Lineal wie folgt: In der euklidischen Ebene E sei eine Menge S mit mindestens zwei Punkten gegeben. Ein Punkt, eine Gerade bzw. ein Kreis sind S-konstruierbar (oder kurz: konstruierbar, wenn der Zusammenhang klar ist), wenn sie in endlich vielen Schritten auf die folgende Weise entstehen: (1) Alle Punkte in S sind konstruierbar. (2) Jede Gerade durch zwei verschiedene konstruierbare Punkte ist konstruierbar. (3) Jeder Kreis mit konstruierbarem Mittelpunkt und durch einen anderen konstruierbaren Punkt ist konstruierbar. (4) Jeder Schnittpunkt zweier konstruierbarer Geraden, einer konstruierbaren Geraden und eines konstruierbaren Kreises bzw. zweier konstruierbarer Kreise ist konstruierbar. Um Fragen der Konstruierbarkeit zu algebraisieren, gehen wir wie folgt vor: Wir zeichnen zwei Punkte P0 , P1 ∈ S aus und betrachten den Abstand |P0 P1 | als Längenmaßeinheit. Es gibt dann genau eine längentreue und orientierungserhaltende Identifizierung E → C mit P0 7→ 0 und P1 7→ 120 Konstruktionen mit Zirkel und Lineal 1. In diesem Sinne betrachten wir von nun an S als eine Teilmenge von C, die die Punkte 0 und 1 enthält, und sprechen von (aus S) konstruierbaren komplexen Zahlen. Es seien p1 und p2 verschiedene komplexe Zahlen. Eine komplexe Zahl z 6= p1 , p2 liegt auf der reellen Geraden durch p1 und p2 , wenn das Verhältnis (z − p1 )/(z − p2 ) reell ist, d.h. wenn z − p1 z − p1 = . z − p2 z − p2 Multiplikation mit dem Hauptnenner und Kürzen aller doppelt vorkommenden Terme führt auf die folgende komplexe Form der Geradengleichung: (14.1) (p1 − p2 )z + (p2 − p1 )z = p1 p2 − p1 p2 . Ist m ∈ C und r ∈ R>0 , so liegt z genau dann auf dem Kreis mit Mittelpunkt m durch den Punkt q, wenn (14.2) (z − m)(z − m) = (q − m)(q − m). Die Berechnung der Schnittpunkte in den elementaren Konstruktionsschritten führt demnach auf die folgenden Gleichungssysteme: (1) Der Schnittpunkt zweier Geraden durch Punkte p1 , p2 bzw. q1 , q2 ist eine Lösung des linearen Gleichungssystems: (p1 − p2 )z + (p2 − p1 )z = p1 p2 − p1 p2 (q 1 − q 2 )z + (q2 − q1 )z = q 1 q 2 − q1 q 2 . Insbesondere liegt z in dem Körper Q(S ∪ S), wenn p1 , p2 , q1 , q2 ∈ S. (2) Jeder Schnittpunkt der Geraden durch Punkte p1 , p2 mit dem Kreis um m durch q ist eine Lösung des Gleichungssystems (p1 − p2 )z + (p2 − p1 )z = p1 p2 − p1 p2 (z − m)(z − m) = (q − m)(q − m). Eliminiert man aus der zweiten Gleichung z bzw. z mit Hilfe der ersten Gleichung, so bleibt eine quadratische Gleichung für z bzw. z mit Koeffizienten in Q(S ∪ S) übrig, wenn p1 , p2 , m, q ∈ S. (3) Jeder Schnittpunkt der beiden Kreise um m1 durch q1 bzw. um m2 durch q2 ist eine Lösung des Gleichungssystems (z − m1 )(z − m1 ) = (q1 − m1 )(q 1 − m1 ) (z − m2 )(z − m2 ) = (q2 − m2 )(q 2 − m2 ). Ersetzt man eine der beiden Gleichungen durch ihre Differenz z(m1 − m2 ) + z(m1 − m2 ) = |q2 − m2 |2 − |q1 − m1 |2 + |m2 |2 − |m1 |2 , so ist dieser Fall auf den vorigen zurückgeführt. Satz 14.1 — Es sei S ⊂ C eine Menge von Punkten mit 0, 1 ∈ S. Ein Punkt z ∈ C ist genau dann in endlich vielen Schritten aus S konstruierbar, wenn es eine Folge von Körpererweiterungen K0 = Q(S ∪ S) ⊂ K1 ⊂ . . . ⊂ Kn mit den folgenden Eigenschaften gibt: [Ki+1 : Ki ] = 2 für i = 0, . . . , n − 1, und z ∈ Kn . Beweis. Es sei zunächst z aus S konstruierbar. Dazu seien ℓ Schritte nötig, bei denen in elementaren Konstruktionsschritten der Reihe nach die Zahlen z1 , z2 ,. . . , zℓ = z konstruiert werden. Wir setzen Sk := S ∪ {z1 , . . . , zk } und Lk := Q(Sk ∪ S k ) für k = 0, . . . , ℓ. Wir haben oben gesehen, daß Algebra I im Wintersemester 2015 121 zk jeweils entweder in Lk−1 oder in einer quadratischen Erweiterung davon liegt. Dasselbe gilt dann auch für z k . Wir erhalten eine Folge von Körpererweiterungen L0 ⊂ . . . ⊂ Lk−1 ⊂ Lk−1 (zk ) ⊂ Lk = Lk−1 (zk , z k ) ⊂ . . . ⊂ Lℓ . Der Körpergrad ist in jedem Schritt 1 oder 2, und nach Konstruktion ist z ∈ Lℓ . Das beweist die erste Richtung. Für die umgekehrte Richtung halten wir zunächst fest: Durch Kombination von elementaren Konstruktionsschritten sind auch die folgenden Konstruktionen immer ausführbar: (1) Die Konstruktion der Parallelen zu einer konstruierten Geraden g durch einen konstruierten Punkt P . (2) Die Konstruktion des Kreises um einen konstruierbaren Punkt m mit Radius |Q1 Q2 |, wobei Q1 und Q2 konstruierte Punkte sind. Damit ist für je zwei konstruierbare Zahlen a und b auch ihre Summe und Differenz konstruierbar. a+b a b 0 Die Konstruktion des Produktes oder Quotienten zweier Zahlen führt auf das Teilproblem, zwei Winkel zu addieren oder zu subtrahieren, und das Teilproblem, zwei Streckenlängen zu multiplizieren oder zu dividieren. Das erste Problem ist leicht, das zweite Problem wird durch die Strahlensätze gelöst: ab b a 0 a 1 b 0 1 b/a Schließlich kann man leicht jeden konstruierten Punkt P an einer konstruierten Geraden g spiegeln: P g 122 Konstruktionen mit Zirkel und Lineal Insbesondere kann man zu jedem konstruierbaren Punkt z auch den komplex konjugierten Punkt z konstruieren. Damit ist gezeigt: Ist T ⊂ C eine Menge von Punkten, die aus S konstruierbar ist, so sind alle Punkte im Körper Q(T ∪ T ) konstruierbar. Um die fehlende Richtung des Satzes zu beweisen, genügt es, die folgende Behauptung zu beweisen: Genügt z ∈ C einer quadratischen Gleichung, deren Koeffizienten konstruierbar sind, so gilt dies auch für z. Offensichtlich genügt es weiter zu zeigen: Ist a konstruierbar, so auch die beiden Quadratwurzeln aus a. Dazu wiederum genügt es, den von a mit der positiven reellen Achse gebildeten Winkel zu halbieren, und die Quadratwurzel aus |a| zu ziehen. Letzteres kann man zum Beispiel mit dem Höhensatz erreichen: p |a| 1 |a| Damit ist alles gezeigt. Satz 14.2 — Die Würfelverdopplung ist nicht mit Zirkel und Lineal ausführbar. √ Beweis. In algebraischer Übersetzung lautet das Problem, die Zahl z = 3 2 zu konstruieren. Dazu müßte es nach Satz 14.1 eine Körpererweiterung L/Q mit z ∈ L und [L : Q] = 2m , m ∈ N geben. Das ist wegen [Q(z) : Q] = 3 und der Multiplikativität des Grads bei Körpererweiterungen unmöglich. Deshalb ist die Konstruktion nicht ausführbar. Satz 14.3 — Die Winkeldreiteilung ist für einen allgemeinen Winkel nicht mit Zirkel und Lineal ausführbar. Beweis. Es sei der Winkel α gegeben und u = 2 cos(α). Einen Winkel β mit α = 3β zu konstruieren, ist äquivalent dazu, die reelle Zahl x = 2 cos(β) aus u zu konstruieren. Nun gilt nach den Formeln von de Moivre: cos(α) + sin(α)i = (cos(β) + i sin(β))3 und somit cos(α) = cos(β)3 − 3 cos(β) sin(β)2 = 4 cos(β)3 − 3 cos(β). Deshalb erfüllt x die kubischen Gleichung x3 − 3x − u = 0. Es genügt, einen einzigen Winkel anzugeben, für den die Dreiteilung nicht möglich ist. Wir wählen dazu α = π/3, also u = 1. Das Polynom f = X 3 − X − 1 ist irreduzibel. Deshalb ist [Q(x) : Q] = 3, und x kann nicht in einer Erweiterung L/Q liegen, deren Grad eine Potenz von 2 ist. Nach Satz 14.1 kann x nicht mit Zirkel und Lineal gelöst werden. Satz 14.4 — Die Quadratur des Kreises ist nicht mit Zirkel und Lineal möglich. √ Beweis. In algebraischer Übersetzung besteht das Problem darin, eine Strecke der Länge π zu konstruieren. Nun hat Ferdinand von Lindemann gezeigt, daß π eine transzendente Zahl ist (Folgerung Algebra I im Wintersemester 2015 123 √ 18.7). Deshalb ist auch π nicht algebraisch und erst recht nicht konstruierbar. Die Hauptschwierigkeit liegt hier natürlich im Satz von Lindemann. Satz 14.5 — Es sei S ⊂ C eine Menge von Punkten mit 0, 1 ∈ S. Ein Punkt z ist genau dann aus S konstruierbar, wenn z algebraisch über K = Q(S ∪S) ist und wenn der Grad des Zerfällungskörpers von z über K eine Potenz von 2 ist. Beweis. Es sei zunächst L/K der Zerfällungskörper eines über K algebraischen Elements z und [L : K] = 2m . Dann ist die Galoisgruppe G := Gal(L/K) eine 2-Gruppe, und es gibt eine Filtrierung von G durch Normalteiler Gn = {id} ⊂ Gn−1 ⊂ . . . ⊂ G0 = G mit der Eigenschaft gibt, daß |Gi |/|Gi+1 | = 2. Dem entspricht eine Folge von Zwischenkörpern K = K0 ⊂ K1 ⊂ . . . ⊂ Kn = L, Kν = LG ν mit [Ki : Ki−1 ] = 2. Nach Satz 14.1 ist z mit Zirkel und Lineal aus S konstruierbar. Zur Umkehrung: Es sei z aus S konstruierbar. Dann gibt es nach Satz 14.1 eine Folge von Körpererweiterungen K = K0 ⊂ K1 ⊂ . . . ⊂ Kℓ mit [Ki : Ki−1 ] = 2 und z ∈ Kℓ . Wir setzen L0 = K0 und konstruieren induktiv eine Folge von Körpererweiterungen K = L 0 ⊂ L 1 ⊂ . . . ⊂ Lℓ mit den folgenden Eigenschaften: (1) Ki ⊂ Li . (2) Li ist normal über K. (3) [Li+1 : Li ] ist eine Potenz von 2. Es sei k ein Index mit 0 ≤ k < ℓ und Lk mit den verlangten Eigenschaften schon konstruiert. Es gibt nun ein a ∈ Kk+1 mit Kk+1 = Kk (a), und dieses a ist eine Nullstelle eines quadratischen Polynoms f ∈ Kk [X]. Es seien weiter a = a1 , . . . , am ∈ C die Nullstellen von minpola/K . Wir setzen Lk+1 := Lk (a1 , . . . , am ). Dann gilt nach Konstruktion sicher Lk ⊂ Lk+1 und Kk+1 ⊂ Lk+1 , und Lk+1 /K ist normal. Zu jedem ai gibt es einen Automorphismus σi ∈ Gal(Lk+1 /K) mit σi (a) = ai . Der Automorphismus σi transformiert f ∈ Kk [X] ⊂ Lk [X] in ein Polynom fi ∈ Lk [X], weil Lk normal ist. Aus f (a) = 0 folgt fi (ai ) = 0. Insbesondere ist ai quadratisch über Lk , also erst recht höchstens quadratisch über Lk (a1 , . . . , ai−1 ). Die Körpererweiterungen Lk ⊂ Lk (a1 ) ⊂ . . . ⊂ Lk (a1 , a2 , . . . , am ) = Lk+1 haben also jeweils den Grad 1 oder 2. Damit ist die Induktion abgeschlossen. Insgesamt erhalten wir so eine normale Erweiterung Lℓ /K von 2-Potenzgrad mit z ∈ Lℓ . Dann enthält Lℓ einen Zerfällungskörper von z über K, und dessen Grad über K ist notwendigerweise ebenfalls eine Potenz von 2. Lemma 14.6 — Eine Zahl der Form 2n + 1 ist höchstens dann eine Primzahl, wenn n = 2k für ein k ∈ N0 . Beweis. Angenommen, n = mq mit einer ungeraden Zahl q, 1 < q ≤ n. Dann gilt 2n + 1 = (2m + 1) (2m )q−1 − (2m )q−2 + . . . − 2m + 1 . Wenn also 2n + 1 eine Primzahl sein soll, darf n keinen nichttrivialen ungeraden Faktor enthalten. k Definition 14.7. — Zahlen der Form Fk = 22 + 1 heißen Fermatzahlen. 124 Konstruktionen mit Zirkel und Lineal Die ersten Fermatzahlen sind wirklich Primzahlen: F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537. 32 Aber schon die nächste Fermatzahl faktorisiert (Euler): 2 + 1 = 641 · 6700417. Es sind keine weiteren Fermatzahlen bekannt, die Primzahlen sind. Die Faktorisierung von Fermatzahlen ist ein beliebter Test für die Qualität von neuen Faktorisierungsalgorithmen. Den jeweils aktuellen Stand der Bemühungen findet man wohl am schnellsten durch eine Suche im Internet. Satz 14.8 (Gauß) — Ein reguläres n-Eck ist genau dann mit Zirkel und Lineal konstruierbar, wenn n die Form n = 2 m p1 · · · pℓ hat, wobei m, ℓ ∈ N0 und p1 ,. . . ,pℓ paarweise verschiedene Fermat-Primzahlen sind. ν Beweis. Es sei n = 2m pν11 · · · pℓ ℓ die Primfaktorzerlegung von n. Der Zerfällungskörper des Kreisteilungspolynoms Φn hat den Grad ν −1 ϕ(n) = 2m−1 p1ν1 −1 · · · pℓ ℓ (p1 − 1) · · · (pℓ − 1). Nach Satz 14.5 ist das reguläre n-Eck genau dann mit Zirkel und Lineal konstruierbar, wenn ϕ(n) eine Zweierpotenz ist. Dies ist genau dann der Fall, wenn jede ungerade Primzahl p = p1 , . . . , pℓ höchstens mit Vielfachheit 1 vorkommt und wenn in diesem Falle p − 1 eine Potenz von 2, also p eine Fermat-Primzahl ist. Was die tatsächliche Konstruktion angeht, so genügt es offensichtlich, für jede Fermat-Primzahl p eine Konstruktion des regulären p-Ecks anzugeben. Wie das geht, haben wir schon gesehen (siehe Satz 13.9). Für zusammengesetzte Zahlen n ergibt sich die Konstruktion dann leicht. Algebra I im Wintesemester 2015 125 §15. Auflösbarkeit von Gleichungen 15.1. Spur und Norm. Es sei L/K eine endliche Körpererweiterung und a ∈ L. Die Linksmultiplikation ℓa : L → L, x 7→ ax ist eine K-lineare Abbildung. Das charakteristische Polynom von a ist charpola/L/K (X) := det(XidL − ℓa ). Lemma 15.1 — Es seien K ⊂ L ⊂ M Körpererweiterungen und a ∈ L. (1) charpola/K(a)/K = minpola/K . [M :L] (2) charpola/M/K = charpola/L/K . (3) charpola/L/K = [L:K(a)] minpola/K . Beweis. Zu 1: Das Minimalpolynom minpola/K ist ein Teiler des charakteristischen Polynoms charpola/K(a)/K . Da beide denselben Grad [K(a) : K] haben und normiert sind, sind sie gleich. Zu 2: Es sei x1 , . . . , xn eine K-Basis von L und y1 , . . . , ym eine L-Basis von M . Es sei B die Matrix zu ℓa bezüglich der Basis x1 , . . . , xn . Dann ist x 1 y 1 , . . . , x n y1 , x 1 y2 , . . . , x n y m eine K-Basis von M , und zu ℓa : M → M gehört bezüglich dieser Basis die Matrix B B .. . B mit m = [L : M ] Blockmatrizen entlang der Hauptdiagonalen. Aus der Multiplikativität des charakteristischen Polynoms für Blockmatrizen folgt charpola/M/K = charpolm a/L/K , wie behauptet. Zu 3: Die Behauptung ist eine Konsequenz aus 1. und 2. Definition 15.2. — Es sei L/K eine endliche Körpererweiterung. Die Abbildungen SpL/K : L → K, a 7→ SpL/K (a) := tr(ℓa ) und NmL/K : L → K, a 7→ NmL/K (a) := det(ℓa ) heißen Spur und Norm von L/K. Nach Definition gilt charpola/L/K (X) = X n − SpL/K (a)X n−1 + . . . + (−1)n NmL/K (a), mit n = [L : K], d.h. bis auf Vorzeichen sind Spur und Norm genau der n − 1-te und der 0-te Koeffizient des charakteristischen Polynoms. Aus Lemma 15.1 ergeben sich leicht eine Reihe von Eigenschaften von Spur und Norm: Lemma 15.3 — Es sei L/K eine endliche Körpererweiterung. Für alle a, b ∈ L gilt SpL/K (a + b) NmL/K (ab) = = SpL/K (a) + SpL/K (b), NmL/K (a) · NmL/K (b). Insbesondere ist NmL/K : L∗ → K ∗ ein Gruppenhomomorphismus. Für a ∈ K gilt außerdem SpL/K (a) = [L : K] · a und NmL/K (a) = a[L:K] . 126 Auflösbarkeit von Gleichungen Beweis. Die erste Behauptung folgt sofort aus der Additivität der Spur bzw. der Multiplikativität der Determinante von Matrizen. Die zweite Aussage ergibt sich daraus, daß ℓa für a ∈ K bezüglich jeder K-Basis von L die Matrix aI[L:K] hat. Lemma 15.4 — Es sei L/K eine endliche Galoiserweiterung mit Galoisgruppe G. Es sei ferner a ∈ L und {a1 , . . . , an } die G-Bahn von a. Dann gilt: n Y minpola/K = i=1 und charpola/K/L = Y (X − ai ) σ∈G (X − σ(a)). Bezeichnet H die Standgruppe von a, so ist K(a) = LH und H = Gal(L/K(a)). Beweis. Die Gruppe G permutiert die Elemente der Bahn B := {a1 , . . . , an }. Deshalb sind die Koeffizienten des Polynoms f := (X − a1 ) · . . . · (X − an ) invariant unter G und liegen in LG = K. Insbesondere ist das Minimalpolynom von a ein Teiler von f . Umgekehrt ist klar, daß f ein Teiler des Minimalpolynoms ist. Da beide normiert sind, sind sie gleich. Weiter ist klar, daß K(a) ⊂ LH . Andererseits ist nach der Bahnengleichung [K(a) : K] = deg(minpola/K ) = |B| = |G|/|H| = [L : K]/[L : LH ] = [LH : K]. Das impliziert K(a) = LH und H = Gal(L/K(a)). Wir betrachten die Abbildung π : G → B, σ 7→ σ(a). Dann ist π −1 (ai ) = σi H. Insbesondere kommt jedes ai in der endlichen Folge (σ(a))σ∈G genau |H| mal vor. D.h. Y σ∈G (X − σ(a)) = n Y i=1 (X − ai ) |H| [L:K(a)] = minpola/K = charpola/L/K . 15.2. Zyklische Erweiterungen. Definition 15.5. — Eine endliche Galoiserweiterung L/K heißt zyklisch, wenn die Galoisgruppe Gal(L/K) eine zyklische Gruppe ist. Der merkwürdige Name des folgenden berühmten Satzes rührt daher, daß er als ‘Satz 90’ in Hilberts Zahlbericht für die Deutsche Mathematiker-Vereinigung erscheint. David Hilbert: Die Theorie der algebraischen Zahlkörper. Jahresbericht der Deutschen Mathematiker-Vereinigung 4 (1897), p. 175 – 546. Satz 15.6 (Hilbert 90) — Es sei L/K eine zyklische Galoiserweiterung und σ ein Erzeuger der Galoisgruppe. Die folgenden Aussagen sind für ein a ∈ L äquivalent: NmL/K (a) = 1 ⇔ a= b für ein b ∈ L× . σ(b) Beweis. Es sei n = [L : K]. Da die Galoisgruppe zyklisch ist, gilt NmL/K (a) = a = b/σ(b) für ein b ∈ L× , so hat man NmL/K (a) = Qn−1 i=0 σ i (a). Falls σ(b) σ n−1 (b) b b · 2 · ... · = n = 1. σ(b) σ (b) σ n (b) σ (b) Zur Umkehrung: Es sei a mit NmL/K (a) = 1 gegeben. Wegen der linearen Unabhängigkeit von id, σ, . . . , σ n−1 ist die Abbildung u : L → L mit u(x) = x + aσ(x) + aσ(a)σ 2 (x) + . . . + aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (x) Algebra I im Wintesemester 2015 127 nicht die Nullabbildung. Wir wählen y ∈ L mit b := u(y) 6= 0. Dann gilt: aσ(b) = aσ(u(y)) = aσ(y) + aσ(aσ(y)) + . . . + aσ(aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (y)) = aσ(y) + aσ(a)σ 2 (y) + . . . + aσ(a)σ 2 (a) · · · σ n−2 (a)σ n−1 (y) + NmL/K (a)σ n (y) = b, weil σ n (y) = y und NmL/K (a) = 1 nach Voraussetzung. Damit ist a = b/σ(b) wie verlangt. Satz 15.7 (Die reine Gleichung) — Es sei n ∈ N und K ein Körper, der eine primitive n-te Einheitswurzel ζ enthält. (1) Ist L/K eine zyklische Erweiterung vom Grad n, dann ist L = K(a) für ein Element a mit einem Minimalpolynom der Form X n − c ∈ K[X]. (2) Ist umgekehrt a ∈ K eine Nullstelle eines Polynoms X n − c ∈ K[X], so ist minpola/K = X d − b für einen Teiler d von n, K(a)/K ist eine zyklische Erweiterung vom Grad d, und die Abbildung Z/d −→ Gal(K(a)/K), k 7→ (a 7→ ζ kn/d a) ist ein Gruppenisomorphismus. Ferner zerfällt X n − c zerfällt über K(a) in Linearfaktoren Q d di und über K wie folgt: X n − c = n/d i=1 (X − ζ b). Beweis. 1. Es gilt NmL/K (ζ) = ζ [L:K] = ζ n = 1. Insbesondere gibt es nach Satz 90 von Hilbert ein a ∈ L mit ζσ(a) = a. Es folgt induktiv: σ k (a) = aζ −k für k = 0, . . . , n − 1. Diese Werte sind paarweise verschieden, weil ζ eine primitive n-te Einheitswurzel ist. Insbesondere ist (X − a) · (X − aζ −1 ) · . . . · (X − aζ n−1 ) = X n − an das Minimalpolynom von a. Mit c = an ∈ K folgt die Behauptung. Zu 2. Ist a eine Nullstelle von X n − c in einem algebraischen Abschluß von K, so sind alle anderen von der Form aζ k , k = 0, . . . , n−1. Insbesondere ist K(a) der Zerfällungskörper von X n −c. Es sei d := [K(a) : K]. Für jedes σ ∈ Gal(K(a)/K) gibt es genau ein ϕ(σ) ∈ Z/n mit σ(a) = aζ ϕ(σ) . Dies definiert eine injektive Abbildung ϕ : Gal(K(a)/K) → Z/n. Außerdem gilt ζ ϕ(τ σ) a = τ (σ(a)) = τ (ζ ϕ(σ) a) = ζ ϕ(σ) τ (a) = ζ ϕ(σ) ζ ϕ(τ ) a = ζ ϕ(σ)+ϕ(τ ) a. Der Vergleich zeigt, daß ϕ(τ σ) = ϕ(σ) + ϕ(τ ), mit anderen Worten, ϕ ist ein Gruppenhomomorphismus. Notwendigerweise ist das Bild von ϕ die zu Z/d isomorphe Untergruppe, die von der Restklasse n/d erzeugt wird. Deshalb wird die Galoisgruppe von der Abbildung a 7→ aζ n/d erzeugt. Bezeichnet ξ := ζ n/d diese primitive d-te Einheitswurzel, so ist das Minimalpolynom von a durch (X − a)(X − ξa) · · · (X − ξ d−1 a) = X d − ad =: X d − b gegeben. Schließlich gilt: Xn − c = n−1 Y i=0 n/d−1 d−1 (X − ζ i a) = Y Y j=0 i=0 n/d−1 (X − ξ i ζ j a) = Y j=0 (X d − (ζ j a)d ). 128 Auflösbarkeit von Gleichungen Satz 15.8 (Hilbert 90, additive Variante) — Es sei L/K eine zyklische Galoiserweiterung und σ ein Erzeuger der Galoisgruppe. Die folgenden Aussagen sind für ein a ∈ L äquivalent: SpL/K (a) = 0 ⇔ a = b − σ(b) für ein b ∈ L. Beweis. Die Richtung ⇐ ist wieder einfach. Für die umgekehrte Richtung sei a ∈ L mit SpL/K (a) = 0 vorgegeben. Wir wählen ein y ∈ L mit SpL/K (y) 6= 0 und bilden c = aσ(y) + (a + σ(a))σ 2 (y) + . . . + (a + σ(a) + . . . + σ n−2 (a))σ n−1 (y). Für dieses Element gilt c − σ(c) = a σ(y) + σ 2 (y) + . . . + σ n−1 (y) − σ(a) + σ 2 (a) + . . . + σ n−1 (a) y. Da SpL/K (a) = 0, ist der Koeffizient von y in c − σ(c) genau a. Deshalb hat man weiter c − σ(c) = a(y + σ(y) + . . . + σ n−1 (y)) = a SpL/K (y). Nach Wahl von y ist das Element SpL/K (y) ∈ K × . Mit b := c/ SpL/K (y) folgt die Behauptung. In einem Körper der Charakteristik p hat das Polynom X p − X nach dem kleinen Fermatschen Satze die p-Nullstellen 0, 1, . . . , (p − 1). Deshalb besteht die Faktorisierung X p − X = X · (X − 1) · . . . · (X − (p − 1)). Substitutiert man X durch X − a mit einem beliebigen Element a erhält man X p − X − (ap − a) = (X − a)(X − a − 1) · . . . · (X − a − p + 1). Diese kleine Rechnung wird im Beweis des folgenden Satzes benutzt: Satz 15.9 (Artin14 – Schreier15) — Es sei K ein Körper der Charakteristik p > 0. (1) Ist L/K eine zyklische Galoiserweiterung vom Grad p, dann ist L = K(a) für ein a mit einem Minimalpolynom der Form X p − X − c ∈ K[X]. (2) Umgekehrt zerfällt jedes Polynom X p − X − c ∈ K[X] entweder schon in K vollständig in Linearfaktoren oder ist irreduzibel. Ist im zweiten Falle a eine Nullstelle in einem algebraischen Abschluß, so ist K(a)/K eine zyklische Galoiserweiterung, und die Abbildung Z/p → Gal(K(a)/K), k 7→ (a 7→ a + k), ist ein Gruppenisomorphismus. Beweis. Es sei zunächst L/K zyklisch vom Grad p. Es gilt SpL/K (−1) = −p = 0. Deshalb gibt es nach der additiven Variante des Satzes von Hilbert ein a ∈ L mit −1 = a−σ(a), oder σ(a) = a+1. Dann kann a nicht in K liegen. Nach dem Gradsatz ist [K(a) : K] ein Teiler von [L : K] = p. Deshalb ist K(a) = L. Das Minimalpolynom bestimmt sich so: Induktiv gilt σ k (a) = a + k für alle k = 0, . . . , p − 1. Also ist p−1 minpola/K = Y k=0 = (X − σ k (a)) (X − a)(X − a − 1) · · · (X − a − p + 1) = X p − X − (ap − a). Das war zu zeigen. Ist umgekehrt das Polynoms X p − X − c ∈ K[X] vorgegeben und a eine Nullstelle in einer Erweiterung von K, so gilt für i = 0, . . . , p−1, daß (a+i)p −(a+i)−c = (ap −a−c)+(ip −i) = 0. Enthält also eine Erweiterung von K eine Nullstelle, so enthält sie alle. Folglich zerfällt X p − X − c in K(a)[X] vollständig in Linearfaktoren. Außerdem ist X p − X − c separabel. Für jedes Element 14Emil Artin, b3. März 1898 in Wien d20. Dezember 1962 in Hamburg. 15Otto Schreier, b3. März 1901 in Wien d2. Juni 1929 in Hamburg. Algebra I im Wintesemester 2015 129 σ ∈ Gal(K(a)/K) gibt es ein eindeutiges ϕ(σ) ∈ Z/p mit σ(a) = a + ϕ(σ), und σ ist durch ϕ(σ) eindeutig bestimmt. Deshalb ist ϕ : Gal(K(a)/K) → Z/p eine injektive Abbildung. Wegen τ (σ(a)) = τ (a + ϕ(σ) = τ (a) + ϕ(σ) = a + ϕ(τ ) + ϕ(σ) gilt ϕ(τ σ) = ϕ(τ ) + ϕ(σ), d.h. ϕ ist ein Gruppenhomomorphismus. Weil p prim ist, ist ϕ entweder trivial oder ein Isomorphismus. Deshalb zerfällt X p − X − a entweder schon über K vollständig in Linearfaktoren oder ist irreduzibel. Im zweiten Falle hat die Erweiterung den Grad p, und man hat einen Isomorphismus Z/p 7→ Gal(K(a)/K), k 7→ (a 7→ k). 15.3. Auflösbare Gleichungen. Es sei K ein Körper und f ∈ K[X] ein separables Polynom vom Grad n. Wir wollen in diesem Abschnitt die Frage betrachten, unter welchen Bedingungen sich die Nullstellen von f durch Wurzelausdrücke in den Koeffizienten von f beschreiben lassen. Wir wollen die folgende Sprechweise verwenden: Es sei L ein Zerfällungskörper von f . Wir bezeichnen die Galoisgruppe Gal(L/K) kurz als Gruppe der Gleichung f = 0. Definition 15.10. — Man nennt eine Galoiserweiterung L/K auflösbar, wenn die Galoisgruppe Gal(L/K) auflösbar ist. Definition 15.11. — Eine Erweiterung M/K ist eine Radikalerweiterung, wenn M/K eine zyklische Erweiterung vom Grad m ist, wobei m entweder die Charakteristik von K ist oder m zur Charakteristik prim ist und K eine primitive m-te Einheitswurzel enthält. Definition 15.12. — Es sei K ein Körper und f ∈ K[X] ein irreduzibles Polynom. f heißt durch Radikale auflösbar, wenn es eine Kette von Körpererweiterungen K = K0 ⊂ K1 ⊂ . . . ⊂ Kn mit den folgenden Eigenschaften gibt: Kn enthält eine Nullstelle von f und für jedes i = 1, . . . , n ist Ki /Ki−1 eine Radikalerweiterung. Satz 15.13 — Die folgenden Aussagen sind für ein irreduzibles Polynom f ∈ K[X] äquivalent: (1) f ist durch Radikale auflösbar. (2) Die Gruppe der Gleichung f = 0 ist auflösbar. Beweis. 1 ⇒ 2: Es sei K = K0 ⊂ . . . ⊂ Kn eine Kette von Erweiterungen mit den Eigenschaften der Definition 15.12. Wir konstruieren induktiv Körper Lk ⊂ K n , k = 0, . . . , n mit (1) K0 = L0 und Ki ⊂ Li für alle i = 1, . . . , n. (2) Li /K ist eine Galoiserweiterung. (3) Gal(Li /Li−1 ) ist auflösbar. Es sei 0 < i ≤ n gegeben und Li−1 bereits konstruiert. Wir betrachten das Kompositum Ki′ = Ki Li−1 . Dann ist Ki′ /Li−1 eine Galoiserweiterung, und es gibt einen kanonischen Monomorphismus Gal(Ki′ /Li−1 ) → Gal(Ki /Ki−1 ). Insbesondere ist Gal(Ki′ /Li−1 ) zyklisch von einer Ordnung m, wobei entweder m = char(K) > 0 oder m prim zur Charakteristik ist und Ki−1 , also auch Li−1 , eine primitive m-te Einheitswurzel enthält, d.h. Ki′ /Li−1 ist eine Radikalerweiterung. Also ist L′ /Li−1 eine einfache Erweiterung, L′i = Li−1 (a), wobei das Minimalpolynom von a die Form X m −X −c oder X m −c für ein c ∈ Li−1 hat. Die Erweiterung Li−1 /K ist nach Induktionsannahme normal. Es seien c = c1 , . . . , cℓ ∈ Li−1 die zu c konjugierten Elemente, ferner aj ∈ K n 130 Auflösbarkeit von Gleichungen eine Nullstelle des Polynoms X m − X − cj bzw. X m − cj für j = 1, . . . , ℓ. Die Erweiterungen Li−1 (aj )/Li−1 sind zyklisch der Ordnung m. Wir betrachten die Erweiterungen Li−1 ⊂ Li−1 (a1 ) ⊂ Li−1 (a1 , a2 ) ⊂ . . . ⊂ Li−1 (a1 , a2 , . . . , aℓ ) =: Li . Dann ist Li /K normal, und jede Erweiterung Li−1 (a1 , . . . , aj )/Li−1 (a1 , . . . , aj−1 ) ist eine Galoiserweiterung, deren Galoisgruppe isomorph zu einer Untergruppe von Gal(Li−1 (aj )/Li−1 ) und daher zyklisch ist. Für die Galoisgruppe Gal(Li /Li−1 ) heißt das, daß es eine Filtrierung durch Normalteiler gibt, deren Faktorgruppen zyklisch sind. Das bedeutet: Gal(Li /Li−1 ) ist auflösbar. Das beendet den Induktionsschritt. Insgesamt erhält man einen Körper Ln , der Kn und damit eine Wurzel von f enthält, der eine Galoiserweiterung von K ist, und der eine Kette von Zwischenkörpern mit auflösbaren Galoisgruppen enthält. Demnach hat Gal(Ln /K) eine Filtrierung durch Normalteiler mit auflösbaren Faktorgruppen und ist damit selbst auflösbar. Der Zerfällungskörper F von f ist nach Konstruktion ein Zwischenkörper von Ln /K, und die Galoisgruppe Gal(F/K) folglich eine Faktorgruppe von Gal(Ln /K). Da Faktorgruppen von auflösbaren Gruppen wieder auflösbar sind, ist Gal(F/K) auflösbar. Das war zu zeigen. 2 ⇒ 1: Es sei F ein Zerfällungskörper von f und N die Ordnung der Galoisgruppe G = Gal(F/K). Nach Annahme ist G auflösbar. Es seien q1 , . . . , qℓ alle Primzahlen ≤ N , die char(K) nicht teilen, und zwar der Größe nach aufsteigend sortiert. Wir konstruieren rekursiv Körpererweiterungen K = K0 ⊂ K1 ⊂ . . . ⊂ Kℓ mit der Eigenschaft, daß Kj alle primitiven Einheitswurzeln der Ordnungen q1 , . . . , qj enthält. Es sei dazu k > 0 und Kk−1 schon konstruiert und ζ eine primitive qk -te Einheitswurzel. Nach Wahl der qi ’s ist qk prim zur Charakteristik, falls diese endlich ist. Die Galoisgruppe Gal(Kk−1 (ζ)/Kk−1 ) ist isomorph zu einer Untergruppe von Z/(qk − 1) und daher abelsch und hat eine Ordnung, deren sämtliche Primfaktoren kleiner als qk sind. Es gibt daher eine Filtrierung der Galoisgruppe durch Untergruppen mit zyklischen Faktoren derselben Primzahlordnungen und dazugehörig eine Kette von zyklischen Körpererweiterungen Kk−1 = Kk−1,0 ⊂ Kk−1,1 ⊂ Kk−1,2 ⊂ . . . ⊂ Kk−1,s = Kk−1 (ζ) =: Kk , wobei der Körpergrad [Ki−1,t : Ki−1,t−1 ] an jeder Stelle entweder eine der Primzahlen q1 , . . . , qk−1 oder die Charakteristik von K ist. Insbesondere sind alle Erweiterungen Ki−1,t /Ki−1,t−1 Radikalerweiterungen. Nach Induktionsannahme enthält Ki−1 die qi -ten Einheitswurzeln für alle i ≤ k−1. Es sei nun L das Kompositum von Kℓ und F in einem gemeinsamen algebraischen Abschluß. Dann ist Gal(L/Kℓ ) eine Untergruppe von Gal(F/K) und nach Annahme auflösbar und hat eine Ordnung ≤ N . Folglich gibt es eine Filtrierung von Gal(L/Kℓ ) durch Normalteiler mit zyklischen Faktoren von Primzahlordnung ≤ N . Dazu gehört eine Kette von zyklischen Körpererweiterungen Kℓ = Kℓ,0 ⊂ Kℓ,1 ⊂ Kℓ,2 ⊂ . . . ⊂ Kℓ,u = L, wobei der Körpergrad [Kℓ,t : Kℓ,t−1 ] an jeder Stelle entweder eine der Primzahlen q1 , . . . , qℓ oder die Charakteristik von K ist, d.h. alle Erweiterungen Kℓ−1,t /Kℓ−1,t−1 sind Radikalerweiterungen. Nach Konstruktion hat f eine Nullstelle in L. Zusammengenommen heißt das, daß f eine Auflösung durch Radikale besitzt. Es sei wieder allgemein K ein Körper, f ∈ K[X] ein separables Polynom. Es seien α1 , α2 , . . . , αn ∈ L die Nullstellen von f im Zerfällungskörper L von f . Jedes Element g ∈ Gal(L/K) permutiert die Nullstellen, d.h. es gibt eine eindeutige Permutation g ∈ Sn mit der Eigenschaft, daß g(αi ) = αg(i) für alle i = 1, . . . , n. Algebra I im Wintesemester 2015 131 Dies definiert einen Gruppenhomomorphismus ϕ : Gal(L/K) → Sn , g 7→ g. Da L von den Nullstellen von f erzeugt wird, ist jedes g ∈ G vollständig durch die Wirkung auf den Nullstellen bestimmt. Insbesondere ist der Homomorphismus ϕ injektiv, und wir können Gal(L/K) als Untergruppe von Sn auffassen. Allerdings hängt ϕ von der Numerierung der Nullstellen ab. Je zwei Numerierungen ′ {α1 , . . . , αn } = {α1′ , . . . , αn } unterscheiden sich um eine Permutation π mit αi′ = απ(i) . Bezeichnet ϕ′ : Gal(L/K) → Sn die Einbettung zur zweiten Numerierung, so gilt: ′ ′ ′ (g)(i) = g(αi ) = g(απ(i) ) = αϕ(g)(π(i)) , απ(ϕ′ (g)(i)) = αϕ d.h. ϕ′ (g) = π −1 ◦ ϕ(g) ◦ π. Die Einbettungen zu verschiedenen Numerierungen sind also konjugiert. Lemma 15.14 — Mit diesen Bezeichnungen gilt: (1) Die Ordnung von Gal(L/K) ist ein Teiler von n!. (2) Wenn f irreduzibel ist, operiert Gal(L/K) transitiv auf den Nullstellen von f . In diesem Falle ist n ein Teiler von |Gal(L/K)|. Beweis. Die erste Behauptung folgt einfach daraus, daß Gal(L/K) eine Untergruppe von Sn ist. Es ist weiter klar, daß für ein irreduzibles Polynom alle Nullstellen von f in einer Bahn unter der Galoisgruppe liegen. Die Teilbarkeitsrelation ist eine Konsequenz der Bahnengleichung: Die Länge jeder Bahn ist ein Teiler der Gruppenordnung. Folgerung 15.15 — Es sei f ∈ K[X] ein Polynom vom Grad ≤ 4. Dann ist die Gleichung f = 0 durch Radikale auflösbar. Beweis. Die Gruppe der Gleichung f = 0 ist eine Untergruppe von S4 und deshalb auflösbar. Beispiel 15.16. — Es sei L/Q der Zerfällungskörper des Polynoms f = X 5 − 4X − 2. Mit dem Eisensteinkriterium folgt sofort, daß f irreduzibel ist. Als Funktion auf R hat f genau zwei Extremstellen, weil die Ableitung f ′ = 5X 4 − 4 zwei reelle Nullstellen hat. Nach dem Zwischenwertsatz hat f deshalb genau drei reelle Nullstellen. Die beiden übrigen Nullstellen sind komplex konjugiert. Die komplexe Konjugation ist daher ein Element der Galoisgruppe G = Gal(L/Q) und entspricht unter der Einbettung G ⊂ S5 einer Transposition. Da 5 ein Teiler der Ordnung von G und eine Primzahl ist, enthält G ein Element der Ordnung 5. Unter der Einbettung G ⊂ S5 muß dieses Element einem 5-Zykel entsprechen. Die Galoisgruppe G ist also eine Untergruppe von S5 , die einen 5-Zykel und eine Transposition enthält. Man kann zeigen (Übung), daß G dann schon mit S5 übereinstimmen muß. Insbesondere ist X 5 − 4X − 2 nicht durch Radikale auflösbar. Beispiel 15.17. Es sei K ein Körper. Die symmetrische Gruppe Sn wirkt auf dem rationalen Funktionenkörper M := K(X1 , . . . , Xn ) durch Vertauschung der Unbestimmten. Die Erweiterung M/M Sn ist eine Galoiserweiterung mit Galoisgruppe Sn . Dies ist einfach ein Spezialfall von Satz 12.28. Mit Hilfe des Hauptsatzes über symmetrische Polynome können wir aber mehr sagen: Zunächst gibt es einen Ringisomorphismus K[Y1 , . . . , Yn ] −→ K[X1 , . . . , Xn ]Sn 132 Auflösbarkeit von Gleichungen der die Unbestimmte Yi mit dem i-ten elementarsymmetrischen Polynom in den Unbestimmten Xj identifiziert. Dieser Isomorphismus induziert eine Abbildung der Funktionenkörper: ψ K(Y1 , . . . , Yn ) −−→ K(X1 , . . . , Xn )Sn ⊂ K(X1 , . . . , Xn ). Wir wollen zeigen, daß ψ ein Isomorphismus ist. Dazu ist zu zeigen, daß jede symmetrische rationale Funktion f ∈ K(X1 , . . . , Xn ) sich als Quotient zweier symmetrischer Polynome p, q ∈ K[X1 , . . . , Xn ] schreiben läßt. Das ist leicht: Es sei f = p/q irgendeine Darstellung von f als Quotient zweier Polynome p, q. Wir bilden Q p · σ∈Sn \{id} σ(q) p Q f= = . q σ∈Sn σ(q) Q Q Der Nenner q̃ = σ∈Sn σ(q) ist invariant. Der Zähler p̃ = p · σ∈Sn \{id} σ(q) aber auch, denn er läßt sich als Produkt der symmetrischen Funktionen f und q̃ schreiben. Das zeigt, daß K(X1 , . . . , Xn )/K(Y1 , . . . , Yn ) eine Galoiserweiterung mit Galoisgruppe Sn ist. Die Unbestimmten Xi sind Nullstellen der Gleichung X n − Y1 X n + Y2 X n−2 + . . . + (−1)n Yn = 0. Diese Gleichung läßt sich als die allgemeine Gleichung vom Grad n über dem Körper K auffassen. Für n ≥ 5 ist die Galoisgruppe Sn nicht auflösbar. In diesem Sinne gibt es keine Lösungsformeln für die Nullstellen, die sich durch Radikale in den Unbestimmten Yi ausdrücken lassen. Trotzdem gibt es Gleichungen vom Grad n ≥ 5, die sich durch Radikale lösen lassen. Das einfachste Beispiel liefern die 11.ten Einheitswurzeln: Das Minimalpolynom von cos(2π/11) hat Grad 5, und der Zerfällungskörper ist zyklisch vom Grad 5. Die Auflösbarkeit wurde für dieses Beispiel zuerst von Vandermonde beschrieben. Näheres dazu im Buch von Tignol, der die Formeln von Vandermonde übernimmt. In einem unveröffentlichten Aufsatz geben Matthew Davis und Shiv Gupta Korrekturen zu diesen Formeln, aber in der mir bekannte Fassung dieses Aufsatzes gibt es zumindest Druckfehler. Die Geschichte der Gleichung fünften Grades ist eine Geschichte für sich. Es gibt spezielle Literatur zur Frage, wie man entscheidet, ob eine vorgelegte Gleichung fünften Grades auflösbar ist, und wie man die Auflösung in einem solchen Fall wirklich findet. Der Schlüssel dazu ist eine gewisse sogenannte Resolvente sechsten Grades, die von Lagrange und Malfatti untersucht wurde. Algebra I im Wintersemester 2015 133 §16. Zur Galoisgruppe 16.1. Berechnung der Galoisgruppe. In den vergangenen Vorlesungen haben wir stets spezielle Polynome oder zumindest spezielle Typen von Polynomen betrachtet, und die Struktur der Galoisgruppe aus den gegebenen Besonderheiten erschlossen. Man kann sich fragen, wie man algorithmisch vorgehen kann, um die Gruppe einer Gleichung f = 0 direkt aus den Ausgangsdaten zu berechnen. Es sei dazu ein Körper K und ein separables normiertes Polynom f ∈ K[X] vom Grad n vorgegeben. Wir bezeichnen mit L einen Zerfällungskörper von f , erzeugt von den Nullstellen α1 , . . . , αn von f und mit Galoisgruppe G = Gal(L/K). Die Numerierung der Wurzeln α1 , . . . , αn bestimmt auch eine Einbettung ϕ : G → Sn , σ 7→ σ̄, mit der Eigenschaft σ(αi ) = ασ̄(i) . Die Einbettung hängt aber von der Anordnung der Nullstellen ab, und eine andere Numerierung führt zu einer anderen Einbettung ϕ′ : G → Sn , die sich aber von ϕ nur durch Konjugation unterscheidet, d.h. es gibt eine Permutation π ∈ Sn mit ϕ′ (g) = πϕ(g)π −1 für alle g ∈ G. Das Problem lautet also: Wie bestimmt man ausgehend allein von f die Galoisgruppe als Untergruppe von Sn . Es ist von vornherein klar, daß dies, wenn überhaupt, nur bis auf Konjugation möglich ist. Wir folgen einem im Buch von van der Waerden beschriebenen Verfahren, daß im Kern auf Galois zurückgeht. Dazu betrachten wir die Funktionenkörper K(u1 , . . . , un ) und L(u1 , . . . , un ) mit Unbestimmten u1 , . . . , un . L(u1 , . . . , un ) tt ttt t t t ttt L KK KKK KKK KKK K PPP PPP PPP PPP K(u1 , . . . , un ) K mm mmm m m m mmm mmm Zur Erinnerung: Der Funktionenkörper K(u1 , . . . , un ) ist der Quotientenkörper des Polynomrings K[u1 , . . . , un ]. Die Wirkung der Galoisgruppe G auf L setzt sich zu einer Wirkung auf dem Funktionenkörper L(u1 , . . . , un ) fort, indem jedes g ∈ G die Unbestimmten u1 , . . . , un festläßt. Lemma 16.1 — Es gilt L(u1 , . . . , un )G = K(u1 , . . . , un ). Insbesondere ist L(u1 , . . . , un ) eine Galoiserweiterung von K(u1 , . . . , un ) mit Galoisgruppe G. Weil LG = K, folgt sofort L[u1 , . . . , un ]G = K[u1 , . . . , un ]. Deswegen ist das Lemma eine direkte Konsequenz aus dem folgenden: Lemma 16.2 — Operiert eine endliche Gruppe G auf einem Integritätsbereich A durch Ringisomorphen, so gilt Q(AG ) = Q(A)G . Hier bezeichnet wie früher Q(R) den Quotientenkörper eines Integritätsbereichs R. Beweis. Es ist klar, daß der Quotient a/b zweier G-invarianter Elemente a, b ∈ A wieder G-invariant ist. Das bedeutet: Q(AG ) ⊂ Q(A)G . Wir müssen die umgekehrte Inklusion zeigen. Dazu sei h = Q Q a/b ∈ Q(A) ein Q-invarianter Quotient. Wir bilden c := g∈G g(b) und u := c/b = g6=id g(b), so daß c ∈ AG und b̃ = bu. Es gilt h= a au au = = . b bu c 134 Zur Galoisgruppe Dann ist einerseits au = ch als Produkt von a, u ∈ A wieder in A, andererseits als Produkt der G-Invarianten c und h selbst G-invariant, d.h. au ∈ AG . Nun ist h ein Quotient von Elementen au, c ∈ AG , und das bedeutet h ∈ Q(AG ). Auf dem Körper L(u1 , . . . , un ) operieren nun zwei Gruppen: Zum Einen die Galoisgruppe G = Gal(L/K): Ein g ∈ G wirkt nur auf den L-wertigen Koeffizienten einer rationalen Funktion in L(u1 , . . . , un ) läßt aber die Unbestimmten fest. Zum Anderen die symmetrische Gruppe Sn : Eine Permutation π ∈ Sn vertauscht die Unbestimmten u1 , . . . , un , läßt aber die Koeffizienten aus L fest. Für ein Element g ∈ G und sein Bild ḡ ∈ Sn muß man also zwischen den Wirkungen von g und ḡ unterscheiden! Wir betrachen das spezielle Element θ := u1 α1 + . . . + un αn = n X i=1 ui αi ∈ L[u1 , . . . , un ], wo α1 ,. . . , αn die Nullstellen von f sind. Man kann θ als eine universelle Linearkombination der Nullstellen von f auffassen. Die Bilder von θ unter G sind offenbar paarweise verschieden. Deshalb ist Y T := (X − g(θ)) ∈ K(u1 , . . . , un )[X] g∈G das Minimalpolynom von θ bezüglich K(u1 , . . . , un ), und θ ist ein primitives Elemente für die Erweiterung L(u1 , . . . , un )/K(u1 , . . . , un . Aus der Konstruktion geht sogar genauer hervor, daß T ∈ K[u1 , . . . , un ][X]. Wir halten ausdrücklich fest: T ist ein irreduzibles Element im faktoriellen Ring K[u1 , . . . , un ][X] und normiert als Polynom in X. Daneben bilden wir das Polynom Y F = (X − π(θ)) ∈ L(u1 , . . . , un )[X]. π∈Sn Die Koeffizienten von F (als Polynom in X) sind Polynome in den ui und αi mit Koeffizienten in K. Sie sind genauer symmetrische Polynome in α1 ,. . . , αn und lassen sich nach dem Hauptsatz über symmetrische Polynome durch die Koeffizienten von f ausdrücken. Es folgt: F ∈ K[u1 , . . . , un ][X]. F ist sogar symmetrisch in u1 , . . . , un und könnte durch die elementarsymmetrischen Polynome der ui ausgedrückt werden, was aber nicht gebraucht wird. Ich hatte oben darauf hingewiesen, daß für ein g ∈ G die Wirkungen von g und seinem Bild ḡ ∈ Sn im allgemeinen völlig verschieden sind, in ihrer Wirkung auf θ hängen sie aber wie folgt zusammen: n n n X X X X ui αg(i) = ui g(αi ) = g(θ) = uj αj ) = g −1 (θ). ug −1 (j) αj = g −1 ( i=1 i=1 j j=1 Es seien nun π1 , . . . , πℓ ∈ Sn Vertreter für die Nebenklassen Sn /ϕ(G). Dann gilt: F = Y π∈Sn = ℓ Y j=1 (X − π(θ)) = πj Y g∈G (X − g ℓ Y Y j=1 g∈G −1 (θ)) ! (X − πj g(θ)) = ℓ Y πj (T ). j=1 Wir wissen, daß T irreduzibel in K[u1 , . . . , un ][X] ist. Dasselbe gilt dann auch für die Bilder πj (T ). Damit erweist sich F = T1 · · · Tℓ Algebra I im Wintersemester 2015 135 mit Tj := πj (T ) als Primfaktorzerlegung von F im faktoriellen Ring K[u1 , . . . , un ]. Üblicherweise ist eine solche Faktorzerlegung eindeutig nur bis auf die Reihenfolge und Einheiten. Weil im vorliegenden Falle die Tj als Polynome in X normiert sind, ist die Faktorzerlegung sogar eindeutig bis auf die Reihenfolge der Faktoren. Lemma 16.3 — 1. Die Permutationen π ∈ Sn vertauschen die irreduziblen Faktoren von F transitiv. 2. Es sei Gj := {g ∈ Sn | π(Tj ) = Tj } die Standgruppe von Tj . Es gilt g ∈ Gj genau dann, wenn g einen Linearfaktor von Tj in einen Linearfaktor von Tj abbildet. 3. Es gilt Gj = πj ϕ(G)πj−1 . Beweis. Die Bilder π(θ), π ∈ Sn , sind paarweise verschieden, weil die Elemente α1 , . . . , αn paarweise verschieden sind. Die Gruppe Sn operiert transitiv auf den Linearfaktoren (X − π(θ)) von F . Da die Primfaktorzerlegung von F in A[u1 , . . . , un ][X] eindeutig ist, vertauscht π ∈ Sn die Primfaktoren von F . Wegen der Transitivität auf den Linearfaktoren muß auch diese Wirkung auf den Primfaktoren transitiv sein. Das beweist Aussage 1. Haben insbesondere Tj und π(Tj ) auch nur einen einzigen Linearfaktor gemeinsam, so müssen sie schon gleich sein. Das zeigt Aussage 2. Für jedes g ∈ G gilt πj gπj−1 (Tj ) = πj (g(T )) = πj (g −1 (T )) = πj (T ) = Tj . Das bedeutet, daß πj ϕ(G)πj−1 ⊂ Gj . Andererseits ist |G| = |Sn |/ℓ = |Gj | wegen der transitiven Wirkung von Sn auf den Restklassen Sn /ϕ(G) bzw. den Faktoren von F . Aus der Inklusion der Gruppen folgt wegen der Gleichmächtigkeit die behauptete Gleichheit Gj = πj ϕ(G)πj−1 . Algorithmus: Es sind also die folgenden Schritte auszuführen. Man geht von Symbolen α1 ,. . . ,αn aus, berechnet das Produkt h und ersetzt die elementarsymmetrischen Polynome in den αi durch die Koeffizienten von f . Das ist ausführbar, ohne daß man die wirklichen Wurzeln kennt. Anschließend wird h im Ring K[u1 , . . . , un , X] in irreduzible Faktoren zerlegt, wofür ein effektives Verfahren für Rechnungen im Koeffizientenbereich K implementiert sein muß. Man wählt dann einen willkürlichen Faktor der Primfaktorzerlegung aus und bestimmt die Standgruppe. Die Komplexität des Verfahrens wächst aber schnell mit der Ordnung n! von Sn , wenn n den Grad des untersuchten Polynoms bezeichnet. Selbst für kleine n kommt man kaum ohne den Computer aus, und für größere n setzt auch dieser bald aus. Beispiel 16.4. — Schon für kleine Grade ist die Ausführung des oben beschriebenen Verfahrens kompliziert. Wir beschränken uns deshalb auf ein kubisches Polynom f = x3 + x2 − 2x − 1 ∈ Q[x]. Das ist das schon mehrfach verwendete Minimalpolynom von 2 cos(2πki/7), k ∈ Z. Es seien α1 , α2 , α3 drei (symbolische) Wurzeln. Wir bilden θ = α1 u1 + α2 u2 + α3 u3 . Die sechs Bilder unter der Wirkung der symmetrischen Gruppe S3 sind θ1 = α 1 u 1 + α 2 u 2 + α 3 u 3 , θ2 = α 1 u1 + α 2 u3 + α 3 u2 , θ3 = α 1 u2 + α 2 u1 + α 3 u3 , θ4 = α 1 u 2 + α 2 u 3 + α 3 u 1 , θ5 = α 1 u 3 + α 2 u 1 + α 3 u 2 , θ6 = α 1 u3 + α 2 u2 + α 3 u1 . Damit erhält man F = = (X − θ1 ) · . . . · (X − θs ) X 6 + F 1 X 5 + F2 X 4 + F3 X 3 + F4 X 2 + F5 X + F6 mit gewissen polynomiellen Ausdrücken Fk ∈ Q[α1 , α2 , α3 , u1 , u2 , u3 ], die symmetrisch sowohl in den αi wie in den uj sind. Die symmetrischen Ausdrücke in den αi werden durch die Koeffizienten von f ersetzt: α1 + α2 + α3 = −1, α1 α2 + α1 α3 + α2 α3 = −2, α1 α2 α3 = 1. 136 Zur Galoisgruppe Um das Ergebnis vernünftig hinschreiben zu können verwende ich auch für elementarsymmetrischen Polynome der uj Abkürzungen: u1 + u2 + u3 = s 1 , u 1 u2 + u1 u3 + u2 u3 = s 2 , u 1 u2 u3 = s 3 . Damit schreiben sich die Koeffizienten von F so: F1 = 2s1 , F2 = −3s21 + 14s2 , F3 = F4 = F5 = F6 = −6s31 + 21s1 s2 − 7s3 , 2s41 − 21s21 s2 + 49s22 − 7s1 s3 , 4s51 − 28s31 s2 + 49s1 s22 + 14s21 s3 − 49s2 s3 , s61 − 7s41 s2 + 49s32 + 56s31 s3 − 245s1 s2 s3 + 343s23 . Allerdings muß man F wirklich als Polynom in K[u1 , . . . , un ][X] auffassen und die si nur als Abkürzungen lesen, sonst sieht man nicht, daß dieses Polynom zerfällt: F = T+ · T− mit kubischen Faktoren T± = X 3 + s1 X 2 + (−2s21 + 7s2 )X + 12 (−2s31 + 7s1 s2 − 7s3 ± 7δ). Die beiden Faktoren unterscheiden sich nur um das Vorzeichen vor δ := (u1 − u2 )(u2 − u3 )(u3 − u2 ). Nach unseren früheren Überlegungen zum Invariantenring der alternierenden Gruppe (vgl. Satz 4.10), werden beide Faktoren sicher von der zyklischen Gruppe A3 festgehalten, aber genauso sicher von ungeraden Permutationen ausgetauscht. Die Galoisgruppe ist in diesem Falle also isomorph zur zyklischen Gruppe A3 ⊂ S3 , was wir nach Wahl des Beispielpolynoms aber schon vorher wußten. Es ist aber klar, daß die tatsächliche Rechnung sowohl bei der Invariantenbildung wie der Faktorisierung ohne Computerhilfe sehr sehr mühselig wäre. Daß wir auf die beschriebene Weise zu einer Identifizierung der Galoisgruppe mit einer Untergruppe von Sn kommen, können wir dazu benutzen, um ganz verschiedene Körpererweiterungen miteinander in Beziehung zu setzen. Den folgenden Satz findet man wieder im Buch von van der Waerden, ich weiß aber nicht, wer der ursprüngliche Entdecker des Satzes ist. Satz 16.5 — Es sei A ein faktorieller Ring mit Quotientenkörper K, ferner p ⊂ A ein Primideal, Ā := A/p der Restklassenring und K̄ dessen Quotientenkörper. Es sei f ∈ A ein normiertes Polynom vom Grad n mit der Eigenschaft, daß sowohl f wie die Reduktion f¯ = f mod p ∈ Ā[X] separabel sind. Es seien G und Ḡ die Galoisgruppen von f bzw. f¯. Dann ist G, aufgefaßt als Untergruppe von Sn , konjugiert zu einer Untergruppe von G ⊂ Sn . Beweis. Wir konstruieren nach dem obigen Verfahren zu f das Polynom F ∈ K[u1 , . . . , un ][X], seine Primfaktorzerlegung F = T1 · . . . · Tℓ und die Standgruppen Gj zu den Faktoren Tj . Gemäß den besonderen Annahmen des Satzes hat f aber schon Koeffizienten im Ring A. Entsprechend dem Hauptsatz über symmetrische Polynome kann man das obige Argument dahingehend verschärfen, daß F dann auch ein Polynom in A[u1 , . . . , un ][X] ist. Wegen des Satzes von Gauß liegen auch die irreduziblen Faktoren Tj von F schon in A[u1 , . . . , un ][X]. Konstruiert man nun in analoger Weise zu f¯ ∈ A[X] ⊂ K[X] das Polynom F̄ ∈ K̄[u1 , . . . , un ][X], so ist aus der Konstruktion klar, daß F̄ das Bild von F unter der Reduktionsabbildung A[u1 , . . . , un ][X] → Ā[u1 , . . . , un ][X] → K̄[u1 , . . . , un ][X] Algebra I im Wintersemester 2015 137 ist. Bezeichnen weiter T̄1 , . . . , T̄ℓ die Bilder der Faktoren T1 , . . . , Tℓ , so besteht im Polynomring K̄[u1 , . . . , un ][X] die Zerlegung F̄ = T̄1 · . . . , ·T̄ℓ . Aber natürlich brauchen die Polynome T̄j nicht irreduzibel zu sein, sondern können (und werden in der Regel) weiter zerfallen, etwa wie folgt: T̄j = Tj1 · . . . · Tjsj , j = 1, . . . , ℓ. Nun gilt für jede Permutation π ∈ Sn : Wenn π(T11 ) = T11 , dann bildet π einen Linearfaktor von T11 , also insbesondere von F̄1 , auf einen Linearfaktor von T11 und damit von F̄1 ab. Aber wegen Aussage 2 des Lemmas 16.3 heißt das, daß π(T1 ) = T1 . Kurzum: Die Standgruppe von T11 ist eine Untergruppe der Standgruppe von T1 . Wegen Aussage 3 von Lemma 16.3 folgt die Behauptung des Satzes. 16.2. Das inverse Galoisproblem. Unter dem inversen Galoisproblem versteht man die Aufgabe zu einem vorgegebenem Körper K und einer vorgegebenen Gruppe G eine Galoiserweiterung L/K mit Galoisgruppe Gal(L/K) ∼ =G zu konstruieren. Für die Aufgabenstellung wichtig ist dabei, daß man sich den Körper K vorgibt. Ohne diese Einschränkung ist die Aufgabe leicht: Ist G eine endliche Gruppe der Ordnung n, so definiert die Wirkung von G auf sich selbst durch Multiplikation von links nach Wahl einer Numerierung der Elemente von G eine Einbettung von G in die symmetrische Gruppe Sn . Vermöge dieser Einbettung operiert dann G auf dem Funktionenkörper Q(u1 , . . . , un ) auf effektive Weise durch Permutation der Unbestimmten, und Q(u1 , . . . , un ) ist eine Galoiserweiterung des Invariantenkörpers Q(u1 , . . . , un )G mit Galoisgruppe G. Die folgenden Sätze lösen das inverse Galoisproblem für den Grundkörper Q und gewisse Gruppen. Shafaerevich hat gezeigt, daß jede auflösbare endliche Gruppe als Galoisgruppe einer Erweiterung von Q vorkommt. Für beliebige endliche Gruppen ist das Problem offen. Im Beweis der Aussage, daß sich jede endliche abelsche Gruppe als Galoisgruppe einer Erweiterung von Q realisieren läßt, wird der folgende schöne und berühmte Satz von Dirichlet gebraucht: Satz 16.6 (Dirichlet 1837) — Sind a und b teilerfremde natürliche Zahlen, so gibt es in der Folge a + kn, k ∈ N0 , unendlich viele Primzahlen. Peter Gustav Lejeune-Dirichlet: Beweis des Satzes, daß jede unbegrenzte arithmetische Progression, deren erstes Glied und Differenz ganze Zahlen ohne gemeinschaftlichen Factor sind, unendlich viele Primzahlen enthält. Abhand. Akad. Wiss. Berlin 48 (1839). Satz 16.7 — Zu jeder endlichen abelschen Gruppe G gibt es eine Galoiserweiterung L/Q mit Galoisgruppe Gal(L/Q) ∼ = G. Beweis. Nach dem Hauptsatz über endliche abelsche Gruppen gibt es eine Zerlegung G∼ = Z/n1 × . . . × Z/ns in endliche zyklische Gruppen. Wir wählen Primzahlen pi mit pi ≡ 1 mod ni für i = 1, . . . , s, und weil es nach dem Satz von Dirichlet davon jeweils unendlich viele gibt, kann man die p1 , . . . , ps auch paarweise verschieden wählen. Es sei mi = (pi − 1)/ni . Es gibt dann Einbettungen ∼ = ϕi : Z/mi −→ Z/(pi − 1) −−→ (Z/pi )× mit Faktorgruppen (Z/pi )× /ϕ(Z/mi ) ∼ = (Z/(p − 1))/(Z/mi ) ∼ = Z/ni . Es sei P = p1 · . . . · ps und ζ ∈ C eine primitive P -te Einheitswurzel. Dann ist Q(ζ) eine abelsche Galoiserweiterung mit Galoisgruppe × × × Gal(Q(ζ)/Q) ∼ = (Z/p1 ) × . . . × (Z/ps ) . = (Z/P ) ∼ 138 Zur Galoisgruppe Die Untergruppe H = ϕ1 (Z/m1 ) × . . . × ϕs (Z/ms ) der Galoisgruppe ist ein Normalteiler mit Faktorgruppe ∼ = Z/n1 × . . . × Z/ns ∼ = G. Der Körper L = Q(ζ)H hat deshalb die verlangten Eigenschaften. Um den Beweisgang des folgenden Satzes nicht zu unterbrechen, erinnere ich vorweg daran, daß jede endliche Körpererweiterung eines endlichen Körpers Fq bereits eine Galoiserweiterung ist, und zwar mit zyklischer Galoisgruppe. Insbesondere hat der Zerfällungskörper eines irreduziblen Polynoms f ∈ Fp [X] vom Grad n ebenfalls den Grad n. Satz 16.8 (Hilbert) — Für jedes n ∈ N existiert ein irreduzibles normiertes Polynom f ∈ Z[X], dessen Zerfällungskörper L/Q eine zu Sn isomorphe Galoisgruppe hat. Beweis. Für n = 2 oder n = 3 leisten f = X 2 − 2 bzw. X 3 − 2 alles Gewünschte. Es sei also im folgenden n ≥ 4. 1. Wähle ein irreduzibles Polynom f2 ∈ F2 [X] vom Grad n. Der Zerfällungskörper von f ist F2n . Die Galoisgruppe G2 = Gal(F2n /F2 ) ist zyklisch von der Ordnung n und wird als Untergruppe in Sn von einem n-Zykel erzeugt. 2. Wähle ein irreduzibles Polynom f3′ ∈ F3 [X] vom Grad n − 1. Setze f3 = X · f3′ . Der Zerfällungskörper von f3 ist F3n−1 . Die Galoisgruppe G3 = Gal(F3n−1 /F3 ) ist zyklisch von der Ordnung n − 1 und wird als Untergruppe von Sn von einem (n − 1)–Zykel erzeugt. 3. Das Polynom f5′ = X 2 + 2 ∈ F5 ist irreduzibel. Wähle weiter ein irreduzibles Polynom f5′′ vom Grad m = n − 2 bzw. m = n − 3 je nachdem, ob n ungerade oder gerade ist, und setze f5 = f5′ ff′′ bzw. f5 = f5′ f5′′ X. Der Zerfällungskörper L von f hat den Grad 2m über F5 . Es seien α1 , . . . , αm die Nullstellen von f5′′ und αm+1 udn αm+2 die beiden Nullstellen von f5′ . Es sei g ∈ G5 = Gal(L/F5 ) ein Element, das αm+1 und αm+2 vertauscht. Die Einschränkung von g auf K(α1 , . . . , αm ) hat eine ungerade Ordnung k. Dann wirkt g k auf α1 , . . . , αm trivial und vertauscht αm+1 und αm+2 als Transposition. Das zeigt: Als Untergruppe in Sn enthält G5 eine Transposition. 4. Mit Hilfe des Chinesischen Restklassensatzes findet man ein normiertes Polynom f ∈ Z[X] vom Grad n, das die simultanen Kongruenzen f ≡ f2 mod 2, f ≡ f3 mod 3, f ≡ f5 mod 5 erfüllt. Da f2 irreduzibel ist, muß auch f irreduzibel sein. Die Galoisgruppe G von f enthält als Untergruppe von Sn gemäß Satz 16.5 Gruppen, die zu G2 , G3 und G5 isomorph sind. Insbesondere enthält G einen n–Zykel, einen (n − 1)–Zykel und eine Transposition. Wir schließen mit dem folgenden Lemma, daß G = Sn . Lemma 16.9 — Es sei G ⊂ Sn eine Untergruppe, die einen n–Zykel, einen (n − 1)–Zykel und eine Transposition enthält. Dann ist G = Sn . Beweis. Ohne Einschränkung können wir annehmen, daß der (n − 1)–Zykel π = (12 . . . (n − 1)) und die Transpostion (ij) zu G gehören. Da G einen n–Zykel enthält, operiert G transitiv auf den Elementen {1, . . . , n}. Wähle g ∈ G mit g(j) = n. Es sei k = g(i). Dann gilt G ∋ g(ij)g −1 = (kn). Es folgt weiter G ∋ π ℓ−k (kn)π k−ℓ = (ℓn) für alle ℓ < n. Schließlich enthält G auch das Element (hℓ) = (hn)(ℓn)(hn)−1 für alle h < ℓ < n. Damit enthält G alle Transpositionen. Da Sn von den Transpositionen erzeugt wird, ist G = Sn . Beispiel 16.10. — Wir illustrieren das Verfahren für n = 5: 5 Das Polynom X 2 −1 − 1 = X 31 − 1 ∈ F2 [X] zerfällt wie folgt in Linearfaktoren: X 31 − 1 = (X − 1)(X 5 + X 2 + 1)(X 5 + X 3 + 1) ·(X 5 + X 3 + X 2 + X + 1)(X 5 + X 4 + X 2 + X + 1) ·(X 5 + X 4 + X 3 + X + 1)(X 5 + X 4 + X 3 + X 2 + 1). Algebra I im Wintersemester 2015 139 Wir wählen als irreduzibles Polynom f2 = X 5 + X 2 + 1 ∈ F2 [X]. Von den 8 verschiedenen irreduziblen Faktoren vom Grad 4 des Polynoms Φ80 = = Φ34 −1 = X 32 − X 24 + X 16 − X 8 − 1 (X 4 + X 3 − 1)(X 4 + X − 1)(X 4 − X 3 − 1)(X 4 − X − 1) ·(X 4 + X 3 + X 2 − X − 1)(X 4 − X 3 + X 2 + X − 1) ·(X 4 + X 3 − X 2 − X − 1)(X 4 − X 3 − X 2 + X − 1) wählen wir X 4 − X − 1 und setzen f3 = X 5 − X 2 − X ∈ F3 [X]. Schließlich sei (mit einer kleinen Abweichung vom Algorithmus des Beweises) f5 = (X 2 + 2)X(X − 1)(X − 2) = X 5 + 2X 4 + 4X 3 + 4X 2 + 4X ∈ F5 [X]. Ein Polynom, das die simultane Kongruenz löst, ist f = X 5 + 12X 4 − 6X 3 − X 2 + 14X + 15. Nach dem Satz ist die Galoisgruppe von f isomorph zu S5 . Satz 16.11 — Die Gruppe der Gleichung X 8 − 72X 6 + 180X 4 − 144X 2 + 36 = 0 über Q ist die Quaternionengruppe Q8 . Beweis. Es sei f (X) := X 8 − 72X 6 + 180X 4 − 144X 2 + 36. Ist α ∈ Q eine Nullstelle von f , so auch −α. In der Zerlegung von f in irreduzible Faktoren muß daher jeder Faktor selbst ein Polynom in X 2 sein, da f keine Lösungen in Q hat. Es genügt also, sich von der Irreduzibilität des Polynoms g(X) := X 4 − 72X 3 + 180X 2 − 144X + 36 zu überzeugen. Das sieht man aus der folgenden expliziten Lösung der Gleichung g(X) = 0. Die Substitution X = z + 18 führt auf das Polynom h(z) = g(z + 18) = z 4 − 1764z 2 − 40320z − 259164. Die Gleichung h(z) = 0 wird mit dem Ansatz (16.1) z 4 + 2dz 2 + d2 = (1764 + 2d)z 2 + 40320z + (259164 + d2 ) gelöst: Bezeichnet man die rechte Seite mit Az 2 + Bz + C, so läßt sie sich genau dann als Quadrat √ √ einer Linearform ( Az + C) schreiben, wenn 4AC = B 2 . Dies führt in der gegeben Situation auf die Bedingung 4(1764 + 2d)(259164 + d2 ) = 403202 , also die Gleichung d3 + 882d2 + 259164d + 25369848 = 0 für d. Macht man hier die Substitution t = d + 882/3, so sieht man sofort, daß t = 0 eine Lösung ist, und damit erhält man leicht die Zerlegung in Linearfaktoren (d + 282)(d + 294)(d + 306) = 0. Setzt man d = −306 in die Gleichung (16.1) ein, so erhält man: √ z 2 − 306 = ±12 2(2z + 35) oder umgeformt: √ √ √ √ (z ∓ 12 2)2 = 594 ± 420 2 = 3(198 ± 140 2) = 3(10 ± 7 2)2 . 140 Zur Galoisgruppe Das führt auf die vier folgenden Lösungen für g(x) = 0: √ √ √ x1 = 18 + 12 2 + 10 3 + 7 6 √ √ √ x2 = 18 − 12 2 + 10 3 − 7 6 √ √ √ x3 = 18 + 12 2 − 10 3 − 7 6 √ √ √ x4 = 18 − 12 2 − 10 3 + 7 6 Offenbar ist der Zerfällungskörper von g(X) der Körper √ √ M := Q(x1 ) = Q( 2, 3). Dessen Galoisgruppe ist √ √ ¯ Ji ¯ Gal(M/Q) = Gal(Q( 2, 3)/Q) ∼ = Z/2 × Z/2 = hI, mit Erzeugern √ √ √ √ I¯ : 2 7→ − 2, 3 7→ 3, √ √ √ √ J¯ : 2 7→ 2, 3 7→ − 3, ¯ und den Relationen I¯2 = 1, J¯2 = 1, I¯J¯ = J¯I. Es sei jetzt α eine Wurzel der Gleichung T 2 − x1 = 0, und L = M (α). Die Galoisgruppe Gal(L/M ) ∼ = Z/2 wird erzeugt von einer Involution ι : α 7→ −α. Wir zeigen zunächst, daß das Polynom f über L in Linearfaktoren zerfällt. Dazu müssen wir Wurzeln αi der Gleichungen T 2 − xi = 0 finden. Nun gilt: (ααi )2 = α2 αi2 = x1 xi . Für i = 2, 3, 4 findet man: x1 x2 = x1 x3 = x1 x4 = √ √ √ 42 + 24 3 = [ 2(3 + 2 3)]2 √ √ √ 18 + 12 2 = [ 3(2 + 2)]2 √ √ √ 30 + 12 6 = [ 3(2 + 6)]2 . Demnach sind die acht Wurzeln von f (X) gegeben durch: √ √ √ √ √ √ 2 3+ 6 2 3+3 2 3 2+2 6 , ± , ± . ±α, ± α α α ¯ die Es bleibt die Galoisgruppe zu bestimmen. Dazu seien I und J die Fortsetzungen von I¯ und J, durch √ √ √ √ 3 2+2 6 2 3+ 6 I(α) = bzw. J(α) = α α charakterisiert sind. Man findet, daß I 2 und J 2 den Körper M festlassen und α auf −α abbilden. Insbesondere gilt I 2 = J 2 = ι, und I und J haben die Ordnung 4. Betrachte die beiden Kompositionen IJ und JI. Man findet: √ √ √ √ √ √ 2 3+ 6 2 3− 6 √ α = −( 2 − 1)( 3 − 2)α IJ(α) = I = √ α 3 2+2 6 und √ √ √ √ √ √ 3 2+2 6 3 2−2 6 √ α = ( 2 − 1)( 3 − 2)α. JI(α) = J = √ α 2 3+ 6 Das zeigt IJ = ιJI. Da ι mit I und J vertauscht, lauten die vollen Relationen für die Automorphismen I, J und K := IJ: I 2 = J 2 = K 2 = IJK = ι, ι2 = id. Die von I und J erzeugte Gruppe ist daher die Quaternionengruppe Q8 , die wegen ihrer Mächtigkeit bereits mit Gal(L/Q) übereinstimmen muß. Algebra I im Wintersemester 2015 141 §17. (*) Normalbasen Zu jeder Galoiserweiterung L/K vom Grad n gibt es nach dem Satz vom primitiven Element ein α ∈ L mit L = K(α). Die Elemente 1, α, α2 , . . . , αn−1 bilden eine K-Basis von L. Unter Umständen läßt sich die Wirkung der Galoisgruppe in dieser Basis nur auf verwickelte Weise ausdrücken. Schreibt man andererseits Gal(L/K) = {σ1 = id, σ2 , . . . , σn }, und αi = σi (α) so werden die Elemente α1 , α 2 , . . . , α n von der Galoisgruppe nur permutiert, im allgemeinen bilden sie aber keine K-Basis, wie die einfachsten Beispiele zeigen: Zum Beispiel wird C als Erweiterung von R von i erzeugt. Aber das zu i konjugierte Element ist −i, und i und −i sind offensichtlich R-linear abhängig. Im vorliegenden Falle kann man zu α1 = 1 + i übergehen. Dann bilden α1 und das konjugierte Element α2 = 1 − i eine R-Basis von C. Definition 17.1. — Es sei L/K eine Galoiserweiterung. Eine K-Basis α1 , . . . , αn von L ist eine Normalbasis, wenn die αi von der Galoisgruppe permutiert werden. Lemma 17.2 — Die Elemente einer Normalbasis bilden eine einzige Bahn unter der Wirkung der Galoisgruppe. Beweis. Es sei {α1 , . . . , αn } = B1 ∪ . . . ∪ Bs die Zerlegung einer Normalbasis der GaloiserweiP terung L/K in Bahnen unter der Galoisgruppe. Die Elemente bi := β∈Bi β, i = 1, . . . , s sind konstruktionsgemäß invariant unter der Galoisgruppe und liegen deshalb in K. Andererseits sind sie K-linear unabhängig, weil die Elemente α1 , . . . , αn eine K-Basis bilden. Das ist ein Widerspruch, falls s ≥ 2. Es gibt deshalb nur eine Bahn. Es gibt also zu jedem αj einer Normalbasis genau einen Automorphismus σj ∈ G = Gal(L/K) mit αj = σj (α1 ). Insbesondere permutiert die Galoisgruppe G die Normalbasis auf dieselbe Weise wie die Elemente von G selbst vermöge Linksmultiplikation. Deshalb gibt es einen G-äquivarianten K-Vektorraumisomorphismus L= n M j=1 Kαj ∼ = M Kσ =: K[G] σ∈G von L auf den sogenannten Gruppenring von G mit Koeffizienten in K. In der Sprache der Darstellungstheorie ist L isomorph zur regulären Darstellung von G. Satz 17.3 — Jede Galoiserweiterung hat eine Normalbasis. Wir folgen einem Beweis von Artin. Wie im Beweis des Satzes vom primitiven Element unterscheidet man die Fälle, ob K endlich oder unendlich ist. Tatsächlich ist der erste Beweisteil allgemeiner auf zyklische Erweiterungen anwendbar, was alle endlichen Körper einschließt. Erster Teil: Es sei L/K eine zyklische Erweiterung vom Grad n ≥ 2, deren Galoisgruppe von σ erzeugt wird. Für jedes Polynom g(t) = g0 + g1 t + . . . + gm tm ∈ K[t] ist g(σ) = g0 + g1 σ + . . . + gm σ m ∈ EndK (L) ein K-linearer Endomorphismus von L. Für jedes Element u ∈ L ist die Menge Iu := {g ∈ K[t] | g(σ)(u) = 0} 142 Normalbasen ein Ideal in K[t], also ein Hauptideal Iu = (µu ) für ein gewisses Polynom µu . Weil σ n = idL , annulliert tn − 1 jedes u ∈ L, so daß man in jedem Falle die Beziehung µu (t)|tn − 1 hat. Die Elemente u, σ(u), σ 2 (u), . . . , σ n−1 (u) bilden genau dann eine Normalbasis, wenn keine K-Linearkombination verschwindet, d.h. wenn es kein Polynom g vom Grad < n mit g(σ)(u) = 0 gibt. Das ist gleichbedeutend damit, daß µu = tn − 1. Wir betrachten die Primfaktorzerlegung tn − 1 = p1 (t)ν1 · · · ps (t)νs in K[t]. Weil tn − 1 in jedem Falle wenigstens den Faktor t − 1 abspaltet, haben alle normierten n Faktoren pi den Grad < n. Die maximalen echten Teiler von tn − 1 sind die Polynome di := t p−1 . i Ein Element u erzeugt also genau dann eine Normalbasis, wenn di (σ)(u) 6= 0 für alle i = 1, . . . , s. n ni −1 der größte gemeinsame Teiler von di und piνi −1 , und Wir setzen noch gi := tpν−1 i . Dann ist pi i es gibt Bézout-Koeffizienten αi , βi ∈ K[t] mit piνi −1 = αi di + βi pνi i . (17.1) Weil die Endomorphismen id, σ, . . . , σ n−1 nach dem Satz von Dirichlet sogar L-linear unabhängig sind, verschwindet kein di (σ) identisch auf L. Es gibt also vi ∈ L mit di (σ)(vi ) 6= 0. Es sei ui := gi (σ)(vi ) und u = u1 + . . . + us . Weil gi pνi i = tn − 1, gilt pνi i (σ)(ui ) = (σ n − 1)(vi ) = 0, und weil pνi i ein Faktor aller dj für j 6= i ist, gilt dj (σ)(u) = dj (σ)(uj ). ν −1 ν −1 Andererseits ist dj = pj j gj , so daß pj j (σ)(uj ) = dj (σ)(vj ) 6= 0. Somit folgt mit der Identität (17.1), daß ν −1 0 6= pj j ν (σ)(uj ) = αj (σ)dj (σ)(uj ) + βj (σ)pj j (σ)(uj ) = αj (σ)dj (σ)(uj ). Insbesondere hat man 0 6= dj (σ)(uj ) = dj (σ)(u) für alle j = 1, . . . , s. Das zeigt, daß µu = tn − 1 und damit daß u, σ(u), . . . , σ n−1 (u) eine Normalbasis ist. Zweiter Teil: Völlig verschieden verläuft der Beweis im Falle eines unendlichen Grundkörpers K. Es sei wieder L/K eine Galoiserweiterung vom Grad n mit Galoisgruppe G = Gal(L/K), und es sei ein primitives Element α ∈ L mit L = K(α) gewählt. Zu den zu α konjugierten Elementen α1 = α, α2 , . . . , αn gibt es eindeutig bestimmte σi ∈ G mit σi (α) = αi . Es bezeichne f ∈ K[X] das Minimalpolynom vom α bezüglich K. Wir bilden den Faktorring R := L[X]/(f ). Die Wirkung der Galoisgruppe auf L setzt sich zu einer Wirkung auf R fort, indem X auf sich abgebildet wird und die Elemente der Galoisgruppe nur auf den Koeffizienten aus L operieren. Tatsächlich ist R nur eine L-Algebra und ausdrücklich kein Körper, denn f zerfällt in L[X] in Linearfaktoren und ist also alles andere als irreduzibel. Das Ideal (f ) ⊂ L[X] hat eine Faktorisierung (f ) = (X − α1 ) · . . . · (X − αn ) mit paarweise koprimen Idealen (X − αi ), i = 1, . . . , n. Nach dem Chinesischen Restklassensatz besteht also ein Ringisomorphismus R = L[X]/(f ) ∼ = n Y i=1 L[X]/(X − αi ) = F1 × . . . × Fn ∼ L. Der Isomorphismus kann wie folgt explizit gemacht mit Körpern Fi := L[X]/(X − αi ) = werden, was zu einer Identifizierung der Ringe Li ⊂ R führt. Die Elemente 1, β, . . . , β n−1 , wo β ∈ R die Restklasse von X modulo (f ) bezeichnet, bilden eine L-Basis von R. Algebra I im Wintersemester 2015 143 Weil die α1 , . . . , αn ∈ L paarweise verschieden sind, ist jedes Polynom in L[X] vom Grad < n eindeutig durch seine Werte auf den αi charakterisiert. Es bezeichne ϕj ∈ L[X] das eindeutig bestimmte Polynom vom Grad < n mit der Eigenschaft ϕj (αi ) = δij . Mit den Lagrangeschen Interpolationsformeln kann man ϕj wie folgt schreiben: Y X − αi 1 Y ϕj (X) = = ′ (X − αi ). αj − αi f (αj ) i6=j i6=j Mit dieser Bezeichnung gilt für jedes Polynom g ∈ L[X] vom Grad < n die Relation g(X) = n X g(αj )ϕj (X) j=1 und folglich g(β) = n X g(αj )ϕj (β). j=1 Das zeigt: Die Elemente ej := ϕj (β), j = 1, . . . , n bilden eine L-Basis von R. Lemma 17.4 — Die Elemente e1 , . . . , en haben die folgenden Eigenschaften: Alle ei sind Idempotente, d.h. e2i = ei für alle i = 1, . . . , n. Die ei sind paarweise orthogonal, d.h. ei ej = 0 für alle i 6= j. e1 + . . . + en = 1. Die Galoisgruppe permutiert die e1 , . . . , en . P Beweis. Die Summe j ϕj (X) nimmt in allen αi den Wert 1 an, stimmt also mit der konstanten Funktion 1 überein. Modulo (f ) erhält man: e1 + . . . + en = 1. Weiter teilt f jedes Produkt ϕi ϕj für i 6= j, weil jeder Faktor von f in ϕi ϕj vorkommt. Modulo (f ) bedeutet das ei ej = 0 für i 6= j. Es folgt ej = ej (e1 + . . . + en ) = e2j . Schließlich ist σj (ϕ1 ) ein Polynom vom Grad n − 1 mit Koeffizienten in L mit der Eigenschaft (1) (2) (3) (4) σj (ϕ1 )(σj (αk )) = σj (ϕ1 (αk )) = σj (δ1k ) = δ1k . Das heißt, σj (ϕ1 ) hat den Wert 1 in σj (α1 ) = αj und den Wert 0 in allen anderen αm , m 6= j. Es folgt σj (ϕ1 ) = ϕj und somit σj (e1 ) = ej . Folglich werden die Idempotenten e1 , . . . , en von der Galoisgruppe permutiert und bilden in diesem Sinne eine Normalbasis von R als L-Vektorraum. Die Abbildung L → R, λ 7→ λej , ist injektiv. Das Bild Fj ist ein zu L isomorpher Körper, aber kein Unterring von R im strengen Wortsinne, weil zwar Addition und Multiplikation in R und in Fj übereinstimmen, aber R und Fj verschiedene Einselemente haben, nämlich 1 = e1 + . . . + en ∈ R und ej ∈ Fj . Neben L enthält R einen weiteren, zu L isomorphen Unterkörper M = K(β). R II II uu u II uu II u u II u u M = K(β) L = K(α) II II II II I K uu uu uu u u uu Als K-Vektorraum hat R eine Basis aus den Elementen αi β j , i, j = 0, . . . , n − 1. Die Rollen P von α und β sind völlig symmetrisch. Aus der Identität g(β) = j g(αj )ej gewinnt man durch 144 Normalbasen Multiplikation mit ej die Beziehung g(β)ej = g(αj )ej . Wenn g nun alle Polynome vom Grad < n mit Koeffizienten in K durchläuft, so erhält man Fj = M ej = Lej . Deshalb ist e1 , . . . , en auch eine Basis von R als M -Vektorraum. Nur der Vollständigkeit halber sei vermerkt, daß man einen K-linearen Isomorphismus von L auf M durch L −→ M, λ 7→ λe1 + σ2 (λ)e2 + . . . + σn (λ)en , P P erhält. Elemente λ ∈ K gehen dabei auf i σi (λ)ei = λ i ei = λ, wie es sein muß. Es sei nun u1 , . . . , un irgendeine Basis von L als K-Vektorraum und damit von R als M Vektorraum. Dann kann man die Polynom ϕi (X) wie folgt entwickeln: ϕi (X) = n X Φji (X)uj j=1 mit Polynomen Φji ∈ K[X] vom Grad < n. Es sei Φ(X) := (Φij (X)) die Koeffizientenmatrix in K[X]n×n . Die Auswertung in β ergibt: ei = n X Φji (β)uj . j=1 Demnach ist Φ(β) ∈ M n×n die Übergangsmatrix für die beiden Basen u1 , . . . , un und e1 , . . . , en von R als M -Vektorraum. Insbesondere ist det(Φ(β)) 6= 0. Dann kann aber auch das Polynom ∆(X) := det(Φ(X)) ∈ K[X] nicht das triviale Polynom sein. An dieser Stelle kommt die Annahme ins Spiel, daß K unendlich viele Elemente besitzt. Aus ihr folgt, daß es ein z ∈ K mit der Eigenschaft ∆(z) 6= 0 gibt. Nun muß auch die Matrix Φ(z) ∈ K n×n invertierbar sein, und folglich bilden die Elemente γj := ϕj (z), j = 1, . . . , n, eine K-Basis von L. Wir haben oben gesehen, daß σj (ϕ1 ) = ϕj . Daraus folgt durch Auswertung in z auch σj (γ1 ) = γj . Demnach permutiert die Galoisgruppe die Basis γ1 , . . . , γn , und wir haben eine Normalbasis gefunden. Algebra im Wintersemester 2015 145 §18. Transzendenzfragen 18.1. Transzendente Zahlen. Ein Element a ∈ L ist transzendent über dem Unterkörper K ⊂ L, wenn es kein nichtkonstantes Polynom f ∈ K[X] mit f (a) = 0 gibt. Eine komplexe Zahl a ist transzendent, wenn sie transzendent über Q ist. Ein Abzählargument liefert: Satz 18.1 (Cantor) — Der algebraische Abschluß Q von Q in C ist abzählbar. Insbesondere gibt es überabzählbar viele transzendente Zahlen in C. Beweis. Es gibt für festes n ∈ N nur abzählbare viele Polynome in Q[X] vom Grad n. Jedes von diesen hat höchstes endlich viele Nullstellen in C. Der Körper Q ⊂ C aller über Q algebraischen Zahlen ist also die abzählbare Vereinigung von abzählbaren Mengen und damit selbst abzählbar. Da C überabzählbar ist, ist auch C \ Q überabzählbar. Der Beweis zeigt eigentlich allgemeiner: Folgerung 18.2 — Ist K endlich, so ist der algebraische Abschluß K abzählbar. Ist K unendlich, so sind K und K gleichmächtig. Streng genommen ist dieser Beweis von Cantor sogar konstruktiv: man kann die algebraischen Zahlen explizit abzählen, und das Diagonalverfahren liefert eine transzendente Dezimalzahl. Der folgende ältere Beweis ist in anderer Weise konstruktiv: Er beruht auf der Beobachtung, daß sich nichtrationale algebraische Zahlen schlecht (!) durch rationale Zahlen approximieren lassen. Satz 18.3 (Liouville) — Es sei a ∈ C eine algebraische Zahl vom Grad n ≥ 2 über Q. Dann gibt es ε > 0 derart, daß für jede rationale Zahl p/q, q ∈ N, gilt a − p ≥ ε . (18.1) q qn Beweis. Es sei f ∈ Q[X] das Minimalpolynom von a. Ferner sei P der Hauptnenner aller KoeffiP (k) (a)/k!|. Da f irreduzibel ist und keine zienten von f , und schließlich sei C = 1 + P · n k=1 |f ′ mehrfache Nullstelle besitzt, ist f (α) 6= 0, also C > 1. Es sei 0 < ε < 1/C. Wir schließen dann wie folgt: Für jede rationale Zahl p/q ∈ Q ist einerseits f (p/q) eine rationale Zahl, die nicht 0 sein kann. Da der Nenner von f (p/q) höchstens P q n ist, gilt (18.2) |f (p/q)| ≥ 1 P qn Andererseits folgt mit δ := a − p/q unter der Annahme |δ| < ε/q n < 1, daß n n (k) X (a) k ε X |f (k) (a)| εC kf (−1) δ < n < . (18.3) |f (p/q)| = |f (a − δ)| = f (a) + k! q k! P qn k=1 k=1 Zusammengenommen hat man den Widerspruch (18.4) 1 εC 1 ≤ f (p/q) ≤ < . P qn P qn P qn Mit diesem Satz findet man sofort viele transzendente Zahlen, zum Beispiel läßt sich die Zahl (18.5) α := ∞ X 1 n! 2 n=0 viel zu gut approximieren. Das ist natürlich ein künstliches Beispiel. Interessanter ist die Tatsache, daß e und π transzendente Zahlen sind. Wir führen den Beweis im folgenden Abschnitt. 146 Transzendenfragen 18.2. Die Transzendenz von e und π. Lemma 18.4 — Für jede ganze Zahl n ≥ 0 gilt R∞ 0 z n e−z dz = n! Beweis. Partielle Integration und vollständige Induktion. Satz 18.5 (Hermite 1873) — e ist transzendent. Beweis. Angenommen, e wäre algebraisch über Q vom Grad m. Dann gibt es rationale Zahlen a0 , . . . , am mit a0 e0 + a1 e1 + . . . + am em = 0. Weil m minimal mit dieser Eigenschaft ist, ist a0 6= 0. Und indem man mit dem Hauptnenner multipliziert, kann man ohne Einschränkung annehmen, daß alle Koeffizienten ak ganze Zahlen sind. Wir setzen h(z) := (z − 1) · . . . · (z − m). Für ein später zu bestimmendes n ∈ N betrachten wir Z ∞ 0 = (a0 e0 + . . . + am em ) z n h(z)n+1 e−z dz 0 = m X ak k=0 Z ∞ z n h(z)n+1 ek−z dz 0 R∞ Rk R∞ Das k-te Integral zerlegt sich gemäß 0 = 0 + k . Führt man im zweiten Integral die Substitution R∞ x = z − k durch, hat dieses Integral wieder die Form 0 . Das ergibt: (18.6) 0= m X a k Ik + Iε k=0 mit Ik = und Z Iε = ∞ (x + k)n h(x + k)n+1 e−x dx 0 m X k=1 ak Z k (zh(z))n (ze−z )dz. 0 Das letzte Integral schätzen wir grob ab: Wenn γ das Supremum von |zh(z)| auf dem Intervall [0, m] bezeichnet und c′ das Supremum von |h(z)e−z |, so gilt Iε | ≤ Cγ n , ′P c mit der von n unabhängigen Konstanten C := m+1 k |ak |. In den Integralen Ik ist der In2 tegrand das Produkt eines ganzzahligen Polynoms mit e−z . Nach Lemma 18.4 sind diese Integrale ganze Zahlen. Man kann aber Genaueres sagen: Für k > 0 hat h(z + k)n+1 bei 0 eine n + 1fache Nullstelle. Alle Monome in z n h(z)n+1 haben also einen Grad ≥ n + 1. Woraus folgt, daß Ik = (n + 1)!Bk für eine ganze Zahl Bk , k = 1, . . . , m. Dagegen ist das Monom kleinsten Grades im Integranden von I0 von der Form h(0)n+1 z n 6= 0, so daß I0 = h(0)n+1 n! + (n + 1)!B0 für eine ganze Zahl B0 . Setzt man diese Werte in (18.6) und teilt durch n!, erhält man a0 h(0)n+1 + (n + 1) m X k=0 Bk = − Iε . n! Die Koeffizienten Bk hängen zwar von n ab, die linke Seite ist aber in jedem Falle eine ganze Zahl. n Dagegen ist die rechte Seite nach oben durch C γn! beschränkt und deshalb für hinreichend großes Algebra im Wintersemester 2015 147 n dem Betrage nach strikt kleiner als 1. Weil der Ausdruck eine ganze Zahl ist, muß er identisch verschwinden. Es bleibt a0 h(0)n+1 = −(n + 1)B(n) für alle hinreichend großen n mit einer von n abhängigen ganzen Zahl B(n). Wählt man n als ein hinreichend großes Vielfaches von a0 h(0), so ist die linke Seite der letzten Gleichung sicher teilerfremd zu n + 1. Widerspruch. Satz 18.6 — Es seien α1 , . . . , αn paarweise verschiedene algebraische Zahlen und A1 , . . . , An beliebige nichtverschwindende algebraische Zahlen. Dann gilt A1 eα1 + . . . + An eαn 6= 0. Unmittelbare Konsequenzen davon sind: Folgerung 18.7 (Lindemann 1882) — π ist transzendent. Beweis. Wäre π algebraisch, so wäre auch πi algebraisch, und die Eulersche Identität 1 + eiπ = 0 stünde im Widerspruch zu Satz 18.6. Lindemanns Beweis der Transzendenz von π ist eine Weiterentwicklung des Ansatzes von Hermite. Der Beweis von Satz 18.6, den ich im Folgenden gebe, stammt von Hilbert (1893, vgl. Ges. Werke Bd. 1, Seite 1). Hilbert beweist in der Arbeit nur den obigen Satz von Hermite und direkt die Folgerung 18.7 und überläßt dem Leser die Ausarbeitung des allgemeinen Falls zur Übung. Der folgende Beweis ist die Bearbeitung dieser Übungsaufgabe. Die Rolle des Polynoms h(z) = (z − 1) · · · (z − m) spielt im folgenden Beweis ein ganzzahliges Polynom h(z), dessen Nullstellen aber irgendwelche algebraische komplexe Zahlen sein können. Die Integrale werden also zu Wegintegralen mit holomorphen (= komplex differenzierbaren) Integranden. Für die Argumente werden einige einfache Ergebnisse aus der Funktionentheorie benötigt, die wir zunächst zusammenstellen: Für Integrale von holomorphen Funktionen auf Gebieten in der komplexen Ebene genügt es im Allgemeinen nicht, die Integrationsgrenzen anzugeben, sondern man muß einen Integrationsweg festlegen. Ist γ : [a, b] → C ein stückweise stetig differenzierbarer Weg, so setzt man Z Z b f (z)dz := f (γ(t))γ ′ (t)dt γ a und führt das Integral so auf ein gewöhnliches Integral über dem Intervall [a, b] zurück. Im Beweis schreiben wir gleichwohl zur besseren Lesbarkeit. Z ∞ Z ∞ f (z)dz := f (α + t)dt α 0 und Z α f (z)dz := 0 Z 1 f (αt)αdt 0 wo t über die reellen Intervalle [0, ∞) bzw. [0, 1] läuft. Ähnlich wie im Reellen läßt sich der Betrag eines Integrals durch das Produkt aus der Länge des Integrationsweges und dem Supremum des Integranden auf dem Bild des Weges abschätzen. Schließlich brauchen wir noch die Identität Z ∞ Z α Z ∞ Z α Z ∞ p(z)e−z dz = p(z)e−z dz + p(z)e−z dz = p(z)e−z dz + p(x + α)e−x−α dx 0 0 α 0 0 für beliebige Polynome p ∈ C[z]. Das zweite Gleichheitszeichen ergibt sich aus einer einfachen Substitution. Wir müssen das erste Gleichheitszeichen rechtfertigen. Dazu betrachten wir die TeilinR α+R−Re(α) RR tegrale α und 0 für großes R > 0 und das Integral über den Weg ϕ : [0, 1] → C, t 7→ R + t Im(α). Die Integrationswege sehen nun so aus: 148 Transzendenfragen R + α − Re(α) α ϕ 0 R Weil die hier betrachteten Integranden überall im Inneren des von den Wegen begrenzten Vierecks komplex differenzierbar sind, ist nach dem Cauchyschen Integralsatz der Wert des Wegintegrals von 0 nach α + R − Re(α) unabhängig davon, ob man links oder rechts um das eingeschlossene Gebiet herumläuft, d.h. Z α Z R+α−Re(α) Z R Z + = + . 0 α 0 ϕ Es genügt also zu zeigen, daß für R → ∞ das Integral über den Weg ϕ gegen 0 geht. Da die von ϕ durchlaufene Wegstrecke unabhängig von R stets | Im(α)| ist und es für jedes Polynom p eine Schranke der Form |p(z)| ≤ C|z|deg(p) gibt, hat man Z R→∞ p(z)e−z dz ≤ C(R + |α|)deg(p)+1 e−R −− −−−→ 0. ϕ Nach diesen Vorbereitungen kommen wir zum Beweis von Satz 18.6. Wir nehmen also an, es seien paarweise verschiedene αi ∈ Q, 1 ≤ i ≤ n, und beliebige Ai ∈ Q \ {0} mit der Eigenschaft A1 eα1 + . . . + An eαn = 0. (18.7) gegeben. Notwendigerweise ist n ≥ 2. Der Beweis besteht aus zwei Teilen: Im ersten Teil reduzieren wir den allgemeinen Fall auf die Betrachtung des folgenden Spezialfalls (18.8) A0 e0 + A1 (eα11 + . . . + eα1ℓ1 ) + . . . + Am (eαm1 + . . . + eαmℓm ) = 0, wobei Ai ganze Zahlen 6= 0 und für jedes j = 1, . . . , m die Exponenten αj1 , . . . , αjℓj die Nullstellen eines irreduziblen Polynoms gj ∈ Q[X] vom Grad ℓj sind. Diese Reduktion geschieht in vier Schritten: 1. Schritt: Wir können ohne Einschränkung annehmen, daß in (18.7) alle Koeffizienten Ai ganze Zahlen sind. Andernfalls sei G die Galoisgruppe der normalen Hülle von Q(A1 , . . . , An ) ⊂ C über Q. Die Exponenten β auf der rechten Seite der Identität X Y B j e βj (σ(A1 )eα1 + . . . + σ(An )eαn ) = (18.9) 0= σ∈G j P haben die Form βj = i mi αi mit ganzzahligen Koeffizienten mi mit i mi = |G| und sind daher algebraische Zahlen. Die Koeffizienten Bj sind invariant unter der Galoisgruppe G und deshalb rationale Zahlen. Nach Multiplikation mit dem Hauptnenner werden sie ganzzahlig. Allerdings werden nach dem Ausmultiplizieren Terme zusammengefaßt und könnten sich gegebenseitig auslöschen. Wir müssen also noch verifizieren, daß wenigstens ein Term eβj mit einem Koeffizienten 6= 0 übrig bleibt. Das ist sicher dann der Fall, wenn βj nur auf eine Weise als Summe von Exponenten αi geschrieben werden kann. Denn dann ist der Koeffizient Bj ein Produkt der zugehörigen Koeffizienten Ai und somit 6= 0. Dazu genügt das Lemma: P Algebra im Wintersemester 2015 149 Lemma 18.8 — Es seien S1 , . . . , Sℓ ⊂ C nichtleere endliche Mengen. Dann gibt es in der Menge S1 + . . . + Sn eine Zahl β, die sich nur auf eine Weise als Summe β = s1 + . . . + sn mit si ∈ Si schreiben läßt. Falls |Sj | ≥ 2 für wenigstens einen Index, so gibt es wenigstens zwei verschiedene β mit der verlangten Eigenschaft. Beweis. Es sei T = S1 ∪ . . . ∪ Sn . Wir wählen x ∈ C so, daß x auf keinem Vektor y − y ′ 6= 0, y, y ′ ∈ T , senkrecht steht. Dann gibt es in jeder Menge Si genau ein si derart, daß hsi , xi = max{hs, xi | s ∈ Si }, und β+ := s1 + . . . + sn hat die verlangte Eigenschaft. Dasselbe Argument mit min statt max liefert ein Element β− , das von β+ verschieden ist, sobald eine Menge Sj wenigstens zwei Elemente hat. 2. Schritt: Es bestehe also die Identität (18.7) mit ganzen Zahlen Aj . Es sei S die Menge der Exponenten. Dann kann man ohne Einschränkung annehmen, daß S mit αj auch alle Konjugierten von αj enthält, und zwar jeweils mit demselben ganzen Koeffizienten: Diesmal bezeichne G die Galoisgruppe der normalen Hülle von Q(α1 , . . . , αn ) ⊂ C über Q. Wir entwickeln wieder das folgende Produkt nach formalen Potenzen von e: X Y B j e βj . (18.10) 0= A1 eσ(α1 ) + · · · + An eσ(αn ) = j σ∈G Zunächst sieht man mit Hilfe des Lemmas, diesmal angewandt auf die Mengen σ(S), σ ∈ G, daß die Summe auf der rechten Seite wenigstens zwei nichttriviale Summanden hat. Außerdem sind die Exponenten algebraische Zahlen, die Menge der Exponenten ist abgeschlossen unter Konjugation, und konjugierte Exponenten haben denselben Koeffizienten. Faßt man die Terme mit konjugierten Exponenten zusammen, so erhält man eine Identität: (18.11) 0 = B1 (eβ11 + . . . + eβ1ℓ1 ) + . . . + Bm (eβm1 + . . . + eβmℓm ) mit ganzen Zahlen Bj ∈ Z \ {0} und paarweise verschiedenen algebraischen Zahlen βji derart, daß für jedes j die Zahlen βj1 , . . . , βjℓj die Nullstellen eines irreduziblen Polynoms gj ∈ Q[X] sind. 3. Schritt: Man kann ohnen Einschränkung annehmen, daß eine Identität der Form (18.8) besteht. Dazu gehen wir von einer Identität der Form (18.11) aus und multiplizieren mit (e−β11 + . . . + e−β1ℓ1 ). Man erhält nach erneutem Umsortieren eine Identität der Form (18.11) mit neuen Exponenten und neuen Koeffizienten, wobei diesmal aber insbesondere der Term ℓ1 B1 e0 vorkommt. Das beendet den ersten Teil. Bevor wir zum zweiten Teil übergehen, will ich die Reduktionsschritte kurz an einem Beispiel illustrieren. Starten wir mit einem Ausdruck √ 3 √ √7 2e + 5e , so erhält man im ersten Schritt √ √ √ √ √ √ √ √ √ √ √ √ ( 2e3 + 5e 7 )(− 2e3 + 5e 7 )( 2e3 − 5e 7 )(− 2e3 − 5e 7 ) 4e12 − 20e6+2 = √ 7 + 25e4 √ 7 . Im zweiten Schritt wird hieraus: (4e12 − 20e6+2 = √ 7 + 25e4 √ 7 √ √ )(4e12 − 20e6−2 7 + 25e−4 7 ) √ √ √ √ −500 e6+2 7 + e6−2 7 + 100 e12+4 7 + e12−4 7 √ √ −80 e18+2 7 + e18−2 7 + 400e12 + 16e24 + 625e0 . Der dritte Schritt ist hier unnötig, weil e0 mit Koeffizient 625 vorkommt. Damit kommen wir zum zweiten, eigentlichen Teil des Beweises. Wir können von folgendem Datum ausgehen: Es besteht eine Identität (18.12) 0 = A0 e0 + A1 (eα11 + . . . + eα1ℓ1 ) + . . . + Am (eαm1 + . . . + eαmℓm ) 150 Transzendenfragen mit ganzen Zahlen Aj ∈ Z \ {0} und paarweise und von 0 verschiedenen algebraischen Exponenten αjk . Dabei sind für jedes j die Exponenten αj1 , . . . , αjℓj die Nullstellen eines irreduziblen normierten Polynoms gj (X) ∈ Q[X] vom Grad ℓj . Es gibt dann zu jedem j = 1, . . . , m ein cj ∈ N mit hj (X) := cj gj (X) ∈ Z[X]. Insbesondere sind für jedes j die symmetrischen Polynome in cj αj1 , . . . , cj αjℓj ganze Zahlen. Setze (18.13) h= m Y hj , c= m Y cj , ℓ= ℓj = deg(h). j=1 j=1 j=1 m X Für später halten wir noch die Beobachtung fest: Ist p irgendein Polynom mit ganzzahligen KoeffiP ℓj zienten, ist cdeg(p) i=1 p(αji ) eine ganze Zahl. Wir wählen nun eine natürliche Zahl n ∈ N, die im Laufe des Beweises genauer spezifiziert wird, multiplizieren die Identität (18.12) mit dem Integral Z ∞ (18.14) (cz)n (cℓ h(z))n+1 e−z dz, 0 und erhalten 0 = A0 Z ∞ (cz)n (cℓ h(z))n+1 e−z dz + 0 m X j=1 Aj ℓj Z X i=1 ∞ (cz)n (cℓ h(z))n+1 eαji −z dz 0 R∞ R∞ Rα Die Integrale des zweiten Summanden werden gemäß 0 = 0 ij + α zerlegt, was nach dem ij Cauchyschen Integralsatz möglich ist. Dabei ist im ersten Integral der Integrationsweg die Strecke von 0 nach αij und im zweiten Integral der Weg t 7→ αij + t für t ∈ R≥0 . Substituieren wir im zweiten Integral z − αji 7→ z. Dann hat man (18.15) 0 = A 0 I0 + Iε + m X A j Ij j=1 wobei die einzelnen Terme für die folgenden Integrale stehen: Z ∞ (18.16) (cz)n (cℓ h(z))n+1 e−z dz, I0 = 0 (18.17) Iε = m X Aj j=1 Ij = XZ k=1 = eαjk k=1 ℓj (18.18) ℓj X ∞ Z αjk (cz)n (cℓ h(z))n+1 e−z dz 0 (cz)n (cℓ h(z))n+1 eαjk −z dz αjk ℓj Z X k=1 ∞ (cz + cαjk )n (cℓ h(z + αjk ))n+1 e−z dz. 0 Wir berechnen nun die einzelnen Integrale oder geben wenigstens eine Abschätzung. Dabei ist die Identität Z ∞ (18.19) z N e−z dz = N !, N ∈ N0 0 wesentlich, von deren Richtigkeit man sich durch partielle Integration und Induktion leicht überzeugt. Wir beginnen mit dem Integral I0 : Das Polynom (cz)n (cℓ h(z))n+1 ist ganzzahlig, und der Term kleinsten Grades ist cn+ℓ(n+1) h(0)n+1 z n . Alle anderen Terme sind ganzzahlig und durch z n+1 teilbar. Demnach hat I0 die Form I0 = B(n + 1)! + cn(1+ℓ)+ℓ h(0)n+1 n! Algebra im Wintersemester 2015 151 für eine gewisse ganze Zahl B. Insbesondere ist I0 /n! ganzzahlig und I0 ≡ cn(ℓ+1)+ℓ h(0)n+1 mod n + 1. n! Das zweite Integral schätzen wir grob ab: Die Vereinigung K der Strecken [0, αjk ] ist eine kompakte Teilmenge in C. Deshalb sind die Funktionen c1+ℓ zh(z) und ch(z)eαij −z auf K dem Betrage nach beschränkt, etwa durch γ > 0 für alle i, j. Somit gilt: X (18.20) |Iǫ | ≤ γ n+1 |Aj |ℓj =: γ n+1 C ′ . j Es verbleiben die Integrale, die in den Summanden Ij eingehen: Für festes j und k = 1, . . . , ℓj ist αjk eine Nullstelle von h(z). Deshalb hat cℓ(n+1) (cz + cαjk )n h(z + αjk )n+1 bei z = 0 eine Nullstelle der Ordnung ≥ (n + 1) und die Koeffizienten bezüglich z sind ganzzahlige Polynom in cαjk . [Genau an dieser Stelle wird der Faktor cℓ(n+1) gebraucht!]. Die Mittelung über alle Nullstellen von hj ergibt deshalb (18.21) ℓj X k=1 (cz + cαjk )n (cℓ h(z + αjk ))n+1 ∈ z n+1 Z[z]. Nun liefert die Integration einen Wert Ij ∈ (n + 1)! Z. Insbesondere gilt (18.22) Ij /n! ≡ 0 mod (n + 1). Zusammengefaßt hat man (18.23) 1 1 X Iǫ A 0 I0 + A j Ij = − , n! n! j n! wo die linke Seite eine ganze Zahl kongruent zu A0 cn(ℓ+1)+ℓ h(0))n+1 modulo n + 1 ist, während n+1 die rechte Seite dem Betrage nach durch C ′ γ n! beschränkt ist. Für hinreichend großes n ist die rechte Seite dem Betrage nach < 1 und muß, weil sie auch ganzzahlig ist, identisch verschwinden. Wählt man n zugleich als Vielfaches von A0 ch(0), so ist die linke Seite (18.23) nicht kongruent 0 modulo n + 1, weil n und n + 1 teilerfremd sind. Mit diesem Widerspruch ist Satz 18.6 bewiesen. 18.3. (*) Transzendenzbasen. Definition 18.9. — Es sei L/K eine Körpererweiterung. (1) Eine Teilmenge S ⊂ L heißt algebraisch unabhängig über K, wenn der kanonische Ringhomomorphismus Φ : K[{Xs }s∈S ] → L, Xs 7→ s, injektiv ist. In diesem Falle setzt sich Φ zu einer kanonischen Einbettung Φ̃ : K({Xs }s∈S ) → L des Funktionenkörpers fort, dessen Bild K(S) ist. (2) Eine algebraisch unabhängige Teilmenge S ⊂ L ist eine Transzendenzbasis der Erweiterung L/K, wenn L algebraisch über K(S) ist. (3) Die Erweiterung L/K heißt rein transzendent, wenn es ein algebraisch unabhängiges Erzeugendensystem S von L gibt. Satz 18.10 (Steinitz) — 1. Jede Körpererweiterung L/K hat eine Transzendenzbasis. 2. Alle Transzendenzbasen einer Körpererweiterung haben dieselbe Mächtigkeit. Beweis. 1. Wir nehmen zunächst allgemeiner an, S sei eine endliche, algebraisch unabhängige Teilmenge und L sei algebraisch über K(T ), und zeigen unter diesen Voraussetzungen, daß |S| ≤ |T |. Offenbar können wir ohne Einschränkung annehmen, daß S nicht leer ist. Angenommen, S0 = S ∩ T und s ∈ S \ S0 . Nach Voraussetzung ist s algebraisch über K(T ), ist also Nullstelle eines nichtkonstanten Polynoms f ∈ K(T )[X]. Nach Multiplikation mit dem 152 Transzendenfragen Hauptnenner kann man ohne Einschränkung annehmen, daß f ∈ K[T ][X]. Es gibt also endlich viele Koeffizienten fnm , so daß X n fn,m t1 n1 · · · tℓ ℓ sm (18.24) 0= n,m mit t1 , . . . , tℓ ∈ T . Wir können annehmen, daß f so gewählt ist, daß ℓ minimal ist. Lägen alle ti in S0 , wäre S0 ∪ {s} nicht algebraisch unabhängig, im Widerspruch zur Annahme über S. Ohne Einschränkung ist tℓ kein Element von S0 . Bezeichnet d den Grad von f bezüglich tℓ , so ist der Koeffizient von tdℓ nicht 0, sonst würde er der Minimalität von f widersprechen. Das zeigt, daß tℓ algebraisch über K(T ′ ) ist, wobei T ′ := S0 ∪ {s} ∪ T \ {tℓ } ist. Jedes Element in L, das algebraisch über K(T ) ist, ist daher auch algebraisch über K(T ′ ). Die neue Menge T ′ hat dieselbe Mächtigkeit wie T , und S0′ = T ′ ∩ S = S0 ∪ {s}. In endlich vielen Schritten kann man also T durch eine Menge T̃ gleicher Mächtigkeit ersetzen, die S enthält. Insbesondere ist dann |T | ≥ |S|. 2. Es seien nun S und T zwei Transzendenzbasen. Jedes s ∈ S ist algebraisch über K(T ). Es gibt dann aber auch schon eine endliche Teilmenge Ts ⊂ T derart, daß s algebraisch über K(Ts ) ist. S Insbesondere ist S algebraisch über K(TS ) mit TS := Ts . Andererseits ist T algebraisch über K(S), also auch über K(TS ). Da T nach Voraussetzung algebraisch unabhängig ist, folgt T = TS . Daraus schließen wir: Ist S endlich, so ist T = TS als Vereinigung von endlich vielen endlichen Mengen ebenfalls endlich. Mit Schritt 1 folgt nun |S| ≤ |T | und |T | ≤ |S|, also Gleichheit. Ist umgekehrt S unendlich, so hat T = TS als Vereinigung einer von S parametrisierten Familie endlicher Mengen höchstens die Mächtigkeit |S|. Aus der Symmetrie des Arguments folgt auch jetzt |S| = |T |. 3. Das beweist die Gleichmächtigkeit beliebiger Transzendenzbasen. Es bliebt zu zeigen, daß es Transzendenzbasen gibt. Dazu betrachten wir die Menge X ⊂ L aller algebraisch unabhängigen Teilmengen und die durch Inklusion definierte Halbordnung auf X. Die Menge X ist nicht leer, denn X enthält die leere S Menge. Es sei weiter K eine Kette in X und T := S∈K S. Wäre T nicht algebraisch unabhängig, so gäbe es eine endliche Teilmenge T ′ ⊂ T , die Nullstelle eines nichtkonstanten Polynoms wäre. Jedes Element t′i ∈ T stammt aus einer Menge Si ∈ K. Da K eine Kette ist, gibt es eine Menge S ∈ K mit Si ⊂ S für alle i, insbesondere also auch T ′ ⊂ S. Aber da S algebraisch unabhängig ist, muß dies auch für T ′ gelten. Damit liegt T in K und ist eine obere Schranke von K. Nach dem Zornschen Lemma gibt es ein maximales Element T in X. Es genügt zu zeigen, daß L algebraisch über K(T ) ist. Andernfalls gibt es ein Element a ∈ L, das transzendent über K(T ) ist. Aber dann ist T ∪ {a} algebraisch unabhängig, im Widerspruch zur Maximalität von T . Definition 18.11. — Es sei K → L eine Körpererweiterung mit Transzendenzbasis S. Die Zahl trdeg(L/K) := |S| heißt Transzendenzgrad von L über K. Offenbar ist K → L genau dann algebraisch, wenn trdeg(L/K) = 0. Satz 18.12 — Es seien K → M → L Körpererweiterungen. Dann gilt (18.25) trdeg(L/K) = trdeg(L/M ) + trdeg(M/K). Beweis. Übung. Aus der Eindeutigkeit der Mächtigkeit einer Transzendenzbasis für L/K folgt nicht, daß die rein transzendenten Zwischenkörper, die von zwei Transzendenzbasen erzeugt werden, gleich sind. Ein einfaches Beispiel bietet der Funktionenkörper K(X)/K. Sowohl {X} also auch {X 2 } sind Transzendenbasen. Aber K(X 2 ) ⊂ K(X) ist ein echter Unterkörper. Algebra im Wintersemester 2015 153 Satz 18.13 — Aut(C) ist eine überabzählbare Gruppe. Beweis. Es sei S ⊂ C eine Transzendenzbasis. Da C der algebraische Abschluß von Q(S) und überabzählbar ist, muß auch S überabzählbar sein. Es sei π : S → S eine beliebige Bijektion und ϕ : Q(S) → Q(S) der zugehörige Körperisomorphismus mit ϕ|S = π. Dann existiert ein Isomorphismus ψ : C → C mit ψ|Q(S) = ϕ.